Informatika2-2014/Gyakorlat04

A MathWikiből

Feladatok

1. feladat

  • A feladat, hogy páciensek adatai alapján egy egyszerű jóslatot adjunk arról, hogy az illető beteg-e, vagy nem.
  • Minden betegnek van sok különböző attribútuma.
  • Ezeket egy sokoszlopos file-ban tároljuk.
  • Egy pácienst akkor nyilvánítunk betegnek, ha minimum 5 attribútumának értéke az adott atrribútum átlaga feletti.
  • A file-okban 1 + 10 + 1 oszlop szerepel.
  • Az első oszlop a beteg ID-ja, a következő 10 a különböző attribútumokat jelöli, az utolsó pedig az "igazság", 1/0 érték arról, hogy a páciens valóban beteg-e.
  • Számoljuk ki a "cancerTrainData.txt" adatai alapján az egyes attribútumok átlagait.
  • Ezek után jósoljuk meg, hogy a "cancerTestData.txt"-ben rögzített páciensek betegek-e!
  • Vessük össze predikciónkat a valósággal: számoljuk ki, hány páciens esetén egyezett a predikció a valósággal (utolsó oszlop).
  • File-ok:
  • cancerTrainData
  • cancerTestData
Személyes eszközök