Informatika2-2014/Gyakorlat04
A MathWikiből
Feladatok
1. feladat
- A feladat, hogy páciensek adatai alapján egy egyszerű jóslatot adjunk arról, hogy az illető beteg-e, vagy nem.
- Minden betegnek van sok különböző attribútuma.
- Ezeket egy sokoszlopos file-ban tároljuk.
- Egy pácienst akkor nyilvánítunk betegnek, ha minimum 5 attribútumának értéke az adott atrribútum átlaga feletti.
- A file-okban 1 + 10 + 1 oszlop szerepel.
- Az első oszlop a beteg ID-ja, a következő 10 a különböző attribútumokat jelöli, az utolsó pedig az "igazság", 1/0 érték arról, hogy a páciens valóban beteg-e.
- Számoljuk ki a "cancerTrainData.txt" adatai alapján az egyes attribútumok átlagait.
- Ezek után jósoljuk meg, hogy a "cancerTestData.txt"-ben rögzített páciensek betegek-e!
- Vessük össze predikciónkat a valósággal: számoljuk ki, hány páciens esetén egyezett a predikció a valósággal (utolsó oszlop).
- File-ok:
- cancerTrainData
- cancerTestData