Salam!
Saya seorang pemula pembelajaran mesin yang sedang bergelut dengan set data UCI Penyakit Jantung daripada Kaggle. Set data saya mendedahkan beberapa lajur dengan nilai yang tiada, dan saya menganggap semua lajur penting untuk analisis saya. Berikut ialah pecahan data yang hilang:
id
: 0 tiada nilaiage
: 0 tiada nilaisex
: 0 tiada nilaidataset
: 0 tiada nilaicp
: 0 tiada nilaitrestbps
: 59 nilai hilangchol
: 30 nilai hilangfbs
: 90 nilai hilangrestecg
: 2 nilai tiadathalch
: 55 nilai hilangexang
: 55 nilai hilangoldpeak
: 62 nilai hilangslope
: 309 nilai hilangca
: 611 nilai hilangthal
: 486 nilai hilangnum
: 0 tiada nilaiMemandangkan kepentingan semua lajur, saya mencari panduan tentang pendekatan paling berkesan untuk mengendalikan nilai yang tiada ini. Imputasi kelihatan seperti kemungkinan, tetapi adakah terdapat kaedah yang lebih baik untuk situasi ini? Sebarang nasihat, terutamanya dengan contoh ilustrasi, adalah tidak ternilai!
Terima kasih atas bantuan anda!
Atas ialah kandungan terperinci Perlukan bantuan dalam Pembelajaran Mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!