您好!
我是機器學習新手,目前正在研究 Kaggle 的心臟病 UCI 資料集。 我的資料集顯示了一些缺失值的列,我認為所有列對於我的分析都至關重要。 以下是缺失資料的詳細資訊:
id
:0 個缺失值age
:0 個缺失值sex
:0 個缺失值dataset
:0 個缺失值cp
:0 個缺失值trestbps
:59 個缺失值chol
:30 個缺失值fbs
:90 個缺失值restecg
:2 個缺失值thalch
:55 個缺失值exang
:55 個缺失值oldpeak
:62 個缺失值slope
:309 個缺失值ca
:611 個缺失值thal
:486 個缺失值num
:0 個缺失值考慮到所有列的重要性,我正在尋求有關處理這些缺失值的最有效方法的指導。 插補似乎是一種可能性,但是對於這種情況有更好的方法嗎? 任何建議,尤其是說明性範例,都是非常寶貴的!
感謝您的幫忙!
以上是需要機器學習的幫助的詳細內容。更多資訊請關注PHP中文網其他相關文章!