
您好!
我是機器學習新手,目前正在研究 Kaggle 的心臟病 UCI 資料集。 我的資料集顯示了一些缺失值的列,我認為所有列對於我的分析都至關重要。 以下是缺失資料的詳細資訊:
id:0 個缺失值age:0 個缺失值sex:0 個缺失值dataset:0 個缺失值cp:0 個缺失值trestbps:59 個缺失值chol:30 個缺失值fbs:90 個缺失值restecg:2 個缺失值thalch:55 個缺失值exang:55 個缺失值oldpeak:62 個缺失值slope:309 個缺失值ca:611 個缺失值thal:486 個缺失值num:0 個缺失值考慮到所有列的重要性,我正在尋求有關處理這些缺失值的最有效方法的指導。 插補似乎是一種可能性,但是對於這種情況有更好的方法嗎? 任何建議,尤其是說明性範例,都是非常寶貴的!
感謝您的幫忙!
以上是需要機器學習的幫助的詳細內容。更多資訊請關注PHP中文網其他相關文章!