您好!
我是一名机器学习新手,目前正在研究 Kaggle 的心脏病 UCI 数据集。 我的数据集显示了一些缺失值的列,并且我认为所有列对于我的分析都至关重要。 以下是缺失数据的详细信息:
id
:0 个缺失值age
:0 个缺失值sex
:0 个缺失值dataset
:0 个缺失值cp
:0 个缺失值trestbps
:59 个缺失值chol
:30 个缺失值fbs
:90 个缺失值restecg
:2 个缺失值thalch
:55 个缺失值exang
:55 个缺失值oldpeak
:62 个缺失值slope
:309 个缺失值ca
:611 个缺失值thal
:486 个缺失值num
:0 个缺失值考虑到所有列的重要性,我正在寻求有关处理这些缺失值的最有效方法的指导。 插补似乎是一种可能性,但是对于这种情况有更好的方法吗? 任何建议,尤其是说明性示例,都是非常宝贵的!
感谢您的帮助!
以上是需要机器学习方面的帮助的详细内容。更多信息请关注PHP中文网其他相关文章!