
您好!
我是一名机器学习新手,目前正在研究 Kaggle 的心脏病 UCI 数据集。 我的数据集显示了一些缺失值的列,并且我认为所有列对于我的分析都至关重要。 以下是缺失数据的详细信息:
id:0 个缺失值age:0 个缺失值sex:0 个缺失值dataset:0 个缺失值cp:0 个缺失值trestbps:59 个缺失值chol:30 个缺失值fbs:90 个缺失值restecg:2 个缺失值thalch:55 个缺失值exang:55 个缺失值oldpeak:62 个缺失值slope:309 个缺失值ca:611 个缺失值thal:486 个缺失值num:0 个缺失值考虑到所有列的重要性,我正在寻求有关处理这些缺失值的最有效方法的指导。 插补似乎是一种可能性,但是对于这种情况有更好的方法吗? 任何建议,尤其是说明性示例,都是非常宝贵的!
感谢您的帮助!
以上是需要机器学习方面的帮助的详细内容。更多信息请关注PHP中文网其他相关文章!