こんにちは!
私は機械学習の初心者で、現在 Kaggle の心臓病 UCI データセットに取り組んでいます。 私のデータセットには欠損値のある列がいくつかあり、すべての列が分析にとって重要であると考えています。 欠落しているデータの内訳は次のとおりです:
id
: 0 欠損値age
: 0 欠損値sex
: 0 欠損値dataset
: 0 欠損値cp
: 0 欠損値trestbps
: 59 個の欠損値chol
: 30 個の欠損値fbs
: 90 個の欠損値restecg
: 2 つの欠損値thalch
: 55 個の欠損値exang
: 55 個の欠損値oldpeak
: 62 個の欠損値slope
: 309 欠損値ca
: 611 個の欠損値thal
: 486 個の欠損値num
: 0 欠損値すべての列の重要性を考慮して、これらの欠損値を処理する最も効果的なアプローチに関するガイダンスを求めています。 代入が可能であるように思えますが、この状況に対する優れた方法はあるのでしょうか? 特に実例を挙げてのアドバイスは非常に貴重です!
ご協力ありがとうございます!
以上が機械学習についてサポートが必要ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。