안녕하세요!
저는 현재 Kaggle의 심장병 UCI 데이터세트를 사용하는 데 어려움을 겪고 있는 기계 학습 초보자입니다. 내 데이터세트에는 누락된 값이 있는 여러 열이 표시되며 모든 열이 분석에 중요하다고 생각합니다. 누락된 데이터에 대한 분석은 다음과 같습니다.
id
: 누락된 값 0개age
: 누락된 값 0개sex
: 누락된 값 0개dataset
: 누락된 값 0개cp
: 누락된 값 0개trestbps
: 누락된 값 59개chol
: 누락된 값 30개fbs
: 누락된 값 90개restecg
: 누락된 값 2개thalch
: 누락된 값 55개exang
: 누락된 값 55개oldpeak
: 누락된 값 62개slope
: 누락된 값 309개ca
: 누락된 값 611개thal
: 누락된 값 486개num
: 누락된 값 0개모든 열의 중요성을 고려하여 이러한 누락된 값을 처리하는 가장 효과적인 접근 방식에 대한 지침을 찾고 있습니다. 전가가 가능해 보이지만 이 상황에 대한 더 나은 방법이 있습니까? 특히 예시를 포함한 조언은 매우 중요합니다!
도와주셔서 감사합니다!
위 내용은 기계 학습에 도움이 필요합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!