NaN 값으로 정수 배열 유형 유지: 과제 및 솔루션
NumPy 및 Pandas에서 숫자 데이터로 작업할 때 다음이 필요할 수 있습니다. 정수 값과 NaN(Not-a-Number) 값을 모두 포함하는 배열을 처리합니다. 그러나 Pandas에는 정수 배열이 NaN 값을 저장할 수 없는 알려진 제한 사항이 있습니다.
Pandas의 from_records() 함수를 coerce_float=False로 사용하거나 NumPy 마스크 배열을 NaN fill_value로 사용하는 등 이전에 시도한 솔루션은 실패했습니다. 정수 데이터 유형을 유지합니다. 이는 현재 NumPy에 정수 배열의 NA 값을 처리하는 기능이 부족하기 때문입니다.
현재 버전의 NumPy 및 Pandas에서 이러한 제한을 해결하는 가장 좋은 방법은 NaN 값이 있는 정수 배열을 사용하지 않는 것입니다. 대신 숫자 값과 NaN을 모두 수용할 수 있는 float와 같은 다른 데이터 유형을 사용하는 것이 좋습니다.
그러나 최근 Pandas 버전 0.24 업데이트에서는 정수 NA 값에 대한 선택적 지원이 도입되었습니다. 이 기능을 사용하려면 기본 int64 dtype 대신 확장 dtype Int64(대문자 "I" 포함)를 사용해야 합니다. 이 새로운 dtype을 통합함으로써 이제 NaN 값의 존재를 허용하면서 정수 배열 유형을 유지할 수 있습니다.
위 내용은 NaN 값을 처리하는 동안 Pandas에서 정수 배열 유형을 어떻게 유지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!