Pandas 列を整数に変換する際の NaN 値の処理
Pandas データフレームを操作する場合、列を変換する必要がある状況が発生する場合があります。 NaN 値を含む整数データ型。ただし、整数配列はデフォルトでは欠損値を処理できないため、この変換ではエラーが発生する可能性があります。
エラー処理アプローチ
ID を変換するために 2 つのアプローチを試みました。 ' 列を整数に変換しましたが、両方ともエラーが発生しました:
解決策: Null 許容整数データ型
Pandas バージョン 0.24 では、Null 許容整数データ型の概念が導入されています。この機能により、整数配列に欠損値を含めることができます。このアプローチを使用するには:
import numpy as np # Create a nullable integer array arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) # Create a Pandas Series from the array series = pd.Series(arr)
結果のシリーズは 'Int64' dtype を持ち、NaN 値を許可します:
>>> series 0 1 1 2 2 NaN dtype: Int64
Pandas 列の変換
Pandas 列を null 許容整数 dtype に変換するには:
df['myCol'] = df['myCol'].astype('Int64')
これにより、'myCol' 列が NaN として表される欠損値を持つ整数データ型に変換されます。
以上がPandas 列を整数に変換するときに NaN 値を処理する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。