欠損値を含む Pandas 列を整数 Dtype に変換する
Pandas で、欠損値 (NaN) を含む列を整数にキャストすると、多くの場合、次のような結果になります。エラー。これは、整数型はデフォルトでは欠落情報を保持できないためです。ただし、Pandas は、Nullable 整数データ型によるソリューションを提供するようになりました。
Nullable Integer Dtype
バージョン 0.24。 Pandas では、null 許容の整数データ型を使用して、欠損値の可能性がある整数値を表すことができます。このデータ型は arrays.IntegerArray として実装されており、配列またはシリーズを作成するときに明示的に指定する必要があります。
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) pd.Series(arr) 0 1 1 2 2 NaN dtype: Int64
列を Null 許容整数に変換する
列を次のように変換するにはnull 許容の整数データ型の場合は、次の構文を使用します:
df['myCol'] = df['myCol'].astype('Int64')
Int64 dtype を指定することで、列が欠損値 (NaN) に対応できる整数データ型を持つ必要があることを Pandas に明示的に通知します。このアプローチにより、型変換エラーが発生することなく、情報が欠落している整数値を表すことができます。
以上がNaN 値を含む Pandas 列を整数データ型に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。