将具有 NaN 值的 Pandas 列转换为 Dtype 'int'
使用 Pandas 库在 Python 中进行数据操作时,很常见遇到缺失值或 NaN 值的列。将此类列转换为整数数据类型(“int”)会带来独特的挑战,因为 NaN 值与整数运算不兼容。
为了克服此问题,Pandas 在 0.24 版本中引入了新的可为空整数数据类型。 。此数据类型允许表示可能存在缺失值的整数值。
要将列的数据类型显式指定为“int64”,可以使用“astypte”方法。但是,请务必记住,“astype”方法无法直接将 NaN 值转换为整数。
要将具有 NaN 值的列转换为可为 null 的整数数据类型,请按照以下步骤操作:
使用具有适当数据类型的数组函数初始化列。例如:
'arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype())'
将新创建的数组分配给 Pandas Series。
' pd.Series(arr)'
转换 DataFrame 中的列对于可为空的整数数据类型,请使用 'astype'方法。
'df['myCol'] = df['myCol'].astype('Int64')'
以上是如何将具有 NaN 值的 Pandas 列转换为整数数据类型?的详细内容。更多信息请关注PHP中文网其他相关文章!