將Pandas 列轉換為整數時處理NaN 值
使用Pandas 資料幀時,您可能會遇到需要轉換列的情況包含NaN 值的整數資料型態。但是,這種轉換可能會導致錯誤,因為預設情況下整數陣列無法處理缺失值。
錯誤處理方法
您已嘗試了兩種方法來轉換'id ' 列轉換為整數,但兩者都導致了錯誤:
解:可為空整數資料型別
Pandas 0.24 版本引進了可為空整數資料型別的概念。此函數允許整數數組包含缺失值。要使用此方法:
import numpy as np # Create a nullable integer array arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) # Create a Pandas Series from the array series = pd.Series(arr)
產生的系列將具有「Int64」資料類型,並允許NaN 值:
>>> series 0 1 1 2 2 NaN dtype: Int64
轉換Pandas 欄位
要將Pandas 欄位轉換為可為空的整數資料類型:
df['myCol'] = df['myCol'].astype('Int64')
這會將'myCol' 欄位轉換為整數資料類型,缺失值表示為NaN。
以上是將 Pandas 列轉換為整數時如何處理 NaN 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!