將陣列類型保持為具有NaN 值的整數:NumPy 與Pandas
使用同時包含整數和NaN 值的資料結構時,在處理遺失的資訊時保持預期的資料類型至關重要。 Python 中流行的資料分析庫 NumPy 和 Pandas 為這項任務提供了不同的方法。
在 NumPy 中,不可能直接將 NaN 值儲存在整數陣列中。此限制源自於 NaN 是一個與浮點資料型態一致的浮點概念。您提到使用屏蔽數組並沒有解決問題,因為它也導致資料類型轉換為浮點型。
另一方面,Pandas 歷來缺乏對整數 NA 值的支持,導致列包含整數和 NaN 值都會轉換為浮點型。然而,隨著 Pandas 0.24 版本中引入擴展資料類型 Int64(大寫),這種情況發生了變化。若要利用此功能,您可以在建立 DataFrame 時將 dtype 指定為「Int64[NA]」。請注意,必須使用此擴充 dtype,而不是預設的 int64(小寫)。
以上是NumPy 與 Pandas:如何在整數陣列中儲存 NaN 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!