使用pd.read_csv('somefile.csv') 時,您可能會遇到DtypeWarning 指示列具有混合類型。指定 dtype 選項可以防止此錯誤並提高效能。
已棄用的 low_memory 選項實際上不會影響行為。但是,它與 dtype 選項相關,因為猜測每列的 dtypes 可能會佔用大量記憶體。
如果最後一行您的檔案包含意外數據,指定資料類型可能會導致載入過程失敗。例如,如果指定為整數的列包含類似「foobar」的字串值,則載入將中斷。
要避免此類錯誤,請明確讀取 CSV 檔案時指定 dtypes。使用 dtype 選項為每一列分配正確的資料類型,從而實現高效解析並減少記憶體消耗。
Pandas 支援各種 dtypes,包括:
Pandas 擴充:
以上是如何使用'dtype”和'low_memory”選項來最佳化 Pandas'read_csv”?的詳細內容。更多資訊請關注PHP中文網其他相關文章!