處理大量類似檔案時,遇到 UnicodeDecodeError 可能會令人沮喪。這個特殊的錯誤源自於 Pandas 的 read_csv 方法,表示無法使用 UTF-8 編碼解碼檔案中的位元組。
為了解決此問題,Pandas 提供了編碼選項,讓您可以指定編碼檔案的格式。常用的編碼包括:
對於大多數文件,使用UTF-8編碼將足夠了。
程式碼範例:
import pandas as pd filepath = 'filepath.csv' data = pd.read_csv(filepath, encoding="utf-8")
如果需要偵測檔案的編碼,請考慮使用enca、file -i (Linux) 或file - 等工具我(macOS )。然後可以相應地指定編碼。
透過使用編碼選項,您可以確保 CSV 檔案正確解碼並防止意外錯誤中斷資料匯入過程。
以上是在 Pandas 中讀取 CSV 檔案時如何修復 UnicodeDecodeError?的詳細內容。更多資訊請關注PHP中文網其他相關文章!