首頁 > 後端開發 > Python教學 > 在 Pandas 中讀取 CSV 檔案時如何修復 UnicodeDecodeError?

在 Pandas 中讀取 CSV 檔案時如何修復 UnicodeDecodeError?

Mary-Kate Olsen
發布: 2024-12-15 09:00:23
原創
263 人瀏覽過

How Can I Fix a UnicodeDecodeError When Reading a CSV File in Pandas?

在 Pandas 讀取 CSV 檔案時出現 UnicodeDecodeError

處理大量類似檔案時,遇到 UnicodeDecodeError 可能會令人沮喪。這個特殊的錯誤源自於 Pandas 的 read_csv 方法,表示無法使用 UTF-8 編碼解碼檔案中的位元組。

為了解決此問題,Pandas 提供了編碼選項,讓您可以指定編碼檔案的格式。常用的編碼包括:

  • UTF-8:encoding="utf-8"
  • ISO-8859-1:encoding="ISO-8859-1"(相當於「 latin" 或"cp1252")

對於大多數文件,使用UTF-8編碼將足夠了。

程式碼範例:

import pandas as pd

filepath = 'filepath.csv'
data = pd.read_csv(filepath, encoding="utf-8")
登入後複製

如果需要偵測檔案的編碼,請考慮使用enca、file -i (Linux) 或file - 等工具我(macOS )。然後可以相應地指定編碼。

透過使用編碼選項,您可以確保 CSV 檔案正確解碼並防止意外錯誤中斷資料匯入過程。

以上是在 Pandas 中讀取 CSV 檔案時如何修復 UnicodeDecodeError?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板