ホームページ > バックエンド開発 > Python チュートリアル > Pandas で CSV ファイルを読み取るときに発生する UnicodeDecodeError を修正するにはどうすればよいですか?

Pandas で CSV ファイルを読み取るときに発生する UnicodeDecodeError を修正するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-12-15 09:00:23
オリジナル
263 人が閲覧しました

How Can I Fix a UnicodeDecodeError When Reading a CSV File in Pandas?

Pandas で CSV ファイルを読み取るときに UnicodeDecodeError が発生する

多数の同様のファイルを処理するときに、UnicodeDecodeError が発生するとイライラすることがあります。この特定のエラーは、Pandas の read_csv メソッドに由来し、UTF-8 エンコーディングを使用してファイル内のバイトをデコードできないことを示しています。

この問題を解決するために、Pandas はエンコーディングを指定できるエンコーディング オプションを提供しています。ファイルの形式。一般的に使用されるエンコーディングは次のとおりです。

  • UTF-8: エンコーディング="utf-8"
  • ISO-8859-1: エンコーディング="ISO-8859-1" (" と同等) latin" または "cp1252")

大部分のファイルでは UTF-8 エンコーディングを使用

コード例:

import pandas as pd

filepath = 'filepath.csv'
data = pd.read_csv(filepath, encoding="utf-8")
ログイン後にコピー

ファイルのエンコーディングの検出が必要な場合は、enca、file -i (Linux)、または file などのツールの使用を検討してください。 -私(macOS)。その後、それに応じてエンコードを指定できます。

エンコード オプションを利用すると、CSV ファイルを適切にデコードできるようになり、予期しないエラーによるデータ インポート プロセスの中断を防ぐことができます。

以上がPandas で CSV ファイルを読み取るときに発生する UnicodeDecodeError を修正するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート