Pandas DataFrame を CSV に書き込む際のエンコーディングの問題とオプションの区切り
pandas では、DataFrame を CSV ファイルに書き込む際に文字について慎重に考慮する必要がありますエンコーディングと区切り文字。デフォルトの「ascii」エンコーディングを使用しようとすると、非 ASCII 文字に対して UnicodeEncodeError が発生する可能性があります。
これを解決するには、encoding 引数を使用して適切なエンコーディングを指定します。たとえば、UTF-8 エンコーディングで CSV ファイルに書き込むには:
df.to_csv('out.csv', encoding='utf-8')
もう 1 つの一般的な要件は、ファイルをカンマではなくタブで区切ることです。 Pandas は明示的な「to-tab」メソッドを提供しませんが、sep 引数を使用して区切り文字を指定できます。タブ区切りの CSV ファイルを書き込むには:
df.to_csv('out.tsv', sep='\t')
さらに、ヘッダーとインデックスのオプションを調整することもできます。インデックスを削除してヘッダーを追加するには:
df.to_csv('out.tsv', sep='\t', index=False, header=True)
適切なエンコードと区切り文字を指定すると、パンダのデータフレームを CSV または TSV ファイルに正常にエクスポートでき、エンコードと区切り文字を適切に処理できます。
以上がPandas DataFrame を CSV に保存するときにエンコーディングと区切り文字を処理するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。