Beim Exportieren von Pandas-Datenrahmen in CSV-Dateien kann es zu UnicodeEncodeError kommen, wenn Ihre Daten Nicht-ASCII-Zeichen enthalten. Lassen Sie uns sowohl den Fehler als auch eine zusätzliche Frage zum Schreiben tabulatorgetrennter Dateien ansprechen.
Unicode-Kodierungsfehler
Um in eine CSV-Datei mit Unicode-Zeichen zu schreiben, geben Sie eine Kodierung an kompatibel mit Ihren Daten. Verwenden Sie das Kodierungsargument in to_csv():
df.to_csv(file_name, sep='\t', encoding='utf-8')
Für die meisten Unicode-Zeichen ist UTF-8 ausreichend.
Schreiben in eine tabulatorgetrennte Datei
Pandas verfügt nicht über eine spezielle „To-Tab“-Methode. Sie können jedoch mithilfe des sep-Arguments in to_csv() manuell durch Tabulatoren trennen:
df.to_csv(file_name, sep='\t', encoding='utf-8')
Zusätzliche Optionen
Zusätzlich zur Angabe der Codierung und des Trennzeichens können Sie Möglicherweise möchten Sie auch den Index deaktivieren und einen Header hinzufügen:
df.to_csv(file_name, sep='\t', encoding='utf-8', index=False, header=True)
Das obige ist der detaillierte Inhalt vonWie behebe ich Unicode-Fehler und erstelle tabulatorgetrennte Dateien beim Exportieren von Pandas-DataFrames in CSV?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!