Beheben von Unicode-Kodierungsfehlern und Exportieren von DataFrames in tabulatorgetrennte CSV-Dateien
Beim Schreiben eines Pandas-DataFrames in eine CSV-Datei kann es bei Benutzern zu UnicodeEncodeError kommen Ausnahmen, wenn ihre Daten Nicht-ASCII-Zeichen enthalten. Dies liegt daran, dass die Standardkodierung, die von der to_csv-Methode von Pandas verwendet wird, ASCII ist.
Überwindung von Unicode-Kodierungsfehlern
Um die Zeichen richtig zu kodieren und UnicodeEncodeError zu vermeiden, geben Sie die Kodierung an mithilfe des Kodierungsarguments verwendet werden. Die UTF-8-Kodierung kann für Zeichen verwendet werden, die nicht im ASCII-Bereich liegen:
df.to_csv('out.csv', encoding='utf-8')
Ausgabe als tabulatorgetrennte CSV
Während Pandas keine bereitstellt Spezielle To-Tab-Methode zum Exportieren von tabulatorgetrennten CSV-Dateien. Benutzer können die Ausgabe mit dem sep-Argument in begrenzen to_csv:
df.to_csv('out.csv', sep='\t')
Zusätzliche Überlegungen
Zusätzlich zur Behebung von Unicode-Kodierungsfehlern und der Begrenzung der Ausgabe haben Benutzer möglicherweise andere Präferenzen für ihre CSV-Exporte:
df.to_csv('out.csv', sep='\t', index=False)
df.to_csv('out.csv', sep='\t', header=True)
Das obige ist der detaillierte Inhalt vonWie exportiere ich Pandas-DataFrames in tabulatorgetrennte CSV-Dateien und behandle dabei Unicode-Kodierungsfehler?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!