Pandas ist eine Datenverarbeitungsbibliothek, die zum Lesen, Bearbeiten und Analysieren von Daten verwendet werden kann. In diesem Artikel stellen wir vor, wie man TXT-Dateien mit Pandas liest. Dieser Artikel richtet sich an Anfänger, die Pandas lernen möchten.
Importieren Sie zunächst die Pandas-Bibliothek in Python.
import pandas as pd
Bevor wir TXT-Dateien lesen, müssen wir einige allgemeine Parameter von TXT-Dateien verstehen: Sie können den Spaltennamen manuell angeben.
data = pd.read_table('data.txt', delimiter=',', header=0)
verwenden, um die ersten Zeilen der gelesenen Daten anzuzeigen. Standardmäßig werden die ersten 5 Datenzeilen angezeigt.
print(data.head())
Nachdem wir die Daten gelesen haben, müssen wir die notwendige Bereinigung und Transformation durchführen. Dazu gehört normalerweise das Entfernen nutzloser Spalten, das Entfernen fehlender Werte, das Umbenennen von Spaltennamen, das Konvertieren von Datentypen usw. Hier sind einige gängige Datenbereinigungsmethoden. .head()
data = data.drop(columns=['ID'])
Fehlende Werte entfernen:
data.dropna(inplace=True)
data = data.rename(columns={'OldName': 'NewName'})
data['ColumnName'] = data['ColumnName'].astype(str) data['ColumnName'] = data['ColumnName'].astype(int)
total = data['ColumnName'].sum() print(total)
grouped_data = data.groupby(['Name']).mean() print(grouped_data.head())
Datenvisualisierung
Durch die Datenvisualisierung können wir schließlich Trends und Muster in den Daten klarer verstehen.import matplotlib.pyplot as plt plt.bar(data['ColumnName'], data['Count']) plt.xlabel('ColumnName') plt.ylabel('Count') plt.title('ColumnName vs Count') plt.show()
Das obige ist der detaillierte Inhalt vonKurzanleitung zum Lesen von TXT-Dateien mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!