Schritte für Pandas zum Lesen von TXT-Dateien: 1. Installieren Sie die Pandas-Bibliothek. 2. Verwenden Sie die Funktion „read_csv“, um die TXT-Datei zu lesen und den Dateipfad und das Dateitrennzeichen anzugeben. 3. Pandas liest die Daten in ein DataFrame-Objekt. 4. Wenn die erste Zeile Spaltennamen enthält, können Sie diese angeben, indem Sie den Header-Parameter auf 0 setzen. Wenn nicht, setzen Sie ihn auf None. 5. Wenn die TXT-Datei fehlende Werte oder leere Werte enthält, können Sie „na_values“ verwenden " Geben Sie diese fehlenden Werte an.
Das Betriebssystem dieses Tutorials: Windows 10-System, Dell G3-Computer.
Pandas ist eine leistungsstarke Python-Bibliothek für Datenanalyse und Datenverarbeitung. Es bietet viele praktische Methoden zum Lesen und Verarbeiten verschiedener Datendateien, einschließlich TXT-Dateien. In diesem Artikel zeige ich Ihnen, wie Sie Pandas zum Lesen von TXT-Dateien verwenden.
Zuerst müssen wir sicherstellen, dass die Pandas-Bibliothek installiert ist. Pandas kann mit dem folgenden Befehl in einer Python-Umgebung installiert werden:
pip install pandas
Nach Abschluss der Installation können wir Pandas zum Lesen von TXT-Dateien verwenden. Angenommen, wir haben eine TXT-Datei mit dem Namen „data.txt“, die einige Daten enthält. Das Folgende ist der Inhalt einer Beispiel-txt-Datei:
Name Age Gender John 25 Male Emily 28 Female
Um diese txt-Datei zu lesen, können wir die read_csv-Funktion von Pandas verwenden und den Dateipfad und das Dateitrennzeichen angeben. Obwohl unsere Datei durch Leerzeichen getrennt ist, verwendet die Funktion read_csv standardmäßig Kommas als Trennzeichen. Daher müssen wir den Trennzeichenparameter auf „“ setzen, was bedeutet, dass Leerzeichen als Trennzeichen verwendet werden. Das Folgende ist ein Codebeispiel zum Lesen einer TXT-Datei:
import pandas as pd # 读取txt文件 data = pd.read_csv('data.txt', sep=' ') # 打印数据 print(data)
Nachdem der obige Code ausgeführt wurde, werden die folgenden Ergebnisse ausgegeben:
Name Age Gender 0 John 25 Male 1 Emily 28 Female
Pandas liest die Daten als Objekt mit dem Namen DataFrame. DataFrame ist die am häufigsten verwendete Datenstruktur in Pandas, ähnlich wie Tabellen in Excel. Jede Spalte wird als Spalte des DataFrame analysiert, und jede Zeile wird als Datensatz des DataFrame analysiert.
Wenn die erste Zeile der TXT-Datei Spaltennamen enthält, kann dies angegeben werden, indem der Header-Parameter auf 0 gesetzt wird. Wenn die TXT-Datei keine Spaltennamen hat, können Sie den Header-Parameter auf „Keine“ setzen. Hier ist ein Beispiel:
import pandas as pd # 读取txt文件,指定列名 data = pd.read_csv('data.txt', sep=' ', header=0) # 打印数据 print(data)
Wenn die TXT-Datei fehlende oder Nullwerte enthält, können Sie den Parameter na_values verwenden, um diese fehlenden Werte anzugeben. Hier ist ein Beispiel, das zeigt, wie „NA“ und „-“ als fehlende Werte identifiziert werden:
import pandas as pd # 读取txt文件,指定缺失值 data = pd.read_csv('data.txt', sep=' ', header=0, na_values=['NA', '-']) # 打印数据 print(data)
Das Obige ist die grundlegende Methode zum Lesen von TXT-Dateien mit Pandas. Zusätzlich zu den oben genannten Parametern stellt die Funktion read_csv viele weitere Parameter für den Umgang mit unterschiedlichen Datensituationen bereit. Weitere Details zur Funktion read_csv finden Sie in der offiziellen Pandas-Dokumentation.
Das Lesen von TXT-Dateien mit Pandas ist sehr einfach. Verwenden Sie einfach die Funktion read_csv und geben Sie den Dateipfad, das Trennzeichen und andere erforderliche Parameter an, um die TXT-Datei in ein DataFrame-Objekt einzulesen und die anschließende Datenverarbeitung und -analyse zu erleichtern. Ich hoffe, dieser Artikel kann Ihnen helfen!
Das obige ist der detaillierte Inhalt vonSo lesen Sie eine TXT-Datei in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!