Der Inhalt dieses Artikels ist eine Zusammenfassung häufig verwendeter Funktionen in Pythons Pandas. Ich hoffe, er wird Ihnen als Referenz dienen.
Pandas ist eine Datenverarbeitungsbibliothek in Python. Wenn wir sie verwenden, müssen wir zuerst import pandas as pd
eingeben, um sie zu importieren.
1.df = pd.read_csv("File Path"): Dies ist die Methode zum Lesen von CSV-Dateien. Wenn Sie Excel- oder andere Dokumente lesen möchten, gibt es eine entsprechende Lesefunktion.
2.df.dtypes: Wenn die Datei Zeichendaten enthält, wird ein Objekt zurückgegeben.
3.df.head(n): Zeigt die ersten n Datenzeilen an. Wenn keine Parameter übergeben werden, werden die ersten 5 Zeilen angezeigt Die Daten werden angezeigt.
4.df.tail(n): Zeigt die letzten n Datenzeilen an. Wenn keine Parameter übergeben werden, werden die letzten 5 Zeilen angezeigt Die Daten werden angezeigt.
5.df.columns: Zeigt die Spaltennamen der Datentabelle in Form einer Liste an.
6.df.shape: Zeigt die Anzahl der Datenzeilen und -spalten in der Tabelle in Form von Tupeln an.
7.df.loc[n]: Gibt die Zeile mit Index n zurück.
8.df.loc[m][n]: Gibt die Daten zurück, deren Indexwert m Zeilen und n Spalten beträgt.
9.df.loc[m:n]: Gibt Zeilen mit Indexwerten von m bis n zurück.
10.df.loc[[m,n,k]]: Gibt die Zeilen zurück, deren Indexwerte jeweils m,n,k sind.
11.df["str"]: Gibt die Spalte mit dem Namen str zurück.
12.df.columns.tolist(): Spaltennamen in eine Liste umwandeln.
13.df["str"]*df["str"]: Wenn die Abmessungen der beiden Spalten gleich sind, dann entsprechende Positionen der beiden Spalten werden multipliziert.
14.df.sort_values("str",inplace=True,ascending=False): Ordnen Sie die str-Spalte in absteigender Reihenfolge an und erhalten Sie Die Daten ersetzen die Originaldaten. inplace gibt an, ob die Originaldaten durch die sortierten Daten ersetzt werden sollen. Der Standardwert ist False, was bedeutet, dass keine Ersetzung erfolgt. Aufsteigend gibt die Sortierreihenfolge an. Der Standardwert ist True, dh in aufsteigender Reihenfolge angeordnet.
15.judge = pd.isnull(df["str"]): Gibt einen Bool-Wert zurück, und die Daten in der Spalte str sind Ein Nullwert gibt „True“ zurück, andernfalls wird „False“ zurückgegeben.
16.a["judge"]: Gibt Judge als True zurück, also die fehlenden Daten, und rufe dann die Funktion len() auf ist Die Anzahl der fehlenden Daten, die gefunden werden können.
17.df.pivot_table(index="a",values= „b“,aggfunc=np.mean): Dies ist eine sehr wichtige Funktion. Sie mittelt b und klassifiziert es entsprechend der Kategorie von a.
18.df.loc[n, "str"]: Suchen Sie die Daten in Zeile n, Spaltenname str.
19.sort_res.reset_index(drop=True): Ordnen Sie die Nummern der sortierten Daten neu. Drop bezieht sich darauf, ob die Originaldaten verworfen werden sollen. Wenn wir die laufenden Ergebnisse mit Abbildung 14 vergleichen, können wir sehen, dass die Zahlen neu angeordnet wurden.
20.df.apply(): So verwenden Sie eine benutzerdefinierte Funktion in Pandas. Der Funktionsname wird in Klammern übergeben.
Das obige ist der detaillierte Inhalt vonZusammenfassung häufig verwendeter Funktionen in Pythons Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!