Fügen Sie eine sequentielle Zählerspalte für Gruppen zu einem Pandas-DataFrame ohne Rückruf hinzu
In der Pandas-Bibliothek können effizientere Methoden als verwendet werden Rückruffunktionen zum Hinzufügen sequentieller Zählerspalten zu gruppierten Datenrahmen. Die Funktion cumcount() bietet einen alternativen Ansatz. So implementieren Sie es:
import pandas as pd df = pd.DataFrame( columns=" index c1 c2 v1 ".split(), data=[ [0, "A", "X", 3], [1, "A", "X", 5], [2, "A", "Y", 7], [3, "A", "Y", 1], [4, "B", "X", 3], [5, "B", "X", 1], [6, "B", "X", 3], [7, "B", "Y", 1], [8, "C", "X", 7], [9, "C", "Y", 4], [10, "C", "Y", 1], [11, "C", "Y", 6], ], ).set_index("index", drop=True) # Add a sequential counter column df["seq"] = df.groupby(["c1", "c2"]).cumcount() + 1 print(df)
Dieses Code-Snippet gruppiert den Datenrahmen nach „c1“ und „c2“ und wendet dann die Funktion „cumcount()“ auf jede Gruppe an, um die Zeilen innerhalb dieser Gruppe zu zählen. Das Ergebnis ist ein Datenrahmen mit einer zusätzlichen „seq“-Spalte, die die sequentiellen Zählungen für jede Gruppe enthält:
c1 c2 v1 seq 0 A X 3 1 1 A X 5 2 2 A Y 7 1 3 A Y 1 2 4 B X 3 1 5 B X 1 2 6 B X 3 3 7 B Y 1 1 8 C X 7 1 9 C Y 4 1 10 C Y 1 2 11 C Y 6 3
Dieser Ansatz macht Callback-Funktionen überflüssig und bietet eine präzisere und effizientere Lösung zum Hinzufügen sequentieller Zählerspalten zu gruppierten Pandas-Datenrahmen.
Das obige ist der detaillierte Inhalt vonWie füge ich gruppierten Pandas-DataFrames effizient eine sequentielle Zählerspalte hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!