Grundlegendes zu GroupBy für aggregierte Berechnungen in Pandas
Bei der Arbeit mit großen Datensätzen bietet Pandas eine leistungsstarke Funktion namens groupby() zum Gruppieren von Daten Sie können bestimmte Spalten aufrufen und Berechnungen für die gruppierten Daten durchführen. Lassen Sie uns in diesem Zusammenhang untersuchen, wie Sie groupby() verwenden, um die Summe der Werte innerhalb von Gruppen zu berechnen.
Betrachten Sie den folgenden Datenrahmen, in dem wir Details zu Obstkäufen durch Einzelpersonen über mehrere Daten hinweg haben:
| Fruit | Date | Name | Number | |---|---|---|---| | Apples | 10/6/2016 | Bob | 7 | | Apples | 10/6/2016 | Bob | 8 | | Apples | 10/6/2016 | Mike | 9 | | Apples | 10/7/2016 | Steve | 10 | | Apples | 10/7/2016 | Bob | 1 | | Oranges | 10/7/2016 | Bob | 2 | | Oranges | 10/6/2016 | Tom | 15 | | Oranges | 10/6/2016 | Mike | 57 | | Oranges | 10/6/2016 | Bob | 65 | | Oranges | 10/7/2016 | Tony | 1 | | Grapes | 10/7/2016 | Bob | 1 | | Grapes | 10/7/2016 | Tom | 87 | | Grapes | 10/7/2016 | Bob | 22 | | Grapes | 10/7/2016 | Bob | 12 | | Grapes | 10/7/2016 | Tony | 15 |
Ziel: Berechnen Sie die Summe der nach Namen gruppierten Obstkäufe
Unser Ziel ist es, die Gesamtzahl zu berechnen Von jedem Einzelnen gekaufte Früchte, wobei die Daten sowohl nach der Frucht (Frucht) als auch nach dem Namen der Person (Name) gruppiert werden.
Lösung: Verwenden von GroupBy.sum()
Um dies zu erreichen, verwenden wir die Funktion „groupby()“ mit den Spalten zum Gruppieren:
result = df.groupby(['Fruit', 'Name']).sum()
Die auf die gruppierten Daten angewendete Methode „sum()“ aggregiert die Werte automatisch die angegebene Spalte (in diesem Fall stellt Number die Anzahl der gekauften Früchte dar).
Ausgabe:
Die Ausgabe des Codes liefert uns die aggregierten Werte:
| | Number | |----------------|--------| | Fruit | Name | | Apples | Bob | 16 | | | Mike | 9 | | | Steve | 10 | | Grapes | Bob | 35 | | | Tom | 87 | | | Tony | 15 | | Oranges | Bob | 67 | | | Mike | 57 | | | Tom | 15 | | | Tony | 1 |
Hier können wir die Gesamtzahl der von jedem Einzelnen innerhalb jeder Obstkategorie gekauften Früchte beobachten. Beispielsweise beträgt die Gesamtzahl der gekauften „Äpfel“ in der Gruppe „Bob“ 16 und die Gesamtzahl der gekauften „Trauben“ 35.
Das obige ist der detaillierte Inhalt vonWie kann die Funktion „groupby()' von Pandas die Summe der Werte innerhalb von Gruppen berechnen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!