Berechnung der Fruchtsummen nach Namen mit Pandas Group-By Sum
Gruppierung und Aggregation sind wesentliche Vorgänge bei der Arbeit mit Daten. Pandas bietet eine leistungsstarke GroupBy-Funktion, die diese Prozesse vereinfacht.
Betrachten Sie den folgenden DataFrame, in dem Sie die Gesamtzahl der von jedem Namen gekauften Früchte berechnen möchten:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
Um dies zu erreichen, haben wir Sie können die GroupBy-Funktion verwenden, um den DataFrame sowohl nach „Name“ als auch nach „Frucht“ zu gruppieren:
df.groupby(['Name', 'Fruit'])
Dies gruppiert jedoch nur die Daten ohne Leistung irgendwelche Aggregationen. Um die Summe von „Number“ für jede Gruppe zu berechnen, können wir sum() verwenden:
df.groupby(['Name', 'Fruit']).sum()
Dies gibt einen neuen DataFrame mit einem hierarchischen Index aus, wobei die erste Ebene „Name“ entspricht und die zweite Ebene entspricht „Frucht“. Die Spalte „Anzahl“ enthält die Summe für jede Gruppe:
Number Name Fruit Bob Apples 16 Grapes 35 Oranges 67 Mike Apples 9 Oranges 57 Steve Apples 10 Tom Grapes 87 Oranges 15 Tony Grapes 15 Oranges 1
Dies gibt uns das gewünschte Ergebnis und zeigt die Gesamtzahl der von jedem Namen gekauften Früchte.
Das obige ist der detaillierte Inhalt vonWie berechnet man mit Pandas GroupBy die gesamten Obsteinkäufe nach Namen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!