Calcul des totaux de fruits par nom à l'aide de Pandas Group-By Sum
Le regroupement et l'agrégation sont des opérations essentielles lorsque l'on travaille avec des données. Pandas fournit une puissante fonction GroupBy qui simplifie ces processus.
Considérez le DataFrame suivant dans lequel vous souhaitez calculer le nombre total de fruits achetés par chaque nom :
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
Pour y parvenir, nous peut utiliser la fonction GroupBy pour regrouper le DataFrame à la fois par "Nom" et "Fruit":
df.groupby(['Name', 'Fruit'])
Cependant, cela regroupe uniquement les données sans effectuer aucune agrégation. Pour calculer la somme des "Nombre" pour chaque groupe, nous pouvons utiliser sum() :
df.groupby(['Name', 'Fruit']).sum()
Cela affichera un nouveau DataFrame avec un index hiérarchique, où le premier niveau correspond au "Nom" et au le deuxième niveau correspond à "Fruit". La colonne "Nombre" contient la somme pour chaque groupe :
Number Name Fruit Bob Apples 16 Grapes 35 Oranges 67 Mike Apples 9 Oranges 57 Steve Apples 10 Tom Grapes 87 Oranges 15 Tony Grapes 15 Oranges 1
Cela nous donne le résultat souhaité, indiquant le nombre total de fruits achetés par chaque Nom.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!