Effectuer une agrégation groupée et des calculs moyens
Considérez le DataFrame suivant avec des données sur le cluster, l'organisation et le temps :
cluster org time 0 a 8 1 a 6 2 h 34 3 c 23 4 d 74 5 w 6
L'objectif est de calculer le temps moyen par organisation au sein de chaque cluster. Le résultat attendu devrait ressembler à :
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
Solution utilisant les calculs Double GroupBy et Mean :
Pour y parvenir, utilisez la puissance de la fonction groupby de Pandas :
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean() result = cluster_org_time.groupby('cluster')['time'].mean()
Solution alternative pour un groupe clusterisé Moyennes :
Pour la moyenne des groupes de clusters uniquement, regroupez simplement par ['cluster'] et calculez la moyenne à l'aide de Mean().
cluster_mean_time = df.groupby(['cluster']).mean()
Option supplémentaire pour GroupBy avec org et calcul de la moyenne :
Vous pouvez également regrouper par ['cluster', 'org'] et calculer directement la moyenne :
cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!