Calcul groupe par : moyenne du temps par organisation et cluster
Dans Pandas, calculer la moyenne du temps par organisation au sein de chaque cluster peut être réalisé en utilisant la fonction groupby().
1. Approche de regroupement imbriqué
Pour calculer la moyenne d'abord par ['cluster', 'org'] puis par 'cluster', utilisez le code suivant :
(df.groupby(['cluster', 'org'], as_index=False).mean() .groupby('cluster')['time'].mean())
2. Approche de regroupement à un seul niveau (cluster uniquement)
Pour calculer directement la moyenne des groupes de cluster, utilisez :
df.groupby(['cluster']).mean()
3. Regroupement par ['cluster', 'org'] et application de la moyenne
Une approche alternative consiste à regrouper par ['cluster', 'org'] puis à appliquer la fonction moyenne :
df.groupby(['cluster', 'org']).mean()
Résultat
Le résultat attendu pour toutes les approches est :
cluster | mean(time) |
---|---|
1 | 15 |
2 | 54 |
3 | 6 |
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!