Soustrayez deux colonnes et obtenez la moyenne avec apply vs transform
Considérez le cadre de données suivant :
df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],</p> <div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false"> 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}) A B C D
0 foo un 0,162003 0,087469
1 bar un -1,156319 -1,526272
2 foo deux 0,833892 -1.666304
3 bar trois -2.026673 -0.322057
4 foo deux 0.411452 -0.954371
5 bar deux 0.765878 -0.095968
6 foo un -0.654890 0.678091
7 foo three -1.789842 -1.130922
apply vs. transform
La commande suivante applique une fonction lambda à chacun groupe dans le dataframe :
df.groupby('A').apply(lambda x: (x['C'] - x['D']))
Ceci renvoie un dataframe avec la même forme que le dataframe d'origine, où chaque cellule contient le résultat de la fonction lambda appliquée au groupe correspondant.
La commande suivante transforme chaque groupe dans le dataframe :
df.groupby('A').transform(lambda x: (x['C'] - x['D']).mean())
Cela renvoie une série avec la même forme que le dataframe d'origine, où chaque cellule contient la moyenne de la différence entre les colonnes C et D pour le groupe correspondant.
Pourquoi les différentes commandes fonctionnent
Les méthodes apply et transform ont des comportements différents car elles fonctionnent sur différents objets d'entrée.
Cette différence de moyens d'entrée qui s'appliquent peut être utilisée pour effectuer des calculs sur l'ensemble du groupe, tandis que la transformation ne peut être utilisée que pour effectuer des calculs sur des colonnes individuelles.
Renvoyer une valeur unique avec transform
Il est important de noter que la fonction lambda passée à transform doit renvoyer un valeur unique pour chaque groupe. Si la fonction lambda renvoie un DataFrame, une Series ou toute autre valeur non scalaire, une erreur sera générée.
C'est pourquoi la commande suivante échoue :
df.groupby('A').transform(lambda x: (x['C'] - x['D']))
La fonction lambda La fonction renvoie un DataFrame, qui n'est pas un seul value.
Conclusion
apply et transform sont deux méthodes puissantes qui peuvent être utilisées pour effectuer des opérations groupby sur des trames de données. Il est important de comprendre la différence entre ces deux méthodes afin de les utiliser efficacement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!