Maison > développement back-end > Tutoriel Python > En quoi « appliquer » et « transformer » diffèrent-ils lors de la soustraction de deux colonnes et du calcul de la moyenne dans un Pandas DataFrame ?

En quoi « appliquer » et « transformer » diffèrent-ils lors de la soustraction de deux colonnes et du calcul de la moyenne dans un Pandas DataFrame ?

Barbara Streisand
Libérer: 2024-11-26 20:28:11
original
729 Les gens l'ont consulté

How do `apply` and `transform` differ when subtracting two columns and calculating the mean in a Pandas DataFrame?

Soustrayez deux colonnes et obtenez la moyenne avec apply vs transform

Considérez le cadre de données suivant :

df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],</p>
<div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">               'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
               'C': np.random.randn(8), 'D': np.random.randn(8)})

 A      B         C         D
Copier après la connexion

0 foo un 0,162003 0,087469
1 bar un -1,156319 -1,526272
2 foo deux 0,833892 -1.666304
3 bar trois -2.026673 -0.322057
4 foo deux 0.411452 -0.954371
5 bar deux 0.765878 -0.095968
6 foo un -0.654890 0.678091
7 foo three -1.789842 -1.130922

apply vs. transform

La commande suivante applique une fonction lambda à chacun groupe dans le dataframe :

df.groupby('A').apply(lambda x: (x['C'] - x['D']))
Copier après la connexion

Ceci renvoie un dataframe avec la même forme que le dataframe d'origine, où chaque cellule contient le résultat de la fonction lambda appliquée au groupe correspondant.

La commande suivante transforme chaque groupe dans le dataframe :

df.groupby('A').transform(lambda x: (x['C'] - x['D']).mean())
Copier après la connexion

Cela renvoie une série avec la même forme que le dataframe d'origine, où chaque cellule contient la moyenne de la différence entre les colonnes C et D pour le groupe correspondant.

Pourquoi les différentes commandes fonctionnent

Les méthodes apply et transform ont des comportements différents car elles fonctionnent sur différents objets d'entrée.

  • apply transmet implicitement l'ensemble du groupe en tant que DataFrame à la fonction lambda.
  • transform transmet chaque colonne du groupe individuellement sous forme de série à la fonction lambda.

Cette différence de moyens d'entrée qui s'appliquent peut être utilisée pour effectuer des calculs sur l'ensemble du groupe, tandis que la transformation ne peut être utilisée que pour effectuer des calculs sur des colonnes individuelles.

Renvoyer une valeur unique avec transform

Il est important de noter que la fonction lambda passée à transform doit renvoyer un valeur unique pour chaque groupe. Si la fonction lambda renvoie un DataFrame, une Series ou toute autre valeur non scalaire, une erreur sera générée.

C'est pourquoi la commande suivante échoue :

df.groupby('A').transform(lambda x: (x['C'] - x['D']))
Copier après la connexion

La fonction lambda La fonction renvoie un DataFrame, qui n'est pas un seul value.

Conclusion

apply et transform sont deux méthodes puissantes qui peuvent être utilisées pour effectuer des opérations groupby sur des trames de données. Il est important de comprendre la différence entre ces deux méthodes afin de les utiliser efficacement.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Recommandations populaires
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal