Maison > développement back-end > Tutoriel Python > Comment remplacer les valeurs manquantes dans les DataFrames Pandas par des moyennes de colonnes ?

Comment remplacer les valeurs manquantes dans les DataFrames Pandas par des moyennes de colonnes ?

Barbara Streisand
Libérer: 2024-10-28 18:33:02
original
1059 Les gens l'ont consulté

How to Replace Missing Values in Pandas DataFrames with Column Averages?

Remplacement des valeurs NaN par des moyennes de colonnes dans les DataFrames Pandas

Lorsque vous travaillez avec des DataFrames Pandas, il est courant de rencontrer des valeurs NaN (manquantes). Pour gérer efficacement ces valeurs, il est crucial de les remplacer par des valeurs appropriées. Un moyen efficace consiste à remplacer les valeurs NaN par la moyenne de leurs colonnes respectives.

Solution utilisant DataFrame.fillna

Contrairement à l'approche mentionnée dans la question référencée, les pandas DataFrames peut être traité différemment. La méthode DataFrame.fillna fournit une solution simple pour remplir les valeurs NaN :

<code class="python">df.fillna(df.mean())</code>
Copier après la connexion

Explication détaillée :

  • La fonction df.mean() calcule le moyenne de chaque colonne du DataFrame.
  • La méthode fillna prend les moyennes calculées et remplit les valeurs NaN dans chaque colonne avec la moyenne correspondante.

Exemple :

Considérons le DataFrame suivant :

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3       NaN -2.027325  1.533582
4       NaN       NaN  0.461821
5 -0.788073       NaN       NaN
6 -0.916080 -0.612343       NaN
7 -0.887858  1.033826       NaN
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Copier après la connexion

Après avoir appliqué la méthode fillna avec des moyennes :

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3 -0.151121 -2.027325  1.533582
4 -0.151121 -0.231291  0.461821
5 -0.788073 -0.231291 -0.530307
6 -0.916080 -0.612343 -0.530307
7 -0.887858  1.033826 -0.530307
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Copier après la connexion

Comme démontré, les valeurs NaN ont été remplacées par les moyennes des colonnes correspondantes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal