Remplir les valeurs manquantes dans les groupes avec la moyenne
Vous recevez un DataFrame pandas avec des valeurs manquantes, et vous souhaitez remplir ces valeurs avec le moyenne de chaque groupe défini par une colonne spécifique. Cette tâche courante peut être résolue à l'aide de diverses méthodes.
Utilisation de GroupBy et Transformation
Une approche efficace consiste à utiliser les fonctions groupby() et transform() :
grouped = df.groupby('name') df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))
Dans ce code, nous regroupons d'abord le DataFrame par la colonne 'name' en utilisant groupby(). Ensuite, nous appliquons une fonction lambda en utilisant transform() sur la colonne 'value'. Cette fonction examine chaque groupe et remplit les valeurs manquantes avec la moyenne de ce groupe. Le résultat final est stocké dans la colonne « valeur » d'origine.
En employant cette technique, vous pouvez gérer efficacement les valeurs manquantes en les remplaçant par des valeurs significatives dérivées des données de chaque groupe.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!