Concaténation de chaînes de lignes à l'aide de Pandas Groupby
Afin de concaténer des chaînes de plusieurs lignes au sein d'une opération groupby à l'aide de Pandas, il est important de comprendre la structure du DataFrame et le résultat souhaité.
Dans ce cas, nous avons un DataFrame contenant du texte entrées regroupées par colonnes « nom » et « mois ». Pour obtenir la concaténation souhaitée, nous pouvons utiliser les fonctions 'groupby', 'transform' et 'apply'.
Tout d'abord, nous regroupons le DataFrame par 'nom' et 'mois' :
df[['name','text','month']].groupby(['name','month'])
Ensuite, nous appliquons une expression lambda en utilisant 'transform' pour joindre le texte entrées :
df['text'] = df[['name','text','month']].groupby(['name','month'])['text'].transform(lambda x: ','.join(x))
Enfin, nous supprimons les lignes en double et affichons le résultat :
df[['name','text','month']].drop_duplicates()
Alternativement, nous pouvons utiliser « appliquer » pour obtenir le même résultat :
df.groupby(['name','month'])['text'].apply(lambda x: ','.join(x)).reset_index()
Une autre approche, sans utiliser de lambda, serait :
df.groupby(['name','month'])['text'].apply(','.join).reset_index()
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!