Suppression des doublons consécutifs dans Pandas
Pour supprimer les doublons consécutifs d'une série pandas, plusieurs méthodes peuvent être utilisées.
Méthode 1 : Utiliser Shift
L'approche la plus efficace consiste à exploiter la fonction shift() :
a.loc[a.shift() != a]
Cette méthode compare la série à sa propre version décalée, créer un masque booléen où les doublons consécutifs sont identifiés.
Méthode 2 : Utiliser Diff
Une méthode alternative consiste à utiliser la fonction diff() :
a.loc[a.diff() != 0]
Cependant, cette approche est légèrement plus lente pour les grands ensembles de données.
Mise à jour :
Il est important de noter que l'utilisation de shift() avec une période par défaut de 1 équivaut à shift(1). Par conséquent, le code suivant produit également le résultat souhaité :
a.loc[a.shift(1) != a]
En utilisant ces méthodes, vous pouvez supprimer efficacement les doublons consécutifs de la série pandas, en garantissant que seules les valeurs distinctes sont conservées.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!