Filtrage des lignes de DataFrame par plage de valeurs
Lors de la manipulation de dataframes, il est souvent nécessaire de sélectionner des lignes en fonction de critères spécifiques. Un de ces scénarios consiste à sélectionner des lignes dans une plage de valeurs spécifiée. Bien que l'utilisation de boucles puisse y parvenir, une approche plus efficace et vectorisée est préférable.
Dans le code donné :
df = df[99 <= df['closing_price'] <= 101]
Une erreur se produit en raison de valeurs de vérité ambiguës dans la comparaison. Pour remédier à cela, utilisez la méthode between() de la classe Pandas Series :
Solution :
df = df[df['closing_price'].between(99, 101)]
La méthode between() prend deux valeurs en paramètres, représentant les limites inférieure et supérieure de la plage. Il renvoie une série booléenne avec True pour les lignes qui répondent aux critères et False dans le cas contraire. Cette série peut ensuite être utilisée pour filtrer la trame de données afin d'inclure uniquement les lignes souhaitées.
Cette solution vectorisée évite l'utilisation de boucles, améliorant ainsi les performances et la concision. De plus, il est plus intuitif à lire et à maintenir.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!