Maison > développement back-end > Tutoriel Python > Comment supprimer des lignes d'une trame de données Pandas en fonction d'un index ou de conditions ?

Comment supprimer des lignes d'une trame de données Pandas en fonction d'un index ou de conditions ?

Linda Hamilton
Libérer: 2024-11-03 10:50:29
original
827 Les gens l'ont consulté

How to Drop Rows from a Pandas Dataframe Based on Index or Conditions?

Supprimer des lignes d'un dataframe Pandas

Dans Pandas, nous rencontrons souvent le besoin de supprimer certaines lignes d'un dataframe, soit pour le nettoyage des données objectifs ou pour se concentrer sur des sous-ensembles spécifiques. Un moyen efficace d'y parvenir consiste à utiliser la fonction drop, qui nous permet de supprimer sélectivement des lignes en fonction de divers critères.

Pour démontrer le processus, considérons un dataframe df :

<code class="python">import pandas as pd

df = pd.DataFrame({'sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
                   'discount': [None, None, None, None, None, None],
                   'net_sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907],
                   'cogs': [2.245, 5.291, 7.981, 12.686, 2.710, 6.459]})

print(df)
</code>
Copier après la connexion

Maintenant, supposons que nous souhaitions supprimer des lignes avec certains numéros de séquence, représentés par une liste, telle que [1, 2, 4]. Pour ce faire, nous pouvons utiliser la fonction drop comme suit :

  1. Créez une série d'étiquettes d'index que vous souhaitez supprimer :
<code class="python">indices_to_drop = [1, 2, 4]</code>
Copier après la connexion
  1. Alternativement , vous pouvez également supprimer des lignes en fonction des conditions des colonnes :
<code class="python">conditions_to_drop = df['sales'] > 10
df = df[~conditions_to_drop]</code>
Copier après la connexion

En spécifiant le paramètre index dans drop, nous pouvons effectivement supprimer les lignes correspondant aux indices fournis, nous laissant avec le sous-ensemble souhaité :

<code class="python">df = df.drop(index=indices_to_drop)
print(df)</code>
Copier après la connexion

Dans ce cas, cela donnerait le dataframe suivant :

                  sales  discount  net_sales    cogs
STK_ID RPT_Date                                     
600141 20060331   2.709       NaN      2.709   2.245
       20061231  15.915       NaN     15.915  12.686
       20070630   7.907       NaN      7.907   6.459
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal