Maison > développement back-end > Tutoriel Python > Comment supprimer efficacement des lignes d'un DataFrame Pandas en fonction d'une valeur de colonne ?

Comment supprimer efficacement des lignes d'un DataFrame Pandas en fonction d'une valeur de colonne ?

Mary-Kate Olsen
Libérer: 2024-12-18 14:06:10
original
427 Les gens l'ont consulté

How to Efficiently Delete Rows from a Pandas DataFrame Based on a Column Value?

Suppression d'une ligne DataFrame dans Pandas en fonction de la valeur de la colonne

Problème :

Considérez un DataFrame Pandas avec une colonne nommée line_race . La tâche consiste à supprimer toutes les lignes dont la valeur dans la colonne line_race est égale à 0.

Solution efficace :

Pour supprimer efficacement des lignes en fonction d'une valeur de colonne spécifique , suivez les étapes suivantes :

  1. Importez les Pandas library:

    import pandas as pd
    Copier après la connexion
  2. Créer le DataFrame avec les données données :

    data = {
        "line_race": [11, 11, 9, 10, 10, 9, 8, 9, 11, 8, 5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
        "rating": [56, 67, 66, 83, 88, 52, 66, 70, 68, 72, 65, 70, 64, 70, 70, -1, -1, -1, -1, -1, 69, -1, -1, -1, -1],
        "rw": [1.000000, 1.000000, 1.000000, 0.880678, 0.793033, 0.636655, 0.581946, 0.518825, 0.486226, 0.446667, 0.164591, 0.142409, 0.134800, 0.117803, 0.113758, 0.109852, 0.098919, 0.093168, 0.083063, 0.075171, 0.048690, 0.045404, 0.039679, 0.034160, 0.030915],
        "wrating": [56.000000, 67.000000, 66.000000, 73.096278, 69.786942, 33.106077, 38.408408, 36.317752, 33.063381, 32.160051, 10.698423, 9.968634, 8.627219, 8.246238, 7.963072, -0.109852, -0.098919, -0.093168, -0.083063, -0.075171, 3.359623, -0.045404, -0.039679, -0.034160, -0.030915],
        "line_date": ["2007-03-31", "2007-03-10", "2007-02-10", "2007-01-13", "2006-12-23", "2006-11-09", "2006-10-22", "2006-09-29", "2006-09-16", "2006-08-30", "2006-02-11", "2006-01-13", "2006-01-02", "2005-12-06", "2005-11-29", "2005-11-22", "2005-11-01", "2005-10-20", "2005-09-27", "2005-09-07", "2005-06-12", "2005-05-29", "2005-05-02", "2005-04-02", "2005-03-13", "2004-11-09"]
    }
    
    df = pd.DataFrame(data)
    Copier après la connexion
  3. Filtrer le DataFrame à l'aide de la méthode query(), ce qui est plus rapide que d'utiliser un booléen indexation :

    df_filtered = df.query("line_race != 0")
    Copier après la connexion
  4. Vous pouvez également utiliser la méthode drop() avec le paramètre inplace défini sur True :

    df.drop(df.index[df['line_race'] == 0], inplace=True)
    Copier après la connexion
  5. Le DataFrame filtré peut ensuite être affecté à la variable DataFrame d'origine ou affecté à une nouvelle variable.

Le DataFrame mis à jour ne sera plus ne contient plus de lignes où la colonne line_race est égale à 0.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal