Sous-ensemble de dataframes Pandas en fonction d'une liste de valeurs
La sélection de lignes dans une trame de données Pandas en fonction d'une valeur spécifique est simple à l'aide de l'opérateur d'égalité . Toutefois, lorsqu’il s’agit de valeurs multiples, une approche plus flexible est nécessaire. Cet article explique comment sous-ensembler un dataframe à l'aide d'une liste de valeurs.
Problème :
Considérez le dataframe suivant :
df = DataFrame({'A': [5,6,3,4], 'B': [1,2,3,5]}) df A B 0 5 1 1 6 2 2 3 3 3 4 5
Nous voulons pour sélectionner les lignes où la colonne « A » correspond aux valeurs d'une liste donnée, telle que [3, 6] :
list_of_values = [3, 6] y = df[df['A'] in list_of_values]
Solution :
La méthode isin du dataframe fournit un moyen pratique d'y parvenir :
df[df['A'].isin([3, 6])]
Ceci renvoie les lignes suivantes :
A B 1 6 2 2 3 3
Pour la sélection inverse, en excluant les lignes avec des valeurs dans la liste donnée, utilisez le ~ opérateur :
df[~df['A'].isin([3, 6])]
Cela renvoie les lignes restantes :
A B 0 5 1 3 4 5
En utilisant la méthode isin, vous pouvez facilement sélectionner ou exclure des lignes en fonction d'une liste de valeurs, offrant une solution plus polyvalente pour l'extraction de données à partir des dataframes Pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!