Suppression des valeurs nulles d'une colonne Pandas DataFrame
Pour supprimer des lignes d'un Pandas DataFrame en fonction de valeurs nulles dans une colonne spécifique, suivez ces étapes :
1. Identifiez la colonne :
Déterminez la ou les colonnes de votre DataFrame contenant les valeurs nulles que vous souhaitez supprimer. Dans ce cas, il s'agit de la colonne "EPS".
2. Utilisez la méthode dropna() :
La méthode dropna() vous permet de supprimer des lignes en fonction de conditions spécifiques. Pour supprimer les lignes où la colonne "EPS" est nulle, utilisez la syntaxe suivante :
df = df.dropna(subset=['EPS'])
3. Facultatif : Spécifiez l'axe (lignes et colonnes) :
Par défaut, dropna() supprime les lignes avec des valeurs nulles. Si vous souhaitez supprimer des colonnes à la place, spécifiez axis=1 comme argument supplémentaire :
df = df.dropna(subset=['EPS'], axis=1)
Exemple :
Considérez le DataFrame fourni dans la question :
df = pd.DataFrame({ 'STK_ID': [601166, 600036, 600016, 601009, 601939, 000001], 'EPS': [np.nan, np.nan, 4.3, np.nan, 2.5, np.nan], 'cash': [np.nan, 12, np.nan, np.nan, np.nan, np.nan] })
L'application de la méthode dropna() donne le DataFrame suivant :
df.dropna(subset=['EPS']) STK_ID EPS cash 0 600016 4.3 NaN 1 601939 2.5 NaN
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!