Pandas DataFrame-Zeilen mit fehlenden Werten in einer bestimmten Spalte löschen
Bei der Datenanalyse ist es oft notwendig, mit fehlenden Werten umzugehen. Eine häufige Aufgabe besteht darin, Zeilen mit fehlenden Werten in einer bestimmten Spalte zu entfernen. Betrachten Sie beispielsweise den folgenden DataFrame:
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
Um einen DataFrame nur mit Zeilen zu erhalten, in denen die Spalte „EPS“ nicht null ist, können wir die folgende Methode verwenden:
df = df[df['EPS'].notna()]
Dieser Ausdruck wählt alle Zeilen aus, in denen die Spalte „EPS“ nicht null ist, und weist das Ergebnis dem neuen DataFrame df zu. Das Ergebnis ist wie folgt:
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
Durch die Verwendung der notna()-Methode können wir fehlende Werte in der angegebenen Spalte effektiv herausfiltern und einen DataFrame erstellen, der nur die Zeilen von Interesse enthält.
Das obige ist der detaillierte Inhalt vonWie entferne ich Zeilen mit fehlenden Werten in einer bestimmten Pandas DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!