So summieren Sie DataFrame-Zeilen für bestimmte Spalten in Pandas
Bei der Arbeit mit DataFrames kann es vorkommen, dass wir neue hinzufügen müssen Spalte, die die Summe der Werte aus mehreren vorhandenen Spalten darstellt. Bei dieser Frage stößt der Benutzer auf ein Problem, während er versucht, eine neue Spalte „e“ zu erstellen, die die Werte aus den Spalten „a“, „b“ und „d“ in einem DataFrame summiert.
Die Initiale des Benutzers Ansatz mit df[['a', 'b', 'd']].map(sum) war erfolglos. Um Zeilen für bestimmte Spalten in Pandas korrekt zu summieren, können wir die Funktion sum() verwenden, wobei der Achsenparameter auf 1 gesetzt ist. Dies bedeutet, dass wir die Zeilen und nicht die Spalten summieren möchten.
df['e'] = df.sum(axis=1, numeric_only=True)
In In Pandas-Versionen vor 2.0 können wir einfach axis=1 ohne numeric_only=True angeben. In späteren Versionen werden jedoch nicht numerische Spalten ignoriert, wenn numeric_only=True angegeben ist.
Wenn das Ziel darin besteht, bestimmte Spalten zu summieren, können wir eine Liste der gewünschten Spalten erstellen und sum() mit axis verwenden =1, um die Zeilensummen für diese Teilmenge von Spalten zu berechnen.
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
Durch Befolgen dieser Schritte können wir erfolgreich eine neue Spalte „e“ hinzufügen, die die Zeilensummen für eine beliebige Kombination von enthält numerische Spalten in einem DataFrame.
Das obige ist der detaillierte Inhalt vonWie summiere ich Zeilen für bestimmte Spalten in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!