Auswählen mehrerer Spalten in einem Pandas-Datenrahmen
Bei der Arbeit mit Datenrahmen besteht häufig die Notwendigkeit, bestimmte Spalten auszuwählen. In Pandas gibt es mehrere Möglichkeiten, dies zu erreichen.
Ein häufiges Missverständnis besteht darin, Spalten mithilfe von Slicing auszuwählen:
df1 = df['a':'b']
Dieser Ansatz funktioniert nicht, da Spaltennamen nicht direkt in Slices unterteilt werden können . Stattdessen gibt es zwei praktikable Optionen:
1. Selektiver Spaltenabruf nach Namen:
Diese Methode beinhaltet die Übergabe einer Liste von Spaltennamen an den []-Operator:
import pandas as pd df = pd.DataFrame({ 'a': [2, 3], 'b': [3, 4], 'c': [4, 5], }) df1 = df[['a', 'b']]
2. Indizierung nach Spaltenposition:
Wenn die Spaltenpositionen im Voraus bekannt sind, können Sie iloc verwenden, um Spalten nach Index auszuwählen:
df1 = df.iloc[:, 0:2] # Remember that slicing is exclusive of the ending index
Zusätzliche Tipps:
{df.columns.get_loc(c): c for idx, c in enumerate(df.columns)}
df1 = df.iloc[:, 0:2].copy()
Das obige ist der detaillierte Inhalt vonWie wähle ich mehrere Spalten aus einem Pandas-DataFrame aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!