Wie teilt man eine Datenrahmen-String-Spalte in zwei Spalten auf?
Im Bereich der Datenanalyse stößt man auf Datenrahmen mit String-Spalten, die dies erfordern gespalten zu sein, kommt häufig vor. Um dieses Kunststück zu erreichen, stellen sich zwei wesentliche Fragen:
Die Lösung liegt im vielseitigen str-Attribut einer Pandas-Serie, insbesondere in ihrer Indizierung Schnittstelle:
df['AB'].str[0] # accesses the first element of each string df['AB'].str[1] # accesses the second element of each string
Durch die Nutzung dieser Indizierungsschnittstelle und des Tupel-Entpackens können wir neue Spalten mit den geteilten Elementen erstellen:
df['A'], df['B'] = df['AB'].str.split('-').str
Alternativ bietet Pandas eine praktische integrierte Methode, str.split(), um Zeichenfolgen aufzuteilen und automatisch eine Reihe von Listen zurückzugeben:
df['AB_split'] = df['AB'].str.split('-')
Um diese Liste in separate Spalten zu erweitern, verwenden wir der expand=True-Parameter:
df[['A', 'B']] = df['AB'].str.split(' ', n=1, expand=True)
Bei Fällen mit unterschiedlichen Teilungslängen geht expand=True elegant damit um und stellt konsistente Spaltenlängen sicher:
df.join(df['AB'].str.split('-', expand=True).rename(columns={0:'A', 1:'B', 2:'C'}))
Mit diesen Techniken unterstützt Sie Pandas um String-Spalten effizient aufzuteilen und Ihren Datenrahmen neu zu strukturieren, um Ihren spezifischen Analyseanforderungen gerecht zu werden.
Das obige ist der detaillierte Inhalt vonWie kann ich eine Pandas DataFrame-String-Spalte in mehrere Spalten aufteilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!