Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich Pandas-DataFrame-String-Einträge in separate Zeilen auflösen (aufteilen)?

Wie kann ich Pandas-DataFrame-String-Einträge in separate Zeilen auflösen (aufteilen)?

Susan Sarandon
Freigeben: 2024-12-21 05:26:14
Original
614 Leute haben es durchsucht

How to Explode (Split) Pandas DataFrame String Entries into Separate Rows?

Pandas-DataFrame-String-Einträge in separate Zeilen auflösen (aufteilen)

In Pandas besteht eine häufige Anforderung darin, durch Kommas getrennte Werte in a aufzuteilen Textzeichenfolgespalte und erstellen Sie für jeden Eintrag eine neue Zeile. Dies kann durch verschiedene Methoden erreicht werden.

Verwendung von Series.explode() oder DataFrame.explode()

Für Pandas-Versionen 0.25.0 und höher ist die Serie. Die Methoden explosion() und DataFrame.explode() bieten eine praktische Möglichkeit, CSV-ähnliche Spalten aufzulösen:

Für einzelne Spalten:

df.explode('column_name')
Nach dem Login kopieren

Für mehrere Spalten:

df.explode(['column1', 'column2'])  # Pandas 1.3.0+
Nach dem Login kopieren

Generische vektorisierte Funktion

Eine weitere Es wird ein vielseitiger vektorisierter Ansatz bereitgestellt, der sowohl für normale als auch für Listenspalten funktioniert unten:

def explode(df, lst_cols, fill_value='', preserve_index=False):
    # Convert CSV string columns to list columns
    for col in lst_cols:
        df[col] = df[col].str.split(',')

    # Extract all non-list columns
    idx_cols = df.columns.difference(lst_cols)

    # Calculate list lengths
    lens = df[lst_cols[0]].str.len()

    # Create exploded DataFrame
    result = (pd.DataFrame({
        col: np.repeat(df[col].values, lens)
        for col in idx_cols
    }, index=np.repeat(df.index.values, lens))
        .assign(**{col: np.concatenate(df.loc[lens>0, col].values)
                    for col in lst_cols}))

    # Handle empty list rows
    if (lens == 0).any():
        result = result.append(df.loc[lens==0, idx_cols], sort=False).fillna(fill_value)

    # Revert index order and reset index if requested
    result = result.sort_index()
    if not preserve_index:
        result = result.reset_index(drop=True)

    return result
Nach dem Login kopieren

Anwendungen

CSV-Spalte:

df['var1'] = df['var1'].str.split(',')
Nach dem Login kopieren

Mehrere Listenspalten:

explode(df, ['num', 'text'], fill_value='')
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie kann ich Pandas-DataFrame-String-Einträge in separate Zeilen auflösen (aufteilen)?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage