Heim > Backend-Entwicklung > Python-Tutorial > Wie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?

Wie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?

Barbara Streisand
Freigeben: 2024-12-08 05:53:10
Original
520 Leute haben es durchsucht

How to Apply Multiple Functions to Multiple Columns in Pandas GroupBy?

So wenden Sie mehrere Funktionen auf mehrere gruppierte Spalten an

Groupby-Operationen in Pandas ermöglichen die Aggregation von Daten basierend auf bestimmten Spalten oder Schlüsseln. Bei der Arbeit mit komplexen Datensätzen kann es jedoch erforderlich sein, mehrere Vorgänge für verschiedene Spalten innerhalb der gruppierten Daten durchzuführen.

Verwenden eines Wörterbuchs für Reihengruppierungen

Für ein Series-Groupby-Objekt können Sie ein Wörterbuch verwenden, um mehrere Funktionen und Ausgabespaltennamen anzugeben, wie unten gezeigt:

grouped['D'].agg({'result1' : np.sum,
   .....:                   'result2' : np.mean})
Nach dem Login kopieren

Bei diesem Ansatz ist dies jedoch nicht der Fall funktioniert für DataFrame-Gruppierungsobjekte, da erwartet wird, dass die Wörterbuchschlüssel Spaltennamen zum Anwenden von Funktionen darstellen.

Benutzerdefinierte Funktionen mit Apply

Um diese Einschränkung zu beheben, können Sie Folgendes nutzen die apply-Methode, die implizit einen DataFrame an die angewendete Funktion übergibt. Indem Sie eine benutzerdefinierte Funktion definieren und eine Serie oder MultiIndex-Serie zurückgeben, können Sie mehrere Vorgänge für mehrere Spalten innerhalb jeder Gruppe ausführen:

Eine Serie zurückgeben:

def f(x):
    d = {}
    d['a_sum'] = x['a'].sum()
    d['a_max'] = x['a'].max()
    d['b_mean'] = x['b'].mean()
    d['c_d_prodsum'] = (x['c'] * x['d']).sum()
    return pd.Series(d, index=['a_sum', 'a_max', 'b_mean', 'c_d_prodsum'])

df.groupby('group').apply(f)
Nach dem Login kopieren

Eine Serie mit MultiIndex zurückgeben:

def f_mi(x):
        d = []
        d.append(x['a'].sum())
        d.append(x['a'].max())
        d.append(x['b'].mean())
        d.append((x['c'] * x['d']).sum())
        return pd.Series(d, index=[['a', 'a', 'b', 'c_d'], 
                                   ['sum', 'max', 'mean', 'prodsum']])

df.groupby('group').apply(f_mi)
Nach dem Login kopieren

Dieser Ansatz bietet eine flexible Möglichkeit, komplexe Aggregationen durchzuführen gruppierte Daten, was mehrere Vorgänge für mehrere Spalten innerhalb jeder Gruppe ermöglicht.

Das obige ist der detaillierte Inhalt vonWie wende ich mehrere Funktionen auf mehrere Spalten in Pandas GroupBy an?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage