Berbilang Pengagregatan pada Lajur Yang Sama Menggunakan Pandas GroupBy.agg()
Apabila bekerja dengan Panda, selalunya perlu melakukan berbilang pengagregatan pada lajur yang sama. Walaupun intuitif, pendekatan mudah untuk menentukan lajur yang sama beberapa kali dalam kaedah agg() tidak betul secara sintaksis. Ini menimbulkan persoalan tentang cara menggunakan fungsi pengagregatan berbeza secara berkesan dan ringkas pada satu lajur menggunakan GroupBy.agg().
Penyelesaian
Sehingga 2022-06- 20, amalan yang disyorkan untuk berbilang pengagregatan adalah menggunakan kamus sintaks:
df.groupby('dummy').agg({ 'returns': {'Mean': np.mean, 'Sum': np.sum} })
Dalam contoh ini, lajur 'pulangan' diagregatkan dengan kedua-dua fungsi min dan jumlah. DataFrame yang terhasil akan mengandungi dua lajur baharu, 'Min' dan 'Sum,' yang menunjukkan pengagregatan masing-masing.
Nota Sejarah
Sebelum penggunaan kamus sintaks, terdapat dua kaedah alternatif untuk berbilang pengagregatan:
df.groupby('dummy').agg({'returns': [np.mean, np.sum]})
Pendekatan ini menghantar fungsi sebagai senarai terus kepada agg(). DataFrame akan mengandungi dua lajur baharu dengan hasil pengagregatan min dan jumlah, masing-masing.
df.groupby('dummy').agg({'returns': {'f1': np.mean, 'f2': np.sum}})
Serupa dengan pendekatan senarai, fungsi diluluskan sebagai kamus dalam kamus. Kekunci kamus dalaman menentukan nama fungsi, manakala nilai adalah fungsi pengagregatan. DataFrame akan mempunyai lajur untuk setiap nama fungsi yang ditentukan.
Atas ialah kandungan terperinci Bagaimana untuk Melakukan Pengagregatan Berbilang pada Lajur Tunggal Menggunakan Pandas GroupBy.agg()?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!