Panda Membentuk Semula Panjang ke Lebar dengan Dua Pembolehubah
Memanipulasi data antara format panjang dan lebar ialah tugas biasa dalam analisis data. Dalam pustaka Pandas Python, operasi lebur dan tindanan/nyahtindan biasanya digunakan untuk tujuan ini. Walau bagaimanapun, senario tertentu mungkin timbul apabila pendekatan yang lebih mudah diingini.
Satu senario sedemikian ialah apabila membentuk semula data yang merangkumi dua pembolehubah (cth., pembolehubah berangka seperti jualan dan pembolehubah kategori seperti produk) ke dalam format yang luas . Menggunakan kaedah cair/tindan/nyahtindan sahaja mungkin tidak memberikan output yang diingini.
Dalam contoh ini, kami mempunyai data "panjang" dengan lajur berikut: Jurujual, Ketinggian, produk dan harga. Matlamat kami adalah untuk membentuk semula data ini ke dalam format "luas" dengan lajur untuk setiap produk unik, termasuk harga sepadannya.
Salesman Height product price Knut 6 bat 5 Knut 6 ball 1 Knut 6 wand 3 Steve 5 pen 2
Untuk mencapainya, kami boleh memanfaatkan fungsi pangsi Pandas, yang menyediakan kemudahan yang mudah cara untuk membuat jadual pangsi. Kami menentukan lajur indeks (Jurujual), lajur pangsi (obs) dan lajur nilai (harga).
Berikut ialah kod Python untuk membentuk semula data:
<code class="python">wide_df = df.pivot(index='Salesman', columns='product', values='price')</code>
Ini akan menghasilkan format "lebar" yang dikehendaki:
Salesman Height product_1 price_1 product_2 price_2 product_3 price_3 Knut 6 bat 5 ball 1 wand 3 Steve 5 pen 2 NA NA NA NA
Atas ialah kandungan terperinci Bagaimana untuk Membentuk Semula Data Panjang ke Lebar dalam Panda Menggunakan Dua Pembolehubah?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!