Menggabungkan Lajur panda dengan Tong Tersuai dan Kiraan Nilai
Apabila bekerja dengan data berangka, selalunya berguna untuk mengumpulkan nilai ke dalam tong untuk mengesan corak atau trend. Proses ini, yang dikenali sebagai binning, boleh dilakukan dengan mudah menggunakan perpustakaan panda.
Untuk bin lajur, anda boleh menggunakan fungsi pandas.cut. Begini cara ia berfungsi dalam contoh yang anda berikan:
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
Kod ini mencipta lajur baharu yang dipanggil binned dalam DataFrame anda. Setiap nilai dalam lajur ini mewakili tong yang mempunyai nilai angka yang sepadan dalam lajur peratusan. Parameter tong sampah menentukan sempadan tong.
Untuk menggambarkan pengedaran nilai merentas tong, anda boleh menggunakan fungsi value_counts:
df['binned'].value_counts()
Kod ini akan mengembalikan bilangan kejadian setiap tong, dengan berkesan memberikan kiraan nilai untuk tong sampah.
Sebagai contoh, jika anda mempunyai perkara berikut data:
df['percentage'].head() 46.5 44.2 100.0 42.12
Dan anda menggunakan tong sampah berikut:
bins = [0, 1, 5, 10, 25, 50, 100]
Keluaran df['binned'].value_counts() ialah:
(25, 50] 3 (50, 100] 1
Ini bermakna bahawa tiga nilai berada dalam tong sampah (25, 50] dan satu nilai berada dalam tong sampah (50, 100].
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengosongkan Lajur Pandas dengan Tong Tersuai dan Mendapat Kiraan Nilai?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!