Menggabungkan Lajur dengan panda untuk Mendapatkan Kiraan Nilai
Apabila berurusan dengan data berangka dalam bingkai data panda, ia boleh berguna untuk bin data ke dalam julat khusus untuk dianalisis. Proses ini dikenali sebagai binning.
Untuk mengosongkan lajur dalam panda, anda boleh menggunakan langkah berikut:
Contoh:
Pertimbangkan bingkai data berikut dengan lajur angka bernama 'peratusan':
import pandas as pd import numpy as np df = pd.DataFrame({'percentage': [46.5, 44.2, 100.0, 42.12]})
Untuk bin lajur 'peratusan' ke dalam tong berikut:
bins = [0, 1, 5, 10, 25, 50, 100]
Anda boleh menggunakan fungsi potong sebagai berikut:
df['binned'] = pd.cut(df['percentage'], bins=bins)
Ini akan mencipta lajur baharu yang dipanggil 'binned' dalam bingkai data yang mengandungi label tong.
Untuk mendapatkan kiraan nilai dalam setiap tong, anda boleh menggunakan kaedah value_counts:
print(df['binned'].value_counts())
Output:
(25, 50] 3 (50, 100] 1
Sebagai alternatif, anda boleh menggunakan groupby dan agregat saiz:
print(df.groupby(df['binned']).size())
Output:
percentage (0, 1] 0 (1, 5] 0 (5, 10] 0 (10, 25] 0 (25, 50] 3 (50, 100] 1 dtype: int64
Ini memberikan anda kiraan nilai dalam setiap tong.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membuang Data Berangka dalam Bingkai Data Pandas dan Mengira Nilai dalam Setiap Tong?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!