Penggantian Nilai Bersyarat dalam Panda
Apabila bekerja dengan DataFrames dalam Pandas, selalunya perlu mengubah suai nilai secara terpilih berdasarkan syarat tertentu. Satu tugas biasa ialah menggantikan nilai dalam lajur tertentu yang melebihi ambang tertentu.
Percubaan sebelumnya menggunakan df[df.my_channel > 20000].my_channel = 0 sintaks terbukti tidak berjaya apabila sebahagian daripada DataFrame asal. Ini disebabkan oleh perubahan pengindeksan yang diperkenalkan dalam Pandas 0.20.0, yang menamatkan pengindeks .ix.
Untuk membetulkannya, kami boleh menggunakan pengindeks .loc, yang menawarkan kaedah alternatif untuk mengakses dan mengubah suai baris dan lajur berdasarkan syarat.
mask = df.my_channel > 20000 column_name = 'my_channel' df.loc[mask, column_name] = 0
Kod ini mencapai hasil yang diingini dengan mencipta topeng Boolean dahulu (mask) di mana setiap nilai sepadan dengan sama ada nilai yang sepadan dalam lajur df.my_channel melebihi 20000. Kami kemudian menggunakan .loc untuk memilih baris yang topeng memegang True dan tetapkan nilai 0 pada lajur_nama_lajur.
Sebagai alternatif, coretan kod satu baris berikut boleh digunakan:
df.loc[df.my_channel > 20000, 'my_channel'] = 0
Dalam ini kes, adalah penting untuk menggunakan .loc dan bukannya .iloc (pengindeksan berasaskan lokasi integer) untuk mengelakkan NotImplementedError.
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai dengan Cekap dalam Pandas DataFrames Berdasarkan Ambang Bersyarat?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!