Dalam Panda, subset DataFrame berdasarkan nilai tertentu adalah mudah, seperti yang ditunjukkan oleh contoh berikut:
import pandas as pd # Dataframe initialization df = pd.DataFrame({'A': [5, 6, 3, 4], 'B': [1, 2, 3, 5]}) # Subset based on a single value x = df[df['A'] == 3]
Walau bagaimanapun, cabaran timbul apabila memilih baris yang sepadan dengan senarai nilai. Pertimbangkan kes penggunaan berikut:
# List of values to filter on list_of_values = [3, 6] # Subset attempt (incorrect syntax) y = df[df['A'] in list_of_values]
Sintaks ini akan mengakibatkan ralat, kerana Pandas memerlukan sintaks yang sedikit berbeza untuk subset berdasarkan berbilang nilai.
Cara yang betul untuk mensubset DataFrame berdasarkan senarai nilai adalah dengan menggunakan kaedah isin(). Berikut ialah kod yang diperbetulkan:
y = df[df['A'].isin(list_of_values)]
Output:
A B 1 6 2 2 3 3
Kaedah isin() mengambil senarai atau tatasusunan nilai sebagai input dan mengembalikan DataFrame yang mengandungi baris di mana lajur yang ditentukan sepadan sebarang nilai dalam input.
Untuk memilih baris di mana nilai lajur tidak sepadan dengan senarai yang dibekalkan, anda boleh menggunakan operator ~ bersama isin(). Contohnya:
# Inverse subset z = df[~df['A'].isin(list_of_values)]
Output:
A B 0 5 1 3 4 5
Atas ialah kandungan terperinci Bagaimana untuk Subset DataFrame Pandas Berdasarkan Berbilang Nilai?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!