Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk menapis data dalam panda

Bagaimana untuk menapis data dalam panda

百草
Lepaskan: 2023-11-22 10:36:26
asal
1988 orang telah melayarinya

Kaedah untuk menapis data panda: 1. Import perpustakaan Pandas 3. Tapis data 5. Kumpulkan dan agregat data; Pengenalan terperinci: 1. Import pustaka Pandas Mula-mula, pastikan pustaka Pandas dipasang Jika ia tidak dipasang, anda boleh menggunakan arahan "pip install panda" untuk memasangnya, dan kemudian anda boleh menggunakan "import panda sebagai. pd" untuk mengimport pustaka Pandas; 2. Baca data , menggunakan pustaka Pandas dan banyak lagi.

Bagaimana untuk menapis data dalam panda

Sistem pengendalian tutorial ini: sistem Windows 10, komputer DELL G3.

Pandas ialah perpustakaan analisis data Python yang popular yang menyediakan banyak ciri berkuasa yang membolehkan anda menapis, memproses dan menganalisis data dengan mudah. Berikut ialah beberapa cara biasa untuk menggunakan Pandas untuk menapis data:

1 Import pustaka Pandas

Pertama, pastikan pustaka Pandas dipasang. Jika ia tidak dipasang, anda boleh menggunakan arahan berikut untuk memasangnya:

pip install pandas
Salin selepas log masuk

Kemudian, import pustaka Pandas:

import pandas as pd
Salin selepas log masuk

2. Baca data

Gunakan fungsi read_csv() dalam pustaka Pandas untuk membaca fail CSV , dan fungsi read_excel() untuk membaca fail Excel, dsb. Contohnya, baca fail CSV bernama data.csv:

df = pd.read_csv('data.csv')
Salin selepas log masuk

3. Tapis data

Pandas menyediakan pelbagai kaedah untuk menapis data. Berikut ialah beberapa kaedah biasa:

(1) Penapisan berdasarkan syarat

Gunakan atribut loc dan iloc serta operator logik (seperti &, |, ~, dll.) untuk menapis data. Contohnya, untuk menapis data yang umurnya lebih besar daripada atau bersamaan dengan 18 tahun dan jantinanya perempuan:

df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
Salin selepas log masuk

(2) Penapisan berdasarkan teg

Gunakan atribut loc untuk menapis data untuk teg tertentu. Contohnya, tapis data dengan nama keluarga "Zhang":

df.loc[df['last_name'] == '张']
Salin selepas log masuk

(3) Tapis mengikut julat

Gunakan atribut loc untuk menapis data dalam julat tertentu. Contohnya, tapis data antara umur 18 dan 30:

df.loc[(df[&#39;age&#39;] >= 18) & (df[&#39;age&#39;] <= 30)]
Salin selepas log masuk

(4) Tapis mengikut berbilang syarat

Gunakan kaedah pertanyaan untuk menapis data yang memenuhi berbilang syarat. Contohnya, untuk menapis data yang umurnya lebih besar daripada atau sama dengan 18 tahun dan jantinanya ialah perempuan:

df.query(&#39;age >= 18 & gender == "female"&#39;)
Salin selepas log masuk

4 Isih data

Gunakan kaedah sort_values() untuk mengisih data. Sebagai contoh, susun mengikut umur dalam tertib menaik:

df.sort_values(&#39;age&#39;, ascending=True)
Salin selepas log masuk

5 Kumpulkan dan agregat data

Gunakan kaedah groupby() untuk mengumpulkan data dan gunakan fungsi agregat (seperti jumlah(), min(), count(). , dsb.) untuk mengumpulkan setiap kumpulan Buat pengiraan. Sebagai contoh, hitung purata umur setiap kumpulan jantina:

df.groupby(&#39;gender&#39;).mean()[&#39;age&#39;]
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk menapis data dalam panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan