Kemahiran pemprosesan data: Gunakan Panda untuk memadamkan lajur tertentu dalam DataFrame
Semasa analisis dan pemprosesan data, pemadaman lajur yang tidak perlu dalam DataFrame ialah salah satu keperluan biasa. Pandas ialah pustaka analisis dan pemprosesan data yang biasa digunakan dalam Python, menyediakan fungsi yang kaya dan kaedah operasi yang fleksibel. Artikel ini akan memperkenalkan cara menggunakan Panda untuk memadamkan lajur tertentu dalam DataFrame dan memberikan contoh kod khusus.
1 Pertama, kita perlu mengimport pustaka Pandas dan mencipta DataFrame untuk demonstrasi:
import pandas as pd # 创建示例DataFrame data = {'姓名': ['张三', '李四', '王五', '赵六'], '性别': ['男', '女', '男', '女'], '年龄': [25, 30, 35, 28], '成绩': [80, 90, 85, 95]} df = pd.DataFrame(data) print(df)
Dalam kod di atas, kami mencipta DataFrame yang mengandungi empat lajur nama, jantina, umur dan gred, dan mencetaknya keputusan adalah seperti berikut :
姓名 性别 年龄 成绩 0 张三 男 25 80 1 李四 女 30 90 2 王五 男 35 85 3 赵六 女 28 95
2. Seterusnya, kami akan menunjukkan cara memadam lajur tertentu dalam DataFrame menggunakan Panda.
drop
untuk memadamkan satu lajur drop
方法删除单个列# 删除单个列 df_drop = df.drop('性别', axis=1) print(df_drop)
以上代码中,我们使用drop
方法删除了DataFrame中的'性别'列,并将结果保存在新的DataFrame df_drop
中。axis=1
表示删除的是列,结果如下:
姓名 年龄 成绩 0 张三 25 80 1 李四 30 90 2 王五 35 85 3 赵六 28 95
# 删除多个列 df_drop_multi = df.drop(['年龄', '成绩'], axis=1) print(df_drop_multi)
以上代码中,我们使用drop
方法删除了DataFrame中的'年龄'和'成绩'两列,并将结果保存在新的DataFrame df_drop_multi
中,结果如下:
姓名 性别 0 张三 男 1 李四 女 2 王五 男 3 赵六 女
# 直接使用列表索引删除多个列 df_drop_iat = df[df.columns[[0, 2]]] print(df_drop_iat)
以上代码中,我们使用DataFrame的columns
属性和列表索引的方式删除了DataFrame中的'姓名'和'年龄'两列,并将结果保存在新的DataFrame df_drop_iat
中,结果如下:
姓名 年龄 0 张三 25 1 李四 30 2 王五 35 3 赵六 28
三、通过以上示例,我们学习了在使用Pandas中删除DataFrame中特定列的不同方法和技巧。这些方法的选择取决于实际需求以及个人偏好。
总结:
drop
方法删除单个或多个列,需要指定axis=1
表示删除的是列。df.columns
drop
untuk memadamkan lajur 'jantina' dalam DataFrame dan simpan hasilnya dalam Dalam DataFrame baharu df_drop
. axis=1
bermakna lajur dipadamkan Hasilnya adalah seperti berikut: drop
Kaedah memadamkan lajur 'umur' dan 'gred' dalam DataFrame dan menyimpan keputusan dalam DataFrame df_drop_multi
Hasilnya adalah seperti berikut: 🎜rrreee lajur
DataFrame dan indeks senarai untuk memadamkan 'nama' dan lajur 'umur' dalam DataFrame , dan simpan hasilnya dalam DataFrame df_drop_iat
baharu, hasilnya adalah seperti berikut: 🎜rrreee🎜 3. Melalui contoh di atas, kami telah mempelajari kaedah dan teknik yang berbeza untuk memadam lajur tertentu dalam DataFrame menggunakan Pandas. Pilihan kaedah ini bergantung kepada keperluan praktikal serta keutamaan peribadi. 🎜🎜Ringkasan: 🎜🎜🎜Gunakan kaedah drop
untuk memadamkan satu atau berbilang lajur Anda perlu menentukan axis=1
untuk menunjukkan bahawa lajur sedang dipadamkan. 🎜🎜Gunakan indeks senarai untuk memadamkan berbilang lajur Anda boleh terus memilih lajur yang perlu dikekalkan melalui sifat df.columns
. 🎜🎜Apabila memadamkan lajur, DataFrame asal tidak diubah suai, tetapi DataFrame baharu dikembalikan. 🎜🎜🎜Melalui operasi fleksibel dan fungsi kaya yang disediakan oleh Pandas, kami boleh memproses dan mengurus data dalam DataFrame dengan mudah untuk memenuhi keperluan analisis dan pemprosesan data yang berbeza. 🎜Atas ialah kandungan terperinci Teknik pemprosesan data untuk memadamkan lajur tertentu dalam DataFrame menggunakan Panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!