Cara menggunakan panda untuk membaca fail CSV dan melakukan pemprosesan data
pandas ialah alat pemprosesan dan analisis data yang berkuasa yang menyediakan fungsi untuk membaca, memanipulasi dan menganalisis data dalam pelbagai format. Dalam artikel ini, kami akan memperkenalkan cara membaca fail CSV dan melakukan pemprosesan data menggunakan panda.
Pertama, pastikan anda telah memasang perpustakaan panda. Jika ia belum dipasang, anda boleh memasangnya dengan menjalankan arahan berikut dalam terminal:
pip install pandas
Seterusnya, kami akan menunjukkan menggunakan contoh fail CSV berikut:
name,age,city John,30,New York Alice,25,Los Angeles Bob,35,Chicago
Sekarang, mari kita mula menulis kod untuk membaca fail dan memproses data.
Mula-mula, import perpustakaan panda:
import pandas as pd
Kemudian, baca fail CSV menggunakan fungsi read_csv()
: read_csv()
函数读取CSV文件:
df = pd.read_csv('data.csv')
这将创建一个名为df
的pandas DataFrame对象来存储CSV文件的内容。
如果你想查看读取的数据,可以使用head()
函数来显示前几行数据:
print(df.head())
接下来,让我们介绍一些常用的数据处理操作。
name_column = df['name'] age_column = df['age']
loc
或iloc
函数:row_0 = df.loc[0] # 使用索引选择第一行数据 row_1 = df.iloc[1] # 使用位置选择第二行数据
filtered_data = df[df['age'] > 30] # 筛选年龄大于30的数据
insert()
函数添加新的列:df.insert(3, 'country', ['USA', 'USA', 'USA']) # 添加一个名为'country'的列,所有行的值都是'USA'
drop()
函数:df = df.drop('city', axis=1) # 删除名为'city'的列
df.loc[0, 'age'] = 31 # 修改第一行'age'列的值为31 df['age'] = df['age'] + 1 # 将'age'列的所有值加1
这些只是pandas提供的许多数据处理操作中的一部分。根据你的具体需求,还可以执行其他操作,如排序数据、合并数据和计算统计信息等。
最后,将数据保存到新的CSV文件中,可以使用to_csv()
df.to_csv('new_data.csv', index=False) # 将数据保存到名为'new_data.csv'的文件中,不包含行索引
df
Objek untuk menyimpan kandungan fail CSV. Jika anda ingin melihat data yang dibaca, anda boleh menggunakan fungsi head()
untuk memaparkan beberapa baris pertama data: rrreee
Seterusnya, izinkan kami memperkenalkan beberapa operasi pemprosesan data biasa. 🎜loc
atau iloc
: insert()
Fungsi untuk menambah lajur baharu:drop()
Fungsi: to_csv()
: 🎜rrreee🎜Ini ialah kaedah asas dan beberapa operasi biasa menggunakan panda untuk membaca fail CSV dan melaksanakan pemprosesan data. Dengan operasi ini, anda boleh memproses dan menganalisis data dengan mudah dalam pelbagai format yang berbeza. 🎜🎜Saya harap artikel ini membantu anda dan saya doakan anda berjaya dalam pemprosesan data dan perjalanan analisis anda! 🎜Atas ialah kandungan terperinci Cara membaca dan memanipulasi data CSV menggunakan perpustakaan panda Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!