Cara mudah untuk membaca fail Excel menggunakan Pandas
Dalam analisis dan pemprosesan data, selalunya perlu membaca data daripada fail Excel dan melakukan pelbagai operasi. Pandas ialah perpustakaan analisis data Python yang berkuasa yang menyediakan cara yang mudah dan mudah untuk membaca fail Excel. Artikel ini akan memperkenalkan cara menggunakan Panda untuk membaca fail Excel dan memberikan contoh kod khusus.
Sebelum bermula, pastikan anda telah memasang pustaka Pandas. Panda boleh dipasang menggunakan kod berikut:
pip install pandas
Seterusnya, kami menganggap bahawa terdapat fail Excel bernama "example.xlsx", yang mengandungi lembaran kerja bernama "Sheet1". Dalam lembaran kerja ini, terdapat beberapa data termasuk nama, umur dan jantina. Kami akan membaca data daripada fail Excel ini.
Mula-mula, mari import pustaka Pandas dan baca fail Excel:
import pandas as pd df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
Dalam kod di atas, kami menggunakan fungsi read_excel
untuk membaca fail Excel. Antaranya, example.xlsx
ialah nama fail bagi fail Excel untuk dibaca dan sheet_name='Sheet1'
ialah nama lembaran kerja yang akan dibaca. Jika parameter sheet_name
tidak ditentukan, lembaran kerja pertama akan dibaca secara lalai. read_excel
函数来读取Excel文件。其中,example.xlsx
是要读取的Excel文件的文件名,sheet_name='Sheet1'
是要读取的工作表的名称。如果不指定sheet_name
参数,则默认读取第一个工作表。
读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df
中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。
现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。
查看前几行的数据:
print(df.head())
获取某列的数据:
name_column = df['姓名'] print(name_column)
筛选数据:
filtered_data = df[df['年龄'] > 30] print(filtered_data)
上面的代码中,df.head()
将显示DataFrame的前几行数据,默认显示前5行。df['姓名']
将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]
将根据"年龄"列的条件筛选出符合条件的数据。
除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:
将DataFrame写入Excel文件:
df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)
上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False
以不包含行索引。
添加新的工作表到现有的Excel文件:
with pd.ExcelWriter('example.xlsx', mode='a') as writer: df.to_excel(writer, sheet_name='Sheet2', index=False)
上面的代码使用pd.ExcelWriter
将DataFrame写入到现有的Excel文件中,并设置mode='a'
以追加写入。df.to_excel()
df
dalam bentuk DataFrame. DataFrame ialah susunan dua dimensi label, serupa dengan jadual dalam Excel. Nama setiap lajur dipanggil label lajur, dan indeks setiap baris dipanggil label baris. Kini, kami boleh melakukan pelbagai operasi pada data yang dibaca, seperti melihat data beberapa baris pertama, mendapatkan data lajur tertentu, menapis data, dsb.
df.head()
akan memaparkan beberapa baris pertama data DataFrame dan 5 baris pertama akan dipaparkan secara lalai. df['Name']
akan mendapat data untuk lajur bernama "Nama", manakala df[df['Umur'] > 30]
akan mendapat data berdasarkan pada Lajur "Umur" syarat menapis data yang memenuhi syarat. 🎜🎜Selain membaca fail Excel, Pandas juga menyediakan beberapa kaedah lain untuk memproses fail Excel, seperti menulis data ke fail Excel, menambah lembaran kerja baharu, dsb. Berikut ialah beberapa kaedah yang biasa digunakan: 🎜index=False
untuk tidak memasukkan indeks baris. 🎜🎜pd.ExcelWriter
untuk menulis DataFrame ke dalam fail Excel sedia ada dan menetapkan mode=' a' untuk menambahkan tulisan. Kaedah df.to_excel()
menulis DataFrame ke dalam lembaran kerja "Sheet2". 🎜🎜🎜🎜Dengan menggunakan Pandas, kami boleh membaca dan memproses fail Excel dengan mudah, serta dapat melakukan pelbagai operasi untuk menjadikan analisis dan pemprosesan data lebih cekap dan mudah. Di atas ialah pengenalan dan contoh kod kaedah mudah untuk membaca fail Excel menggunakan Pandas. Harap ini membantu! 🎜Atas ialah kandungan terperinci Kaedah Pandas untuk membaca fail Excel dengan cepat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!