Tutorial Pandas: Penjelasan terperinci tentang cara menggunakan perpustakaan ini untuk membaca fail Excel, contoh kod khusus diperlukan
Pandas ialah perpustakaan pemprosesan data yang biasa digunakan dengan banyak fungsi yang berkuasa, terutamanya dalam pemprosesan data. Dalam proses pemprosesan data sebenar, selalunya perlu membaca fail Excel. Artikel ini akan menerangkan secara terperinci cara menggunakan pustaka Pandas untuk membaca fail Excel dan memberikan contoh kod khusus.
Untuk menggunakan perpustakaan Pandas, anda perlu mengimport perpustakaan terlebih dahulu:
import pandas as pd
Antaranya, pd adalah alias perpustakaan Pandas, yang memudahkan penggunaan kaedah berkaitan Pandas.
Sangat mudah menggunakan Panda untuk membaca fail Excel Ia hanya memerlukan satu baris kod:
data = pd.read_excel('file_name.xlsx')
Antaranya, nama_file.xlsx ialah nama fail Excel, yang terdapat dalam direktori yang sama dengan skrip Python Down.
Jika fail Excel tidak berada dalam direktori yang sama, anda perlu menentukan laluan lengkap, contohnya:
data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')
Selepas membaca fail Excel, anda boleh melihat data dalam fail melalui kaedah berikut:
print(data.head())
head () kaedah untuk melihat fail Excel 5 baris pertama data. Jika anda perlu melihat lebih banyak baris, anda boleh menukar nombor dalam kurungan kepada bilangan baris yang anda perlu lihat, contohnya:
print(data.head(10))
Apabila fail Excel mengandungi berbilang jadual, anda perlu nyatakan yang diperlukan Jadual yang hendak dibaca, contohnya:
data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')
Antaranya, sheet_name digunakan untuk menyatakan nama jadual yang perlu dibaca. Jika anda perlu membaca berbilang helaian, anda boleh menukar sheet_name kepada senarai, contohnya:
data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])
Dengan cara ini, data Helaian1 dan Helaian2 boleh dibaca pada satu masa dan disimpan dalam kamus.
Apabila terdapat banyak data dalam jadual Excel, kadangkala kita hanya perlu membaca beberapa baris atau lajur, yang boleh dicapai menggunakan kaedah loc dan iloc Pandas:
kaedah loc boleh Membaca data baris atau lajur yang ditentukan, contohnya seperti berikut:
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.loc[2]) # 读取名称为 'column_name' 的列数据 print(data.loc[:, 'column_name']) # 读取第 3 行、名称为 'column_name' 的数据 print(data.loc[2, 'column_name'])
kaedah iloc boleh membaca data baris atau lajur yang ditentukan, tetapi ia perlu menggunakan indeks kedudukan integer, contohnya seperti berikut:
data = pd.read_excel('file_name.xlsx') # 读取第 3 行数据 print(data.iloc[2]) # 读取第 3 行、第 4 列数据 print(data.iloc[2, 3]) # 读取第 2-4 行、第 1-3 列的数据 print(data.iloc[1:4, 0:3])
Dalam proses membaca fail Excel, kadangkala anda perlu mendapatkan nama lajur dalam fail Excel Anda boleh menggunakan kaedah berikut:
data = pd.read_excel('file_name.xlsx') # 读取所有列名 print(data.columns.values) # 读取第 3 列的列名 print(data.columns.values[2])
Antaranya , columns.values digunakan untuk mengembalikan senarai nama lajur. Dalam Python, senarai indeks bermula dari 0.
Selain membaca fail Excel, Pandas juga menyediakan kaedah untuk menulis data ke fail Excel. Contohnya adalah seperti berikut:
data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]}) # 将数据写入名为 'MySheet' 的表格中 data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)
Antaranya, kaedah to_excel() digunakan untuk menulis data ke fail Excel Parameter pertama ialah nama fail Excel, dan parameter kedua ialah nama jadual yang akan ditulis. index=False bermakna tiada penulisan diperlukan lajur Indeks.
Artikel ini terutamanya memperkenalkan cara menggunakan perpustakaan Pandas untuk membaca fail Excel dan menyediakan contoh kod khusus. Sudah tentu, Panda mempunyai banyak fungsi lain, yang boleh difahami dengan lebih lanjut dalam pemprosesan data harian.
Atas ialah kandungan terperinci tutorial panda: Penjelasan terperinci tentang cara menggunakan perpustakaan ini untuk membaca fail Excel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!