簡單易學：掌握pandas讀取Excel文件的基本操作方法-Python教學-PHP中文網

簡單易學：掌握pandas讀取Excel文件的基本操作方法

PHPz

發布： 2024-01-19 10:03:07

原創

1113 人瀏覽過

簡單易學：掌握pandas讀取Excel文件的基本操作方法

掌握pandas讀取Excel檔案的基本操作方法

在資料分析與處理中，Excel檔案是常見的資料來源，Pandas是Python中一個強大的資料分析處理庫，可以快速且有效率地讀取Excel檔案並進行資料清洗、處理和分析。本文將介紹Pandas讀取Excel檔案的基本操作方法，並提供具體的程式碼範例，方便讀者快速掌握。

安裝Pandas

首先需要安裝Pandas函式庫。可以透過pip指令在命令列中安裝，如下所示：

pip install pandas

登入後複製

讀取Excel檔案

Pandas讀取Excel檔案的核心工具是read_excel()函數，它可以讀取Excel中的一個或多個表格，支援多種格式的文件，例如xls和xlsx等。

下面是一個簡單的讀取Excel檔案的範例：

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx')
 
# 打印数据
print(data)

登入後複製

上面的程式碼會將名為"data.xlsx"的Excel檔案讀入一個DataFrame物件中，並將數據列印出來。

選擇表格和欄位

在讀取Excel檔案之後，我們可以選擇一些需要的表格和欄位來進行進一步的分析和處理。 Pandas提供了多種選取資料的方法，例如使用表格名稱、列名，或使用行和列的索引。

下面是一個選擇表格和列的範例：

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 选择数据
selected_data = data[['Name', 'Age', 'Gender']]
 
# 打印数据
print(selected_data)

登入後複製

上面的程式碼會選擇Excel檔案中名為"Sheet1"的表格，然後選擇表格中的"Name"、"Age "和"Gender"三列，並將結果列印出來。

過濾資料

過濾資料是資料分析中常見的操作，Pandas提供了多種方法來過濾數據，例如使用布林索引或使用query()函數。

下面是一個過濾資料的範例：

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 打印数据
print(filtered_data)

登入後複製

上面的程式碼會選擇Excel檔案中名為"Sheet1"的表格，然後選擇年齡大於18歲且性別為男性的數據，並將結果列印出來。

資料計算與分析

一旦選擇了需要的數據，就可以進行各種計算和分析操作，例如求和、平均值、標準差等。 Pandas提供了一些內建函數來完成這些操作，例如sum()、mean()和std()等。

下面是一個資料計算和分析的範例：

import pandas as pd
 
# 读取Excel文件
data = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 
# 过滤数据
filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')]
 
# 计算数据
age_mean = filtered_data['Age'].mean()
age_std = filtered_data['Age'].std()
 
# 打印数据
print('Average Age:', age_mean)
print('Standard Deviation of Age:', age_std)

登入後複製

上面的程式碼會選擇Excel檔案中名為"Sheet1"的表格，然後選擇年齡大於18歲且性別為男性的數據，併計算出年齡的平均值和標準差，並將結果列印出來。