使用Pandas 有效率地從工作簿載入特定工作表
Pandas 的pd.read_excel() 函式是讀取Excel 工作簿強大工具。但是,在處理包含多個工作表的大檔案時,載入整個工作簿可能會效率低下,尤其是當您只需要幾個特定工作表中的資料時。
使用pd.read_excel( 了解載入過程) )
在特定工作表上使用pd.read_excel() 時,似乎整個工作簿都已載入記憶體中。這是因為 pandas 內部使用 ExcelFile 物件來表示工作簿。 ExcelFile 物件在初始化期間解析整個文件,無論指定哪個工作表。
高效載入特定工作表
要最佳化載入過程,請考慮使用 pd直接.ExcelFile物件。透過使用工作簿路徑實例化 ExcelFile 對象,您可以存取特定工作表,而無需重新載入整個檔案。
例如:
此方法在建立過程中只會載入整個工作簿一次ExcelFile 物件的。後續呼叫 pd.read_excel() 將從指定工作表中檢索數據,而不會產生重新載入檔案的開銷。
載入多個工作表
此外,您可以向 pd.read_excel() 指定工作表名稱或索引清單同時載入多個工作表。這將傳回一個字典,其中鍵是工作表名稱或索引,值是相應的資料框。
例如:
載入所有工作表
如果需要載入工作簿中的所有工作表,請將sheet_name參數設為無:
以上是如何使用 Pandas 有效率地從大型 Excel 檔案載入特定工作表?的詳細內容。更多資訊請關注PHP中文網其他相關文章!