將 CSV 資料匯入 NumPy 中的記錄陣列
使用表格資料時,記錄陣列可能是 NumPy 中有用的資料結構。它允許您儲存具有異質資料類型的資料並使用欄位名稱存取資料。如果您正在尋找一種將CSV 資料直接匯入記錄數組的方法,類似於R 中的read.table()、read.delim() 和read.csv() 函數,這裡有一個解決方案:
使用numpy.genfromtxt()
NumPy 的genfromtxt()函數提供了直接讀取的方式將 CSV 資料儲存到記錄數組中。將分隔符號關鍵字參數設為逗號,genfromtxt() 會自動將資料分隔成欄位:
import numpy as np # Import CSV data using genfromtxt() data = np.genfromtxt("my_data.csv", delimiter=",")
產生的資料變數是一個結構化的NumPy 數組,其中每行代表一筆記錄,每列代表一筆記錄代表一個欄位。您可以使用類似屬性的語法存取各個欄位:
# Access the 'name' field names = data['name']
或者,您可以使用dtype.names 屬性將欄位作為元組存取:
# Get the field names field_names = data.dtype.names # Access the 'name' field using the tuple index names = data[field_names.index('name')]
其他選項
如果您需要對資料導入過程進行更多控制,您可以使用pandas 庫中的pd.read_csv() 函數。它提供了額外的功能,例如處理不同的編碼和跳過標題:
import pandas as pd # Import CSV data using pd.read_csv() df = pd.read_csv("my_data.csv")
無論您選擇哪種方法,NumPy 的記錄數組都提供了一種處理表格資料的便捷方法,而genfromtxt() 提供了一種直接的方法將CSV 資料匯入此格式。
以上是如何將 CSV 資料匯入 NumPy 記錄數組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!