在本文中,我們將向您展示什麼是稀疏矩陣以及如何在 python 中建立稀疏矩陣。
例如 -
M = [ [1, 0, 0, 0], [0, 0, 3, 0], [0, 0, 0, 0], [0, 0, 0, 2] ]
自然語言處理(NLP)和資料編碼都大量使用稀疏矩陣。如果大多數矩陣元素為 0,則儲存所有矩陣元素的儲存成本會很高。
以下是使用稀疏矩陣而不是簡單矩陣的兩個主要優點 -
儲存 - 因為非零元素比零少,所以可以使用更少的記憶體來單獨儲存這些元素。
計算時間 - 透過邏輯建立僅遍歷非零元素的資料結構可以節省計算時間。
Python 中的 SciPy 提供了使用各種資料結構建立稀疏矩陣以及將稠密矩陣轉換為稀疏矩陣的工具。
在Python中,我們可以使用以下函數來建立稀疏矩陣 -
csr_matrix() 函數 - 以壓縮稀疏行格式建立稀疏矩陣,
csc_matrix() 函數 - 以壓縮稀疏列格式建立稀疏矩陣。 ,,
scipy.sparse.csr_matrix(shape=None, dtype=None)
shape - 它是矩陣的形狀
dtype - 它是矩陣的資料型別
以下是執行所需任務所需遵循的演算法/步驟 -
使用 import 關鍵字,匯入帶有別名 (np) 的 numpy 模組。
使用 import 關鍵字,從 scipy 模組導入 csr_matrix 函式。
使用csr_matrix()函數建立int資料類型的3 * 3稀疏矩陣(row格式)並使用toarray轉換為陣列() 函數。
以下程式使用 csr_matrix() 函數傳回稀疏矩陣 (3x3) -
# importing numpy module with an alias name import numpy as np # importing csr_matrix function from scipy module from scipy.sparse import csr_matrix # Using csr_matrix function to create a 3 * 3 sparse matrix of int datatype # and converting into array sparse_matrix = csr_matrix((3, 3), dtype = np.int8).toarray() # printing the resultant sparse matrix print("The resultant sparse matrix:\n", sparse_matrix)
執行時,上述程式將產生以下輸出 -
The resultant sparse matrix: [[0 0 0] [0 0 0] [0 0 0]]
以下是執行所需任務所需遵循的演算法/步驟 -
使用 import 關鍵字,匯入帶有別名 (np) 的 numpy 模組。
使用 import 關鍵字,從 scipy 模組匯入 csr_matrix 函式。
# importing numpy module with alias name import numpy as np # importing csr_matrix function from scipy module from scipy.sparse import csr_matrix # Giving rows and columns values rows = np.array([0, 1, 0, 2, 1, 1]) columns = np.array([1, 0, 0, 2, 1, 2]) # Giving array data arrayData = np.array([1, 3, 2, 5, 7, 6]) # Using csr_matrix function to create a 3x3 sparse matrix sparse_matrix = csr_matrix((arrayData, (rows, columns)), shape = (3, 3)).toarray() # print the resultant sparse matrix print("The resultant sparse matrix:\n", sparse_matrix)
執行時,上述程式將產生以下輸出 -
The resultant sparse matrix: [[2 1 0] [3 7 6] [0 0 5]]
scipy.sparse.csc_matrix(shape=None, dtype=None)
shape - 它是矩陣的形狀
dtype - 它是矩陣的資料型別
以下是執行所需任務所需遵循的演算法/步驟 -
使用 import 關鍵字,匯入帶有別名 (np) 的 numpy 模組。
使用 import 關鍵字,從 scipy 模組匯入 csc_matrix 函式。
使用csc_matrix()函數建立int資料類型的3 * 3稀疏矩陣(列格式)並使用toarray轉換為陣列() 函數。
以下程式使用 csc_matrix() 函數以列格式傳回稀疏矩陣 (3x3) -
# importing numpy module with an alias name import numpy as np # importing csc_matrix function from scipy module from scipy.sparse import csc_matrix # Using csc_matrix function to create a 3 * 3 sparse matrix of int datatype # and converting into array sparse_matrix = csc_matrix((3, 3), dtype = np.int8).toarray() # printing the resultant sparse matrix print("The resultant sparse matrix:\n", sparse_matrix)
執行時,上述程式將產生以下輸出 -
The resultant sparse matrix: [[0 0 0] [0 0 0] [0 0 0]]
以下程式使用 csc_matrix() 函數以整數列格式傳回稀疏矩陣 (3x3) -
import numpy as np # importing csc_matrix function from scipy module from scipy.sparse import csc_matrix # Giving rows and columns values rows = np.array([0, 1, 0, 2, 1, 1]) columns = np.array([1, 0, 0, 2, 1, 2]) # Giving array data arrayData = np.array([1, 3, 2, 5, 7, 6]) # Using csc_matrix function to create a 3x3 sparse matrix in column format sparse_matrix = csc_matrix((arrayData, (rows, columns)), shape = (3, 3)).toarray() # print the resultant sparse matrix print("The resultant sparse matrix:\n", sparse_matrix)
執行時,上述程式將產生以下輸出 -
The resultant sparse matrix: [[2 1 0] [3 7 6] [0 0 5]]
在本教程中,我們學習了四種在 Python 中產生稀疏矩陣的不同方法。我們也學習如何從 numpy 陣列產生稀疏矩陣。