Python Numpy中ndarray的常見操作實例分析-Python教學-PHP中文網

前言

NumPy（Numerical Python）是Python的一種開源的數值計算擴展。這種工具可用於儲存和處理大型矩陣，比Python本身的嵌套列表（nested list structure)結構要高效的多（該結構也可以用來表示矩陣（matrix）），支援大量的維度數組與矩陣運算，此外也針對數組運算提供大量的數學函數庫。
Numpy中主要使用ndarray來處理N維數組，Numpy中的大部分屬性和方法都是為ndarray服務的，所以掌握Numpy中ndarray的常見操作非常有必要！

0 Numpy基礎

NumPy的主要物件是同構多維數組。它是一個元素表（通常是數字），所有類型都相同，由非負整數元組索引。在NumPy維度中稱為軸。
在下面所示的範例中，陣列有2個軸。第一軸的長度為2，第二軸的長度為3。

[[ 1., 0., 0.],
 [ 0., 1., 2.]]

登入後複製

1 ndarray的屬性

1.1 輸出ndarray的共同屬性

ndarray.ndim ：陣列的軸（維度）的個數。在Python世界中，維度的數量稱為rank。
ndarray.shape ：陣列的維度。這是一個整數的元組，表示每個維度中數組的大小。對於有 n 行和 m 列的矩陣，shape 將是 (n,m)。因此，shape 元組的長度就是rank或維度的個數 ndim。
ndarray.size ：陣列元素的總數。這等於 shape 的元素的乘積。
ndarray.dtype ：一個描述陣列中元素類型的物件。可以使用標準的Python類型來建立或指定dtype。另外NumPy提供它自己的類型。例如numpy.int32、numpy.int16和numpy.float64。
ndarray.itemsize ：陣列中每個元素的位元組大小。例如，元素為 float64 類型的陣列的 itemsize 為8（=64/8），而 complex32 類型的陣列的 itemsize 為4（=32/8）。它等於 ndarray.dtype.itemsize 。

>>> import numpy as np
>>> a = np.arange(15).reshape(3, 5)
>>> a
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
>>> a.shape
(3, 5)
>>> a.ndim
2
>>> a.dtype.name
&#39;int64&#39;
>>> a.itemsize
8
>>> a.size
15
>>> type(a)
<type &#39;numpy.ndarray&#39;>
>>> b = np.array([6, 7, 8])
>>> b
array([6, 7, 8])
>>> type(b)
<type &#39;numpy.ndarray&#39;>

登入後複製

2 ndarray的資料型別

在同一個ndarray中，儲存的是相同類型的數據，ndarray常見的資料型別包括：

Python Numpy中ndarray的常見操作實例分析

3 修改ndarray的形狀和資料型別

3.1 檢視和修改ndarray的形狀

## ndarray reshape操作
array_a = np.array([[1, 2, 3], [4, 5, 6]])
print(array_a, array_a.shape)
array_a_1 = array_a.reshape((3, 2))
print(array_a_1, array_a_1.shape)
# note: reshape不能改变ndarray中元素的个数，例如reshape之前为（2，3）,reshape之后为（3，2）/（1，6）...
## ndarray转置
array_a_2 = array_a.T
print(array_a_2, array_a_2.shape)
## ndarray ravel操作:将ndarray展平
a.ravel()  # returns the array, flattened
array([ 1,  2,  3,  4,  5,  6 ])

输出：
[[1 2 3]
 [4 5 6]] (2, 3)
[[1 2]
 [3 4]
 [5 6]] (3, 2)
[[1 4]
 [2 5]
 [3 6]] (3, 2)

登入後複製

3.2 檢視和修改ndarray的資料型別

astype(dtype[, order, casting, subok, copy])：修改ndarray中的資料型別。傳入需要修改的資料類型，其他關鍵字參數可以不關注。

array_a = np.array([[1, 2, 3], [4, 5, 6]])
print(array_a, array_a.dtype)
array_a_1 = array_a.astype(np.int64)
print(array_a_1, array_a_1.dtype)
输出：
[[1 2 3]
 [4 5 6]] int32
[[1 2 3]
 [4 5 6]] int64

登入後複製

4 ndarray陣列建立

NumPy主要透過np.array()函數來建立ndarray陣列。

>>> import numpy as np
>>> a = np.array([2,3,4])
>>> a
array([2, 3, 4])
>>> a.dtype
dtype(&#39;int64&#39;)
>>> b = np.array([1.2, 3.5, 5.1])
>>> b.dtype
dtype(&#39;float64&#39;)

登入後複製

也可以在建立時明確指定陣列的類型：

>>> c = np.array( [ [1,2], [3,4] ], dtype=complex )
>>> c
array([[ 1.+0.j,  2.+0.j],
       [ 3.+0.j,  4.+0.j]])

登入後複製

也可以透過使用np.random.random函數來創建隨機的ndarray數組。

>>> a = np.random.random((2,3))
>>> a
array([[ 0.18626021,  0.34556073,  0.39676747],
       [ 0.53881673,  0.41919451,  0.6852195 ]])

登入後複製

通常，陣列的元素最初是未知的，但它的大小是已知的。因此，NumPy提供了幾個函數來建立具有初始佔位符內容的陣列。這就減少了數組增長的必要，因為數組增長的操作花費很大。
函數zeros建立一個由0組成的數組，函數ones建立一個完整的數組，函數empty 建立一個數組，其初始內容是隨機的，取決於記憶體的狀態。 預設情況下，建立的陣列的dtype是 float64 類型的。

>>> np.zeros( (3,4) )
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])
>>> np.ones( (2,3,4), dtype=np.int16 )                # dtype can also be specified
array([[[ 1, 1, 1, 1],
        [ 1, 1, 1, 1],
        [ 1, 1, 1, 1]],
       [[ 1, 1, 1, 1],
        [ 1, 1, 1, 1],
        [ 1, 1, 1, 1]]], dtype=int16)
>>> np.empty( (2,3) )                                 # uninitialized, output may vary
array([[  3.73603959e-262,   6.02658058e-154,   6.55490914e-260],
       [  5.30498948e-313,   3.14673309e-307,   1.00000000e+000]])

登入後複製

為了建立數字組成的數組，NumPy提供了一個類似於range的函數，該函數傳回數組而不是列表。

>>> np.arange( 10, 30, 5 )
array([10, 15, 20, 25])
>>> np.arange( 0, 2, 0.3 )                 # it accepts float arguments
array([ 0. ,  0.3,  0.6,  0.9,  1.2,  1.5,  1.8])

登入後複製

5 ndarray數組的常見運算

與許多矩陣語言不同，乘積運算子*在NumPy數組中按元素運算。矩陣乘積可以使用@運算子（在python> = 3.5中）或dot函數或方法執行：

>>> A = np.array( [[1,1],
...             [0,1]] )
>>> B = np.array( [[2,0],
...             [3,4]] )
>>> A * B                       # elementwise product
array([[2, 0],
       [0, 4]])
>>> A @ B                       # matrix product
array([[5, 4],
       [3, 4]])
>>> A.dot(B)                    # another matrix product
array([[5, 4],
       [3, 4]])

登入後複製

某些操作（例如 = 和*=）會更直接地更改被操作的矩陣陣列而不會建立新矩陣陣列。

>>> a = np.ones((2,3), dtype=int)
>>> b = np.random.random((2,3))
>>> a *= 3
>>> a
array([[3, 3, 3],
       [3, 3, 3]])
>>> b += a
>>> b
array([[ 3.417022  ,  3.72032449,  3.00011437],
       [ 3.30233257,  3.14675589,  3.09233859]])
>>> a += b                  # b is not automatically converted to integer type
Traceback (most recent call last):
  ...
TypeError: Cannot cast ufunc add output from dtype(&#39;float64&#39;) to dtype(&#39;int64&#39;) with casting rule &#39;same_kind&#39;

登入後複製

當使用不同類型的陣列進行操作時，結果陣列的類型對應於更一般或更精確的陣列（稱為向上轉換的行為）。

>>> a = np.ones(3, dtype=np.int32)
>>> b = np.linspace(0,pi,3)
>>> b.dtype.name
&#39;float64&#39;
>>> c = a+b
>>> c
array([ 1.        ,  2.57079633,  4.14159265])
>>> c.dtype.name
&#39;float64&#39;
>>> d = np.exp(c*1j)
>>> d
array([ 0.54030231+0.84147098j, -0.84147098+0.54030231j,
       -0.54030231-0.84147098j])
>>> d.dtype.name
&#39;complex128&#39;

登入後複製

許多一元操作，例如計算數組中所有元素的總和，都是作為ndarray類別的方法實現的。

>>> a = np.random.random((2,3))
>>> a
array([[ 0.18626021,  0.34556073,  0.39676747],
       [ 0.53881673,  0.41919451,  0.6852195 ]])
>>> a.sum()
2.5718191614547998
>>> a.min()
0.1862602113776709
>>> a.max()
0.6852195003967595

登入後複製

預設情況下，這些操作適用於數組，就像它是一個數字列表一樣，無論其形狀如何。但是，透過指定axis 參數，您可以沿著數組的指定軸套用操作：

>>> b = np.arange(12).reshape(3,4)
>>> b
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
>>>
>>> b.sum(axis=0)                            # 计算每一列的和
array([12, 15, 18, 21])
>>>
>>> b.min(axis=1)                            # 计算每一行的和
array([0, 4, 8])
>>>
>>> b.cumsum(axis=1)                         # cumulative sum along each row
array([[ 0,  1,  3,  6],
       [ 4,  9, 15, 22],
       [ 8, 17, 27, 38]])
解释：以第一行为例，0=0，1=1+0，3=2+1+0，6=3+2+1+0

登入後複製

6 ndarray數組的索引、切片和迭代

一維的陣列可以進行索引、切片和迭代操作的，就像列表和其他Python序列類型一樣。

>>> a = np.arange(10)**3
>>> a
array([  0,   1,   8,  27,  64, 125, 216, 343, 512, 729])
>>> a[2]
8
>>> a[2:5]
array([ 8, 27, 64])
>>> a[:6:2] = -1000    # 等价于 a[0:6:2] = -1000; 从0到6的位置, 每隔一个设置为-1000
>>> a
array([-1000,     1, -1000,    27, -1000,   125,  fan 216,   343,   512,   729])
>>> a[ : :-1]                                 # 将a反转
array([  729,   512,   343,   216,   125, -1000,    27, -1000,     1, -1000])

登入後複製

多維的陣列每個軸可以有索引。這些索引以逗號分隔的元組給出：

>>> b
array([[ 0,  1,  2,  3],
       [10, 11, 12, 13],
       [20, 21, 22, 23],
       [30, 31, 32, 33],
       [40, 41, 42, 43]])
>>> b[2,3]
23
>>> b[0:5, 1]                       # each row in the second column of b
array([ 1, 11, 21, 31, 41])
>>> b[ : ,1]                        # equivalent to the previous example
array([ 1, 11, 21, 31, 41])
>>> b[1:3, : ]                      # each column in the second and third row of b
array([[10, 11, 12, 13],
       [20, 21, 22, 23]])
>>> b[-1]                                  # the last row. Equivalent to b[-1,:]
array([40, 41, 42, 43])

登入後複製

7 ndarray数组的堆叠、拆分

几个数组可以沿不同的轴堆叠在一起，例如：np.vstack()函数和np.hstack()函数

>>> a = np.floor(10*np.random.random((2,2)))
>>> a
array([[ 8.,  8.],
       [ 0.,  0.]])
>>> b = np.floor(10*np.random.random((2,2)))
>>> b
array([[ 1.,  8.],
       [ 0.,  4.]])
>>> np.vstack((a,b))
array([[ 8.,  8.],
       [ 0.,  0.],
       [ 1.,  8.],
       [ 0.,  4.]])
>>> np.hstack((a,b))
array([[ 8.,  8.,  1.,  8.],
       [ 0.,  0.,  0.,  4.]])

登入後複製

column_stack()函数将1D数组作为列堆叠到2D数组中。

>>> from numpy import newaxis
>>> a = np.array([4.,2.])
>>> b = np.array([3.,8.])
>>> np.column_stack((a,b))     # returns a 2D array
array([[ 4., 3.],
       [ 2., 8.]])
>>> np.hstack((a,b))           # the result is different
array([ 4., 2., 3., 8.])
>>> a[:,newaxis]               # this allows to have a 2D columns vector
array([[ 4.],
       [ 2.]])
>>> np.column_stack((a[:,newaxis],b[:,newaxis]))
array([[ 4.,  3.],
       [ 2.,  8.]])
>>> np.hstack((a[:,newaxis],b[:,newaxis]))   # the result is the same
array([[ 4.,  3.],
       [ 2.,  8.]])

登入後複製

使用hsplit()，可以沿数组的水平轴拆分数组，方法是指定要返回的形状相等的数组的数量，或者指定应该在其之后进行分割的列：
同理，使用vsplit()，可以沿数组的垂直轴拆分数组，方法同上。

################### np.hsplit ###################
>>> a = np.floor(10*np.random.random((2,12)))
>>> a
array([[ 9.,  5.,  6.,  3.,  6.,  8.,  0.,  7.,  9.,  7.,  2.,  7.],
       [ 1.,  4.,  9.,  2.,  2.,  1.,  0.,  6.,  2.,  2.,  4.,  0.]])
>>> np.hsplit(a,3)   # Split a into 3
[array([[ 9.,  5.,  6.,  3.],
       [ 1.,  4.,  9.,  2.]]), array([[ 6.,  8.,  0.,  7.],
       [ 2.,  1.,  0.,  6.]]), array([[ 9.,  7.,  2.,  7.],
       [ 2.,  2.,  4.,  0.]])]
>>> np.hsplit(a,(3,4))   # Split a after the third and the fourth column
[array([[ 9.,  5.,  6.],
       [ 1.,  4.,  9.]]), array([[ 3.],
       [ 2.]]), array([[ 6.,  8.,  0.,  7.,  9.,  7.,  2.,  7.],
       [ 2.,  1.,  0.,  6.,  2.,  2.,  4.,  0.]])]
>>> x = np.arange(8.0).reshape(2, 2, 2)
>>> x
array([[[0.,  1.],
        [2.,  3.]],
       [[4.,  5.],
        [6.,  7.]]])
################### np.vsplit ###################
>>> np.vsplit(x, 2)
[array([[[0., 1.],
        [2., 3.]]]), array([[[4., 5.],
        [6., 7.]]])]

登入後複製

以上是Python Numpy中ndarray的常見操作實例分析的詳細內容。更多資訊請關注PHP中文網其他相關文章！