Analisis contoh operasi biasa ndarray dalam Python Numpy-Tutorial Python-php.cn

Kata Pengantar

NumPy (Numerical Python) ialah sambungan pengkomputeran berangka sumber terbuka untuk Python. Alat ini boleh digunakan untuk menyimpan dan memproses matriks besar Ia jauh lebih cekap daripada struktur senarai bersarang Python sendiri (yang juga boleh digunakan untuk mewakili matriks) dan menyokong sejumlah besar operasi tatasusunan dan matriks , selain itu juga menyediakan sejumlah besar perpustakaan fungsi matematik untuk operasi tatasusunan.
Numpy terutamanya menggunakan ndarray untuk memproses tatasusunan N-dimensi Kebanyakan sifat dan kaedah dalam Numpy berkhidmat ndarray, jadi sangat perlu untuk menguasai operasi biasa ndarray dalam Numpy!

0 Asas Numpy

Objek utama NumPy ialah tatasusunan berbilang dimensi isomorfik. Ia ialah senarai elemen (biasanya nombor), semua jenis yang sama, diindeks oleh tuple integer bukan negatif. Dipanggil paksi dalam dimensi NumPy.
Dalam contoh yang ditunjukkan di bawah, tatasusunan mempunyai 2 paksi. Panjang paksi pertama ialah 2 dan panjang paksi kedua ialah 3.

[[ 1., 0., 0.],
 [ 0., 1., 2.]]

Salin selepas log masuk

1 Sifat ndarray

1.1 Sifat biasa output ndarray

ndarray.ndim: Paksi (dimensi) bagi tatasusunan ) nombor. Dalam dunia Python, bilangan dimensi dipanggil pangkat.
ndarray.shape: Dimensi tatasusunan. Ini ialah tuple integer yang mewakili saiz tatasusunan dalam setiap dimensi. Untuk matriks dengan n baris dan m lajur, bentuknya ialah (n,m). Oleh itu, panjang tuple bentuk ialah pangkat atau bilangan dimensi ndim.
ndarray.size: Jumlah bilangan elemen tatasusunan. Ini adalah sama dengan produk unsur-unsur bentuk.
ndarray.dtype: Objek yang menerangkan jenis unsur dalam tatasusunan. Dtype boleh dibuat atau ditentukan menggunakan jenis Python standard. Selain itu NumPy menyediakan jenisnya sendiri. Contohnya numpy.int32, numpy.int16 dan numpy.float64.
ndarray.itemsize : Saiz bait setiap elemen dalam tatasusunan. Sebagai contoh, tatasusunan dengan elemen jenis float64 mempunyai saiz item 8 (=64/8), manakala tatasusunan jenis kompleks32 mempunyai saiz item 4 (=32/8). Ia sama dengan ndarray.dtype.itemsize.

>>> import numpy as np
>>> a = np.arange(15).reshape(3, 5)
>>> a
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])
>>> a.shape
(3, 5)
>>> a.ndim
2
>>> a.dtype.name
&#39;int64&#39;
>>> a.itemsize
8
>>> a.size
15
>>> type(a)
<type &#39;numpy.ndarray&#39;>
>>> b = np.array([6, 7, 8])
>>> b
array([6, 7, 8])
>>> type(b)
<type &#39;numpy.ndarray&#39;>

Salin selepas log masuk

2 Jenis data ndarray

Dalam ndarray yang sama, jenis data yang sama disimpan termasuk:

Analisis contoh operasi biasa ndarray dalam Python Numpy

3 Ubah suai bentuk dan jenis data ndarray

3.1 Lihat dan ubah suai bentuk ndarray

## ndarray reshape操作
array_a = np.array([[1, 2, 3], [4, 5, 6]])
print(array_a, array_a.shape)
array_a_1 = array_a.reshape((3, 2))
print(array_a_1, array_a_1.shape)
# note: reshape不能改变ndarray中元素的个数，例如reshape之前为（2，3）,reshape之后为（3，2）/（1，6）...
## ndarray转置
array_a_2 = array_a.T
print(array_a_2, array_a_2.shape)
## ndarray ravel操作:将ndarray展平
a.ravel()  # returns the array, flattened
array([ 1,  2,  3,  4,  5,  6 ])

输出：
[[1 2 3]
 [4 5 6]] (2, 3)
[[1 2]
 [3 4]
 [5 6]] (3, 2)
[[1 4]
 [2 5]
 [3 6]] (3, 2)

Salin selepas log masuk

3.2 Lihat dan ubah suai bentuk ndarray Jenis data

astype(dtype[, order, casting, subok, copy]): Ubah suai jenis data dalam ndarray. Masukkan jenis data yang perlu diubah suai dan parameter kata kunci lain boleh diabaikan.

array_a = np.array([[1, 2, 3], [4, 5, 6]])
print(array_a, array_a.dtype)
array_a_1 = array_a.astype(np.int64)
print(array_a_1, array_a_1.dtype)
输出：
[[1 2 3]
 [4 5 6]] int32
[[1 2 3]
 [4 5 6]] int64

Salin selepas log masuk

4 penciptaan tatasusunan ndarray

NumPy terutamanya mencipta tatasusunan ndarray melalui fungsi np.array().

>>> import numpy as np
>>> a = np.array([2,3,4])
>>> a
array([2, 3, 4])
>>> a.dtype
dtype(&#39;int64&#39;)
>>> b = np.array([1.2, 3.5, 5.1])
>>> b.dtype
dtype(&#39;float64&#39;)

Salin selepas log masuk

Anda juga boleh menyatakan secara eksplisit jenis tatasusunan semasa mencipta:

>>> c = np.array( [ [1,2], [3,4] ], dtype=complex )
>>> c
array([[ 1.+0.j,  2.+0.j],
       [ 3.+0.j,  4.+0.j]])

Salin selepas log masuk

Anda juga boleh mencipta tatasusunan ndarray rawak dengan menggunakan fungsi np.random.random.

>>> a = np.random.random((2,3))
>>> a
array([[ 0.18626021,  0.34556073,  0.39676747],
       [ 0.53881673,  0.41919451,  0.6852195 ]])

Salin selepas log masuk

Biasanya, elemen tatasusunan pada mulanya tidak diketahui, tetapi saiznya diketahui. Oleh itu, NumPy menyediakan beberapa fungsi untuk mencipta tatasusunan dengan kandungan pemegang tempat awal. Ini mengurangkan keperluan untuk pertumbuhan tatasusunan, yang merupakan operasi yang mahal.
Fungsi zeros mencipta tatasusunan 0s, fungsi ones mencipta tatasusunan lengkap dan fungsi empty mencipta tatasusunan yang kandungan awalnya rawak dan bergantung pada keadaan ingatan. Secara lalai, dtype tatasusunan yang dicipta ialah float64.

>>> np.zeros( (3,4) )
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])
>>> np.ones( (2,3,4), dtype=np.int16 )                # dtype can also be specified
array([[[ 1, 1, 1, 1],
        [ 1, 1, 1, 1],
        [ 1, 1, 1, 1]],
       [[ 1, 1, 1, 1],
        [ 1, 1, 1, 1],
        [ 1, 1, 1, 1]]], dtype=int16)
>>> np.empty( (2,3) )                                 # uninitialized, output may vary
array([[  3.73603959e-262,   6.02658058e-154,   6.55490914e-260],
       [  5.30498948e-313,   3.14673309e-307,   1.00000000e+000]])

Salin selepas log masuk

Untuk mencipta tatasusunan nombor, NumPy menyediakan fungsi yang serupa dengan range, yang mengembalikan tatasusunan dan bukannya senarai.

>>> np.arange( 10, 30, 5 )
array([10, 15, 20, 25])
>>> np.arange( 0, 2, 0.3 )                 # it accepts float arguments
array([ 0. ,  0.3,  0.6,  0.9,  1.2,  1.5,  1.8])

Salin selepas log masuk

5 Operasi biasa pada tatasusunan ndarray

Tidak seperti kebanyakan bahasa matriks, pengendali produk * beroperasi mengikut elemen pada tatasusunan NumPy. Produk matriks boleh dilakukan menggunakan operator @ (dalam python> = 3.5) atau fungsi atau kaedah dot:

>>> A = np.array( [[1,1],
...             [0,1]] )
>>> B = np.array( [[2,0],
...             [3,4]] )
>>> A * B                       # elementwise product
array([[2, 0],
       [0, 4]])
>>> A @ B                       # matrix product
array([[5, 4],
       [3, 4]])
>>> A.dot(B)                    # another matrix product
array([[5, 4],
       [3, 4]])

Salin selepas log masuk

Sesetengah operasi, seperti += dan *=, berubah secara langsung Tatasusunan matriks yang dimanipulasi tidak menghasilkan tatasusunan matriks baharu.

>>> a = np.ones((2,3), dtype=int)
>>> b = np.random.random((2,3))
>>> a *= 3
>>> a
array([[3, 3, 3],
       [3, 3, 3]])
>>> b += a
>>> b
array([[ 3.417022  ,  3.72032449,  3.00011437],
       [ 3.30233257,  3.14675589,  3.09233859]])
>>> a += b                  # b is not automatically converted to integer type
Traceback (most recent call last):
  ...
TypeError: Cannot cast ufunc add output from dtype(&#39;float64&#39;) to dtype(&#39;int64&#39;) with casting rule &#39;same_kind&#39;

Salin selepas log masuk

Apabila beroperasi dengan tatasusunan pelbagai jenis, jenis tatasusunan yang terhasil sepadan dengan tatasusunan yang lebih umum atau tepat (tingkah laku yang dipanggil upcasting).

>>> a = np.ones(3, dtype=np.int32)
>>> b = np.linspace(0,pi,3)
>>> b.dtype.name
&#39;float64&#39;
>>> c = a+b
>>> c
array([ 1.        ,  2.57079633,  4.14159265])
>>> c.dtype.name
&#39;float64&#39;
>>> d = np.exp(c*1j)
>>> d
array([ 0.54030231+0.84147098j, -0.84147098+0.54030231j,
       -0.54030231-0.84147098j])
>>> d.dtype.name
&#39;complex128&#39;

Salin selepas log masuk

Banyak operasi unari, seperti mengira jumlah semua elemen dalam tatasusunan, dilaksanakan sebagai kaedah kelas ndarray.

>>> a = np.random.random((2,3))
>>> a
array([[ 0.18626021,  0.34556073,  0.39676747],
       [ 0.53881673,  0.41919451,  0.6852195 ]])
>>> a.sum()
2.5718191614547998
>>> a.min()
0.1862602113776709
>>> a.max()
0.6852195003967595

Salin selepas log masuk

Secara lalai, operasi ini berfungsi pada tatasusunan seolah-olah ia adalah senarai nombor, tanpa mengira bentuknya. Walau bagaimanapun, dengan menentukan parameter paksi, anda boleh menggunakan operasi sepanjang paksi tatasusunan yang ditentukan:

>>> b = np.arange(12).reshape(3,4)
>>> b
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
>>>
>>> b.sum(axis=0)                            # 计算每一列的和
array([12, 15, 18, 21])
>>>
>>> b.min(axis=1)                            # 计算每一行的和
array([0, 4, 8])
>>>
>>> b.cumsum(axis=1)                         # cumulative sum along each row
array([[ 0,  1,  3,  6],
       [ 4,  9, 15, 22],
       [ 8, 17, 27, 38]])
解释：以第一行为例，0=0，1=1+0，3=2+1+0，6=3+2+1+0

Salin selepas log masuk

6 Pengindeksan, penghirisan dan lelaran tatasusunan ndarray

Satu Dimensi Tatasusunan boleh diindeks, dihiris dan diulang sama seperti senarai dan jenis jujukan Python yang lain.

>>> a = np.arange(10)**3
>>> a
array([  0,   1,   8,  27,  64, 125, 216, 343, 512, 729])
>>> a[2]
8
>>> a[2:5]
array([ 8, 27, 64])
>>> a[:6:2] = -1000    # 等价于 a[0:6:2] = -1000; 从0到6的位置, 每隔一个设置为-1000
>>> a
array([-1000,     1, -1000,    27, -1000,   125,  fan 216,   343,   512,   729])
>>> a[ : :-1]                                 # 将a反转
array([  729,   512,   343,   216,   125, -1000,    27, -1000,     1, -1000])

Salin selepas log masuk

Tatasusunan berbilang dimensi boleh mempunyai satu indeks setiap paksi. Indeks ini diberikan sebagai tuple yang dipisahkan koma:

>>> b
array([[ 0,  1,  2,  3],
       [10, 11, 12, 13],
       [20, 21, 22, 23],
       [30, 31, 32, 33],
       [40, 41, 42, 43]])
>>> b[2,3]
23
>>> b[0:5, 1]                       # each row in the second column of b
array([ 1, 11, 21, 31, 41])
>>> b[ : ,1]                        # equivalent to the previous example
array([ 1, 11, 21, 31, 41])
>>> b[1:3, : ]                      # each column in the second and third row of b
array([[10, 11, 12, 13],
       [20, 21, 22, 23]])
>>> b[-1]                                  # the last row. Equivalent to b[-1,:]
array([40, 41, 42, 43])

Salin selepas log masuk

7 ndarray数组的堆叠、拆分

几个数组可以沿不同的轴堆叠在一起，例如：np.vstack()函数和np.hstack()函数

>>> a = np.floor(10*np.random.random((2,2)))
>>> a
array([[ 8.,  8.],
       [ 0.,  0.]])
>>> b = np.floor(10*np.random.random((2,2)))
>>> b
array([[ 1.,  8.],
       [ 0.,  4.]])
>>> np.vstack((a,b))
array([[ 8.,  8.],
       [ 0.,  0.],
       [ 1.,  8.],
       [ 0.,  4.]])
>>> np.hstack((a,b))
array([[ 8.,  8.,  1.,  8.],
       [ 0.,  0.,  0.,  4.]])

Salin selepas log masuk

column_stack()函数将1D数组作为列堆叠到2D数组中。

>>> from numpy import newaxis
>>> a = np.array([4.,2.])
>>> b = np.array([3.,8.])
>>> np.column_stack((a,b))     # returns a 2D array
array([[ 4., 3.],
       [ 2., 8.]])
>>> np.hstack((a,b))           # the result is different
array([ 4., 2., 3., 8.])
>>> a[:,newaxis]               # this allows to have a 2D columns vector
array([[ 4.],
       [ 2.]])
>>> np.column_stack((a[:,newaxis],b[:,newaxis]))
array([[ 4.,  3.],
       [ 2.,  8.]])
>>> np.hstack((a[:,newaxis],b[:,newaxis]))   # the result is the same
array([[ 4.,  3.],
       [ 2.,  8.]])

Salin selepas log masuk

使用hsplit()，可以沿数组的水平轴拆分数组，方法是指定要返回的形状相等的数组的数量，或者指定应该在其之后进行分割的列：
同理，使用vsplit()，可以沿数组的垂直轴拆分数组，方法同上。

################### np.hsplit ###################
>>> a = np.floor(10*np.random.random((2,12)))
>>> a
array([[ 9.,  5.,  6.,  3.,  6.,  8.,  0.,  7.,  9.,  7.,  2.,  7.],
       [ 1.,  4.,  9.,  2.,  2.,  1.,  0.,  6.,  2.,  2.,  4.,  0.]])
>>> np.hsplit(a,3)   # Split a into 3
[array([[ 9.,  5.,  6.,  3.],
       [ 1.,  4.,  9.,  2.]]), array([[ 6.,  8.,  0.,  7.],
       [ 2.,  1.,  0.,  6.]]), array([[ 9.,  7.,  2.,  7.],
       [ 2.,  2.,  4.,  0.]])]
>>> np.hsplit(a,(3,4))   # Split a after the third and the fourth column
[array([[ 9.,  5.,  6.],
       [ 1.,  4.,  9.]]), array([[ 3.],
       [ 2.]]), array([[ 6.,  8.,  0.,  7.,  9.,  7.,  2.,  7.],
       [ 2.,  1.,  0.,  6.,  2.,  2.,  4.,  0.]])]
>>> x = np.arange(8.0).reshape(2, 2, 2)
>>> x
array([[[0.,  1.],
        [2.,  3.]],
       [[4.,  5.],
        [6.,  7.]]])
################### np.vsplit ###################
>>> np.vsplit(x, 2)
[array([[[0., 1.],
        [2., 3.]]]), array([[[4., 5.],
        [6., 7.]]])]

Salin selepas log masuk

Atas ialah kandungan terperinci Analisis contoh operasi biasa ndarray dalam Python Numpy. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!