a的数据ndarray
存储为1d缓冲区-只是一块内存。数组的多维性质由shape
和strides
属性以及使用它们的代码产生。
的numpy
开发人员选择,以允许尺寸的任意数量的,所以形状和进展被表示为任何长度的元组,包括0和1。
相反,MATLAB是围绕FORTRAN程序构建的,该程序是为矩阵运算而开发的。在早期,MATLAB中的所有内容都是二维矩阵。在2000年(v3.5)左右,它被普遍允许超过2d,但永远不会少于2d。在numpy
np.matrix
依然沿用旧的2D MATLAB约束。
如果您来自MATLAB世界,则习惯于这两个维度,以及行向量和列向量之间的区别。但是在不受MATLAB影响的数学和物理学中,向量是一维数组。python列表本质上是一c
维数组,数组也是如此。要获得2d,您必须具有列表列表或指向数组的指针数组x[1][2]
以及索引样式。
查看此数组及其变体的形状和步幅:
In [48]: x=np.arange(10)
In [49]: x.shape
Out[49]: (10,)
In [50]: x.strides
Out[50]: (4,)
In [51]: x1=x.reshape(10,1)
In [52]: x1.shape
Out[52]: (10, 1)
In [53]: x1.strides
Out[53]: (4, 4)
In [54]: x2=np.concatenate((x1,x1),axis=1)
In [55]: x2.shape
Out[55]: (10, 2)
In [56]: x2.strides
Out[56]: (8, 4)
MATLAB最后添加了新尺寸。它像order='F'
数组一样排列其值,并且可以很容易地将(n,1)矩阵更改为(n,1,1,1)。numpy
是default order='C'
,并且很容易在开始时扩展数组维度。利用广播时,了解这一点至关重要。
因此x1 + x
是(10,1)+(10,)=>(10,1)+(1,10)=>(10,10)
由于广播,(n,)
阵列更像(1,n)
一个而不是(n,1)
一个。一维数组更像行矩阵而不是列矩阵。
In [64]: np.matrix(x)
Out[64]: matrix([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])
In [65]: _.shape
Out[65]: (1, 10)
关键concatenate
是它需要匹配的尺寸。它不使用广播来调整尺寸。有很多stack
函数可以减轻这种约束,但是它们可以通过在使用之前调整尺寸来实现concatenate
。查看他们的代码(可读的Python)。
因此,精通的numpy用户需要熟悉该通用shape
元组,包括空()
(0d数组),(n,)
1d及更高版本。对于更高级的东西,理解步幅也会有所帮助(例如,查看转置的步幅和形状)。