NumPy库入门教程：基础知识总结|array|numpy|下标|维数

视学算法 | 作者

知乎专栏 | 来源

numpy可以说是Python运用于人工智能和科学计算的一个重要基础，近段时间恰好学习了numpy，pandas，sklearn等一些Python机器学习和科学计算库，因此在此总结一下常用的用法。

numpy数组（array）的创建

通过array方式创建，向array中传入一个list实现

一维数组的创建：

二维数组的创建：传入一个嵌套的list即可，如下例：

通过arange创建数组：下例中创建一个0~1间隔为0.1的行向量，从0开始，不包括1，第二个例子通过对齐广播方式生成一个多维的数组。

通过linspace函数创建数组：下例中创建一个0~1间隔为1/9的行向量（按等差数列形式生成），从0开始，包括1.

通过logspace函数创建数组：下例中创建一个1~100，有20个元素的行向量（按等比数列形式生成），其中0表示10^0=1，2表示10^2=100，从1开始，包括100

生成特殊形式数组：

生成全0数组（zeros()函数），生成全1数组（ones()函数），仅分配内存但不初始化的数组（empty()函数）。

注意要指定数组的规模（用一个元组指定），同时要指定元素的类型，否则会报错

生成随机数组

通过frombuffer，fromstring，fromfile和fromfunction等函数从字节序列、文件等创建数组，下例中生成一个9*9乘法表

显示、创建、改变的数组元素

的属性、数组的尺寸（shape）等

改变数组的尺寸（shape）

reshape方法，第一个例子是将43矩阵转为34矩阵，第二个例子是将行向量转为列向量。注意在numpy中，当某个轴的指定为-1时，此时numpy会根据实际的数组元素个数自动替换-1为具体的大小，如第二例，我们指明了c仅有一列，而b数组有12个元素，因此c被自动指定为12行1列的矩阵，即一个12维的列向量。

元素索引和修改

简单的索引形式和切片：

当使用布尔数组b作为下标存取数组x中的元素时，将收集数组x中所有在数组b中对应下标为True的元素。使用布尔数组作为下标获得的数组不和原始数组共享数据空间，注意这种方式只对应于布尔数组（array），不能使用布尔列表（list）。（附注：当布尔数组的长度与被索引的数组的长度短时，不足的部分都当作False）

利用条件进行索引：利用不等式等进行索引

多维数组的索引和切片（右边框图中的颜色和左边的指令的颜色相对应）：

同样的，可以采用bool型的方式对数组进行索引和切片操作

其实多维数组的索引还是很好理解的，例如下例中，我们可以看到对于一个张量，也就是b，对其索引是，[i,j,k]中的i表示选择第几个二维数组，然后j表示取二维数组中的第几个行向量，k表示取行向量中的第几个元素。

ufunc操作

ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。numPy内置的许多ufunc函数都是在C语言级别实现的，因此它们的计算速度非常快。下面给一个计算sin函数（sin函数计算数组中全部元素的sin值）的小实例：

四则运算符可以直接用于数组（一维或多维）计算：

比较操作也可直接进行，如下，比较x1和x2各对应元素的大小，返回的是一个bool型数组。

可用的操作符有 ‘==’，‘！

=’，‘<’，‘>’，‘<=’，‘>=’等。另外可以使用数组的any()或all()方法。只要数组中有一个值为True，则any()返回True；而只有数组的全部元素都为True，all()才返回True。

想要了解更多的numpy自带的ufunc函数，可以查看这篇博客：

自定义ufunc函数：frompyfunc(func,nin,nout) 函数可以将计算单个值的函数转换成一个可对数组中每个元素进行计算的ufunc函数。其中nin是输入func的参数的个数，nout是func返回值的个数。如下例。

reduce方法（与Python的reduce函数类似，其沿着axis轴对array进行操作）

accumulate方法（其作用和reduce方法类似，但是会保存中间结果）

outer方法（对其两个参数数组的每两对元素的组合进行运算，计算外积）：若数组a的维数为M，数组b的维数为N，则ufunc函数op的outer()方法对a、b数组计算所生成的数组c的维数为M+N，c的形状是a、b的形状的结合。例如a的形状为(2,3)，b的形状为(4,5)，则c的形状为(2,3,4,5)。

广播操作

广播是针对形状不同的数组的运算采取的操作。当我们使用ufunc函数对两个数组进行计算时，ufunc函数会对这两个数组的对应元素进行计算，因此它要求这两个数组有相同的大小(shape相同)。如果两个数组的shape不同的话（行列规模不等），会进行如下的广播(broadcasting)处理：

1)让所有输入数组都向其中shape最长的数组看齐，shape中不足的部分都通过在前面加1补齐。因此输出数组的shape是输入数组shape的各个轴上的最大值（往最大轴长上靠）。

2)如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时，这个数组能够用来计算，否则出错。

3)当输入数组的某个轴的长度为1时，沿着此轴运算时都用此轴上的第一组值。