Python怎么使用NumPy库_NumPy数组操作教程一览-小浪学习网

numpy是python科学计算的核心库，提供高性能多维数组ndArray及向量化操作工具。通过import numpy as np导入后，可使用np.array()、np.zeros()、np.ones()、np.linspace()等函数创建数组，相比Python列表，ndarray存储同类型数据，内存连续，计算效率更高。支持元素级运算、广播机制、布尔索引和reshape等形状操作，聚合函数如sum、mean可沿指定轴计算，linalg模块支持矩阵运算，广泛应用于数据分析与机器学习。

Python怎么使用NumPy库_NumPy数组操作教程一览

NumPy是Python进行科学计算的核心库，它提供了一个高性能的多维数组对象（ndarray）以及用于处理这些数组的工具。简单来说，如果你想在Python里高效地处理大量数值数据，尤其是进行向量化操作，NumPy几乎是不可或缺的选择。它让复杂的数学运算变得简洁而快速。

要使用NumPy，第一步自然是导入它：

import numpy as np

。这几乎是所有使用NumPy代码的开端，

np

是约定俗成的别名。NumPy的核心是

ndarray

对象，它与Python自带的列表（list）有本质区别。列表可以存储不同类型的数据，而

ndarray

则要求所有元素都是同一种类型，这正是其高效性能的基石。

我们通常通过几种方式创建NumPy数组。最直接的是从Python列表转换：

arr = np.array([1, 2, 3, 4])

。但更常见且高效的做法是使用NumPy自带的创建函数，比如

np.zeros((3, 4))

会创建一个3×4的全零数组，

np.ones((2, 2))

是全一数组，

np.arange(0, 10, 2)

则能生成一个等差数列。我个人特别喜欢

np.linspace(0, 1, 5)

，它能在指定区间内均匀生成固定数量的样本点，对于绘制函数曲线或模拟数据非常有用。

一旦有了数组，操作就变得非常直观。NumPy支持元素级的数学运算，这意味着你可以直接对整个数组进行加减乘除，而不需要写循环。例如，

arr * 2

会将数组中每个元素都乘以2。这种向量化操作是NumPy性能的秘密武器，它在底层是用C或fortran实现的，速度远超Python的循环。

立即学习“Python免费学习笔记（深入）”；

索引和切片也与Python列表类似，但功能更强大。你可以用

arr[0]

访问第一个元素，用

arr[1:3]

进行切片。对于多维数组，比如

matrix = np.array([[1, 2, 3], [4, 5, 6]])

，你可以用

matrix[0, 1]

访问第一行第二列的元素。更酷的是布尔索引，比如

arr[arr > 5]

会返回所有大于5的元素，这在数据筛选时简直是神来之笔。

数组的形状（shape）操作也是日常。

arr.shape

会告诉你数组的维度，

arr.reshape((new_rows, new_cols))

能改变数组的形状，但总元素数量必须保持不变。需要注意的是，

reshape

通常返回一个新视图，而不是修改原数组，这在处理大型数据集时需要留意，以免意外修改数据。

NumPy数组与Python列表：性能与用途的深层考量

我们经常会遇到一个问题：既然Python有列表，为什么还需要NumPy数组？这其实是效率和功能定位的根本区别。Python列表在设计上是为了通用性，它可以存储任何类型的对象，并且大小是动态变化的。这种灵活性是以牺牲性能为代价的。当你处理几十万、上百万甚至上亿的数值数据时，Python列表的迭代和计算会变得异常缓慢，内存占用也高得惊人。

NumPy数组则完全不同。它的核心是一个固定大小、同质类型元素的连续内存块。这意味着数据存储更紧凑，处理器可以更高效地访问和操作这些数据。这种“同质性”是关键，它允许NumPy在底层使用高度优化的C/Fortran代码来执行向量化操作，比如矩阵乘法、元素级运算等，其速度比Python的for循环快上几十甚至几百倍。

从用途上看，Python列表更适合存储异构数据集合，比如一个包含字符串、数字、对象混合的购物车列表。而NumPy数组则专注于数值计算，是科学计算、数据分析、机器学习领域的基础。无论是处理图像像素、音频信号、股票数据，还是训练神经网络，NumPy都提供了坚实而高效的底层支持。可以说，没有NumPy，Python在科学计算领域的地位会大打折扣。所以，不是说谁取代谁，而是它们各司其职，相辅相成。

掌握NumPy数组的创建技巧：从基础到进阶

创建NumPy数组远不止从Python列表转换那么简单。了解不同的创建方法，可以让我们更灵活、更高效地生成所需的数据结构。除了

np.array()

，还有一些非常常用的函数。

比如，

np.zeros(shape)

和

np.ones(shape)

是初始化全零或全一数组的利器，它们接受一个表示形状的元组。如果你需要一个填充了某个特定值的数组，

np.full(shape, fill_value)

就派上用场了。

对于序列数据，

np.arange(start, stop, step)

类似于Python的

range()

，但它返回的是NumPy数组。而

np.linspace(start, stop, num)

则更适合在指定范围内生成等间隔的数字，例如在0到10之间生成50个点，

np.linspace(0, 10, 50)

，这在数据可视化和函数采样中极其方便。

随机数生成也是NumPy的强项。

np.random.rand(d0, d1, ...)

可以生成[0, 1)区间的均匀分布随机数，而

np.random.randn(d0, d1, ...)

则生成标准正态分布（均值为0，方差为1）的随机数。如果你需要指定范围内的整数，

np.random.randint(low, high, size)

是首选。这些随机数生成器在模拟、机器学习模型初始化等方面有着广泛应用。

此外，还有

np.empty(shape)

，它创建一个未初始化的数组，里面的值是内存中原有的任意值，这在某些对性能要求极致的场景下，可以稍微快一点，因为它省去了初始化的开销，但使用时要确保后续会立即填充数据。

理解这些创建函数，能让我们在面对不同的数据初始化需求时，选择最合适、最有效的方法，避免不必要的性能损耗。

NumPy数组的高级操作：广播、聚合与线性代数

NumPy的魅力不仅在于基本的创建和索引，更在于它提供了一系列强大的高级操作，让复杂的数据处理变得简洁高效。

广播（Broadcasting）是我认为NumPy最“魔幻”的特性之一。它允许NumPy在执行算术运算时，自动处理形状不同的数组。举个例子，一个形状为

(3, 4)

的二维数组与一个形状为

(4,)

的一维数组相加，NumPy会自动将一维数组“扩展”到二维数组的每一行，然后进行元素级加法。这个过程无需显式地复制数据，极大地节省了内存和计算资源。广播规则有些微妙，但核心原则是：如果两个数组的维度不同，较小的数组会被“拉伸”以匹配较大的数组；如果维度相同，但某个轴的长度不同，并且其中一个轴的长度是1，那么这个轴会被“拉伸”以匹配另一个数组的长度。理解广播，能让你写出更简洁、更“NumPyic”的代码。

聚合函数（Aggregation Functions）也是日常数据分析的利器。