PyTorch Tensor维度处理详解：创建、聚合与变换-小浪学习网

PyTorch Tensor维度处理详解：创建、聚合与变换

本文深入解析了pytorch中Tensor的维度处理方式，涵盖了Tensor创建时size参数的用法，以及torch.Tensor.sum()和torch.Tensor.softmax()等方法中axis参数的行为。通过详细的示例和解释，帮助读者理解PyTorch Tensor在维度上的操作逻辑，从而更有效地利用PyTorch进行深度学习模型的开发和训练。

Tensor 创建

在 PyTorch 中创建 Tensor 时，size 参数用于指定 Tensor 的形状。size 参数接受一个元组，元组中的每个元素代表一个维度的大小。需要注意的是，size 参数指定维度时，是从最后一个元素到第一个元素，即最后一个元素代表列数，倒数第二个元素代表行数，以此类推。

import torch  # 可以简写： tensor1 = torch.ones((2, 3)) tensor2 = torch.ones(2, 3)  # 不能简写： tensor3 = torch.randint(10, (2, 3))  print(tensor1.shape) # 输出: torch.Size([2, 3]) print(tensor2.shape) # 输出: torch.Size([2, 3]) print(tensor3.shape) # 输出: torch.Size([2, 3])

以下是一些 size 参数的示例及其对应的 Tensor 描述：

(2,): 长度为 2 的行向量，没有第二个维度。
(2, 1): 矩阵，看起来像列向量，但实际上是二维的。
(1, 2): 矩阵，看起来像行向量，但实际上是二维的。
(3, 2): 矩阵。
(4, 3, 2): 三维 Tensor（”3D 矩阵”）。

Tensor 聚合

pytorch.Tensor 类中的许多方法需要一个 axis 参数（通常为 int 或 list of int）。该参数指定了操作沿哪个轴进行。对于由 1 组成的 Tensor（使用 torch.ones(size) 创建），torch.sum(axis=axis) 操作的行为如下：

size	axis	output shape	output
(2,)	-1 或 0	[]	tensor(2.)
(2,1)	-1 或 1	[2]	tensor([1., 1.])
(1,2)	-1 或 1	[1]	tensor([2.])
(3,2)	-1 或 1	[3]	tensor([2., 2., 2.])
(4,3,2)	-1 或 2	[4,3]	tensor([[2., 2., 2.],[2., 2., 2.],[2., 2., 2.],[2., 2., 2.]])

从上表可以看出，torch.sum(axis=-1) 总是执行以下两项操作：

沿列轴求和所有元素。 对于行向量（一维 Tensor），结果是一个数字，它是向量中所有元素的总和；对于只有一列的矩阵，由于只有一行，因此总和等于矩阵的原始值；对于只有一行的矩阵，结果是一个大小为 1 的一维向量，其唯一元素是矩阵中所有元素的总和；对于更高维度的矩阵和 Tensor，求和发生在“每行”，当你考虑到 Tensor 的标准显示时。
降低维度并“移动”每个轴。 最后一个轴消失，其位置由倒数第二个轴占据，倒数第二个轴的位置由倒数第三个轴占据，依此类推。这可能会令人困惑，因为 PyTorch 似乎“旋转”了结果矩阵，但这种行为是因为 Tensor 中的最后一个维度始终是列数并如此显示。

对于 axis 参数的其他指定，行为类似。

Tensor 变换

在 Tensor 变换中，原始 Tensor 的形状被保留，但其值被更改。以 torch.softmax() 为例：softmax 变换这些值，使其总和等于 1。softmax transforms the values so that their sum equals one。dim 参数允许你选择沿哪个轴的元素总和等于 1：

import torch  # 对于 dim=-1，沿列的总和等于 1： tensor4 = torch.randn((2, 2, 2)).softmax(dim=-1) print(tensor4)  # 对于 dim=-2，沿行的总和等于 1： tensor5 = torch.randn((2, 2, 2)).softmax(dim=-2) print(tensor5)

注意事项：