Python之维度dim的定义及其理解使用方式

作者:静静喜欢大白 时间:2021-06-10 12:33:04 

一、dim的定义

Python之维度dim的定义及其理解使用方式

TensorFlow对张量的阶、维度、形状有着明确的定义,而在pytorh中对其的定义却模糊不清,仅仅有一个torch.size()的函数来查看张量的大小(我理解的这个大小指的就是TensorFlow对张量的形状描述,也和numpy的.shape类似)。

所以,首先要搞清楚如何看一个张量的形状

import torch
z = torch.ones(2,3,4)
print(z)
print(z.size())
print(z.size(0))
print(z.size(1))
print(z.size(2))

以上代码的控制台输出为:

tensor([[[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]],
 
        [[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]])
torch.Size([2, 3, 4])
2
3
4

可见,我们成功创建了一个(2,3,4)大小的张量,那么我们人工应该怎么辨别一个张量的大小呢?

为了直观,我把这个张量的中括号调整一个位置:

[
    [
         [1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]
    ],
 
    [
         [1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]
    ]
]

我们可以看到:

  • 第一层(最外层)中括号里面包含了两个中括号(以逗号进行分割),这就是(2,3,4)中的2

  • 第二层中括号里面包含了三个中括号(以逗号进行分割),这就是(2,3,4)中的3

  • 第三层中括号里面包含了四个数(以逗号进行分割),这就是(2,3,4)中的4

结论:pytorch中的tensor维度可以通过第一个数前面的中括号数量来判断,有几个中括号维度就是多少。拿到一个维度很高的向量,将最外层的中括号去掉,数最外层逗号的个数,逗号个数加一就是最高维度的维数,如此循环,直到全部解析完毕。

我们还看到:

z.size(0) = 2,z.size(1) = 3,z.size(2) = 4

第0维度为2,第1维度为3,第2维度为4,即维度的标号是以0开始的

二、dim 的理解

网上很多对dim的理解,比如,dim=0,表示的是行,函数的意思就是不要行这一维度,保留列巴拉巴拉之类的,个人觉得不好理解。

比如下图博主的理解

Python之维度dim的定义及其理解使用方式

那我的理解就是:

控制变量法大家知道吗??或者消融实验?就是几个方法或者实验的比较,保持只有一个因素是可变的,其他都是一致的,就是控制变量法,论文术语也叫消融实验。

所以,dim的使用也是这样,只有dim指定的维度是可变的,其他都是固定不变的

  • dim = 0,列不变(按列-将当前列所有行数据-计算),指定的是行,那就是行变,理解成:针对每一列中,所有行之间的数据比较或者求和等操作,是每一行的比较,因为行是可变的。

  • dim = 1,行不变(按行-将当前行所有列数据-计算),指定的是列,那就是列变,理解成:针对每一行中,所有列之间的数据比较或者求和等操作,是每一行的比较,因为行是可变的。

三、举例

torch.argmax()  

  •  得到最大值的序号索引

  • dim=0保留列维度,不要行了,保留列的size就可以了

  • dim=1保留行维度,不要列了,保留行的size就可以了

a = torch.rand((3,4))
print(a)
b = torch.argmax(a, dim=1) ##行不变,指定列,列之间的比较,对下面每列数值进行比较,将最大值对应序号存下,比如下面第一列中第一个值最大,为0,第二列中第二个是最大值,为1,第三列同
print(b)
>>tensor([[0.8338, 0.6953, 0.7558, 0.5803],
       [0.2105, 0.7638, 0.0912, 0.3341],
       [0.5585, 0.8019, 0.6590, 0.2268]])
>>tensor([0, 1, 1])

说明:dim=1,指定列,也就是行不变,列之间的比较,所以原来的a有三行,最后argmax()出来的应该也是三个值,第一行的时候,同一列之间比较,最大值是0.8338,索引是0,同理,第二行,最大值的索引是1……

sum()

求和

a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
       [3, 4, 5]])
a.sum()
a.sum(dim=0) #列不变,指定行,行是可变的,对每一列中的所有行之间的数值进行求和,比如这个例子中,第一列0+3,第二列1+4,第三列2+5
a.sum(dim=1) #行不变,指定列,列是可变的,对每一行中的所有列之间的数值进行求和,比如这个例子中,第一行0+1+2,第二行3+4+5
>>tensor(15.)
>>tensor([3., 5., 7.])
>>tensor([ 3., 12.])

说明:dim=0,指定行,行是可变的,列是不变,所以就是同一列中,每一个行的比较,所以a.sum(dim = 0),第一列的和就是3,第二列的和就是5,第三列的和就是7.

同理,a.sum(dim=1),指定列,列是可变的,行是不变的,所以就是同一列之间的比较或者操作,所以第一行的求和是3,第二行的求和是12

cumsum()

累加

a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
       [3, 4, 5]])
a.cumsum(dim=0)  # 指定行,列不变,行变,从第一行到最后一行的累加
>>tensor([[0, 1, 2],
       [3, 5, 7]])

a.cumsum(dim=1) # 指定列,行不变,列变,从第一列到最后一列的累加
>>tensor([[ 0,  1,  3],
       [ 3,  7, 12]])

来源:https://jingliu.blog.csdn.net/article/details/114262597

标签:Python,维度,dim
0
投稿

猜你喜欢

  • 跟老齐学Python之dict()的操作方法

    2022-05-12 16:54:43
  • Python扫描IP段查看指定端口是否开放的方法

    2023-10-14 22:57:17
  • python调用百度API实现人脸识别

    2021-06-11 23:52:23
  • Python图像处理之图片文字识别功能(OCR)

    2023-10-29 17:38:00
  • 详解Python 中的容器 collections

    2021-09-12 07:11:38
  • Python实现将绝对URL替换成相对URL的方法

    2023-08-28 13:40:08
  • Golang Goroutine的使用

    2023-09-20 20:38:45
  • php+Memcached实现简单留言板功能示例

    2023-11-15 09:30:02
  • 前端开发中一些常用技巧总结

    2010-07-18 13:13:00
  • css学习笔记:为什么在IE6下图片会往下掉一行

    2009-06-19 12:50:00
  • 用 Python 脚本实现电脑唤醒后自动拍照并截屏发邮件通知

    2023-08-30 14:15:44
  • Python绘图之二维图与三维图详解

    2023-01-09 11:25:05
  • numpy系列之数组重塑的实现

    2022-10-20 13:36:35
  • php投票系统之增加与删除投票(管理员篇)

    2023-10-14 09:44:53
  • 使用pandas实现csv/excel sheet互相转换的方法

    2022-05-22 18:38:18
  • windows及linux环境下永久修改pip镜像源的方法

    2021-02-19 09:08:59
  • Python编程判断这天是这一年第几天的方法示例

    2022-01-30 22:38:19
  • Python Django ORM与模型详解

    2022-01-03 10:40:53
  • Python群发邮件实例代码

    2021-05-05 18:42:35
  • ASP无组件汉字验证码

    2008-05-08 13:19:00
  • asp之家 网络编程 m.aspxhome.com