pytorch MSELoss计算平均的实现方法

作者:sunrise_ccx 时间:2021-07-31 18:44:15 

给定损失函数的输入y,pred,shape均为bxc。

若设定loss_fn = torch.nn.MSELoss(reduction='mean'),最终的输出值其实是(y - pred)每个元素数字的平方之和除以(bxc),也就是在batch和特征维度上都取了平均。

如果只想在batch上做平均,可以这样写:


loss_fn = torch.nn.MSELoss(reduction='sum')
loss = loss_fn(pred, y) / pred.size(0)

补充:PyTorch中MSELoss的使用

参数


torch.nn.MSELoss(size_average=None, reduce=None, reduction: str = 'mean')

size_average和reduce在当前版本的pytorch已经不建议使用了,只设置reduction就行了。

reduction的可选参数有:'none' 、'mean' 、'sum'

reduction='none':求所有对应位置的差的平方,返回的仍然是一个和原来形状一样的矩阵。

reduction='mean':求所有对应位置差的平方的均值,返回的是一个标量。

reduction='sum':求所有对应位置差的平方的和,返回的是一个标量。

更多可查看官方文档

举例

首先假设有三个数据样本分别经过神经网络运算,得到三个输出与其标签分别是:


y_pre = torch.Tensor([[1, 2, 3],
                     [2, 1, 3],
                     [3, 1, 2]])

y_label = torch.Tensor([[1, 0, 0],
                       [0, 1, 0],
                       [0, 0, 1]])

如果reduction='none':


criterion1 = nn.MSELoss(reduction='none')
loss1 = criterion1(x, y)
print(loss1)

则输出:

tensor([[0., 4., 9.],

[4., 0., 9.],

[9., 1., 1.]])

如果reduction='mean':


criterion2 = nn.MSELoss(reduction='mean')
loss2 = criterion2(x, y)
print(loss2)

则输出:

tensor(4.1111)

如果reduction='sum':


criterion3 = nn.MSELoss(reduction='sum')
loss3 = criterion3(x, y)
print(loss3)

则输出:

tensor(37.)

在反向传播时的使用

一般在反向传播时,都是先求loss,再使用loss.backward()求loss对每个参数 w_ij和b的偏导数(也可以理解为梯度)。

这里要注意的是,只有标量才能执行backward()函数,因此在反向传播中reduction不能设为'none'。

但具体设置为'sum'还是'mean'都是可以的。

若设置为'sum',则有Loss=loss_1+loss_2+loss_3,表示总的Loss由每个实例的loss_i构成,在通过Loss求梯度时,将每个loss_i的梯度也都考虑进去了。

若设置为'mean',则相比'sum'相当于Loss变成了Loss*(1/i),这在参数更新时影响不大,因为有学习率a的存在。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

来源:https://blog.csdn.net/qq_27061325/article/details/96130824

标签:pytorch,MSELoss,平均
0
投稿

猜你喜欢

  • 用SQL语句删除重复记录的四种方法

    2011-05-03 09:25:00
  • Django模型中字段属性choice使用说明

    2022-06-23 16:28:20
  • Python使用ffmpy将amr格式的音频转化为mp3格式的例子

    2021-06-14 13:50:07
  • Python学习小技巧之列表项的排序

    2022-03-31 12:06:12
  • python保留两位小数的3种方法实例

    2022-01-28 20:20:36
  • python利用跳板机ssh远程连接redis的方法

    2023-04-04 23:06:01
  • 在SQL Server中编写通用数据访问方法

    2009-01-20 11:35:00
  • Python基于动态规划算法计算单词距离

    2021-09-18 11:18:16
  • Django静态资源部署404问题解决方案

    2021-05-20 21:28:46
  • 网站设计中的面包屑[译]

    2009-03-22 15:42:00
  • javascript双击自动滚屏单击停止

    2008-10-13 13:05:00
  • 高效率的GetRows()的使用方法

    2008-09-23 18:29:00
  • 基于Python实现天天酷跑功能

    2022-09-30 01:18:33
  • Python实现视频中添加音频工具详解

    2022-06-03 12:32:28
  • JS获取页面窗口实际大小函数

    2008-01-28 13:18:00
  • 详解python列表(list)的使用技巧及高级操作

    2021-05-12 15:26:47
  • python中日期和时间格式化输出的方法小结

    2023-07-01 11:39:31
  • Python的Flask框架标配模板引擎Jinja2的使用教程

    2022-07-17 08:47:35
  • python判断自身是否正在运行的方法

    2022-07-30 02:34:44
  • Python如何实现的二分查找算法

    2021-10-22 18:39:30
  • asp之家 网络编程 m.aspxhome.com