基于pytorch中的Sequential用法说明

作者:Ibelievesunshine 时间:2023-06-23 14:57:55 

class torch.nn.Sequential(* args)

一个时序容器。Modules 会以他们传入的顺序被添加到容器中。当然,也可以传入一个OrderedDict。

为了更容易的理解如何使用Sequential, 下面给出了一个例子:


# Example of using Sequential

model = nn.Sequential(
    nn.Conv2d(1,20,5),
    nn.ReLU(),
    nn.Conv2d(20,64,5),
    nn.ReLU()
   )
# Example of using Sequential with OrderedDict
model = nn.Sequential(OrderedDict([
    ('conv1', nn.Conv2d(1,20,5)),
    ('relu1', nn.ReLU()),
    ('conv2', nn.Conv2d(20,64,5)),
    ('relu2', nn.ReLU())
   ]))

补充知识:pytorch 中 torch.optim.Adam 方法的使用和参数的解释

class torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)[source]

实现Adam算法。

它在Adam: A Method for Stochastic Optimization中被提出。

参数:

params (iterable) – 待优化参数的iterable或者是定义了参数组的dict

lr (float, 可选) – 学习率(默认:1e-3)

betas (Tuple[float, float], 可选) – 用于计算梯度以及梯度平方的运行平均值的系数(默认:0.9,0.999)

eps (float, 可选) – 为了增加数值计算的稳定性而加到分母里的项(默认:1e-8)

weight_decay (float, 可选) – 权重衰减(L2惩罚)(默认: 0)

个人理解:

lr:同样也称为学习率或步长因子,它控制了权重的更新比率(如 0.001)。较大的值(如 0.3)在学习率更新前会有更快的初始学习,而较小的值(如 1.0E-5)会令训练收敛到更好的性能。

betas = (beta1,beta2)

beta1:一阶矩估计的指数衰减率(如 0.9)。

beta2:二阶矩估计的指数衰减率(如 0.999)。该超参数在稀疏梯度(如在 NLP 或计算机视觉任务中)中应该设置为接近 1 的数。

eps:epsilon:该参数是非常小的数,其为了防止在实现中除以零(如 10E-8)。

读者可结合官方文档中的参数说明和我的个人理解掌握该函数的用法。

来源:https://blog.csdn.net/Ibelievesunshine/article/details/99613508

标签:pytorch,Sequential
0
投稿

猜你喜欢

  • 如何使用python wasmtime调用rust生成的wasm库

    2023-11-26 23:58:38
  • 以一段代码为实例快速入门Python2.7

    2021-04-24 05:00:06
  • Python机器学习pytorch交叉熵损失函数的深刻理解

    2021-12-11 06:09:40
  • 查找python项目依赖并生成requirements.txt的方法

    2021-11-27 20:41:43
  • js 原型对象和原型链理解

    2024-04-23 09:20:23
  • php实现utf-8和GB2312编码相互转换函数代码

    2024-04-29 13:56:12
  • python安装pywifi全过程

    2023-05-25 22:59:29
  • Asp编写不再让人讨厌的自动弹出窗口

    2007-09-29 12:16:00
  • 人工智能学习Pytorch梯度下降优化示例详解

    2023-02-11 16:28:02
  • Python安装与基本数据类型教程详解

    2022-04-18 18:44:59
  • python3.5安装python3-tk详解

    2021-01-02 02:15:23
  • python 三元运算符使用解析

    2021-05-02 17:03:28
  • Python爬虫框架Scrapy实战之批量抓取招聘信息

    2022-03-28 11:38:09
  • python实现马丁策略回测3000只股票的实例代码

    2023-03-02 01:12:29
  • Python关键字及可变参数*args,**kw原理解析

    2023-08-25 06:41:47
  • Python GUI学习之登录系统界面篇

    2023-01-06 14:32:42
  • 符合w3c标准flash插入代码,常用flash参数设置

    2009-01-20 18:47:00
  • python:socket传输大文件示例

    2022-04-18 19:44:26
  • Python去除PDF水印的实现示例

    2022-08-13 19:26:45
  • 深入理解Python虚拟机中字节(bytes)的实现原理及源码剖析

    2021-12-20 22:51:28
  • asp之家 网络编程 m.aspxhome.com