pytorch自定义不可导激活函数的操作

作者：Luna_Lovegood_001 时间：2022-07-05 10:09:13　

pytorch自定义不可导激活函数

今天自定义不可导函数的时候遇到了一个大坑。

首先我需要自定义一个函数：sign_f

import torch
from torch.autograd import Function
import torch.nn as nn
class sign_f(Function):
@staticmethod
def forward(ctx, inputs):
output = inputs.new(inputs.size())
output[inputs >= 0.] = 1
output[inputs < 0.] = -1
ctx.save_for_backward(inputs)
return output

@staticmethod
def backward(ctx, grad_output):
input_, = ctx.saved_tensors
grad_output[input_>1.] = 0
grad_output[input_<-1.] = 0
return grad_output

然后我需要把它封装为一个module 类型，就像 nn.Conv2d 模块封装 f.conv2d 一样，于是

import torch
from torch.autograd import Function
import torch.nn as nn
class sign_(nn.Module):
# 我需要的module
def __init__(self, *kargs, **kwargs):
super(sign_, self).__init__(*kargs, **kwargs)

def forward(self, inputs):
# 使用自定义函数
outs = sign_f(inputs)
return outs

class sign_f(Function):
@staticmethod
def forward(ctx, inputs):
output = inputs.new(inputs.size())
output[inputs >= 0.] = 1
output[inputs < 0.] = -1
ctx.save_for_backward(inputs)
return output

@staticmethod
def backward(ctx, grad_output):
input_, = ctx.saved_tensors
grad_output[input_>1.] = 0
grad_output[input_<-1.] = 0
return grad_output

结果报错

TypeError: backward() missing 2 required positional arguments: 'ctx' and 'grad_output'

我试了半天，发现自定义函数后面要加 apply ，详细见下面

import torch
from torch.autograd import Function
import torch.nn as nn
class sign_(nn.Module):

def __init__(self, *kargs, **kwargs):
super(sign_, self).__init__(*kargs, **kwargs)
self.r = sign_f.apply ### <-----注意此处

def forward(self, inputs):
outs = self.r(inputs)
return outs

class sign_f(Function):
@staticmethod
def forward(ctx, inputs):
output = inputs.new(inputs.size())
output[inputs >= 0.] = 1
output[inputs < 0.] = -1
ctx.save_for_backward(inputs)
return output

@staticmethod
def backward(ctx, grad_output):
input_, = ctx.saved_tensors
grad_output[input_>1.] = 0
grad_output[input_<-1.] = 0
return grad_output

问题解决了！

PyTorch自定义带学习参数的激活函数（如sigmoid）

有的时候我们需要给损失函数设一个超参数但是又不想设固定阈值想和网络一起自动学习，例如给Sigmoid一个参数alpha进行调节

函数如下：

import torch.nn as nn
import torch
class LearnableSigmoid(nn.Module):
def __init__(self, ):
super(LearnableSigmoid, self).__init__()
self.weight = torch.nn.Parameter(torch.FloatTensor(1), requires_grad=True)

self.reset_parameters()
def reset_parameters(self):
self.weight.data.fill_(1.0)

def forward(self, input):
return 1/(1 + torch.exp(-self.weight*input))

验证和Sigmoid的一致性

class LearnableSigmoid(nn.Module):
def __init__(self, ):
super(LearnableSigmoid, self).__init__()
self.weight = torch.nn.Parameter(torch.FloatTensor(1), requires_grad=True)

self.reset_parameters()
def reset_parameters(self):
self.weight.data.fill_(1.0)

def forward(self, input):
return 1/(1 + torch.exp(-self.weight*input))

Sigmoid = nn.Sigmoid()
LearnSigmoid = LearnableSigmoid()
input = torch.tensor([[0.5289, 0.1338, 0.3513],
[0.4379, 0.1828, 0.4629],
[0.4302, 0.1358, 0.4180]])

print(Sigmoid(input))
print(LearnSigmoid(input))

输出结果

tensor([[0.6292, 0.5334, 0.5869],
[0.6078, 0.5456, 0.6137],
[0.6059, 0.5339, 0.6030]])

tensor([[0.6292, 0.5334, 0.5869],
[0.6078, 0.5456, 0.6137],
[0.6059, 0.5339, 0.6030]], grad_fn=<MulBackward0>)

验证权重是不是会更新

import torch.nn as nn
import torch
import torch.optim as optim
class LearnableSigmoid(nn.Module):
def __init__(self, ):
super(LearnableSigmoid, self).__init__()
self.weight = torch.nn.Parameter(torch.FloatTensor(1), requires_grad=True)

self.reset_parameters()

def reset_parameters(self):
self.weight.data.fill_(1.0)

def forward(self, input):
return 1/(1 + torch.exp(-self.weight*input))

class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.LSigmoid = LearnableSigmoid()
def forward(self, x):
x = self.LSigmoid(x)
return x

net = Net()
print(list(net.parameters()))
optimizer = optim.SGD(net.parameters(), lr=0.01)
learning_rate=0.001
input_data=torch.randn(10,2)
target=torch.FloatTensor(10, 2).random_(8)
criterion = torch.nn.MSELoss(reduce=True, size_average=True)

for i in range(2):
optimizer.zero_grad()
output = net(input_data)
loss = criterion(output, target)
loss.backward()
optimizer.step()
print(list(net.parameters()))

输出结果

tensor([1.], requires_grad=True)]
[Parameter containing:
tensor([0.9979], requires_grad=True)]
[Parameter containing:
tensor([0.9958], requires_grad=True)]

会更新~

来源：https://blog.csdn.net/qq_43110298/article/details/115032262

标签：pytorch,激活,函数

投稿

pytorch自定义不可导激活函数的操作

pytorch自定义不可导激活函数

PyTorch自定义带学习参数的激活函数（如sigmoid）

猜你喜欢

golang操作mongodb的方法

Python实现调用另一个路径下py文件中的函数方法总结

ASP获取远程文件大小信息(通过header头信息)

简化的CSS Reset — 常用CSS重设实例

PHP 二维数组根据某个字段排序的具体实现

使用FCKeditor添加文章时，在文章最后多了逗号

ASP中如何判断字符串中是否包含字母和数字

深入浅析python的第三方库pandas

Access的特点及其概念问答

如何解决SQLServer占内存过多的问题

CentOS7 LNMP+phpmyadmin环境搭建第三篇phpmyadmin安装

Python 在局部变量域中执行代码

Python中列表与元组的乘法操作示例

如何用ASP输出HTML文件？

HTML,CSS和JavaScript速查表

Python单向链表和双向链表原理与用法实例详解

sqlserver 日期比较、日期查询常用语句：月的第一天，季度的第一天等

python爬虫容易学吗

QQ在线客服网页代码大全

Python基础之numpy库的使用

pytorch自定义不可导激活函数的操作

pytorch自定义不可导激活函数

PyTorch自定义带学习参数的激活函数（如sigmoid）

猜你喜欢

golang操作mongodb的方法

Python实现调用另一个路径下py文件中的函数方法总结

ASP获取远程文件大小信息(通过header头信息)

简化的CSS Reset — 常用CSS重设实例

PHP 二维数组根据某个字段排序的具体实现

使用FCKeditor添加文章时，在文章最后多了逗号

ASP中如何判断字符串中是否包含字母和数字

深入浅析python的第三方库pandas

Access的特点及其概念问答

如何解决SQLServer占内存过多的问题

CentOS7 LNMP+phpmyadmin环境搭建 第三篇phpmyadmin安装

Python 在局部变量域中执行代码

Python中列表与元组的乘法操作示例

如何用ASP输出HTML文件？

HTML,CSS和JavaScript速查表

Python单向链表和双向链表原理与用法实例详解

sqlserver 日期比较、日期查询常用语句：月的第一天，季度的第一天等

python爬虫容易学吗

QQ在线客服网页代码大全

Python基础之numpy库的使用

CentOS7 LNMP+phpmyadmin环境搭建第三篇phpmyadmin安装