pytorch 自定义卷积核进行卷积操作方式
作者:月亮是蓝色 时间:2021-07-24 22:54:39
一 卷积操作:在pytorch搭建起网络时,大家通常都使用已有的框架进行训练,在网络中使用最多就是卷积操作,最熟悉不过的就是
torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)
通过上面的输入发现想自定义自己的卷积核,比如高斯核,发现是行不通的,因为上面的参数里面只有卷积核尺寸,而权值weight是通过梯度一直更新的,是不确定的。
二 需要自己定义卷积核的目的:目前是需要通过一个VGG网络提取特征特后需要对其进行高斯卷积,卷积后再继续输入到网络中训练。
三 解决方案。使用
torch.nn.functional.conv2d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1)
这里注意下weight的参数。与nn.Conv2d的参数不一样
可以发现F.conv2d可以直接输入卷积的权值weight,也就是卷积核。那么接下来就要首先生成一个高斯权重了。这里不直接一步步写了,直接输入就行。
kernel = [[0.03797616, 0.044863533, 0.03797616],
[0.044863533, 0.053, 0.044863533],
[0.03797616, 0.044863533, 0.03797616]]
四 完整代码
class GaussianBlur(nn.Module):
def __init__(self):
super(GaussianBlur, self).__init__()
kernel = [[0.03797616, 0.044863533, 0.03797616],
[0.044863533, 0.053, 0.044863533],
[0.03797616, 0.044863533, 0.03797616]]
kernel = torch.FloatTensor(kernel).unsqueeze(0).unsqueeze(0)
self.weight = nn.Parameter(data=kernel, requires_grad=False)
def forward(self, x):
x1 = x[:, 0]
x2 = x[:, 1]
x3 = x[:, 2]
x1 = F.conv2d(x1.unsqueeze(1), self.weight, padding=2)
x2 = F.conv2d(x2.unsqueeze(1), self.weight, padding=2)
x3 = F.conv2d(x3.unsqueeze(1), self.weight, padding=2)
x = torch.cat([x1, x2, x3], dim=1)
return x
这里为了网络模型需要写成了一个类,这里假设输入的x也就是经过网络提取后的三通道特征图(当然不一定是三通道可以是任意通道)
如果是任意通道的话,使用torch.expand()向输入的维度前面进行扩充。如下:
def blur(self, tensor_image):
kernel = [[0.03797616, 0.044863533, 0.03797616],
[0.044863533, 0.053, 0.044863533],
[0.03797616, 0.044863533, 0.03797616]]
min_batch=tensor_image.size()[0]
channels=tensor_image.size()[1]
out_channel=channels
kernel = torch.FloatTensor(kernel).expand(out_channel,channels,3,3)
self.weight = nn.Parameter(data=kernel, requires_grad=False)
return F.conv2d(tensor_image,self.weight,1,1)
来源:https://blog.csdn.net/lyl771857509/article/details/84113177
标签:pytorch,自定义,卷积核,卷积
0
投稿
猜你喜欢
python使用tkinter模块实现文件选择功能
2022-06-18 18:35:56
浅谈Python 递归算法指归
2023-01-12 06:27:50
WEB页面工具语言XML支持的工具之运用
2008-05-29 10:55:00
记Qzone项目组视觉设计标注的前前后后
2010-03-24 18:03:00
python实现单机五子棋
2021-04-26 05:34:35
实例讲解MySQL统计库表大小
2024-01-19 09:21:53
mysql中如何对列求和
2024-01-16 12:28:48
python 中文乱码问题深入分析
2023-06-12 19:04:37
requests在python中发送请求的实例讲解
2022-06-26 09:04:07
Python的Django框架中TEMPLATES项的设置教程
2022-09-23 03:16:09
Python实现json对值进行模糊搜索的示例详解
2023-07-22 09:35:24
JS与CSS合并写在同一份文件
2010-01-23 12:33:00
利用Google Ajax Library API加速常用js类库的载入
2008-06-17 17:44:00
python正则表达式的使用
2023-07-21 07:42:15
MySQL备份与恢复之冷备(1)
2024-01-26 13:37:50
Django修改端口号与地址的三种方式
2023-06-22 00:48:27
mysql出现10061错误解决办法
2010-07-04 13:36:00
在Django中限制已登录用户的访问的方法
2023-02-20 19:55:14
浅谈Python实时检测CPU和GPU的功耗
2021-06-11 17:05:58
使用Title提升可访问性二
2009-11-16 12:53:00