Pytorch 实现sobel算子的卷积操作详解

作者:洪流之源 时间:2022-02-22 10:11:37 

卷积在pytorch中有两种实现,一种是torch.nn.Conv2d(),一种是torch.nn.functional.conv2d(),这两种方式本质都是执行卷积操作,对输入的要求也是一样的,首先需要输入的是一个torch.autograd.Variable()的类型,大小是(batch,channel, H,W),其中batch表示输入的一批数据的数目,channel表示输入的通道数。

一般一张彩色的图片是3,灰度图片是1,而卷积网络过程中的通道数比较大,会出现几十到几百的通道数。H和W表示输入图片的高度和宽度,比如一个batch是32张图片,每张图片是3通道,高和宽分别是50和100,那么输入的大小就是(32,3,50,100)。

如下代码是卷积执行soble边缘检测算子的实现:


import torch
import numpy as np
from torch import nn
from PIL import Image
from torch.autograd import Variable
import torch.nn.functional as F

def nn_conv2d(im):
 # 用nn.Conv2d定义卷积操作
 conv_op = nn.Conv2d(1, 1, 3, bias=False)
 # 定义sobel算子参数
 sobel_kernel = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]], dtype='float32')
 # 将sobel算子转换为适配卷积操作的卷积核
 sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))
 # 给卷积操作的卷积核赋值
 conv_op.weight.data = torch.from_numpy(sobel_kernel)
 # 对图像进行卷积操作
 edge_detect = conv_op(Variable(im))
 # 将输出转换为图片格式
 edge_detect = edge_detect.squeeze().detach().numpy()
 return edge_detect

def functional_conv2d(im):
 sobel_kernel = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]], dtype='float32') #
 sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))
 weight = Variable(torch.from_numpy(sobel_kernel))
 edge_detect = F.conv2d(Variable(im), weight)
 edge_detect = edge_detect.squeeze().detach().numpy()
 return edge_detect

def main():
 # 读入一张图片,并转换为灰度图
 im = Image.open('./cat.jpg').convert('L')
 # 将图片数据转换为矩阵
 im = np.array(im, dtype='float32')
 # 将图片矩阵转换为pytorch tensor,并适配卷积输入的要求
 im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
 # 边缘检测操作
 # edge_detect = nn_conv2d(im)
 edge_detect = functional_conv2d(im)
 # 将array数据转换为image
 im = Image.fromarray(edge_detect)
 # image数据转换为灰度模式
 im = im.convert('L')
 # 保存图片
 im.save('edge.jpg', quality=95)

if __name__ == "__main__":
 main()

原图片:cat.jpg

Pytorch 实现sobel算子的卷积操作详解

结果图片:edge.jpg

Pytorch 实现sobel算子的卷积操作详解

来源:https://blog.csdn.net/weicao1990/article/details/100521530

标签:Pytorch,sobel算子,卷积
0
投稿

猜你喜欢

  • Go语言中的Slice学习总结

    2023-07-22 23:33:37
  • 详解python之协程gevent模块

    2022-12-20 05:42:54
  • Python tempfile模块生成临时文件和临时目录

    2022-06-28 05:20:20
  • MySQL中Order By多字段排序规则代码示例

    2024-01-22 01:10:35
  • python opencv把一张图片嵌入(叠加)到另一张图片上的实现代码

    2021-08-11 12:52:30
  • 浅谈为什么#{}可以防止SQL注入

    2024-01-27 07:19:08
  • Python时间的精准正则匹配方法分析

    2022-12-10 12:59:28
  • 查看Oracle的执行计划一句话命令

    2010-07-16 13:02:00
  • python字符类型的一些方法小结

    2023-06-27 00:00:20
  • python 绘制场景热力图的示例

    2022-01-22 07:03:21
  • 二级下拉菜单代码

    2008-11-01 18:18:00
  • 详解Django关于StreamingHttpResponse与FileResponse文件下载的最优方法

    2021-04-13 08:17:01
  • PHP中大于2038年时间戳的问题处理方案

    2023-07-03 14:33:26
  • python 处理数字,把大于上限的数字置零实现方法

    2022-11-13 09:20:56
  • 3个asp简单技巧

    2009-11-26 20:55:00
  • Python机器学习NLP自然语言处理基本操作词袋模型

    2023-08-20 06:23:30
  • python模块之re正则表达式详解

    2021-08-15 03:34:52
  • SQL Server数据库入门学习总结

    2024-01-21 18:23:25
  • Data URI 和 MHTML

    2009-08-16 16:19:00
  • JS如何实现在弹出窗口中加载页面

    2024-04-29 14:07:53
  • asp之家 网络编程 m.aspxhome.com