Python OpenCV 针对图像细节的不同操作技巧

作者:梦想橡皮擦 时间:2021-08-13 01:29:22 

本系列专栏写作将采用首创的问答式写作形式,快速让你学习到 OpenCV 的初级、中级、高级知识。

6. 在 Python OpenCV 针对图像细节的不同操作

本篇博客的目标将为你解释一幅图像的拆解,包括图像像素的说明,图像属性信息的获取与修改,
图像目标区域 ROI 相关内容,以及图像通道的知识(包括拆分通道和合并通道)

这些内容在知识结构上与 numpy 库十分紧密,如果从学习的角度出发,建议你储备一下 numpy 相关知识。

读取修改图像的像素值

在之前的博客中,我们已经学到了如何读取一幅图像,使用 cv2.imread 函数即可,并且掌握了该函数的两个关键参数。

读取图片之后,我们可以直接使用操作数组的方式获取图像任意位置的颜色,一般这个颜色的默认顺序是 BGR。

测试代码如下:


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 获取 100 x 100 位置的像素值
print(src[100, 100])

cv2.imshow("src", src)

cv2.waitKey()

这里首先获取 100 x 100 位置的像素值。
src[100,100]会获取到三个值,分别对应的 BGR 通道的值。我们在图片上标记一个像素点,rows = 250,cols=470 ,接下来修改上述代码,看获取到的 BGR 值。


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470])

cv2.imshow("src", src)

cv2.waitKey()

Python OpenCV 针对图像细节的不同操作技巧

上文特别注意的就是,获取像素值的格式为 [cols,rows],列在前,行在后。

以上获取到的是 BGR 值,也可以只获取单个通道的值,对应的代码是 [cols,rows,channel],对应到代码部分,如下所示:


# 获取蓝色通道值
print(src[250, 470, 0])

蓝色通道对应 0,绿色通道为 1,红色通道为 2,超出以上三个值,就会出现如下错误:


IndexError: index 3 is out of bounds for axis 2 with size 3

当前如果你直接读取了灰度图,例如下述代码,三个通道的值是相同的。


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg", 0)

# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470])

cv2.imshow("src", src)

cv2.waitKey()

这个地方还有一个编码上存在的潜在问题,如果读取的是四通道图片,即图片有透明度,那数组的索引值可以读取到 3,也就是下述代码是正确的。


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./test.jpg", -1)

# 注意获取像素值的格式为 [cols,rows]
print(src[250, 470, 3])

cv2.imshow("src", src)

cv2.waitKey()

src[250, 470, 3] 成功读取到了透明通道的值。

我们可以针对特定的像素点进行值的修改,例如下述代码


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意获取像素值的格式为 [cols,rows]
src[250, 470] = [255, 255, 255]

cv2.imshow("src", src)

cv2.waitKey()

注意下图的红色箭头指向的位置,出现一个白色亮点,使用该办法,可以制造出一个【椒盐图片】。

Python OpenCV 针对图像细节的不同操作技巧

这个地方需要注意的一个潜在 BUG,读取图片的通道数,决定了你复制时数组元素个数,例如下述代码将会报错。


import cv2
import matplotlib.pyplot as plt

src = cv2.imread("./6_test.jpg")

# 注意获取像素值的格式为 [cols,rows]
src[250, 470] = [255, 255, 255, 255]

cv2.imshow("src", src)

cv2.waitKey()

错误信息都是类似的,提示数组维度不同。


ValueError: cannot copy sequence with size 4 to array axis with dimension 3

最后一点使用以上方式操作图像的像素点,非常耗时,因为一张图片的像素点数据是非常大的,一般情况下能用 numpy 集成好的方法,就不要用这种最笨拙的方式。

使用 numpy 获取通道值,注意该方式获取的是标量,如果你想获得所有 BGR 的值,你需要使用 array.item() 依次获取。


import cv2
import numpy as np

src = cv2.imread("./6_test.jpg")
print(src[100, 100])
b = src.item(100, 100, 0)
g = src.item(100, 100, 1)
r = src.item(100, 100, 2)
print(b, g, r)

cv2.imshow("src", src)
cv2.waitKey()

如果希望设置该值,直接使用 itemset 函数即可。


src.itemset((100, 100, 0), 200)
print(src[100, 100])

可以任意寻找一张图片进行对应的测试,运行效果如下:

[ 31 68 118]
31 68 118
[200 68 118]

OpenCV 中图像属性常见问题解析

对于一幅图像,除了像素矩阵以外,还有一个非常重要的内容,是图像的属性,这些包括行、列、通道、数据类型,像素数量、图像形状等内容。

例如,我们经常使用 img.shape 去获取图像的形状,尤其注意的是,返回的内容是行数(rows),列数(cols),以及通道数(channels),并且返回值类型是一个元组。

如果你读取图像的时候,设置紧读取灰度图,那只会返回行数和列数,相应的通过这个值很容易能判断出你加载的图像类型。

例如下述代码,通过不同的方式读取同一张图片,输出图像的不同形状。


import cv2
import numpy as np

# 选择一个 jpg 图片,可以读取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
# 灰度图
print(src2.shape)
# 三通道
print(src3.shape)

输出结果可以快速的读取出图像是彩色图像还是灰度图像。


(397, 595, 4)
(397, 595)
(397, 595, 3)

使用 img.size 可以快速返回图像中像素的合计数目,测试代码如下:


# 选择一个 jpg 图片,可以读取到不同的通道
src1 = cv2.imread("./test.jpg", -1)
src2 = cv2.imread("./test.jpg", 0)
src3 = cv2.imread("./test.jpg")
# 四通道,包含透明通道
print(src1.shape)
print(src1.size)
# 灰度图
print(src2.shape)
print(src2.size)
# 三通道
print(src3.shape)
print(src3.size)

我们依旧三种不同的读取方式,读取到的像素数分别如下:


(397, 595, 4)
944860
(397, 595)
236215
(397, 595, 3)
708645

注意,灰度图像和彩色图像的像素数不同,它们之前存在如下关系。

灰度图像的像素数 = 行数 x 列数 = 397 x 595 = 236215

彩色图像的像素数 = 行数 x 列数 x 通道数 = 944860 (四通道)/ 708645(三通道)

使用 img.dtype 属性可以获取到图像的类型,具体如下:


print(src1.dtype)

这里读取到的值,都是相同的 uint8 表示 8 位图像,这里可以记住只要是 uint8 格式,那对应的 BGR 值的范围就是在 [0,255] 之间。

在操作上述属性值的时候,会出现如下 BUG,该 BUG 的通用解决方案是排查图片是否正常读取,需要特别注意下:


AttributeError: 'NoneType' object has no attribute 'shape'

print(src1.dtype)

这里读取到的值,都是相同的 uint8 表示 8 位图像,这里可以记住只要是 uint8 格式,那对应的 BGR 值的范围就是在 [0,255] 之间。

在操作上述属性值的时候,会出现如下 BUG,该 BUG 的通用解决方案是排查图片是否正常读取,需要特别注意下:


AttributeError: 'NoneType' object has no attribute 'shape'

来源:https://blog.csdn.net/hihell/article/details/119719818

标签:Python,OpenCV,图像
0
投稿

猜你喜欢

  • Python利用keras接口实现深度神经网络回归

    2021-02-07 12:01:41
  • 10分钟学会Google Map API (一)

    2009-06-07 18:17:00
  • Oracle数据库的空间管理技巧

    2010-07-26 13:16:00
  • 如何取消pyecharts绘制地图时默认显示小圆点标识

    2021-05-06 19:43:35
  • mysql中如何查看表空间

    2024-01-27 00:25:25
  • ROS  TF坐标变换基本概念及使用案例

    2022-02-01 10:25:35
  • keras 获取某层的输入/输出 tensor 尺寸操作

    2021-11-14 09:55:06
  • 图片自动更新(说明)

    2024-04-28 09:46:51
  • ASP实现长文章自动分页的函数代码

    2008-10-10 17:09:00
  • PHP 危险函数全解析

    2023-11-20 15:36:12
  • Django中使用group_by的方法

    2023-04-13 21:26:34
  • Python爬取365好书中小说代码实例

    2023-05-31 21:25:55
  • 详解从Django Allauth中进行登录改造小结

    2021-05-05 14:26:58
  • 四个Python操作Excel的常用脚本分享

    2023-12-04 07:04:27
  • GO语言入门学习之基本数据类型字符串

    2023-07-16 08:26:31
  • python调用动态链接库的基本过程详解

    2023-05-31 13:24:00
  • 使用动画实现微信读书的换一批效果(两种方式)

    2023-10-23 14:30:55
  • Python数据存储之XML文档和字典的互转

    2023-02-12 08:56:11
  • [译]2009年海外Web设计风潮(下)

    2009-01-23 09:34:00
  • 利用MySQL系统数据库做性能负载诊断的方法

    2024-01-16 21:12:07
  • asp之家 网络编程 m.aspxhome.com