OpenCV图像分割之分水岭算法与图像金字塔算法详解

作者：机器视觉小学徒时间：2022-11-27 07:59:24　

前言

主要介绍OpenCV中的分水岭算法、图像金字塔对图像进行分割的方法。

一、使用分水岭算法分割图像

分水岭算法的基本原理为：将任意的灰度图像视为地形图表面，其中灰度值高的部分表示山峰和丘陵，而灰度值低的地方表示山谷。用不同颜色的水(标签)填充每个独立的山谷(局部最小值)；随着水平面的上升，来自不同山谷(具有不同颜色)的水将开始合并。为了避免出现这种情况，需要在水汇合的位置建造水坝；持续填充水和建造水坝，直到所有的山峰和丘陵都在水下。整个过程中建造的水坝将作为图像分割的依据。

使用分水岭算法执行图像分割操作时通常包含下列步骤：

(1) 将原图转换为灰度图像

(2) 应用形态变换中的开运算和膨胀操作，去除图像噪声，获得图像边缘信息，确定图像背景

(3) 进行距离转换，再进行阈值处理，确定图像前景

(4) 确定图像的未知区域(用图像的背景减去前景剩余的部分)

(5) 标记背景图像

(6) 执行分水岭算法分割图像

1、cv2.distanceTransform()函数

OpenCV中的cv2.distanceTransform()函数用于计算非0值像素点到0值(背景)像素点的距离，其基本格式如下：

dst = cv2.distanceTransform(src, distanceType, maskSize[, dstType])

dst为返回的距离转换结果图像

src为原图像, 必须是8为单通道二值图像

distanceType为距离类型

maskSize为掩膜的大小, 可设置为0, 3或5

dstType为返回的图像类型, 默认值为CV_32F(32位浮点数)

import cv2
import numpy as np
import matplotlib.pyplot as plt

# cv2.distanceTransform()函数，计算非0值像素点到0值(背景)像素点的距离
img = cv2.imread('home.jpg')
cv2.imshow('original', img)

img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 灰度操作
cv2.imshow('gray', img_gray)

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 阈值操作
cv2.imshow('thresh', thresh)

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) # 形态学操作
cv2.imshow('open', img_open)

img_dilate = cv2.dilate(img_open, kernel, iterations=2) # 膨胀操作，确定背景
cv2.imshow('img_dilate', img_dilate)

img_dist = cv2.distanceTransform(img_dilate , cv2.DIST_L2, 5) # 距离转换
cv2.imshow('img_dist', img_dist)

cv2.waitKey(0)
cv2.destroyAllWindows()

2、cv2.connectedComponents()函数

OpenCV中的cv2.connectedComponents()函数用于将图像中的背景标记为0，将其他图像标记为从1开始的整数，其基本格式如下：

ret, labels = cv2.connectedComponents(image[, connectivity[, ltype]])

labels为返回的标记结果图像, 和image大小一样

image为要标记的8位单通道图像

connectivity为4或8(默认值), 表示连接性

ltype为返回的标记结果图像的类型

# cv2.connectedComponents()函数，将图像中的背景标记为0，将其他图像标记为从1开始的整数
ret, imgfg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, cv2.THRESH_TRUNC)

imgfg = np.uint8(imgfg)

ret, markers = cv2.connectedComponents(imgfg)

plt.imshow(imgfg,cmap='gray')
plt.title('imgfg')
plt.axis('off')
plt.show()

plt.imshow(markers,cmap='gray')
plt.title('markers')
plt.axis('off')
plt.show()

3、cv2.watershed()函数

OpenCV中的cv2.watershed()函数用于执行分水岭算法分割图像，其基本格式如下：

ret = cv2.watershed(image, markers)

ret为返回的8位或32位单通道图像

image为输入的8位或32位单通道图像

markers为输入的32位单通道图像

# cv2.watershed()函数，执行分水岭算法分割图像
img = cv2.imread('qizi.jpg')

img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 灰度操作

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 阈值操作

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) # 形态学操作

img_dilate = cv2.dilate(img_open, kernel, iterations=3) # 膨胀操作(确定背景)

img_dist = cv2.distanceTransform(img_open, cv2.DIST_L2, 0)

ret, img_fg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, 2) # 距离操作(确定前景)

img_fg = np.uint8(img_fg)

ret, markers = cv2.connectedComponents(img_fg)

unknown = cv2.subtract(img_dilate, img_fg)# 确定位置未知区域

markers = markers + 1# 加1使背景不为0

markers[unknown == 255] = 0# 将未知区域设置为0

img_water = cv2.watershed(img, markers)# 执行分水岭算法

plt.imshow(img_water, cmap='gray')
plt.title('watershed')
plt.axis('off')
plt.show()

img[img_water == -1] = [0, 255, 0]# 将原图中的被标记点设置为绿色
cv2.namedWindow('watershed', cv2.WINDOW_NORMAL)
cv2.imshow('watershed', img)

cv2.waitKey(0)
cv2.destroyAllWindows()

二、图像金字塔

图像金字塔从分辨率的角度分析处理图像。图像金字塔的底部为原始图，对原始图像进行梯次向下采样，得到金字塔的其他各层图像。层次越高，分辨率越低，图像越小。通常，每向上一层，图像的宽度和高度就为下一层的一半。常见的图像金字塔可分为高斯金字塔和拉普拉斯金字塔。

高斯金字塔有向上和向下两种采样方式。向下采样时，原始图像为第0层，第1次向下采样的结果为第1层，第2次向下采样的结果为第2层，以此类推。每次采样图像的宽度和高度都减小为原来的一半，所有的图层构成高斯金字塔。向上采样的过程和向下采样的过程相反，每次采样图像的宽度和高度都扩大为原来的二倍。

1、高斯金字塔向下采样

OpenCV中的cv2.pyrDown()函数用于执行高斯金字塔构造的向下采样步骤，其基本格式如下：

ret = cv2.pyrDown(image[, dstsize[, borderType]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

borderType为边界类型

# 高斯金字塔向下采样
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrDown(img)
img2 = cv2.pyrDown(img1)

cv2.imshow('img', img)
cv2.imshow('img1', img1)
cv2.imshow('img2', img2)

print('0层的形状：', img.shape)
print('1层的形状：', img1.shape)
print('2层的形状：', img2.shape)

cv2.waitKey(0)
cv2.destroyAllWindows()

2、高斯金字塔向上采样

OpenCV中的cv2.pyrUp()函数用于执行高斯金字塔构造的向下采样步骤，其基本格式如下：

ret = cv2.pyrUp(image[, dstsize[, borderType]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

borderType为边界类型

3、拉普拉斯金字塔

拉普拉斯金字塔的第n层是该层高斯金字塔图像减去n+1层向上采样的结果获得的图像。

# 拉普拉斯金字塔
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrDown(img)
img2 = cv2.pyrDown(img1)
img3 = cv2.pyrDown(img2)

imgL0 = cv2.subtract(img, cv2.pyrUp(img1))
imgL1 = cv2.subtract(img1, cv2.pyrUp(img2))
imgL2 = cv2.subtract(img2, cv2.pyrUp(img3))

cv2.imshow('imgL0', imgL0)
cv2.imshow('imgL1', imgL1)
cv2.imshow('imgL2', imgL2)

cv2.waitKey(0)
cv2.destroyAllWindows()

4、应用图像金字塔实现图像的分割和融合

# 应用图像金字塔实现图像融合
img1 = cv2.imread('jiang1.jpg')
img2 = cv2.imread('jiang2.jpg')

#生成图像1的高斯金字塔，向下采样6次
img = img1.copy()
img1Gaus = [img]
for i in range(6):
img = cv2.pyrDown(img)
img1Gaus.append(img)

#生成图像2的高斯金字塔，向下采样6次
img = img2.copy()
img2Gaus = [img]
for i in range(6):
img = cv2.pyrDown(img)
img2Gaus.append(img)

#生成图像1的拉普拉斯金字塔，6层
img1Laps = [img1Gaus[5]]
for i in range(5,0,-1):
img = cv2.pyrUp(img1Gaus[i])
lap = cv2.subtract(img1Gaus[i-1],img) #两个图像大小不同时，做减法会出错
img1Laps.append(lap)

#生成图像2的拉普拉斯金字塔，6层
img2Laps = [img2Gaus[5]]
for i in range(5,0,-1):
img = cv2.pyrUp(img2Gaus[i])
lap = cv2.subtract(img2Gaus[i-1],img)
img2Laps.append(lap)

#拉普拉斯金字塔拼接：图像1每层左半部分与和图像2每层右半部分拼接
imgLaps = []
for la,lb in zip(img1Laps,img2Laps):
rows,cols,dpt = la.shape
ls=la.copy()
ls[:,int(cols/2):]=lb[:,int(cols/2):]
imgLaps.append(ls)

#从拉普拉斯金字塔恢复图像
img = imgLaps[0]
for i in range(1,6):
img = cv2.pyrUp(img)
img = cv2.add(img, imgLaps[i])

#图像1原图像的半部分与和图像2原图像的右左半部分直接拼接
direct = img1.copy()
direct[:,int(cols/2):]=img2[:,int(cols/2):]
cv2.imshow('Direct',direct) #显示直接拼接结果
cv2.imshow('Pyramid',img) #显示图像金字塔拼接结果
cv2.waitKey(0)
cv2.destroyAllWindows()

来源：https://blog.csdn.net/weixin_43843069/article/details/122173685

标签：OpenCV,图像分割,分水岭算法,图像金字塔

投稿

OpenCV图像分割之分水岭算法与图像金字塔算法详解

前言

一、使用分水岭算法分割图像

1、cv2.distanceTransform()函数

2、cv2.connectedComponents()函数

3、cv2.watershed()函数

二、图像金字塔

1、高斯金字塔向下采样

2、高斯金字塔向上采样

3、拉普拉斯金字塔

4、应用图像金字塔实现图像的分割和融合

猜你喜欢

babel的使用及安装配置教程

矩形相交以及求出相交的区域的原理解析

深入了解SQL Server 2008 商业智能平台

Python学习之MRO方法搜索顺序

详细总结Python常见的安全问题

在Python的web框架中中编写日志列表的教程

VueJs 将接口用webpack代理到本地的方法

Python正则表达式常用函数总结

解决Tensorflow使用pip安装后没有model目录的问题

微信JSSDK调用微信扫一扫功能的方法

如何防止页面中的敏感信息被提取

layui table 表格上添加日期控件的两种方法

pandas 把数据写入txt文件每行固定写入一定数量的值方法

laravel中短信发送验证码的实现方法

MSSQL段落还原脚本，SQLSERVER段落脚本

Python实现数通设备端口使用情况监控实例

一个JSP页面导致的tomcat内存溢出的解决方法

Pytorch相关知识介绍与应用

Python装饰器如何实现修复过程解析

Pandas 数据框增、删、改、查、去重、抽样基本操作方法