OpenCV图像缩放之cv.resize()函数详解
作者:零度蛋花粥 时间:2021-02-06 12:36:58
系列前言
这个系列是我第一个想要更下去的系列。每篇会全面介绍一个 OpenCV 函数,会给出 API 和示例。示例主要是用 Python 去写,但是 OpenCV 的原生语言是 C++,所以想翻译过去其实很简单。介绍过程中如果有相关的 CV 知识也会一并写入,还是那句话,争取做到说人话,让小白也能看得懂。
API
API 来自 OpenCV官方文档
C++
void cv::resize(InputArray src,
OutputArray dst,
Size dsize,
double fx = 0,
double fy = 0,
int interpolation = INTER_LINEAR
)
Python
dst = cv.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])
函数详解
顾名思义,这个函数可以把图片缩放到你想要的大小。
参数列表
在这里我们主要说 Python 的参数。把各个参数的含义和相关信息打一张表:
参数 | 类型 | 是否必须指定 | 具体含义 |
---|---|---|---|
src | numpy.ndarray | 是 | 原图像 |
dsize | tuple<int> | 是 | 缩放后的图像大小 |
dst | 无所谓 | 否 | 目标图像,但是在 Python 里面没有任何意义。一般不传参或者设成 None |
fx , fy | 数值类型 | 否 | x 和 y 方向上的缩放比例 |
interpolation | int | 否 | 插值方式表示代码,本质是一个 int 数值,一般用 OpenCV 内置的参数代号以提高可读性。 |
看这张表想必大家就很清楚了。
缩放方式其一
那么,想要实现缩放图像,有两种方法。第一种方法是指定缩放后的图像大小。下面是实现这个功能的一个简单的程序。后面的给出的其他程序都是对 resize
所在行进行的改动。
import numpy as np
import cv2 as cv
img = cv.imread("你希望缩放的图片")
# 缩放图像,后面的其他程序都是在这一行上改动
dst = cv.resize(img, (400, 300))
# 显示图像
cv.imshow("dst: %d x %d" % (dst.shape[0], dst.shape[1]), dst)
cv.waitKey(0)
cv.destroyAllWindows()
在这个例子中,我们指定了缩放后图像的大小为 400 x 300
,resize
函数就会将图像拉伸到这个大小,拉伸后的图像相比于原图不会有任何的裁剪。
缩放方式其二
另一种方法,就是利用后面的 fx
和 fy
,指定缩放后图像长宽相对于原图的比例。如果利用这两个参数,前面的 dsize
要写成一个不合法的形式(比如:(0, 0)
)。具体原因后面会解释。
注意,在 dsize
和 fx
中间其实隔了一个无用的 dst
,虽然没有实际作用,但是这个参数确实存在,按照 Python 的函数传参规则,要么指明实参传递给哪个形参,要么按顺序传参不能遗漏。具体看下面的例子,两行的效果一致,都是将图像横向缩放为原来的 0.5 倍,纵向缩放为原来的 0.3 倍。
# 形参缺省
dst = cv.resize(img, (0, 0), None, 0.5, 0.3)
# 指明形参
dst = cv.resize(img, (0, 0), fx=0.5, fy=0.3)
值得注意的是,缩放后的图像宽高是根据 round(img.shape[0] * fx)
和 round(img.shape[1] * fy)
来计算的,所以即使 fx
和 fy
并不是0,只要这两个计算结果中有一个是 0,也会报错。
两种方式的优先级
OpenCV 会先检查 dsize
是否合法,即图像的宽和高是否都是非 0 的。如果是,就按照这个缩放,忽略后面的 fx
和 fy
;如果不是,就按照 fx
,fy
来计算。即优先级: dsize
> fx
fy
.
另外,两种方式是独立定义的,也就是不能混着,用数值指定长却用比率指定宽。不存在 cv.resize(img, (0, 400), fx=0.42)
这种用法!
关于插值方式
最后一个参数,在 resize
函数里有 7 种可能取值,参考OpenCV文档相关页。但是我这里第 7 个参数是不存在的,或许是版本问题?最后两个参数我试过,会报错,不行。
虽然这些参数非常庞杂,但他们的插值效果却差不多,一般情况下,默认的线性插值就够用。如果非要给点建议的话,我翻译一下官网方文档的原话:
要缩小图片,一般来说最好的插值方法是 cv.INTER_AREA
,而要放大一张图片的话,一般来说效果最好的是 cv.INTER_CUBIC
(速度慢)或者 cv.INTER_LINEAR
(速度快一些但结果仍然不错)。
扩展 —— 相关函数
OpenCV 为缩放图像的大小提供了其他的选择,这里说两个函数:cv.pyrUp
和cv.pyrDown
。
这两个函数可以用于构建图像金字塔,pyrUp
可以将图像长宽均放大为原来的 2 倍,而 pyrDown
则可以将图像长宽缩小为原来的 1/2. 与 resize
不同的是,这两个函数和高斯卷积核紧密相关。pyrUp
是对图像升采样,隔行隔列插入零向量之后用高斯核卷积,而 pyrDown
则是对图像高斯卷积后隔行隔列采样。两个的卷积核成倍数关系,前者是后者的4倍。
来源:https://blog.csdn.net/hysterisis/article/details/112381220