数字图像插值算法比较研究
2019-05-23盛晓艳龚超
盛晓艳 龚超
摘要:图像插值是图像处理中最基本的技术之一,得到了广泛研究和应用 。文中详细地阐述了常用的4种图像插值算法:最近邻插值、双线性插值、双三次插值、Lanczos插值。从图像插值的一般原理开始,对4种算法的数学公式进行了推导,并给出了部分算法的实现代码。然后,通过在Visual Studio 2015 + OpenCV 3.2 平台上的实验,分别对4种算法插值后的图像进行主客观两方面的评价,并对算法运行效率做了比较。
关键词:图像插值;兰索斯插值;原理;公式
中图分类号:TP317 文献标识码:A
文章编号:1009-3044(2019)08-0153-04
开放科学(资源服务)标识码(OSID):
Research on Digital Image Interpolation Algorithm
SHENG Xiao-yan, GONG Chao
(Nanjing Forestry University, Nanjing 210037, China)
Abstract: Image interpolation is one of the most basic technologies in image processing, and has been widely studied and applied. This paper detailly explains 4 commonly used image interpolation algorithms, including nearest neighbor interpolation, bilinear interpolation, bicubic interpolation, Lanczos interpolation. Starting from the general principle of image interpolation, the mathematical formulas of the 4 algorithms are derived, and the implementation codes of some algorithms are given. Then, through the experiments on the platform of Visual Studio 2015 + OpenCV 3.2, the assessment of the subjective and objective two aspects of the interpolated images and the comparison of the operating efficiency are obtained by the 4 algorithms.
Key words: image interpolation; Lanczos interpolation; principle; formula
图像缩放广泛应用于军事、航空、医学、手持设备和多媒体设备等领域的图像处理与显示。比如日常生活中,当用户通过4K电视机观看节目时,由于缺乏4K节目源,就需要将低分辨率的图像转换为高分辨率的图像,这就需要用到图像插值技术。图像缩放的基本原理就是根据原图像的像素值通过一定的规则计算得到目标图像的像素值。在图像的缩放过程中,最重要的就是确定下面两个问题:一是计算目标图像中的每一个像素值时,应该选取原图像中哪些像素值;二是这些选取出的像素值在计算目标像素时权重如何确定。
图像插值算法的一般思路[1]是这样的。原图像的像素位于整数坐标表示的网格上,比如,我们说某像素点的坐标是(10,17)。当把这个整数的坐标映射到新的图像后会出现两个问题:一是原像素的整数坐标被映射到目标图像的小数坐标,这样的话,必须求整到最近的整数坐标。二是某些目标图像的位置没有从原像素的位置映射坐标(比如,在高度方向放大原图像两倍,则目标图像每隔一行就是空的)。这些问题一般被称作前向投影问题(forward projection)。为了解决这些问题,我们采用后向解决的思路:我们逐个遍历目标图像的每一像素点并询问“原图像上的哪些像素点需要映射到这个目标像素点?”而这些原像素点几乎总是位于小数的位置。所以我们必须插值原像素点以求出目标像素点的值。
1常用插值算法
目前比较常用的插值算法有这么几种:最邻近插值,双线性插值,双三次插值,Lanczos插值等等,下面我们就逐一阐述这些算法。
1.1 最邻近插值
最邻近插值算法是最简单的一种插值方法。思路是:根据目标像素的坐标计算出在原图像中的坐标(待采样点的坐标)。用原图像中最靠近待采样点的像素点的颜色值表示目标像素值。设(i+u, j+v)(i, j为正整数, u, v为大于零小于1的小数,下同)是待采样点的坐标,则求目标像素的值 f(i+u, j+v) 如图1所示。
图1 最近邻插值示意图
如果(i+u, j+v)落在A区,即u<0.5, v<0.5,则将左上角像素点(i,j)的值赋给f(i+u, j+v),同理,落在B区则赋予右上角的像素点(i+1,j)的值,落在C区则赋予左下角像素点(i,j+1)的值,落在D区则赋予右下角像素点(i+1,j+1)的值。
下面給出了算法的实现代码。matSrc表示原图像,matDst表示缩放后的目标图像。scale_x, scale_y分别表示x,y方向的缩放因子。matDst.cols, matDst.rows分别表示目标图像的列数和行数。sx,sy分别表示目标像素点的坐标(i, j)对应于与原图像中的坐标。cv::saturate_cast
cv::Mat matSrc, matDst;
matSrc = cv::imread("lena.jpg", 2 | 4);
matDst = cv::Mat(cv::Size(800, 1000), matSrc.type(), cv::Scalar::all(0));
double scale_x = (double)matSrc.cols / matDst1.cols;
double scale_y = (double)matSrc.rows / matDst1.rows;
for (int i = 0; i < matDst.cols; ++i)
{ int sx = cv::saturate_cast
for (int j = 0; j < matDst.rows; ++j)
{ int sy = cv::saturate_cast
matDst.at
}}
cv::imwrite("nearest_1.jpg", matDst);
这个算法的优点是计算简单方便,缺点是图像容易出现锯齿。
1.2 双线性插值
一维线性插值问题即已知(x0, y0),(x1, y1)情況下,求解P(x)=a1x+a0使得P(xi)=yi,求解思路如图2所示。
根据点斜式可得:
若用f(x0), f(x1)来表示y0, y1,公式(1)可改写为:
P(x)也称为拉格朗日差值多项式[2]。在理解了一维的线性插值后,那么二维的线性插值就容易理解了。也就是双线性插值算法中已知四个像素点的颜色值,求中间某一像素点的颜色值f(x,y),如图3所示。
首先在水平方向上运用一维线性插值,公式(2),由f(i,j)和f(i+1,j)求取f(x,j),由
f(i,j+1)和f(i+1,j+1)求取f(x,j+1),然后在竖直方向运用一维线性插值,由f(x,j)和f(x,j+1)求取f(x,y)。
f(x,j)=(i+1-x)f(i,j)+(x-i)f(i+1,j) (3)
f(x,j+1)=(i+1-x)f(i,j+1)+(x-i)f(i+1,j+1) (4)
f(x,y)=(j+1-y)f(x,j)+(y-j)f(x,j+1) (5)
把(3)和(4)代入(5)得:
f(x,y)=(j+1-y)(i+1-x)f(i,j)+(j+1-y)(x-i)f(i+1,j)+(y-j)(i+1-x)f(i,j+1)+(y-j)(x-i)f(i+1,j+1) (6)
令x=i+p,y=j+q得:
f(i+p,j+q)=(1-p)(1-q)f(i,j)+p(1-q)f(i+1,j)+(1-p)qf(i,j+1)+pqf(i+1,j+1) (7)
公式(7)即为双线性插值算法中计算目标图像中坐标为(i,j)点的颜色值函数。
1.3 双三次插值[3-4]
三次卷积插值是一种更加复杂的插值方式。该算法利用待采样点周围16个点的颜色值作三次插值,不仅考虑到4 个直接相邻点的颜色值影响,而且考虑到各邻点间颜色值变化率的影响。待采样点(x,y)的颜色值由其周围16个点的颜色值加权内插得到,如图4所示。
这种算法需要选取插值基函数(16个点的权值)来拟合数据,最常用的插值基函数[5]如图5所示。
公式(9)或(10)即为双三次插值算法中计算目标图像中坐标为(i,j)点的颜色值函数。
三次运算可以得到更接近高分辨率图像的放大效果,但也导致了运算量的急剧增加。
1.4 Lanczos插值算法
Lanczos插值算法是取待采样点周围8×8个,即64个像素点的颜色值来表示目标像素点的颜色值。我们首先引出一维情况下的Lanczos插值算法。已知2a个点的函数值,求x点的函数值。则插值基函数[6](也称为Lanczos 核函数)如图6。
公式(12)或(13)即为双三次插值算法中计算目标图像中坐标为(i,j)点的颜色值函数。
2 实验结果及评价
目前,评价图像插值质量优劣的方式主要有两种标准,一种是主观评价[7-8],即设计实验,由观测者对图像质量进行评价; 另一种是客观评价[9-11],采用算法对图像质量进行评价。我们首先取标准测试图象lena.tiff(512x512)的奇数行奇数列组成新图像quarter.tiff(256x256),然后在quarter.tiff上分别运用上文提到的4种插值算法,得到与原图一样大小的图像nearest.tiff(512x512),bilinear.tiff(512x512),bicubic.tiff(512x512), lanczos.tiff(512x512)。我们的实验是运行在Visual Studio 2015和OpenCV 3.2的环境下,CPU是 Intel Xeon E5620 @2.40GHz,内存8GB。
2.1 主观评价
主观评价[7-8]指通过人眼对于图像的观察,从视觉效果上做出评价。
由于排版的需要,经过缩小后,图7中各幅图像的差别较难发现。从未经缩小的实验结果原图中能看出,除了极小的四周边缘部分之外,lanczos算法要优于bicubic算法,bicubic算法要优于bilinear算法,bilinear算法要优于nearest算法。
主观评价方法会受到观测者专业背景、心理和动机等主观因素的影响,研究人员又提出客观评价方法,即通过一定的算法计算得出一个数值,用数值的大小表示图像的插值质量,这里列出两种常用的客观评价方法。
2.2 客观评价
客观评价[9-11]指通过插值运算得到的图像与原始图像的像素,按某一规则计算得到指标值的大小来衡量图像质量的好坏。由于不同算法得到的指标值往往不同,并且以指标值的形式来呈现图像质量的好坏比主观的评价更具有可比性,因此客观的评价方法逐渐成了该领域评价插值算法优劣的主流。但是,单一的规则往往存在一定的缺陷,不能全面地概括图像的好坏。为了解决这个问题,学者们提出了多种不同的计算规则,从不同的角度去探讨图像质量的评价标准。目前较为流行的评价标准主要有均方误差法[9]、峰值信噪比法[10]等等。
( 1) 均方误差( Mean square error,MSE) 是指原图像和插值图像各像素点颜色值差异的平均数。MSE 的计算公式为:
式中:K和I分别表示插值后的图像与原图像,m、n表示图像的行、列数。MSE的值越小,表明R和I的差异越小,即插值算法越好。反之数值越高表明两幅图像的差异越大,即插值算法越差。
(2) 峰值信噪比( Peak signal to noise ratio,PSNR) 是一种比较常用的图像评价指标,计算公式为:
式中: MAX表示图像颜色的最大数值,8位图像取值为255; MSE为图像之间的均方误差。PSNR 的单位为dB,数值越大表示两个图像越相似,也就是插值效果越好。普遍基准为30dB,30dB以下的图像劣化较为明显。实验结果显示,PSNR 值并不能总与人眼看到的视觉品质一致。
从表2中可以看出,从左到右每个算法所用的CPU时间逐渐增加,这个与每个算法的理论是相吻合的,因为它们分别是从1, 2×2,4×4,8×8个像素的颜色值来计算目标图像像素的颜色值。
3结束语
本文通过对常用的4种图像插值算法原理和实际代码验证分析,我们发现这4种插值算法中,Lanczos插值和双三次插值的效果最好,但比较耗时间,最近邻插值的效果较差,但速度最快。双线性插值在效果和速度上都介于上面的算法之间,在一般的应用中常被选用。展望未来,作为一个很有实用价值的研究领域,图像插值将会有更多的研究和应用。
参考文献:
[1] Adrian Kaehler, Gary Bradski. Learning OpenCV 3 [M]. OReilly,2016: 300-301.
[2] 张铁,阎家斌.数值分析[M].冶金工业出版社,2007: 143-145.
[3]Zhou D,Shen X,Dong W.Image zooming using directional cubic convolution interpolation[J]IET Image Processing,2012,6(6) :627-634.
[4] Hou H S,Andrews H.Cubic splines for image interpolation and digital filtering [J].IEEE Transactions on Acoustics Speech & Signal Processing,1979,26(6):508-517.
[5] Robert G. Keys. Cubic convolution interpolation for digital image processing [J].IEEE Transactions on Signal Processing, Acoustics, Speech, and Signal Processing, 1981,29(6):1153–1160.
[6] Wilhelm Burger, Mark J. Burge. Principles of digital image processing: core algorithms [M]. Springer, 2009: 231–232.
[7] Sheikh H R,Bovik A C. Image information and visual quality[J].IEEE Transactions on Image Processing,2006,15(2):430-444.
[8] Liu S,Wu L,Gong Y,et al. Overview of image quality assessment[J].Science Paper Online,2011,6( 7) : 501-506.
[9] Sakowicz B,Kaminski M,Ritter R,et al. Methods of 3D images quality assessment[C]. IEEE International Conference on Mixed Design of Integrated Circuits &Systems.[S.l.]: IEEE,2015:123-128.
[10] Sheikh H R,Sabir M F,Bovik A C. A statistical evaluation of recent full reference image quality assessment algorithms[J].IEEE Transactions on Image Processing,2006,15(11):3440-3451.
[11] Wang Z,Li Q. Information content weighting for perceptual image quality assessment[J].IEEE Transactions on Image Processing,2011,20(5):1185-1198.
【通聯编辑:唐一东】