基于局部字典搜索和多原子匹配追踪的图像逼近算法*

2018-01-26黄亚飞梁昔明樊绍胜

计算机工程与科学 2018年1期

黄亚飞,梁昔明,樊绍胜

(1.中南大学信息科学与工程学院，湖南长沙 410083； 2.长沙理工大学智能电网运行与控制湖南省重点实验室，湖南长沙 410114)

1 引言

以小波分析为基础，Mallat等[1]提出了信号在冗余字典中的稀疏表示和稀疏分解思想，此后该思想被推广到二维信号，并已应用于图像处理的许多方面，如图像去噪[2]、图像重建[3]、图像表示[4,5]、人脸识别[6]等。稀疏分解问题是一个NP-hard组合搜索问题，直接求解十分困难，现有方法分为三类：(1)贪婪算法，其特点是每次迭代选取一个最能匹配残差信号的原子，如匹配追踪MP(Matching Pursuit)算法[1];(2)松弛算法，其特点是将l0优化问题松弛为易求解的lp(p≥1)优化问题，如BP(Basis Pursuit)算法[7];(3)函数逼近法，其特点是利用构造的特殊函数序列来逼近l0范数，如SL0(Smoothed L0 Norm)算法[8]。上述方法的共同特点是计算量巨大，造成图像稀疏分解实际应用发展缓慢。

Gribonval等[9]对MP算法在理论上做出收敛证明，使其有了充分的理论依据，MP算法相对较低的计算复杂度使它成为稀疏分解方法中最常用的一种。为降低运算复杂度，MP的众多改进算法已被提出。快速傅里叶变换FFT(Fast Fourier Transform)的引入实现了内积的批量计算[10,11]，大大提高了稀疏分解速度。由于FFT实际上是复数运算，对于虚部为0的实信号来说，增加了不必要的计算开销。为此，基于快速哈特莱变换FHT(Fast Hartley Transform)的图像稀疏分解算法被提出[12]。以上算法由于每次迭代只搜索一个最佳原子，速度提升有限。M项追踪MTP(M-Term Pursuit)算法将冗余字典划分成若干非相干子字典，然后从子字典中一次并行选择多个原子，使稀疏分解速度得到极大提高[13]。AMMP(Approximate M-fold Matching Pursuit)算法基于原子间互相关信息的估计进行多原子选择，在损失微小精度的情况下大幅降低了稀疏分解运算复杂度[14]。然而，多原子选择算法采用全局字典搜索方式，仍浪费了很多运算时间。

本文首先介绍基于二维FHT(2D-FHT)的内积批量计算方法；然后分析MP算法相邻代核原子的排序规律，提出基于局部字典搜索和多原子匹配追踪LMMP(Local dictionary searching and Multi-atom Matching Pursuit)的图像逼近算法；接着对LMMP算法的收敛性和时间复杂度进行理论推导；最后通过实验对LMMP算法参数进行讨论，并与其他全局搜索算法作性能比较。理论分析和实验结果表明，相比其他算法，本文算法的运算速度有明显提升且逼近精度接近MP算法。

2 LMMP算法原理与实现

2.1 基于2D-FHT的内积批量计算

Φ(u,v)=Fe(u,v)Ge(u,v)+

Fo(u,-v)Go(u,-v)-

Fe(u,-v)Go(u,v)+Fo(u,v)Ge(u,-v)

(1)

(2)

2.2 局部字典搜索和多原子匹配追踪

其中,sup表示取上确界，Rt为当前残差图像。

对Rt作如下分解后进入第t+1代：

(3)

从图1可以看出，在400次的迭代中，位序为1的核原子(最佳原子由其平移得到)在前一代的位序有397次未超过50，余下3次都未超过150。用K值来衡量，则位序为1的核原子在前一代的位序均未超过数值0.2K。由图1还可看出，位序为100和200的核原子在前一代的位序绝大部分仍在100和200附近，表明核原子在MP算法相邻代中的位序基本稳定。对其他图像实验所得结果类似，从而间接验证了前面的推断。

Figure 1 Statistical results of Lena(256×256) for P(t-1,(t,k))图1 对Lena(256×256)实验统计的P(t-1,(t,k))情况

多原子匹配追踪以原子的互不相干性为前提[13,14]，如果一次局部字典搜索选择多个互不相干的普通原子，应不会对逼近质量造成较大影响，却能更多地节省图像稀疏分解时间，为此提出结合局部字典搜索的多原子匹配追踪方法。

(4)

(5)

(6)

与文献[14]中累加投影后更新残差一次的方式不同，式(6)是按下式逐原子依次更新残差Mt次。

(7)

(8)

2.3 LMMP算法步骤

3 LMMP算法性能分析

3.1 逼近误差分析

下面对LMMP算法的收敛性进行分析。为简明，暂不考虑迭代次数t，讨论ρ=1时迭代一次选择M个原子的逼近误差。

引理1设Η为有限Hilbert空间，f∈Η，令R1=f，GΛ是满足式(4)和式(5)的原子集，则∀gm∈GΛ(m=1,…,M)，有:

(9)

其中,Rm由式(7)得到。

(10)

|〈R2,g2〉|≥|〈R1,g2〉|-

(11)

|〈R3,g3〉|≥|〈R2,g3〉|-

按上述过程不断递推，可得式(9)。

□

定理1设f∈Η，则∀M>0，LMMP算法迭代一次选择M个原子的逼近误差为:

(12)

证明由引理1可知，GΛ中的原子gm满足:

于是∀M>0，迭代一次选择M个原子的逼近误差如式(12)。

□

(13)

3.2 时间复杂度分析

4 实验结果

为验证LMMP算法的有效性，采用Gabor多成份字典对多幅标准图像进行实验，分析LMMP算法参数对算法性能的影响，并与FSMP算法[10]、MTP算法[13]、AMMP算法[14]的逼近性能和运算速度作比较。

对五幅标准测试图像，用LMMP算法的单原子搜索方式(即Mt=1)选取400个原子重构图像。表1给出不同ρ值对应的重构图像峰值信噪比PSNR(Peak Signal to Noise Ratio)，以此说明ρ值对LMMP算法逼近性能的影响。由表1可看出，当ρ=0.2时已能保证局部字典搜索与全局字典搜索(ρ=1)所得重构图像的PSNR相同，此时单原子局部搜索速度是单原子全局搜索速度的5倍；当ρ=0.1时，LMMP算法重构图像的PSNR至多减少0.01 dB。该结果验证了2.2节提出的局部字典搜索方法是可行的。

Table 1 Approximation performance ofthe LMMP for different ρ

图2是以Barbara(256×256)为测试图像时LMMP算法与FSMP算法逼近性能的比较。因为FSMP算法和MP算法都是全局单原子搜索方法，二者的逼近性能相同，而运行速度相差N/(2log2N)倍，故实验以FSMP算法结果作为参考。由图2a可看出，ρ=0.2,δ=0.01时，LMMP算法重构图像的PSNR随着逼近原子数的增加逐渐提高，α越大，LMMP算法与FSMP算法的逼近性能越接近。特别地，当α=0.8、逼近原子数为3 000时，LMMP算法仅比FSMP算法的重构图像PSNR低0.14 dB，显示出了良好的性能。由图2b可看出，ρ=0.2,α=0.8时，LMMP算法的逼近性能随δ的减小而越加接近FSMP算法的逼近性能。因为当δ很小时，每代选取的原子间相干性很小，张成的空间大从而使得投影大，故稀疏逼近性能好。

图2表明，LMMP算法好的逼近性能需设置较大的α和较小的δ。

Figure 2 Approximation performance comparison between the LMMP and FSMP图2 LMMP算法与FSMP算法逼近性能的比较

给定PSNR条件下，设LMMP算法的ρ=0.2,α=0.8,δ=0.01，MTP算法、AMMP算法的参数分别同文献[13]和文献[14]，比较LMMP算法与其他算法的运算时间。由图3可看出，随PSNR增大，FSMP算法的运算时间成幂级数增长，MTP算法和AMMP算法的运算时间增长比FSMP算法慢。相比于其他算法，LMMP算法的耗时增长缓慢，且在迭代后期，因满足式(4)的原子越来越多，每代选取的不相干原子数也越多，LMMP算法的运算速度优势越明显。用上述各算法搜索800个原子重构Lena(256×256)图像，并与原图像作比较。观察图4的细节放大图可看出，MTP算法和AMMP算法重构图中的帽子羽毛和眼睛比较模糊，而LMMP算法更为完整地重构了轮廓纹理等细节，视觉效果更接近原图像。

Figure 3 Complexity comparison among the LMMP,FSMP,MTP and AMMP图3 LMMP与FSMP、MTP、AMMP算法稀疏分解耗时比较

Figure 4 Comparison of reconstruction results among the three algorithms图4 三种算法的重构结果对比

表2是四种算法对512×512标准图像重构逼近时的实验结果，其中的时间单元是在相同软硬件条件下，以FSMP算法的运算时间为基准折算所得。正如理论分析那样，与FSMP算法相比，LMMP算法在损失微小精度的情况下具有显著的速度优势，且随着逼近原子数的增多该优势迅速增强；与MTP算法和AMMP算法相比，LMMP算法的运算时间更少、逼近质量更高。但是，由于原子排序及不相干性判断等附加运算，LMMP运算速度的提升比3.2节的分析值稍低。

5 结束语

针对图像稀疏分解算法运算量过大的问题，本文提出一种结合局部字典搜索和多原子匹配追踪的新算法LMMP。LMMP算法利用2D-FHT实现内积的批量快速计算，在此基础上，从局部字典中搜索多个近似非相干原子，并采用逐原子依次更新残差的方式来逼近原图像，显著降低了运算复杂度。理论分析和实验结果表明，LMMP算法收敛且在逼近性能微小损失下时间复杂度比MP算法低数个数量级，与其他三种先进算法相比，LMMP算法在运算速度和逼近性能上都有优势，有利于下一步工程应用研究的开展。

[1] Mallat S G, Zhang Z F.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.

[2] Tang Y B, Chen Y,Xu N,et al.Image denoising via sparse coding using eigenvectors of graph Laplacian[J].Digital Signal Processing,2016,50(C):114-122.

Table 2 Comparison of run time and approximation performance

[4] Zhao W,Liu Z,Guan Z Y,et al.Orthogonal projective sparse coding for image representation[J].Neurocomputing,2016,173(P2):270-277.

[5] Shu Z Q,Zhou J,Huang P,et al.Local and global regularized sparse coding for data representation[J].Neurocomputing,2016,175(Part A):188-197.

[6] Ma Xiao-hu,Tan Yan-qi.Face recognition based on discriminant sparsity preserving embedding[J].Acta Automatica Sinica,2014,40(1):73-82.(in Chinese)

[7] Chen S,Donoho D,Saunders M.Atomic decomposition by basis pursuit[J].SIAM Journal Sciences Computation,2001,43(1):129-159.

[8] Mohammadi M R, Fatemizadeh E,Mahoor M H.Non-negative sparse decomposition based on constrained smoothedl0norm[J].Signal Processing,2014,100(6):42-50.

[9] Gribonval R, Vandergheynst P.On the exponential convergence of matching pursuits in quasi-incoherent dictionaries[J].IEEE Transactions on Information Theory,2006,52(1):6-18.

[10] Figueras V R, Divorra E O,Vandergheynst P.A matching pursuit full search algorithm for image approximations:No 31 CH-1015[R].Lausanne, Switzerland:Ecole Polytechnique Federale de Lausanne (EPFL),Lausanne:ITS-EPFL,2004.

[11] Yin Zhong-ke, Shao Jun,Vandergheynst P.MP based on signal sparse decomposition with FFT[J].Journal of Electronics & Information Technology,2006,28(4):614-618.(in Chinese)

[12] Wang Zai-lei,He Hong-jie,Wang Jian-ying,et al.Fast algorithm for image MP sparse decomposition based on FHT and core dictionary[J].Journal of the China Railway Society,2012,34(9):51-57.(in Chinese)

[13] Rahmoune A,Vandergheynst P,Frossard P.Sparse approximation using m-term pursuit and application in image and video coding[J].IEEE Transactions on Image Processing,2012,21(4):1950-1962.

[14] Gan T,He Y M,Zhu W L.Fast m-fold matching pursuit algorithm for image approximation[J].Journal of Systems Engineering and Electronics,2009,20(4):883-888.

[15] Gong Jun-bin, Ming De-lie,Liu De-kun,et al.Fast image template matching algorithm based on discrete hartley transform[J].Journal of Astronautics,2011,32(5):1115-1123.(in Chinese)

[16] Sun Yu-bao,Xiao Liang,Wei Zhi-hui,et al.Sparse representations of images by a multi-component gabor perception dictionary[J].Acta Automatica Sinica,2008,34(11):1379-1387.(in Chinese)

附中文参考文献：

[6] 马小虎,谭延琪.基于鉴别稀疏保持嵌入的人脸识别算法[J].自动化学报,2014,40(1):73-82.

[11] 尹忠科,邵君,Vandergheynst P.利用FFT实现基于MP的信号稀疏分解[J].电子与信息学报,2006,28(4):614-618.

[12] 王在磊,和红杰,王建英,等.基于核心原子库和FHT的图像MP稀疏分解快速算法[J].铁道学报,2012,34(9):51-57.

[15] 龚俊斌,明德烈,刘德坤,等.基于哈特莱变换的快速图像模板匹配算法[J].宇航学报,2011,32(5):1115-1123.

[16] 孙玉宝,肖亮,韦志辉,等.基于Gabor感知多成份字典的图像稀疏表示算法研究[J].自动化学报,2008,34(11):1379-1387.