基于稀疏特征选择的立体素描图像建模方法
2020-07-23孙会强吕佳吴秀敏
孙会强 吕佳 吴秀敏
摘 要: 为了合成出更加清晰的人脸素描画像,文中提出一种基于稀疏表示的自适应图像建模方法。通过从训练数据中提取有效的训练集,降低学习的盲目性和难度,获取更加精确的字典结果。在精确字典结果的基础上,通过控制线性组合系数的非零元素个数,实现测试图像的自适应重构与优化,从而解决传统经典合成算法噪声较大的问题。仿真测试结果表明,文中所提出的方法提取了更多的图像块,能够滤除更多的高频分量,其合成图像的噪声更小,具有更加优秀的平滑性。
关键词: 人脸素描; 图像建模; 稀疏表示; 训练集提取; 图像重构; 仿真测试
中图分类号: TN911.73?34; TP391 文献标识码: A 文章编号: 1004?373X(2020)14?0146?03
Method of 3D sketch image modeling based on sparse feature selection
SUN Huiqiang, L? Jia, WU Xiumin
(Yanan University, Yanan 716000, China)
Abstract: A method of adaptive image modeling based on sparse representation is proposed to synthesize clearer face sketch images. By extracting the effective training set from the training data, the blindness and difficulty of learning are reduced, and the more accurate dictionary results are obtained. On the basis of accurate dictionary results, the adaptive reconstruction and optimization of the image under testing are realized by controlling the quantity of non?zero elements of the linear combination coefficient, so as to overcome the large noise in the traditional classical synthesis algorithm. The simulation results show that the proposed method can extract more image blocks, filter out more high?frequency components, and its synthesized image has less noise and better smoothness.
Keywords: facial sketch; image modeling; sparse representation; training set extraction; image reconstruction; simulation testing
0 引 言
随着科学与技术的快速发展,图像逐渐成为了人类信息传播的重要载体,在各个领域衍生出众多不同的形态[1?2]。例如公安部门使用清晰的人脸画像侦破案件;动漫领域利用真实的人脸照片生成卡通化的人物图像。这些不同的形态均为由人脸生成的异质图像。
一般而言,与指纹、手纹、虹膜和视网膜等身体特征相比,人脸也是人体表征性较强的特征之一。其蕴含较多的信息量,同时应用便捷。在该背景下,学者们逐渐扩展了人脸图像的应用范围,实现了多种人脸照片的合成算法[3?6]。在這些文献中,大部分的合成算法均是基于K近邻算法进行的,其详细过程为:首先输入一定数量的随机图像块,选取固定数量的近邻;再利用机器学习方法处理这些图像块,获取其具体的图像特征。然而,在算法训练集数量的限制下,提取图像块的数量不太可能等于近邻数量K。而两者的差值产生了较大的噪声,从而影响算法的整体性能。如何降低图像合成的噪声并合成更加清晰的素描图像,成为了一个值得研究的问题。针对这一问题,本文提出一种基于稀疏特征选择的自适应图像合成方法。该方法通过引入图像的稀疏表示方法,使用自适应的方法计算相关的图像特征个数,突破了提取训练集特征对于图像数据样本个数的限制,从而降低异质人脸合成图像的噪声。为了验证该方法的有效性和稳定性,本文进行相关的仿真试验。仿真结果表明,与传统合成方法相比,本文所提出的方法具有更加优秀的图像合成效果。
1 稀疏表示
稀疏表示是一种利用较少的基本信号表示原始信号的方法,在图像重建、去噪和修复中均有广泛的应用。一般而言,不妨令[D]表示[s×N]维的过完备矩阵。该矩阵又称为字典,矩阵的每一列均是一个原子。利用该方法令[n0]表示大多数分量为0的列向量,则信号[y]可表示为[N]个列变量的线性组合,如下:
[y=Dn0] (1)
且信号[y]的稀疏表达式为:
[n0=argminnn0, s.t. y=Dn0] (2)
式中,[n0]是列向量[n0]中分量不为0的个数。一般而言,求解式(2)是一个NP困难问题。但在一定的假设下,式(2)的求解问题可以转变为式(3)的求解,而这是一个利用凸优化可以解决的问题,又称Lasso问题,即:
[n0=argminnn1, s.t. y=Dn0] (3)
2 素描图像合成方法
在文献[7?8]的启发下,本文提出一种基于稀疏表示的素描图像合成方法。该方法首先利用匹配追踪算法,求解训练图像的稀疏表示系数;其次将人脸数据库的图像分割为多个图像子块;再利用机器学习和训练集获取全部区域的素描?照片块的所有参数,得到其稀疏表示方式,即“字典”。该方法用公式描述为:
[minD,nn1+αE-Dc22] (4)
式中:[D]表示稀疏表示方式中的字典,由照片块[Dph]和素描块[Dsk]按列组合的矩阵;[E]表示训练后的照片块和素描块按列组合的矩阵;[n]表示稀疏表示的系数矩阵。利用式(4)进行不间断的交替求解,即可求解[D]和[n]。该方法的计算过程如下所述。
2.1 匹配追踪算法
在求解的过程中,本文主要使用多原子匹配追踪算法。通过迭代的方法提取和图像块匹配度最高的原子,从而精确描述人脸图像的多种纹理结构信息[9?10]。从算法本质上看,匹配追踪是一种复杂度较低的贪婪算法,也是广泛使用的迭代稀疏分解算法。该算法选取内积衡量相关性,每次迭代均从字典[D=dk,k=1,2,…,K]中挑选与残差信号相关性最高的列向量。最终尽量逼近原始人脸图像,其具体步骤如下:
1) 初始化,即令原始人脸图像信号[f]赋值给初始的残差信号[R0f],即[R0f=f],同时令迭代轮数[i=0];
2) 计算残差信号与所有字典信号之间的内积系数[αk],即计算[αk=Ri,dk];
3) 计算内积的最大值,即记录某原子的下标[ki=argmaxαk];
4) 计算新一轮的残差信号,即[Ri+1f=Rif-αkidki];
5) 若新一轮残差信号的内积未达到一定的阈值,即[Ri+1f2≤ζ],则终止迭代计算;否则,令[i=i+1],转向步骤2),继续运算。
利用匹配追踪算法的多轮迭代,当迭代的总次数[N]逐渐增大时,则信号[f]将达到收敛状态,即[limN→∞RNf=0]。此时,本文可以得到原始的人脸图像信号分解公式:
[f=i=0N-1αkidki] (5)
一般而言,匹配追踪算法的复杂度主要取决于字典矩阵[D]中的原子个数。若原子个数越多,则匹配追踪算法的空间复杂度越高[11?12]。另外,当原子个数较多时,匹配追踪算法容易产生“过匹配”现象。即在迭代轮数较小时,选择错误的原子会导致后续计算耗费更多的时间代价去纠正错误,最终难以达到最优解[13]。例如,原始人脸图像信号[f=d1+d2],字典[D=dk,k=1,2,…,K]。若匹配追踪算法在前期的迭代过程中选择[di]([3≤i≤K]),此时为了纠正选取原子的误差,迭代计算将持续运行。最终,稀疏表示系数将难以得到最优解。
2.2 特征选择
训练数据集通常包含多张人脸照片,这里不妨设某张训练照片为[Lp]。首先将这张照片平均分为[N]个图像块,令[yi]表示照片的第[i]个列向量,则照片[Lp]的图像块可以表示为[y1,y2,…,yN]。使用[Dph]表示照片块形成的字典,[Dsk]表示素描块形成的字典,令[ni]为稀疏表示的相应系数,则照片块向量[yi=Dpn]的数学表示为:
[ni=argminnn1] (6)
所以,令[Nyi]表示照片块向量[yi]的近邻个数,则近邻照片块与表示系数[ni]之间的关系为:
[Nyi=jσnij≠0,j=1,2,…,#ni] (7)
式中:[nij]是表示系数[ci]的第[j]项元素;[#ni]是表示系数[ci]的元素个数。其近邻索引[σnij]的定义为:
[σnij=nij, nij>ε0 , otherwise] (8)
式中,[ε]表示較小的正整数,一般取值为0.001。若其取值变大,模糊效应将变得更小,进而图像块的近邻数量则越小。另外,对于差异较大的训练图像块,其近邻照片块[Nyi]的子图像块个数是不同的。其主要由稀疏表示系数决定,从而实现图像块个数的自适应确定,素描重构的权值归一化计算公式为:
[nij=σnijj=1#niδnij] (9)
根据归一化计算后的稀疏表示系数[nij],利用素描块字典[Dsk],即可得到原始照片块[yi]对应的合成素描块[xi]。将所有的合成素描块[xi]([1≤i≤N])进行一定的组合,即可得到完整的合成素描图像。
3 仿真结果与分析
为了验证合成方法的有效性,本文使用CU数据库进行必要的仿真与分析。一般而言,CU数据库主要包含3个子数据库:学生数据库、AR数据库和XM2VTS数据库。这些子数据库分别包含180张、120张和290张人脸照片。在合成方法中,本文将这些照片分割成大小为[36×36]的图像块,从各个子数据库中选取100对素描?照片对进行初步的训练,其他作为测试数据。另外,本文选取基于K近邻的人脸画像合成算法,与基于稀疏特征选择的算法合成效果进行对比。经过多张照片的训练与测试,本文得到多张素描?照片对,并选取一张照片进行对比、分析,如图1~图3所示。其中,图1展示了输入照片;图2展示了基于K近邻算法的合成图像;图3展示了基于稀疏特征选择的合成算法图像。