基于岭回归与最近邻搜索的人脸画像合成算法

2017-06-26朱明瑞

电子科技 2017年6期

关键词：子类画像特征向量

高彦，朱明瑞

(1.鲁东大学信息与电气工程学院，山东烟台 264025; 2.西安电子科技大学电子工程学院，陕西西安 710071)

基于岭回归与最近邻搜索的人脸画像合成算法

高彦1，朱明瑞2

(1.鲁东大学信息与电气工程学院，山东烟台 264025; 2.西安电子科技大学电子工程学院，陕西西安 710071)

针对现有人脸画像合成算法复杂度高、合成速度慢的问题，提出了一种基于岭回归与最近邻搜索的快速人脸画像合成算法。该算法的核心是利用岭回归由人脸照片块获得初始合成画像块，并在此基础上利用最近邻搜索在训练画像块样本集中找到与初始合成画像块最相似的画像块作为最终合成画像块，使得细节纹理更具画像风格，并将合成画像块拼接得到合成人脸画像。通过仿真实验表明，该算法不仅能由人脸照片合成出高质量的人脸画像，且具有计算复杂度低、合成速度快的优点。

人脸画像合成；岭回归；最近邻搜索；快速算法

人脸画像合成技术在刑侦破案方面具有较大的利用价值[1]。法医根据目击者描述画出人脸素描画向后，由于公民数据库中的图片为人脸照片，照片与画像间存在差距，传统的人脸识别方法难以获取得到满意的识别效果。将公民照片数据库中的照片合为画像能有效减小他们纹理上的差距，进而提高识别率[2-3]。

文献[4]首先提出了基于主成分分析的特征转换方法，其假设照片与画像间的转换是线性的，将输入照片投影到训练照片集中得到投影系数，继而利用该系数线性组合训练画像集中相应的画像得到合成画像。文献[5]引入流行学习中局部线性嵌入(LLE)的思想来得到学习照片与画像间的非线性映射。文献[6]提出了利用稀疏编码在合成的原始画像上补偿高频信息，并利用稀疏表示来自适应的选择画像块。文献[7]提出了多尺度马尔科夫随机场(MRF)模型来结合相邻块之间的信息，并在多尺度上进行人脸画像合成。文献[8]在此基础上提出马尔科夫权重场模型(MWF)来克服MRF中求解NP-hard的问题，并且能合成出训练集中没有的画像块。此外，还有诸多文献对人脸画像合成算法进行研究[9-12]，但这些算法都存在算法复杂导致人脸画像合成速度慢等问题。为了克服这个问题，在得到高质量的合成人脸画像同时，提升合成速度，提出一种结合岭回归[13]与最近邻搜索[14]的两阶段人脸素描画像合成算法。

1 人脸画像合成问题模型

人脸画像合成要解决的问题如图1所示。

图1 人脸画像合成示意图

给定训练照片样本集与训练画像样本集，将测试人脸照片合成为人脸画像。基于机器学习的人脸画像合成算法一般将图像进行有重叠区域的分块处理后，首先将人脸照片块合成为人脸画像块，再将人脸画像块进行拼接得到合成人脸画像。

2 算法的具体实现

2.1 岭回归基本原理

在训练阶段，采用K-Means聚类[15]将训练集照片-画像块聚成若干个子类，通过该处理，每个子类内的照片-画像块之间的映射关系接近线性，此时通过岭回归能够很好的拟合此映射关系。

假设每个子类中，训练画像块特征向量组成的矩阵为Y∈R(m×n)，训练照片块特征向量组成的矩阵为X∈R(p×n)，其中，m表示训练画像块特征向量的维数;p表示训练照片块特征向量的维数;n表示训练照片-画像块对的个数，则X与Y之间的线性关系可以表示为

Y=θX+Γ

(1)

其中，θ表示映射系数矩阵；Γ表示残差矩阵。

为了得到系数矩阵θ的唯一解，需要优化下面的最小化问题

(2)

其中，λ表示惩罚参数。

上式的闭合解为

θ=YXT(XXT+λI)-1

(3)

将训练阶段得到的映射系数矩阵θ保存后，进入测设阶段。在测试阶段，根据每一个测试照片块与每一类聚类中心间的欧氏距离分到最相似的子类。在每一个子类中，假设测试照片块矩阵为X(test)∈R(p×l)，则输出的初始合成画像块矩阵Yt∈θXm×l可以由下式计算

Yt=θX(test)

(4)

2.2 最近邻搜索基本原理

得到初始合成画像块之后，计算其与训练画像块样本集中每一个画像块间的欧氏距离，欧氏距离公式如下

(5)

其中，k表示初始合成画像块与训练画像块样本的特征向量的维度；x表示初始合成画像块的特征向量；y表示每一个训练样本画像块的特征向量。

对于每一个初始合成画像块，取与其欧氏距离最小的样本画像块作为最终合成画像块。得到所有的最终合成画像块后，按照相邻画像块间重叠部分取平均值的方法拼接最终合成画像块，得到最终合成画像。

2.3 算法步骤

(1)图像分块处理。将所有图像划分成大小相同，且重叠程度相同的图像块；(2)训练样本图像块划分子类。使用K均值聚类算法将训练样本块集合划分为多个训练样本块子类集合；(3)使用岭回归映射每个子类中训练照片块与训练画像块间的线性关系，得到映射系数矩阵；(4)合成初始画像块。将测试照片块划分到不同的训练样本块子集中，根据岭回归得到初始合成画像块；(5)合成最终画像块。使用最近邻搜索在训练画像块样本中找到与初始合成画像块最相似的画像样本块作为最终合成画像块；(6)拼接所有最终合成画像块得到最终合成画像。

3 仿真实验结果与分析

3.1 合成画像质量分析

为验证算法的有效性，在香港中文大学多媒体实验室发布的CUHK人脸画像数据库[7]上进行了实验。该数据库包含3个子库：CUHK学生数据库，AR数据库和XM2VTS数据库，分别包含188、123、295对人脸画像-照片。该实验分别在CUHK学生数据库，AR数据库和XM2VTS数据库上进行了画像合成实验。其中CUHK学生数据库取88对照片-画像作为训练集，100对照片-画像作为测试集，AR数据库采用留一法进行合成，XM2VTS数据库取100对照片-画像作为训练集，剩余195对照片-画像作为测试集。由于XM2VTS数据库中数据结构复杂，该数据库合成结果相较于其他两个数据库噪声和模糊略多。算法在3个数据库上的部分画像合成结果如图2所示，其中图2(a)所示为本算法在CUHK学生数据库上的部分画像合成结果，图2(b)所示为算法在AR数据库上的部分画像合成结果，图2(c)所示为算法在XM2VTS数据库上的部分画像合成结果，可见所提算法的画像合成结果背景噪声小、纹理清晰，合成结果质量高。

图2 部分画像合成结果

3.2 合成画像耗时分析

为验证所提算法在画像合成速度方面具有优势，在相同的实验环境下，分别使用所提算法、LLE算法[5]和MWF算法[8]合成100张画像，统计总时间并计算每合成一张画像消耗的平均时间，对比3种方法合成画像的平均耗时。仿真实验的计算机配置环境为Intel(R) Core i7-4790 3.6 GHz、内存16 GB、Windows 7操作系统，仿真软件为Matlab R2012a，数据库采用香港中文大学CUHK学生数据库，3种算法平均耗时对比如表1所示，可见所提算法在画像合成速度方面具有较大优势。

表1 3种画像合成算法平均耗时对比

4 结束语

针对现有人脸画像合成算法复杂、合成速度慢等问题，提出了基于岭回归与最近邻搜索的两阶段人脸画像合成算法。每一阶段所采用的算法模型简单、复杂度低，但不影响合成画像质量，大幅提升了画像合成速度。此外，所提算法是模型驱动的，现有大多数画像合成算法为数据驱动，此算法模型具有良好的可扩展性。

[1] 高新波,王楠楠.基于三元空间融合的人脸图像模式识别[J].模式识别与人工智能,2015,28(9):811-821.

[2] 高新波,王楠楠.异质人脸图像合成,机器学习及其应用[M].北京:清华大学出版社,2013.

[3] 张英武,姬红兵.人脸画像识别研究[J].电子科技,2005,18(3):29-31.

[4] Tang X,Wang X.Face sketch synthesis and recognition[C].Beijing:IEEE International Conference on Computer Vision,2003.

[5] Liu Q, Tang X. A nonlinear approach for face sketch synthesis and recognition[C].Shanghai:IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2005.

[6] 高新波,王楠楠.基于稀疏表示的人脸画像-照片生成方法:中国,ZL2010102893309[P].2012-08.

[7] Wang X,Tang X.Face photo-sketch synthesis and recognition[J].IEEE Transactions on Software Engineering,2009,31(11):1955-1967.

[8] Zhou H,Kuang Z.Markov weight fields for face sketch synthesis[J].IEEE Conference on Computer Vision and Pattern Recognition,2012(23):1091-1097.

[9] 李洁,彭春蕾.基于多特征融合的图像合成方法:中国,201410165469.0[P].2014-09-12.

[10] 肖兵.人脸画像-照片的合成与识别方法研究[D].西安:西安电子科技大学,2010.

[11] 李伟红,朱宪宇,龚卫国.基于人脸画像的伪照片合成及修正[J].光学精密工程，2014，22(5):1371-1378.

[12] 高新波,张声传.基于贪婪搜索的人脸画像合成方法:中国,201410818175.3[P].2014-10-20.

[13] 杨姗姗,王松会,宋东东.基于回归分析的研究及R语言实现[J].电子科技,2015,28(10):186-188.

[14] 刘桥,杨正坤,李晗.基于SURF算法的医学图像特征点匹配[J].电子科技,2014,27(5):145-148.

[15] 毛秀,冒纯丽,丁岳伟.基于密度和聚类指数改进的K-means算法[J].电子科技,2015,28(11): 47-50.

更正

我刊2017年第30卷第3期第20页图8与图10位置错误，图片位置应相互置换，图题不变，特此更正。

《电子科技》编辑部

Face Sketch Synthesis via Linear Regression and Nearest Neighbor Search

GAO Yan1, ZHU Mingrui2

(1. School of Information and Electrical Engineering, Ludong University, Yantai 264025, China;2. School of Electronic Engineering, Xidian University, Xi’an 710071, China)

A fast algorithm of face sketch synthesis based on ridge regression and nearest neighbor search is proposed in this paper to address the high complexity and slow speed of existing algorithms. The initial synthesized sketch patch is obtained firstly from photo patch using ridge regression. Then the nearest sketch patch is found as the final high quality synthesized sketch from training sketch patch samples using nearest neighbor search. The experimental results show that the proposed algorithm offers synthesis of high quality face sketches with low complexity and at high speed.

face sketch synthesis; ridge regression; nearest neighbor search; fast algorithm

2016- 07- 28

国家自然科学基金重点项目(61432014)

高彦(1995-)，女，本科。研究方向：数字图像处理。朱明瑞(1992-)，男，硕士研究生。研究方向：模式识别。

10.16180/j.cnki.issn1007-7820.2017.06.007

TN911.73；TP391.41

1007-7820(2017)06-024-03