APP下载

基于发育网络的复杂背景下人脸识别

2016-06-16王东署郑光璞

郑州大学学报(工学版) 2016年1期
关键词:识别率人脸识别

王东署,郑光璞

基于发育网络的复杂背景下人脸识别

王东署,郑光璞

(郑州大学 电气工程学院,河南 郑州 450001)

摘要:针对人脸识别中光线、背景及面部表情的变化,利用密歇根州立大学人脸库构建复杂背景人脸图像库,并将发育网络应用于二维人脸识别.引入突触维护机制来处理复杂背景,可以自动决定突触的完全去除、保留和部分去除,弱化背景并强化人脸,从而降低复杂背景对人脸识别的不利影响.通过和传统方法测试结果对比,采用带突触维护机制的发育网络对复杂背景下人脸的识别可以取得更好的效果,其识别率可达96%以上.

关键词:发育网络;人脸识别;复杂背景;突触维护;识别率

0引言

人脸识别作为计算机视觉及模式识别研究的一个重要子领域,具有重要的理论研究意义和实际应用价值.复杂背景下的人脸识别是一个非常复杂和极具挑战性的课题,它与指纹、视网膜、基因、声音等其他人体生物特征识别相比,具有友好、简单、易于被接受等特点,近年已被广泛用于国家安全、银行密码系统、公安刑侦破案等领域[1].

在复杂背景人脸识别的研究中,国内较有代表性的研究有:王波等[2]提出了具有形状约束的snake模型的人脸检测方法;于威威等[3]利用灰度边缘图像并结合人脸的几何特征,检验双眼及人脸的真实性;田春娜等[4]则采用基于聚类有效性分析及多姿态检测算法检测人脸.此外,仲澄等[5]提出一种新的自适应肤色分割的算法定位人脸,采用局部奇异值分解法 (singular value decomposition,SVD)提取图像特征值,用主成分分析法(principal components analysis,PCA)加以识别;何露等[6]则利用肤色分割减小搜索区域,在匹配时只需对肤色分析后的区域作匹配,改变了传统模板匹配方法中逐点扫描的方式,所需匹配的区域大大减少,检测速度得到了提高.

国外研究中,Huang[7]提出了在噪声干扰或复杂背景下,基于α-散度的非负矩阵分解(nonnegative matrix factorization,NMF)方法的人脸识别.该方法用α-散度来测量距离,通过NMF表达式中不同的参数值得到一系列迭代的因子分解式,以便NMF得到总体最优值,改善人脸识别的精度;Chen等[8]提出了基于复杂背景视频下移动机器人的实时人脸识别与检测,通过嵌入式马尔科夫模型去识别人脸;Vaidehi等[9]提出了基于哈尔小波和独立成分分析算法的人脸识别,如果特定人脸信息在该系统中已经被训练过,那么该算法就可以实时检测照片背景中的该人脸,并且确定其身份.

为了模拟人类大脑的识别,笔者提出了基于发育网络(developmental network,DN)的复杂背景下的人脸识别算法,并引入突触维护机制[10-11],自动决定突触的全部去除、保留和部分去除,弱化复杂背景,强化人脸.实验结果表明,在复杂背景下的二维人脸识别领域是很有效的.

1理论基础

1.1发育网络

发育网络[12]是美国密歇根州立大学翁巨杨教授模拟人类大脑的发育规律而提出的一种智能网络.发育网络的X、Y和Z3个区域类似于传统网络的输入层、隐含层和输出层.X作为传感器与外界环境接触,Y层作为发育网络的大脑,不能直接与外界环境接触,作为执行器层,Z层即可以输入也可以输出,当Z处于外界监督状态时,作为网络的输入,否则,Z输出一个向量来驱动执行器(肌肉或腺体)作用于真实世界.X,Y,Z3个区域顺序是由低到高,如X→Y,Y↔Z.图1即为发育网络的工作原理,描述如下:

图1 DN网络示意图

1)在t= 0时刻,对A={X,Y,Z}中的任一区域,初始化N和反应向量r,其中N=(V,G),V是突触权值,G是神经元的年龄,r是权值与输入相乘后的值.

2)在t=1,2,…,n时刻, 对A中的任一区域,重复下面的两个步骤:

①利用区域函数f进行计算,运算关系如下:

(r′,N′)=f(b,t,N).

(1)

其中,b(bottom-up)和t(top-down)分别是自下而上和自上而下的输入;

②更新:N←N′,r←r′.

区域Y中神经元能量值的计算如下:

(2)

其中,vb和vt分别对应自下而上和自上而下的权值.激活神经元位置由下式得到:

(3)

其中,j代表响应值最大的神经元,激活后,其与X和Z之间的连接权值更新如下:

(4)

(5)

其中,ti是神经元的激活时间,激活神经元的年龄加1,即nj←nj+1.

1.2突触维护

乙酰胆碱和去甲肾上腺素对突触的神经调节作用定义为突触维护[13].乙酰胆碱在基底前脑和脑干中生成,甲肾上腺素既是一种激素又是一种神经递质[14].Yu等[15]提出了乙酰胆碱与预测的不确定性有关,去甲肾上腺素与无法预测的不确定性有关.

1.2.1乙酰胆碱系统

输入pi和权值vi的方差表达公式如下:

(6)

方差更新如下:

(7)

ω1(n)=1-ω2(n).

(8)

其中,μ(n)是遗忘因子,只有年龄更新到一定次数才起作用(n0≤20时等于0,否则等于1.5). 所有突触中预期的突触标准方差定义为

(9)

其中,d代表神经元的突触点(像素点)个数.

1.2.2去甲肾上腺素

每一个突触相对方差定义如下:

(10)

采用如下突触因子来决定突触的去留[10]:

f(ri(n))=

(11)

其中,βb=1.5;βs=1;ri(n)是相对方差.当ri(n)<βs,突触连接将增强;当βs≤ri(n)≤βb,连接将减弱;当βb

1.2.3突触修剪

对输入vi和权值pi修剪如下[10-14]:

vi←f(ri(n))·vi.

(12)

pi←f(ri(n))·pi.

(13)

计算神经元激活之前的能量:

(14)

其中,α,β表示输入比重系数,其和是1.

2实验部分

2.1网络设计

1)创建DN网络:将训练图片输入到X层.

2)Y层和Z层神经元个数是36个和27个.

3)网络初始化:权值连接全部初始化为0,Y层突触方差σ初始值定为0.001 1,即1/256,设置相似度门限值为0.7.

4)图库:由密歇根州立大学人脸库与不同复杂背景合成,共324副(114×114).训练集共270副头像,27个人每人10副;测试集共54副,每人2副.

图2 图库的合成

2.2实验过程

训练过程如图3所示.

图3 训练过程示意图

X层向Y层输入为b(114×114,自下而上输入),Z层向Y的指定输入为t(27×1,自上而下输入),由式(6)、(7)、(9)、(10)、(11)得到突触因子f,然后根据式(12)、(13)对突触权值和输入向量进行突触修剪,由公式(14),分别用b和t乘以Y中所有神经元的对应连接权值并相加,得到r(6×6),r中响应值最大的对应神经元j激活,rj=1,其余神经元值为0.更新神经元j对应的权值,激活的神经元年龄值加1.

测试过程如图4所示.测试阶段网络被“冻结”,只有X层向Y层的输入,将响应向量r输入到Z层,得到输出r′(27×1),激活神经元位置对应网络预测的结果,与目标输出进行对比,确定识别结果的对与否.

图4 测试示意图

3结果分析

3.1实验结果

图5为突触因子f图,从图5可以看出,只有前27个神经元权值进行了修剪,其中白色表示权值保留,黑色为权值修剪,其余9副白色图像表示相应神经元者激活年龄值未达到n0或未激活.

图5 突触因子f

图6是经过突触修剪后的X到Y的权值,头像中复杂背景有了明显的弱化,人脸部分则实现了保留.

图6 突触修剪后X层到Y层的权值

表1和表2分别是不带与带突触维护时识别率对比.由表1和表2可知,加上突触维护的发育网络有更好的识别效果.突触维护机制削弱了图像中不稳定信息,即变化较大的背景部分,而人脸得以保持,这就减少了由于头像背景的变化造成的识别误差,从而提高了识别率.

3.2多种算法对比

利用和本文相同的训练集测试集(每个人有12副不同的图片),采用改进型反向传播(back propagation,BP)神经网络和基于PCA的三阶近邻法以及基于鲁棒稀疏表示算法[16]进行验证对比.识别率情况如表3~5所示.表3和表5中的PCA维数和特征维数是特征提取后特征向量的维数.表6为不同方法识别率的比较.

表1 不带突触维护DN识别率

表2 带突触维护DN的识别率

表3 PCA维数与识别率的关系

基于本文图库,人脸位于复杂背景中间,相比领域中热门的美国Yale人脸图库、英国ORL(olivetti research laboratory)人脸图库更为复杂,以上3种传统流行方法提取的特征都含有较多的干扰背景,而稀疏表示算法因测试样本是训练样本的稀疏组合,所以训练样本中同一人不同背景造成的干扰导致识别率下降.本研究中,基于突触维护的DN算法通过突触修剪削弱不断变化的背景,专注于人脸部分的检测,鲁棒性强,最高识别率能达到96%以上,其识别效果明显优于其他4种算法.

表4 BP网络训练迭代次数与识别率的关系

表5 稀疏表示算法特征维数与识别率的关系

表6 5种方法识别率的比较

4结论

笔者模拟人类乙酰胆碱系统和去甲肾上腺素系统,提出带突触维护的DN算法,可以弱化复杂背景,专注于人脸部分识别.对比结果表明,DN网络中引入突触维护机制要比不加突触维护效果好,并且都优于BP网络算法、三阶近邻法以及鲁棒稀疏表示算法的识别.本研究仍然存在图库的创建没有实现尺度无关性及头像与背景位置相对固定的问题,笔者将在未来的工作中继续研究.

参考文献:

[1]朱长仁.复杂背景下的多姿态人脸识别技术研究[D].长沙:国防科学技术大学信息与通信工程,2001.

[2]王波,刘丰年,陈迎娜. 复杂背景下人脸检测技术的研究[J].河南机电高等专科学校学报,2010,18(3):39-41.

[3]于威威,滕晓龙,刘重庆.复杂背景下人眼定位及人脸检测[J].计算机仿真,2004(12):185-187.

[4]田春娜.复杂背景下多视角人脸检测与识别[D],西安:西安电子科技大学智能信息处理,2008.

[5]仲澄,冯涛.复杂背景下的人脸定位识别方法[J].计算机工程与应用,2012,48(1):205-207.

[6]何露,王贤明.复杂背景下基于视频流的人脸检测技术研究[J].中国水运,2010,10(6):80-82.

[7]HUANG A M NMF face recognition method based on alpha divergence[C]//Proceedings of the international conference on information engineering and applications (IEA). London: Springer-Verlag,2013:26-28.

[8]CHEN S,ZHANG T. A real-time face detection and recognition system for a mobile robot in a complex background[J].Artificial life and robotics,2010,15(4): 439-443.

[9]VAIDEHI V, FATHIMA A, TREESA T M. An efficient face detection and recognition system[J].Lecture notes in engineering and computer science, 2011, 21(1): 499-503.

[10]王悦凯,吴晓峰.仿大脑视觉皮层的自主发育网络模型研究[D].上海:复旦大学信息与科学工程学院,2013.

[11]WANG D S, ZHENG G P, LIU L. Developmental network and its application to face recognition [C]//Control & decision conference.Qingdao: IEEE Press, 2015:3360-3365.

[12]WENG J Y. Natural and Artificial intelligence, introduction to computation brain-mind[M].Michigan: BMI Press,2012.

[13]BEAR M F, CONNORS B W, PARADISO M A. Neuroscience: Exploring the Brain[M].Philadelphia: Lippincott Williams & Wilkins, 2007.

[14]MCCANN C M, NGUYEN Q T, NETO H S , et al. Rapid synapse elimination after postsynaptic protein synthesis inhibition in vivo[J].The journal of neuroscience, 2007, 27(22): 6064-6067.

[15]YU A J, DAYAN P. Uncertainty neuronal-modulation and attention[J].Neuron, 2005, 46(4): 681-692.

[16]DU H S, ZHANG X D, HU Q P, et al. Sparse representation-based robust face recognition by graph regularized low-rank sparse representation recovery [J]. Neurocomputing, 2015, 164: 220-229.

Face Recognition with Complex Background Based on Developmental Network

WANG Dongshu, ZHENG Guangpu

(School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China)

Abstract:Aiming at the change of light, background and facial expressions in face recognition, this paper constructs a face database with complex background based on the face database of Michigan State University and applies the developmental network (DN) to the two-dimensional face recognition.The synapse maintenance mechanism is introduced to deal with the complex background, which can automatically determine the synapses’ complete removal, partial removal or retention. Moreover, it can weaken the background, strengthen the face and consequently decrease the negative effects of the complex background. Compared with the test results of the traditional methods, DN with the synapse maintenance mechanism can recognize faces with complex background effectively and the recognition rate can reach above 96%.

Key words:developmental network; face recognition; complex background; synapse maintenance; recognition rate

收稿日期:2015-04-20;

修订日期:2015-06-19

基金项目:国家自然科学基金资助项目(61174085)

作者简介:王东署(1973—),男,河南郑州人,郑州大学副教授,博士,主要从事机器人自主发育研究,E-mail:wangdongshu@zzu.edu.cn.

文章编号:1671-6833(2016)01-0019-05

中图分类号:TP18

文献标志码:A

doi:10.3969/j.issn.1671-6833.201504040

引用本文:王东署,郑光璞.基于发育网络的复杂背景下人脸识别[J].郑州大学学报(工学版),2016,37(1):19-23.

猜你喜欢

识别率人脸识别
人脸识别 等
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
提升高速公路MTC二次抓拍车牌识别率方案研究
人脸识别技术在高速公路打逃中的应用探讨
基于(2D)2PCA-LBP 的人脸识别方法的研究
人脸识别在高校安全防范中的应用
档案数字化过程中OCR技术的应用分析