基于小样本人脸识别的身份验证工具及系统
2018-07-09游清清谌海云
游清清,谌海云
( 西南石油大学,四川 成都 610500 )
0 引言
职业教育培训和学业能力考试是企业和社会选拔人才的重要手段和主要途径,培训和考试的种类复杂多样,难度也越来越大。随着社会竞争愈加激烈,学生或考生为了取得好成绩,在相关考试中使用各种各样的作弊手段,极大影响考试的公平性。如何保证考试的公平公正,是亟待解决的主要问题。考试作弊手段中常见的夹带、抄袭、利用电子高科技等作弊方式目前已有较好的解决方法,但是考生替考现象目前仅能通过传统的监考人员人工验证来防范。人工验证由于存在验证时间短、验证人数多、证件易修改、人为影响等诸多不利因素,无法完全达到防作弊效果。随着计算机视觉的逐步发展,生物识别技术(指纹识别、虹膜识别、人脸识别等)被广泛应用到各个领域当中,其中就包括了身份验证领域。基于此,本文提出基于人脸识别的身份验证工具,以加强考试身份验证管理,杜绝替考现象发生。
1 概况
目前对于人脸识别研究大多是在多训练样本数据集的基础上进行识别,对于一些场景,例如信用卡、驾照、个人身份验证(包括本文涉及到的身份验证情况)等场所,人在注册时只能获得一幅图像,在人脸验证时只有一张训练样本,从而产生了小样本问题。由于小样本问题仅有单一的训练样本,无法从中获取样本的类内信息,传统的人脸识别算法识别效果大大下降,甚至不能使用。
研究表明,不同的人脸具有相似形状和轮廓,并且由于姿态、光照、表情等因素导致每个人人脸图像的变化也具有较强的相似性,所以区分每个类的鉴别特征可以从其他类学习得到。基于此,文献[2]中提出通用学习框架法来解决小样本问题,该方法利用通用框架库学习特征空间,将训练库与待测试样本投影至该特征空间中,采用距离度量,投影在该特征空间的训练库中与待测试库中距离最近的样本类别即待测试样本的类别。文献[3]中提出了扩展稀疏表示算法(ESRC),利用类内图像相减,即用训练库中的图像减去对应的均值图像,得到扩展的训练样本库称作误差图像,将误差图像与训练样本组成字典,得到测试库中图像的稀疏表示,从而对待检测图像进行识别。该方法虽然提高了识别率,但是研究发现,ESRC 中使用的字典为固定字典,并不能够对人脸进行准确的描述。因此本文提出使用稀疏变化字典学习(SVDL)算法重构人脸图像,通过多次更新系数学习最稀疏的字典,得到人脸图像的最优表示,从而完成对待检测样本的识别,该方法在人脸表情、姿态光照等发生变化时仍具有较好的识别效果。
2 稀疏表示
稀疏表示(Sparse Represent)最初是为了压缩重建高维信号。稀疏表示高维信号主要是利用一组矩阵(字典)对原始信息用进行线性表示,用较少的数据对原始信息进行传输、处理存储等。稀疏表示利用了信号的稀疏性对其进行数学建模,通过含有少量非零元素的稀疏矩阵反映信号的性质与结构,该方法简洁高效地表示了信号,较大程度降低了信号处理过程中的复杂度。
给定一个字典其中M << N,该字典的原子可以张成N维欧式空间,称该字典为过完备字典。设向量x为人脸图像X的向量表示形式,长度为M。该人脸图像可由上述过完备字典线性展开,即:
其中为系数向量。
由于过完备字典Ψ列数大于行数,因此在上述方程求解过程中,未知数大于方程数,即式(1)为欠定的,存在无穷解。图像的稀疏表示求解是为了使得系数向量α尽可能稀疏,即系数向量中非零元素尽可能少。向量的0-范数是指向量中非零元素的个数,由此将图像的稀疏表示求解问题转换为求解下式优化问题:
假设系数向量α为k稀疏的,即向量中非零元素有k个。这里的x和α为人脸图像x在时域空间与Ψ域空间的不同表示,此时的k≤N,表明该图像x是可以被压缩表示的。
在实际应用中,式(2)还可以表示为:
上式指在小于k个原子的条件下,使得表示误差尽可能小。
在式(2)求解过程中,当字典Ψ为正交基矩阵时,其解较易得到,但是对于一个过完备字典来说,稀疏表示求解问题变成了一个NP难题,且很难对其进行稀疏逼近。一些学者们通过数学推导发现,在约束等距性条件下,0-范数与1-范数求解值相同。因此在满足约束等距性条件下,一般选择l1范数逼近l0范数。约束等距性是指投影前信息中各元素的距离在投影后各元素之间的保持不变,数学描述为对于一个整数s=1,2,…,定义矩阵A的等距常数δs为满足下式的值:
在满足约束等距性条件下,式(4)可转换为式(5)所示。
求解模型(5)得到的系数向量,可较好反映出图像信息。在求得系数向量之后,可根据过完备字典Ψ,重构出原始图像,最后通过比较原始图像与重构图像之间的表示残差对图像完成最终分类,残差r如式(6)所示。
3 小样本识别算法
针对小样本识别问题,在稀疏表示的基础上进行扩展延伸,提出通用框架库法,该方法从其他类别的数据库中学习到可区分待检测类的类内特征,根据训练样本重构出测试图像,对其进行识别验证。通用框架库法有很多,本文主要采用Yang Meng等人于2013年提出的稀疏变化字典学习算法完成小样本人脸识别。
稀疏变化字典学习的基本原理是将训练库中的人脸图像自适应投影在参考子集中,从变化子集中学习稀疏变化字典,重构出待检测人脸可能出现的变化,最后根据得到的自适应投影项与变化字典学习项得到人脸图像的最终表示,并完成人脸的识别验证。
稀疏变化字典学习算法模型如式(7)所示,包含自适应投影项和变化字典学习项。
其中,D为待学习的字典,γi为gi的稀疏表示,为自适应投影项,为变化字典学习项。在变化字典学习项中,通过稀疏向量γi将变化矩阵Xi投影到字典D上得到训练库的变化矩阵。
3.1 自适应投影项
自适应投影项主要是将训练库中的图像自适应在投影参考子集中,训练图库中的第i个人脸可由参考子集近似得到,即因此自适应投影项可定义为:
3.2 变化字典学习项
训练库对应的具有其他变化的图像定义为Yi(即为待测试图像),可近似表示为:
由于待测试人脸图像的变化较多且未知,使得变化矩阵维数过大且冗余,因此使用一个较为简洁紧凑的字典D来表示待测试图像。字典其中dj为字典D的原子。变化字典学习项为:
其中为的稀疏表示,为常数。分别表示系数矩阵项和字典原子基础项。
由此可得SVDL算法的整体模型如式(11)所示。
3.3 模型优化算法
为了求得SVDL模型的最小值,可对式(11)分成两部分求解:自适应投影项与变化字典学习项。
在进行替代优化前,初始化γi值。
将初始化后的γi值带入式(10)中,为了描述方便,使得得 :
采用变量交替优化的策略求上式解。固定字典D,使用BP算法求解为每个样本得到相应的Bi,以Bi为初值更新字典D,可将式(13)写为:
使用基于逐列更新策略的KSVD算法更新字典D,更新第i列元素时,其他列元素保持不变,令di表示字典D的第i列元素,Bi表达稀疏矩阵B的第i行元素,则式(14)可重写为:
式中是固定的,使用K_SVD算法对上式最小化。根据以上反复迭代求得字典D和样本集Y的稀疏表示矩阵B。
确定字典D和稀疏表示矩阵B之后,式(11)变为:
对该式求导得最小值,即:
4 实验与结果
4.1 对比
为验证算法的有效性,在不同的数据库上进行对比,同时也与目前流行的算法(PCA、SVM、SRC、CRC、ESRC等)进行了比较,结果如下所述。
1)AR数据库测试
进行实验时,将AR数据库分为s1和s2,两个库包含了光照、表情、遮挡等变化,分别进行实验后结果如表1和表2所示。
2)CMU-PIE数据库测试
将CMU-PIE数据库分为四个部分(s1、s2、s3),其中s1为不同光照下的人脸,s2为不同表情的人脸、s3为不同姿态的人脸,结果如表3所示。
3)Extended YaleB数据库测试
Extended YaleB数据库包含了38个志愿者在9种姿态、64种光照下采集的人脸图像,每人64张,实验结果如表4所示。
表1 AR数据库对比实验(s1)
表2 AR数据库对比实验(s2)
表3 CMU-PIE-database
表4 Extended YaleB
(4)自建库测试
为选择合适的通用数据库应用在实践中,在自建库中进行实验。分别选择AR数据库、CMU-PIE数据库、ORL数据、FERET数据库、Extended YaleB数据库作为通用数据库,自建库中每类人脸的第二张图像为训练图像,其余为测试图像,实验结果如表5所示。
表5 FERET-database
4.2 分析
从稀疏变化字典学习算法在不同的人脸数据库上进行的实验可以看出,该算法通过使用通用框架库,提取了样本的类内信息,解决了小样本问题,并增强了算法对光照表情变化的鲁棒性,与传统的识别算法相比,一定程度上提高了识别效果。
5 身份验证系统
5.1 系统框架
根据系统功能,设计了验证系统,其整体框架见图1。系统主要包括三大功能模块,分别是信息管理模块、身份验证模块和数据通讯模块。信息管理模块主要负责存储管理从终端下载到的信息,实时人脸图像采集和学员考生信息读取。身份验证模块主要功能是负责身份验证,数据通讯模块主要用于数据传输、与后台数据库信息交互。
图1 系统框架
5.2 系统仿真实验
针对上述系统总体框架及流程,对系统进行仿真实现。考试开始时,考生手持相应证件经过身份验证系统,读写器读取相关信息,检索该考生所处考场,通过对比信息判断是否为本考场考生,如不是,给出相应提示,见图2。
图2 不属于本考场界面
考场确认无误后进行人脸验证,系统获取人脸图像之后,对图像进行处理,与库中模拟人脸进行比较,选择误差最小的作为拟身份,将考生信息与拟身份进行比较,相一致则匹配成功并显示考生基本信息,若无法匹配则提醒监考人员采取人工复核,避免系统误检,见图3和图4。
图3 识别成功
图4 误检提示
6 结语
本文采用稀疏变化字典学习算法,利用通用框架库的思想,解决了小样本问题中难以获取样本类内信息的问题,同时对光照、表情、姿态等变化有好的鲁棒性,得到更高的人脸识别精度,在此基础上建立了身份验证系统,具有实时有效特性。
[1]王科俊,段胜利,冯伟兴.单训练样本人脸识别技术综述[J].模式识别与人工智能,2008,21(5).
[2]Wang J,Plataniotis K N,LuJ,etal.On solving the face recognition problem with one training sample per subject[J].Pattern recognition, 2006,39(9):1746-1762.
[3]Deng W,HuJ,GuoJ.ExtendedSRC:undersampledface recognition via intraclass variant dictionary[J].IEEE transactions on pattern analysis &machine intelligen ce,2012,34(9):1864-1870.