基于LBP的人脸识别技术在考试身份验证中的应用研究
2014-04-13陈史政
陈史政
(福建广播电视大学漳州分校,福建 漳州 363000)
不论在什么考试中,身份认证都是一件非常关键的事情,这直接关系到考试本身是否公平、有效.目前最常见的考生身份认证方法是使用证件进行验证,这种方法在实际应用中较容易被替考者蒙蔽,特别是当监考人员不认识考生时,如果证件照片被篡改,则发现替考的难度就会增大.通过构造网络型考试身份验证与监督体系,将考生信息放在数据库上,在考生入场身份验证时记录考生人脸图像信息并与数据库中考生图像进行比对,可以更好地防范这类身份验证问题的发生,并保有考后对替考者责任的追究能力,对有替考舞弊倾向的考生产生较强的心理威慑作用.现在有一些考试已经开始记录考生人脸图像信息,如全国计算机应用能力考试、会计从业资格考试等,不过在这些考试的身份验证过程中考生图像信息仅被手动拍摄并提交到服务器,缺少进一步的处理.这时就可以在考试身份验证中引入人脸识别技术,以求更快、更好地完成身份验证的过程.
人脸识别技术,就是以信息技术为基础,利用计算机自动对人的脸部图像进行数据处理与分析,并以此来实现人的身份识别的方法.由于在现实生活中身份识别应用的普遍性,人脸识别技术的研究具有很重要的意义,在许多领域都拥有显而易见的应用价值,是计算机科学技术研究中的一个热点.但是现在人脸识别技术还存在许多尚未解决的难点,也还没有通用的实现方法,不过经过这些年的发展,已经出现了一些应用实例.本文将采用一种基于改良LBP算法的人脸识别技术,对其在考试身份验证系统中的应用进行研究.
1 系统分析与设计
人脸识别技术要应用在考试身份验证中至少需要几个必备的基础条件,那就是网络、服务器与数据库、监考客户端、摄像头,其整体结构如图1所示.随着网络技术的飞速发展、计算机设备成本的不断下降、小型摄像器材的大面积普及,如果仅从硬件方面考虑,在许多考试机构已经可以轻松实现图1所示的系统平台.所以能否应用人脸识别技术来更快、更好地完成身份验证的关键在于如何求取一个切实可行的人脸识别算法上.
图1 系统结构图
由于现实操作过程中无法要求每位考生在报考时提供多幅像片,通常情况下服务器里的考生数据库仅存有相应考生的一幅图像,即样本集里每个人都只有一个样本,这样问题的核心就转化为如何较好地解决单样本人脸识别.相比一般情况,由于考场拍摄环境较为固定、可以安排纯色背景、拍摄时都是正面,所以处理的基本上都是简单背景正面人脸图像.其倾斜角度较小,而且受到光照干扰的影响幅度也相对较小,有利于人脸识别.目前的人脸识别算法通常需要一定数量的训练样本才能取得良好识别效果,单样本人脸识别算法的识别率还比较低,所以应用在考试身份验证时无法达到全自动完成的程度,需要监考人员的介入操作才能较好完成.
图2 考试身份验证流程图
从监考客户端采集考生图像数据需要在考生入场时间段进行.通过调研发现,考生主体入场时间会比较集中,通常小于10分钟,如果每个考生采集图像时都需要由监考人员搜索对应考生信息再拍摄保存,在时间上会比较紧张,同时对监考人员操作能力要求较高.此时可以改为先采集人脸图像,由系统在未入场考生信息中进行人脸识别比对后,给出最匹配项和两个次佳备用学生项供监考人员点选录入.增加的两个后备项可以在首选识别失败时保持较快的图像采集速度.最后,上传数据并对数据库图像与现场图像相似度异常的考生进行标记示警.
通过以上的分析发现现阶段人脸识别技术实际应用于考试身份验证中,除了可以尽可能提高正确识别率外,主要还应考虑实现以下两个方面的功能,一是降低图像采集操作复杂度,搜索匹配考生辅助完成身份验证;二是对相似度异常的考生进行标记示警,供监考人员与巡查监督人员核查.在本文中选用LBP算法,主要原因有两个:一个是LBP算法能够保证在单样本人脸识别上达到一定的应用效果;另一方面则是相对其它算法来说,LBP算法的实现简单、速度较快,符合现场实时操作的时间要求.
2 人脸识别
2.1 图像预处理
在人脸识别时为了减少运算量,需要将其转为灰度图像,这一过程会使不少图像信息丢失,所以在转化过程中需要尽量让灰度图像携带较多的有效特征信息.同时为了减少光照变化所再来的影响,提高识别率,这里采用几种方法相结合的方式对灰度图像进行预处理:
(1)对数变换,这个变换对每个象素的灰度值进行重新计算,扩展低值灰度、压缩高值灰度,处理后可以使得图像中的灰度取值更均匀,细节更清晰.公式如下:
其中f(x,y)是相应点的灰度值,根据图像变换需要,设置参数 a=0、b=1、c=e.
(2)使用二维高斯滤波实现图像平滑,减少因为图像噪声对人脸识别所带来的干扰.
(3)直方图均衡化.由于设备或环境影响,在图像采集时,可能会出现一些区域对比度不足,这时会隐藏原图像中的有用特征信息.这种情况可以通过直方图均衡化方法使图像的灰度分布范围变大,增大反差、增强图像的对比度.
2.2 局部二值模式LBP
目前在人脸识别领域已经有许多研究成果表明LBP算子可以较好地应用于这一领域.原始的LBP算子是对图像中的某个像素,取其灰度值按顺序与其周围8个像素的灰度比较大小,用1和0表示大于或小于,得到一个8位二进制数,转换成10进制得到LBP编码,图3为求取过程示例.
图3 LBP编码求取
这样的LBP编码会有256种取值,对图中每个像素都进行计算后,求256种取值的统计直方图即可描述其纹理特征.
2.3 改良LBP
在LBP算子中判断当前像素灰度与其周围8个像素灰度的大小时,并没有考虑其中灰度差的大小,但是这个对比度的大小本身也是很有用的纹理特征.对于单样本人脸识别,由于识别准确度较低,所以可以考虑进一步利用这些被原本被丢弃的图像信息.在进行灰度比较时,先设置一个阈值W,大于W为明显变化,小于W为轻微变化,其中阈值W可以设为灰度差平均值.
由于灰度差有变大或变小两种可能,所以每个点可以通过阈值得到四种LBP编码.
将四个LBP编码连结得到特征编码.
2.4 识别过程
为了取得更好的识别效果,可以先采用均分区域的方式将目标图像均分成N*N块,分别对四种LBP编码求取编码统计直方图,然后连接直方图得到分块特征直方图,再连结分块特征直方图获得图像特征直方图.这个特征直方图的维度很高,需要降维,可以将出现较少的编码种类统一归到一类,实现降维.最后判别目标与样本间对应关系,计算两个图像的加权距离,公式如下:
其中ωi为子图区块加权系数采用人工指定方式,人脸中的眉毛、眼睛、嘴巴等区域设置的加权系数较高,θj为灰度变化等级.目标图像对所有样本计算出L并从小到大排列,取第1个样本为匹配项,第2、3个为备选项.如果配对确定后所取的L值大于警示阈值,则进行标记示警.
3 实验结果与分析
实验所用的数据库有两个,一个是ORL人脸数据库,另一个是考生数据库.实验分别对这两个数据库采用上述的人脸识别算法进行测试识别与近似识别.近似识别是针对目前无法实现人脸识别100%正确率,必须进行人工干预的现状下,只要能让对应图像出现在前三个候选项里,实现近似识别也能在很大程度上改善考试身份验证过程.
3.1 ORL数据库
取ORL人脸数据库中每个人的一张正常表情图像作为样本库,抽取40人,余下图像用于测试.测试结果如表1所示:
表1 在ORL数据库上的识别率(N=7)
3.2 考生数据库
考生数据库为实际在用的考试系统中考生报考图像及入场时拍摄的现场图像,共有3926幅.从中随机抽取30人的报考图像作为未入场考生样本集,以这30人入场图像为测试集,替换3人入场图像模拟替考,并按随机顺序进行仿真人脸识别.由于考生入场信息由监考人员审查确定,如果识别错误会被手工修改为对应项,所以样本集的未入场考生样本数量随考生入场一直递减,识别难度逐步降低.经过大量模拟实验,取得首张识别率S、首张近似识别率S'、平均识别率T、平均近似识别率T'、标识区替考覆盖率Q如表2所示:
表2 在考试数据库上的识别率对比(N=7)
通过实验表明,采用这一人脸识别算法可以较好地降低考生入场时进行图像采集的难度,并能够较好地通过相似性阈值将异常考生标记出来,这样监考与巡查人员可以通过对小范围标记考生的重点核查,加大发现替考的可能性.
4 结束语
人脸识别技术发展很快,但是单样本人脸识别的准确率相对较低,因此在考试身份验证中还做不到完全自动化.本文提出一种基于LBP的人脸识别算法,其在考试身份验证中能够协助完成图像采集、缩小替考排查范围,增加查出替考舞弊的可能性,在考试身份验证工作中能够起到很好的辅助作用.
〔1〕张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报,2000(11):885-888.
〔2〕AhonenT,HadidA,PietikainenM.Face recognition w ith local binarypatterns[C].In:Proceedings of Eighth European Conf Computer Vision,2004:469-481.
〔3〕陶亮,庄镇泉.一种基于个人身份认证的正面人脸识别算法[J].中国图象图形学报,2003(8):860-865.
〔4〕张建明,刘霄,樊莉静.基于三层虚拟图像生成的单样本人脸识别[J].计算机工程,2010(9):187-189.
〔5〕OjalaT,PietikainenM,MaenpaaT.Multiresolutiongrayscaleand rotation invariant texture classification w ith local binary patterns[J].IEEE Trans Pattern Anal M ach Intell,2002,24(7):971-986.
〔6〕焦峰,山世光,崔国勤,高文,李锦涛.基于局部特征分析的人脸识别方法[J].计算机辅助设计与图形学学报,2003(1):53-58.