基于模块化2D-LDA的视频监控中的人脸识别算法
2014-07-02付永钢
计 蕾,付永钢
(集美大学计算机工程学院,福建 厦门 361021)
0 引言
人脸识别是生物特征识别技术中的重要研究课题之一,也是近年来的一个研究热点.被广泛应用于公安、银行、交通、海关、社区等领域.在现实生活中,人脸识别往往受光线、人脸角度及遮挡物的影响,很容易造成识别困扰,导致人脸识别效果不尽如人意.文献 [1]提出了基于主成分分析(Principal Component Analysis,PCA)和二维PCA的人脸识别算法,提高了人脸检测的速度和人脸识别的准确率.文献[2]从清除目标人脸以外特征、人脸角度补偿和支持向量机检测的角度,即是从人脸的正面,提出人脸识别的方法,得到了较好的结果.文献 [3]对人脸识别中的光照效果进行了优化处理,提高了识别的能力,但该文没有对遮挡物的干扰等实际环境因素进行综合考虑.为了达到实际应用的效果,研究者对目前的人脸识别方法和技术进行了不断的创新,分别在算法的稳定性、效率和精确度等方面[4-5]进行了大量的研究工作.
文献[6]对基于主成分分析的人脸识别算法进行了改进,提出了基于二维的线性判别分析(Linear Discriminant Analysis,LDA)的人脸识别算法.文献 [7]对基于PCA的算法深入优化.文献[8]改进了基于PCA的人脸识别算法,并采用混合算法对人脸进行分割和识别.文献 [9]直接借用了文献[6]的算法,再进一步提升视频跟踪过程中人脸识别的能力.文献 [10]综合了2DPCA、2D-LDA两种方法,采用融合分类器的人脸识别方法,效果有所提高但仍然不尽如人意.总之,到目前为止,人脸识别在精确度方面仍然有很多工作需要深入探讨.本文拟针对常规算法在人脸受方位变化、帽子遮挡等因素影响下的识别效率不高的问题,进行算法上的改进.
1 本文提出的人脸识别算法
把基于二维的线性判别分析算法扩充并改进为模块化性能,是本文的核心思想.
1.1 人脸识别
首先将图像分块以便将样本模块化,其次实现特征提取,目的是为了细化样本个性特征,是将样本模块化并降低特征方阵的维数的有效手段.步骤为:设共有c类样本,其中第i类样本数in,第i类中用Aji表示序数为j的图像,用M表示样本总数,样本模块化个数为r×s,则有
设N为所有子图像的个数,U为所有子块的均值,有
Ui为第i类样本的子图像的均值,
那么,所有训练子块的类内散布矩阵和类间散布矩阵:
在识别过程中,需要先把训练样本和待识别样本映射到特征空间中,再借助矩阵距离来判断模式的类别.
1.2 在视频监控系统中的应用
视频监控系统由人脸检测、人脸跟踪、人脸识别三个主要功能组成.本文提出的人脸跟踪算法步骤详细描述如下:
1)系统人脸跟踪模块空闲,处于等待状态,程序初始化.
2)输入视频序列,检测视频中出现的人脸目标,并把检测到的人脸位置存放到数组中,视频跟踪开始.
3)在检测到的人脸图像中选择合适的人脸部分进行目标分割,然后用式 (1)将分割的目标进行目标模块化处理.
4)如果出现人脸遮挡,则更新初始模型.转至第2)、3)步.
5)提取样本类内协方差矩阵变量BW*Sw和图像类间协方差矩阵的变量BW*Sb,生成式 (6)的对应特征向量.在提取特征流程中,由于得到模块化的训练样本,不仅最大程度地抽取了原来样本的人脸特征,而且很好地降低了原有目标特征空间的维数.
6)在人脸库样本进行特征对比.利用得到的特征向量,与人脸库中的样本进行比对,输出检测结果.
2 实验结果
2.1 人脸样本介绍
人脸数据库对所研究的人脸在抽取之前就有一定的特征数据,人们用先验特征来描述这种特征.常规情况下,先验概率的取值为1/c.实验中采用的人脸数据库为ORL国际标准人脸库 (英国剑桥大学建立),ORL数据库存储了40组不同人的信息,人均提取10幅人脸图像,并且每幅人脸的表情不相同,图1为人脸库中的一组图像举例.
图1 ORL数据库的某组人脸图像Fig.1 A set of face images in ORL database
实验时以每人的任意1个样本作为训练样本,另外9个样本作为待测样本,共10组实验,每次实验训练样本和测试样本的比例为1∶9.
2.2 人脸样本的扩充
对单样本进行虚拟扩充,得到携带相同特征的虚拟人脸,弥补视频监控时人脸倾斜、侧位和遮挡等情况人脸特征的缺失.例如采用泛滑动窗口、斜切旋转等方法,可以采集得到一系列如图2、图3所示的图像,起到样本扩充的作用,以便得到更多提取特征的样本.
图2 泛化窗口采样图Fig.2 Generalization window sample figure
图3 斜切变换扩充图Fig.3 Oblique transformation expansion graph
2.3 视频识别效果
以验证改进算法之后的视频跟踪效果为目的,本文对10个视频序列进行试验,试验中动态更新阈值β=0.3,动态变化因子为0.2,人脸识别效果如图4所示.
图4 改进算法的人脸识别效果Fig.4 Improved algorithm of face recognition effect
从图4中可以看出,本文改进的人脸识别算法效果不错.为了检测本文算法的准确率,笔者对有10段视频的不同算法进行测试比较,结果如表1所示.
表1 不同算法的平均识别准确率对比Tab.1 The average recognition accuracy compared different algorithm%
从表1可以看出,本文将人脸识别二维改进算法应用于视频监控项目中,通过主成分算法降低维度,并根据人脸区域机理特征生成的特征向量识别人脸.从实验仿真结果来看 (见图5),本文提出的算法在平均识别准确率上较文献 [1,9-10]有了一定的提高.
图5 实验执行结果仿真Fig.5 Experimental simulation execution results
3 结束语
本文改进的人脸识别算法解决了原本的线性人脸识别比较棘手的单训练样本的问题.它利用泛化窗口和斜切变形等方法,把已经取得精确信息的样本再次扩充,生成携带同类特征的样本数据,有效地模拟人脸遮挡或者人脸角度变化的人脸特征.
但是由于单训练样本仍然依托原人脸特征信息,模拟人脸的姿态、旋转和遮挡的情况也存在一定的局限性,再加上本实验是对不间断的动态影像中的人脸部位实现跟踪,批量割取人脸图像并得到一个包含多属性的识别评价.所以总体上的识别准确率还远远不够.而随着科技的进步和人们对人脸识别技术的了解越来越成熟,三维的人脸识别已经在视频监控中有所应用,相信在将来深入研究和利用三维人脸识别技术会有更好的效果.
[1]黄泉龙.基于PCA的人脸识别研究 [D].西安:西安电子科技大学,2012.
[2]ARANDJELOVIC OGNJEN,ZISSERMAN ANDREW.Automatic face recognition for film character retrieval in featurelength films[C]//Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR 2005),San Diego:IEEE,2005:860-867.
[3]李粉兰,段海峰,郝建国,等.人脸识别中光照补偿问题的实验研究 [J].工程图学学报,2009,30(3):113-120.
[4]刘瑾,徐可欣,陈小红.采用图像融合技术的多模式人脸识别 [J].工程图学学报,2007,28(6):72-78.
[5]陈皓,霍星.视频监控中人脸识别算法稳定性的改进 [J].工程图学学报,2011,32(6):53-56.
[6]YANG C J,DURAISWAMI R,DAVIS L S.Efficient mean-shift tracking via a new similarity measure[C]//Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR 2005),San Diego:IEEE,2005:176-183.
[7]尹飞,冯大政.基于PCA算法的人脸识别[J].计算机技术与发展,2008,18(10):31-33.
[8]刘超.基于改进PCA的人脸识别混合算法研究 [D].太原:太原理工大学,2011.
[9]王海珍.基于LDA的人脸识别技术研究 [D].西安:西安电子科技大学,2010.
[10]温福喜,刘宏伟.基于2D-PCA和2D-LDA的人脸识别方法[J].计算机应用研究,2007,24(8):201-203.