APP下载

基于PCA和SRC算法的人脸识别储物柜系统的设计与实现

2018-01-18涛,吴

自动化与仪表 2017年4期
关键词:储物柜范数识别率

张 涛,吴 键

(南京理工大学 机械工程学院,南京210094)

21世纪以来,随着识别技术和互联网的发展,人们已经意识到基于IC/ID卡、身份证号、密码的识别系统仍不够安全。据MasterCard公司估计,美国因为信用卡安全性差造成每年有价值4.5亿美元的诈骗案发生,损失巨大。生物特征的识别技术因其安全便利,显示出较好的应用价值。基于生物特征的指纹识别和虹膜识别,是比较成熟的生物识别技术,但因指纹和虹膜的获取都要求待识别对象与成像设备有较近的空间距离,导致其应用范围较小。而基于生物特征的人脸识别突破了这一限制,广泛应用于远程安全、安防、检疫以及图像传送等领域。

目前,智能储物柜多采用条形码识别(如超市储物柜),IC/ID卡识别(如游乐场、浴室、泳池)、指纹或人脸的生物特征的识别。指纹因为容易被污染、破坏,导使识别错误,而人脸识别具有非强制性、非接触性及可并发性识别的特点,因此得到很多研究机构的认可。

现有的人脸识别储物柜,尚存在一些问题,例如在取物的过程中,人脸会被口罩、眼镜等遮挡,或在识别过程中产生背景噪声信号,使图像不清晰,导致识别率降低。由文献[1]研究可知,基于压缩感知的稀疏脸对噪声相当鲁棒,且在有部分遮挡的情况下,仍有较高的识别性能。以下采用压缩感知方法,以解决人脸识别储物柜系统所存在的问题。

压缩感知,是一种新的采样理论,2006年由E.J.Candes,D.L.Donoho和T.Tao等人提出。这一理论通过开发信号的稀疏特性(信号的稀疏性比带宽更能表达信号的信息),信号的离散样本通过随机采样获取。如果一个信号在某个基下是稀疏的,就可以设计一个观测矩阵。通过这个与变换基不相关的观测矩阵将所得到的高维信号投影到一个低维空间上,得到少量投影,通过求解一个凸优化问题就可以从这些少量的投影中重构出原始信号[2]。如果设计好观测矩阵和利用观测矩阵观测到的低维信号,就可以求解出原始信号的稀疏表示,也就是对原信号的压缩编码。该编码信号可以作为人脸识别分类的依据[3]。

特征向量提取和分类方法的实现(即分类器的设计)是人脸识别技术的关键。在此采用了PCA算法提取特征向量,利用稀疏表示分类算法(SRC)实现分类。

1 主成分分析法(PCA)原理

主成分分析法在降维和特征提取上具有很强的优势,因此在人脸识别技术中获得大量的使用。

1.1 主成分分析的数学模型

令 x=[x1,x2,…,xM]T为一随机变量,其自相关矩阵为 Rx=E{xxH},对 x 进行线性变换,即 ω=QHx,式中Q为酉矩阵,即Q-1=QH。原信号x可以用线性正交变换矩阵Q表示为ω的线性组合,即

随机向量的m阶逼近的误差为

均方误差为

为使均方误差最小化,使用了Lagrange乘数法来构造代价函数[4],则

求极值得 Rxqi=λiqi,i=m+1,…,M

通过上述K-L变换,当使用式(1)逼近原始信号时,选择Lagrange乘数因子作为矩阵Rx后面的M-m个特征值,代价函数中的正交基向量作为矩阵Rx的前m个特征向量。得出

自相关矩阵Rx的特征值分解为

式中:ui为代价函数中的正交基向量,若令主分量为i,则根据能量最大化准则

1.2 基于PCA的人脸识别算法

步骤1将人脸图像数据尺度归一化(差值脸),即 xi=x-;

步骤2计算构建人脸图像的协方差矩阵,即

图1 主成分的比例Fig.1 Proportion of principal component

图2 保留的主成分比例Fig.2 Retain proportion of principal component

步骤3对协方差矩阵进行特征值分解,求解出协方差矩阵的特征值和其对应的特征向量,取前k个特征值所对应的特征向量构成特征脸空间,即w=(u1,u2,…,uk);

步骤4将归一化的人脸矢量投影到特征脸空间,即 Ωi=wTxi;

步骤5将待识别的人脸Γ和的差值投影到w 特征空间里,即 ΩΓ=wT(Γ-),计算阈值为

采用欧氏距离计算ΩΓ与每个人脸的距离通过与阈值θ比较,识别人脸。图3为基于ORL数据库的一部分特征脸,最后一张是平均脸[5]。

2 基于压缩感知的稀疏表示分类算法(SRC)原理

2.1 压缩感知

图3 基于ORL数据库的部分特征脸和平均脸Fig.3 Partial eigenfaces and average faces based on ORL database

压缩感知的特点是信号的采样与数据的压缩同时进行,在较大的压缩条件下,重构出较好的信号。该理论的核心是信号的稀疏表示、编码测量以及信号重构,其中信号的稀疏表示是先验条件[6]。

设一个一维离散信号f,由一组标准正交基线性表示出来,即

式中:N为信号的长度;Ψ为N×N的标准正交基;φi为 Ψ 的列向量;Θ 为系数矩阵若Θ的非零个数远小于N,则此信号是可压缩的。

得到信号的稀疏系数矩阵以后,需构建一个稳定的测量矩阵Φ∈RM×N,式中M≪N,对系数矩阵进行线性变换,保证在任意稀疏度为K的可压缩信号,在降维到测量信号y的过程中,原信号的信息不会被破坏,从而重构出原信号f,即y=Φf=ΦΨΘ,式中A=ΦΨ∈RM×N为传感矩阵。因为Θ是稀疏的,A满足约束性等距条件,所以方程可求出唯一解[7]。Candes等人从理论上证明了使用最小l0范数法是可以用来计算解答信号重构的问题,即=arg min‖x‖0s.t.y=Φx,式中x为稀疏系数;y为测试图像[8]。在计算信号重构的过程中,最小l0范数法和最小l1范数法在约束等距条件下是近似等价的。但最小l0范数法是一个NP-hard的问题,求解最优解需要列举x中所有种可能才能得到,因此一般采用最小l1范数法来解决次优解的问题,即=arg min‖x‖1s.t.y=Φx。

2.2 稀疏表示分类算法(SRC)

SRC算法的理论基础是压缩感知,假设人脸可以构成一个空间,任何一张图像可以由其他线性表示,在充分利用人脸在高维空间具有稀疏特性的情况下,对一欠定方程求取最稀疏解,以进行人脸识别而得到分类结果[9]。

设N个训练样本分别属于C个人,每个人有ki个正面脸图像,矢量 xi,k∈Rm×1为第 i个人的第 ki幅图像,这ki个矢量为基向量所构成的人脸子空间称为第i类人脸子空间。其空间中的任意矢量x都可以被此基向量线性表达,即

式中:α= [αi,1,αi,2,…,αi,k]T,αi,j∈R( j=1,2,…,k1)为稀疏系数。构造冗余矩阵

任何一幅测试图像y均可以表示为y=Ax0,例如若测试图像的类别属于第i个人,那么理想情况的系数向量为

那么这个冗余矩阵A就可构造过完备冗余字典。这个系数向量可当作y在A下的坐标,若样本数量大于类内的最大样本数量,即 N>max(ki),N 和max(ki)的差距越大,x0越稀疏,也更有利于恢复。

因为压缩感知的特征提取比较理想,将输入的人脸图像在过完备冗余字典A中通过稀疏系数α展开,此时的样本y为整个训练样本集的线性组合,即y=Ax0∈Rm,m为人脸识别中的特征维数,m≪N。用向量x0表示测试样本y,所以将问题变为求解一个线性方程y=Ax。目标函数为

根据2.1节所述,可将l0范数转化为l1范数来求解。

3 结合PCA的SRC人脸识别算法

在实际的人脸识别时,人脸图像的维度很大,一般达到105数量级,虽然压缩感知处理高维度问题具有优势,但是对计算机的计算能力要求很高,并且图像维度超过训练图像的训练样本数,即m>N,使得等式约束方程y=Ax是超定的,解出的解x作为方程的唯一解,效果不好,不能正确分类。因此在人脸识别时,需要先降维,而PCA在降维方面优势很大。

通过PCA降维后,原始人脸图片m维高维空间到m′低维空间的投影矩阵作为观测矩阵,即Φ=wT,Φ∈Rm′×m,并且 m′<N<m,由 2.2 节所述可知,构造过完备冗余字典为

进而构造人脸稀疏模型,即

然后利用观测矩阵Φ对所有人脸的训练数据进行观测投影,即:

通过稀疏表示和观测投影,就完成了人脸图像的训练过程,即完成了训练阶段。当输入一幅测试图像x时,系统利用相同的观测矩阵Φ对样本x投影得到:

由式(16)~式(18),得到优化的目标函数,即Yα=y;利用最小l1范数法求解,即

恢复误差最小时所属的类为人脸识别出来的类。图4为人脸实例及其基于PCA特征提取的SRC算法的人脸重构,图 4(a)为人脸原图,图 4(b)为相应的人脸重构图像。

图4 基于SRC算法的人脸原图与人脸重构Fig.4 Original face and face reconstruction based on SRC algorithm

4 人脸识别储物柜系统设计

人脸识别储物柜系统的总体设计主要包括储物柜控制器模块,它作为系统的终端主要负责控制储物柜的开关、实时监测储物柜的状态、读取人脸图像。系统的硬件总体设计如图5所示。

图5 系统硬件总体设计Fig.5 Overall design of system hardware

储物柜采用一对多的控制方式,1个储物柜中,从机控制器控制12个箱柜,且实时监测箱柜状态,并将状态实时反馈到主控MCU上。1个主控MCU可通过RS485接口级联多个储物柜。主控制器主要由摄像头、时钟模块、触摸屏模块、通信模块、驱动模块及单片机微处理器等部分组成。储物柜主控芯片选用意法半导体公司生产的芯片STM32F103单片机,32位ARM微控制器,Cortex-M3内核。此款单片机功能强大、I/O口较多、读写速度快、功耗较低,在人脸识别时可连接计算机运用Matlab软件进行识别计算[10]。储物柜从机控制器选用TI公司的MSP430F149单片机,主要考虑到低功耗的问题[11]。

在该系统中,摄像头采集的图像像素为240×320;显示屏用于显示图像和储物柜中各个储物箱的状态;电磁锁有驱动功能;红外对管用于检查箱内是否有物;LED灯用作信息提示。

人脸识别储物箱的软件流程如图6所示。

图6 控制器软件工作流程Fig.6 Controller software work flow chart

5 试验结果

为了验证该人脸识别算法的性能,选择在ORL人脸数据库进行仿真测试实验,测试其识别率。数据库包含40位不同的人,每人包含10幅图像,这10幅图像均是在不同的光照强度、面部表情以及各个角度下拍摄的;每张人脸图像是92×112的灰度图像。当训练样本数N取4,5,6时,PCA算法和PCA+SRC算法在ORL数据库上的识别率如表1所示。

表1 PCA算法和PCA+SRC算法在ORL数据库上的识别率Tab.1 Recognition rate of PCA algorithm and PCA&SRC algorithm on ORL face database

表2是在仿真试验中,将ORL数据库中的像素受到随机选取的不同比例白噪声的污染时,PCA和PCA+SRC算法的识别率,训练样本取5。

表2 PCA算法和PCA+SRC算法的识别率Tab.2 PCA algorithm and PCA&SRC algorithm recognition rate

表3是在储物柜的测试实验中,通过戴墨镜、口罩2种遮挡时,PCA和PCA+SRC算法的识别率,重复次数30次,测试了3个人。图7为实际测验中部分未识别的人脸。

表3 算法在储物柜上的识别率Tab.3 Recognition rate of algorithm on locker

图7 未能识别的人脸Fig.7 Unrecognized faces

6 结语

将压缩感知应用于PCA人脸识别储物柜系统,与基于PCA的人脸识别算法相比,前者的组合方法识别效果更好,并对遮挡、噪声相当鲁棒。至于未识别出的图像,经过分析,是由于遮挡面积过大或识别时环境太暗所导致,还有待于进行深入的研究。由于所涉及的运算复杂度相对高了点,时间相对来说变长了,下一步重点减少求解最优解的时间,使得人脸识别储物柜市场化。

[1]Wright J,Yang A Y,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.

[2]Boyd S,Vandenberghe L.Convex optimization[M].[S.l.]:Cambridge University Press,2004.

[3]石光明,刘丹华,高大华.压缩感知理论及其研究进展[J].电子学报,2009,37(5):1071-1080.

[4]沈理,刘翼光,熊志勇.人脸识别原理及算法:动态人脸识别系统研究[M].北京:人民邮电出版社,2014.

[5]曾凌子.基于压缩感知的人脸识别算法研究[D].合肥:中国科技大学,2014.

[6]Graham D,Allison.Characterizing virtual eigensignatures for general purpose face recognition[M].Face Recognition:From Theory to Applications,1998:446-456.

[7]Candes E J,Romberg J.Sparsity and incoherence in compressive sampling[J].Inverse Problems,2007,23(3):969-985.

[8]Candès E J,Wakin M B.An introduction to compressive sampling[J].Signal Processing Magazine,2008,25(2):21-30.

[9]Wright J,Yang A,Ganesh A,et al.Robust face recognition via sparse epresentation[J].IEEE Trans on Pattern Analysis and Machine Intelligence(PAMI),2009,31(2):210-227.

[10]张洋,刘军,严汉宇.原子教你玩STM32[M].北京:北京航空航天大学出版社,2013.

[11]利尔达科技有限公司.MSP430开发板实验指导书[Z].杭州:[s.n.],2012.

猜你喜欢

储物柜范数识别率
一种基于MVC架构的智能储物柜交互系统设计
基于同伦l0范数最小化重建的三维动态磁共振成像
向量范数与矩阵范数的相容性研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
井井有型
基于加权核范数与范数的鲁棒主成分分析
档案数字化过程中OCR技术的应用分析
科技文档中数学表达式的结构分析与识别
高效储物柜