APP下载

基于最大边距局部敏感鉴别分析的人脸识别

2014-06-12

关键词:类间维数识别率

卜 婷

(淮阴师范学院物理与电子电气工程学院,江苏淮安 223300)

基于最大边距局部敏感鉴别分析的人脸识别

卜 婷

(淮阴师范学院物理与电子电气工程学院,江苏淮安 223300)

局部敏感鉴别分析(LSDA)是一种基于向量学习的提取特征的算法,该算法使得属于同一类的相邻数据经投影后尽量靠近,但不同类的邻近数据则相远离.在实际应用中,由于小样本问题,通常先利用PCA算法对原始数据进行降维处理,然后再使用LSDA算法提取特征.然而,这种方法会丢掉一些重要的鉴别信息.提出了最大边距局部敏感鉴别分析(MM⁃LSDA)算法,直接从原始数据中提取特征,避免了鉴别信息的损失,同时使得同类中的近邻数据尽量靠近,而不同类之间的样本远离.在ORL和Yale人脸库上的仿真实验表明此算法更有效.

局部敏感鉴别分析;最大边距准则;人脸识别

0 引言

特征提取是人脸识别和表情识别中的关键技术,其中比较著名的算法有主成分分析(PCA)[1]和线性鉴别分析(LDA)[2]等.主成分分析(PCA)是一种无监督的线性特征提取算法,此算法的思想是通过求解出训练样本散布矩阵的特征值,得到一组数量远远小于样本空间维数的正交基来表示训练样本张成的子空间.从线性重建的角度来看,这组基的优点是可以最充分地表示样本,但是没有考虑到类内、类间的不同.而线性鉴别分析(LDA)是有监督的线性特征提取算法,该算法能够使样本所生成的子空间类间离散度最大,而类内离散度最小.但是,使用LDA算法时经常会遇到小样本问题,由于训练样本的数量通常会小于每一个样本的维数,因此类内散布矩阵一般是奇异的.最近,Li Haifeng等人用最大边距准则(MMC)[5]替代Fisher准则,从另外一个角度解决了小样本问题,所采用的基于最大边距准则提取的特征相比较于其他算法具有更好的高效性和鲁棒性.

上述算法都是基于全局结构的算法,它们可以较好的揭示具有线性结构的高维数据集的全局分布,但是对于嵌入在高维空间中具有非线性流形结构的数据,很难学习出隐含在数据集中的低维流行结构[6⁃8].线性流形学习是近年来出现的一种新的机器学习理论,该类算法能够学习出嵌入在高维空间中的低维流行结构,所提取的特征能够保持原始数据的局部信息.这类算法主要有局部保持投影(Locality Preserving Projection,LPP)[9]算法、近邻关系保持嵌入(Neighborhood Preserving Embedding,NPE)[10]算法、局部敏感鉴别分析(Locality Sensitive Discriminant Analysis,LSDA)[11]算法等.局部敏感鉴别分析算法的主要思想是构造两个近邻图,分别为类内近邻图和类间近邻图,目的是使在原始样本空间中原本属于同一类的邻近样本点经线性映射后尽可能的靠近,而在原始样本空间中邻近的不同类样本点经线性映射后尽可能的远离.

为了避免使用PCA算法处理数据带来的鉴别信息的损失,在局部敏感鉴别分析算法的基础上,本文提出了最大边距局部敏感鉴别分析(MM⁃LSDA)算法.该算法直接从原始数据中提取特征,同时使得同类中的近邻数据尽量靠近,而不同类之间的样本远离.

1 相关算法简介

设数据集X=(x1,x2,…,xN),其中xi∈Rn,已知的c个模式类别分别为c1,c2,…,cc为,每个类别ci包含Ni(i=1,2,…,c)个样本.寻找转换矩阵A∈Rn×d,将X=(x1,x2,…,xN)映射为Rd中的数据集Y=(y1,y2,…,yN),其中d≪n,yi代表xi,即yi=ATxi.

1.1 局部敏感鉴别分析

根据文献[11],令Nw(xi)表示与xi同类的近邻点,而Nb(xi)表示与xi不同类的近邻点,并构造类内近邻图Gw和类间近邻图Gb.如果xj∈Nw(xi),则Gw有边xixj;如果xj∈Nb(xi),则Gb有边xixj.那么,Gw和Gb的权重矩阵Ww和Wb可由下式得到:

LSDA算法的两个目标函数为:

其中yi=aTxi,yT=aTX且y=(y1,y2,…,yN)T.

经推导,目标函数式(3)可以简化为:

其中,Dw是对角阵,

1.2 类间近邻关系矩阵

根据文献[12],定义类间近邻关系矩阵:

其中,Rb为类间近邻关系权重矩阵:

经运算,式(6)可化简为:

其中,D为对角阵,对角线上的元素为类间近邻关系权重矩阵Rb的行或列的和(因为Rb为对称阵)

2 最大边距局部敏感鉴别分析

算法的提出及理论.为了避免了鉴别信息的损失,同时使得同类中的近邻数据尽量靠近,而不同类之间的数据远离,因此,MM⁃LSDA算法的目标函数为:根据式(5)和(8),目标函数可简化为:

其中,G=L-Lw,限制条件为:aTa=1.

这里,我们使用拉格朗日乘法算子求解目标函数:

那么,可以通过解XGXT的前d个最大特征值对应的特征向量得到最佳转换矩阵A.得

3 实验结果及分析

为了检测算法的性能,分别在ORL和Yale人脸库上进行了实验,将MM⁃LSDA算法与PCA、LDA和LSDA算法的检测结果做了比较.实验中将每个人脸库划分为训练集和测试集两部分,实验分别在这两部分中进行,训练阶段有两个步骤:一是将经过归一化处理的图像分别利用上述几种算法进行特征提取从而得到最佳转换矩阵;二是转换训练样本.在测试阶段中,将测试样本转换到之前在训练阶段得出的特征向量上,再与经过转换的训练样本进行比较,然后进行识别.识别过程采用k=1的KNN方法. 3.1 ORL人脸库实验

ORL人脸库中包含40个人的脸部图像,其中的每个人都含有不同的10幅图像,每幅图像的原始维数为112×92,这里面的有些图片是在不同时间拍摄的,从而会产生不同光照条件和不同的表情(比如睁眼/闭眼,笑/不笑)以及不同的脸部细节(比如戴眼镜/不带眼镜);此外,人脸的姿态也各不相同,甚至有高达20°的深度旋转和平面旋转以及多达10%的人脸尺度变化.实验前对原始人脸图片进行了预处理,将人脸部分提取出来,图片归一化为32×32大小的灰度图像,每张图像的人眼被定位在同一位置.图1为ORL人脸库中经过预处理的某一人的部分幅图像.

图1 归一化后ORL人脸库中同一个人的部分人脸图像

图2 不同算法的识别率随特征维数变化的曲线图

实验中随机取l=6个样本进行训练,剩下的样本作为测试样本,重复实验50次得到平均识别率.图2示出不同算法的识别率随特征维数变化的曲线图.从图中可以看出,PCA算法的性能最差,因为该算法是无监督的,提取的特征鉴别能力不强,LDA算法的性能与LSDA算法的性能相近,而本文提出的MM⁃LSDA算法比LSDA算法识别性能有所提高,因为MM⁃LSDA算法没有使用PCA对原始数据进行处理,避免了鉴别信息的损失,所以性能有所提高

表1列出了不同算法达到的最高识别率及相应维数.从表1可以看出,本文提出的MM⁃LSDA算法的识别率最高为96.15%,从而说明了的MM⁃LSDA算法的有效性.

表1 ORL人脸库上各种算法的最高识别率及相应维数

3.2 Yale人脸库实验

Yale人脸库中含有15个人的脸部图像,其中每个人包含11张图像,一共有165张.每个人的11张图像都各不相同,如表情不同、灯光角度不同或者人脸细节不同.处理方法同ORL人脸库一样,先将人脸部分提取出来,图片归一化为32×32大小的灰度图像,每张图像的人眼被定位在同一位置.图3为经处理后的部分Yale人脸图像示例.实验同样分为50组,每组从每类中随机选取l=6个人脸图片作为训练样本,其余的作测试样本,记录每组的识别率,最后得到平均识别率.

图3 归一化后Yale人脸库中同一个人的部分人脸图像

图4为Yale人脸库上各种算法的识别率与降维后的维数的关系.由图4可以看出,MM⁃LSDA算法的识别率要高于其他所有的算法,这说明该算法在表情和光照变化比较大的情况下也能取得很好的识别效果.因此,本文提出的算法具有鲁棒性和高效性.

图4 不同算法的识别率随特征维数变化的曲线图

表2列出了Yale人脸库上各种算法的最高识别率及相应的维数.由表2可知,本文的算法识别率最高为93.68%.

表2 Yale人脸库上各种算法的最高识别率及相应维数

4 结束语

本文基于局部敏感鉴别分析算法提出了最大边距局部敏感鉴别分析(MM⁃LSDA)算法,概算直接从原始数据中提取特征,避免了鉴别信息的损失,同时使得同类中的近邻数据尽量靠近,而不同类之间的样本远离.在ORL和Yale人脸数据库上的实验表明,本文提出的算法更有效.

睑板腺功能障碍(Meibomain gland dysfunction,MGD)是睑板腺的慢性、弥漫性功能异常,终末分泌导管开口堵塞伴有脂质分泌量异常和(或)成分改变,导致泪膜异常,出现眼部刺激症状,发生炎症反应的一类眼表疾病[1]。临床上大多数合并MGD的白内障患者在就诊时,其合并的MGD并未引起眼科医师的高度关注。但当这部分患者进行白内障手术后,往往很快出现眼表症状加剧,严重影响白内障手术效果及患者术后生活质量。本研究采用相关眼表参数来评价白内障手术是否影响睑板腺功能,结果报告如下。

参考文献:

[1] Turk M A,Pentland A P.Face Recognition Using Eigenfaces[J].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,1991,11:586-591.

[2] Belhumeur PN,Hespanha JP,Kriegman D J.Eigenfaces vs Fisherface:Recognition Using Class Specific Linear Projec⁃tion[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1997,19:711-720.

[3] 杨鑫,田捷.生物特征识别技术理论与应用[M].北京:电子工业出版社,2005.

[4] Raudys Sarunas J,Jain Anil K.Small Sample Size Effects in Stistical Pattern Recognition:Recommendation for Practition⁃ers[J].IEEE Transactions On Pattern Analysis And Machine Inteligence,1991,13:252-264.

[5] Li H F,Jiang T,Zhang K S.Efficientand Robust Feature Extraction by Maximum Margin Criterion[J].IEEE Transactions on Neural Networks,2006,17(1):157-165.

[7] Zhang J,Li S Z,Wang J.Manifold learning and applications in recognition[J].Intelligent Multimedia Processing with Soft Computing,2004:105:281-300.

[8] Chang Y,Hu C,Turk M.Manifold of facial expression[J].Proceedings of the IEEE InternationalWorkshop on Analysis and Modeling of Faces and Gestures,2003,10:28-35.

[9] He X F,Yan SC.Face Recognition Using Laplacianfaces[J].IEEE Transactions on Pattern Analysis and Machine Intel⁃ligence,2005,27(3):328-340.

[10] He X F,CaiD,Yan SC.Neighborhood preserving embedding[M].//Proceedings of the Tenth IEEE International Con⁃ference on Computer Vision,Beijing,China,2005:1-6.

[11] Cai D,He X F,Zhou K,Han J,Bao H.Locality sensitive discriminantanalysis[M].//In Proceedings of the20th Inter⁃national Joint Conference on Artificial Intelligence,2007:708-713.

[12] Hu H F.Orthogonal neighborhood preserving discriminant analysis for face recognition[J].Pattern Recognition,2008,41:2045-2054.

M aximum M argin Neigborhood Preserving Embeding for Face Recognition

BU Ting
(School of Physics and Electronic Electrical Engineering,Huaiyin Normal University,Huaian Jiangsu 223300,China)

Locality Sensitive Discriminant Analysis(LSDA)was a liner manifold learning algorithm,it makes that the nearby data pointswith the same label are closed to each otherwhile the nearby pointswith dif⁃ferent labels are far apart.In practice,because of small sample size problem,PCA is applied to reduce the di⁃mension of original data space before utilizing LSDA.However,this strategymay discard important discrimina⁃tive information.Maximum Margin Locality Sensitive Discriminant Analysis(MM⁃LSDA)is proposed to over⁃come the above problem in this paper.The new method extracts features directly from original data,preserving the nearby data points with the same label,while aparting data points with different labels.Experiments on ORL and Yale databases show that the proposed method ismore effective.

locality sensitive discriminant analysis;feature extraction;face recognition

TP391.41

A

1671⁃6876(2014)03⁃0226⁃05

[责任编辑:蒋海龙]

2014⁃03⁃08

卜婷(1981⁃),女,江苏连云港人,讲师,硕士,研究方向为信号与图像处理.E⁃mail:buting1213@126.com

猜你喜欢

类间维数识别率
β-变换中一致丢番图逼近问题的维数理论
基于OTSU改进的布匹检测算法研究
基于贝叶斯估计的多类间方差目标提取*
一类齐次Moran集的上盒维数
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
关于一维Moran集Hausdorff维数的一个新证明和一个新结果
基于类间相对均匀性的纸张表面缺陷检测
提升高速公路MTC二次抓拍车牌识别率方案研究
基于改进最大类间方差法的手势分割方法研究