鼻子区域生物特征识别
2014-07-11李云飞卢朝阳
李云飞, 卢朝阳, 李 静, 姚 超
(西安电子科技大学 综合业务网理论及关键技术国家重点实验室,陕西 西安 710071)
随着信息化技术的发展,生物特征识别技术已成为保障公共和个人安全的核心技术,在金融、安全、网络和电子商务等领域都有着非常广阔的应用前景.人脸图像是每个人固有的生物特征,与指纹、虹膜等其他生物特征图像相比具有采集方式友好、采集设备隐蔽性高等优点,所以人脸识别在身份识别、检索、安全监控等方面已被广泛应用,一直是模式识别领域的一个研究热点.
但人脸图像在获取时存在一些不稳定因素,如表情、胡须、发型、光照、姿态、胖瘦、年龄等变化始终影响着人脸识别的准确性.和人脸识别相比,虹膜识别、指纹识别、DNA识别等虽然精度高,但其数据采集比较麻烦,且需要被测试对象密切配合.而鼻子是人脸中最主要、最显著的器官之一,不易遮挡和隐藏,在人的一生中形状比较固定,受表情、胡须、发型、胖瘦影响小.
最近有学者提出将鼻子区域作为生物特征进行个体身份识别[1-6],但文献中都是针对三维人脸数据进行分析,笔者旨在分析二维人脸数据中鼻子区域的识别性能.首先对鼻子的生物特征进行了分析,并对Gabor核Fisher判别分析(Gabor Kernel Fisher Discriminant Analysis,GKFA)算法进行了优化;然后选择了正面中性表情人脸数据库ORL、正面表情人脸数据库JAFFE和侧面旋转角度比较大的人脸数据库FEI,分别裁剪组成相应的鼻子数据库;最后用优化后的GKFA算法对所截取的鼻子数据库和相应的人脸数据库进行了识别比较.实验结果表明,利用鼻子区域进行生物特征识别可以避免人脸识别中表情和姿态的影响,完全可以作为单独的生物特征进行个体身份鉴别.
图1 鼻子结构图
1 鼻子的生物特征分析
1.1 鼻子的结构和特点
通常,一个正常人的鼻子由外鼻、鼻腔和鼻窦3部分组成,而鼻型则由外鼻决定.外鼻分为鼻根、鼻梁、鼻尖和鼻翼4部分,如图1所示.
整个鼻子主要由骨质组织构成,共有6块骨骼,左右对称,形成一个突出的三棱锥体.覆盖鼻上部 2/3 的皮肤松弛,富于弹性,皮肤伸展、扩张容易,而覆盖鼻下部 1/3 的皮肤则紧附着在下面的皮下组织,皮肤不容易伸展、扩张[7].医学研究结果表明,人骨是成比例生长且整体结构比例基本保持不变,一般在18岁左右比例就稳定而不会再长了,以后仅仅是骨质内有机物质发生变化,而其外观仍能保持原有的形状[8].
由于鼻子主要由骨质组织构成,没有肌肉组织覆盖,因骨骼的生理特性决定,鼻子在人的一生中具有稳定的形状,与众多的生物特征相比,人的鼻子作为一种生物特征具有独特的优势:
(1) 鼻子是每个正常人都具有并且惟一的生物特征.每个人的鼻子具有相对独特的形状和比例,可以用其作为生物特征进行个体身份鉴别[1-2,4-5].
(2) 鼻子受表情变化影响比较小.人面部表情主要由一组表情肌产生,而表情肌主要分布在眼睛、嘴巴周围和额头、脸颊区域,表情的变化对鼻子形状的变化影响较小[9].
(3) 鼻子受年龄和胖瘦变化影响比较小.在婴幼儿到成人阶段,人脸各个部位成比例生长,大概从35岁以后,人脸开始出现衰老迹象,主要变化是肌肤开始松弛,出现皱纹.面部最容易衰老的部位是眼袋、额头、颈部、法令纹,而鼻子影响最小[10];人的胖瘦表现在面部主要是脸颊、下巴和颈部肌肉的增减,由于鼻子主要由骨质组织构成,没有肌肉组织覆盖,所以鼻子不会受胖瘦变化的影响.
图2 AR和UMB-DB人脸数据库中的遮挡人脸示例图
(4) 鼻子部分不易遮挡.在人脸识别中,最易受遮挡影响的因素主要有墨镜、围巾、帽子、口罩、胡须、手势等,如图2所示.相对人脸其他部位,鼻子不容易被遮挡.
(5) 鼻子具有独特的姿态辨别优势.人脸识别受姿态影响比较大,在人脸姿态变化比较大的情况下识别效果明显变差.而鼻子即使在正面人脸转动90°时,仍能提取其显著的轮廓信息[4].
1.2 鼻子的数据获取
目前,国内外还没有专门的鼻子图像数据库,为了比较验证鼻子区域的识别性能,实验选取正面中性表情人脸数据库ORL、正面表情人脸数据库JAFFE和侧面旋转角度比较大的人脸数据库FEI,分别裁剪出鼻子区域构成鼻子数据库.裁剪时以鼻子为中心,裁成一个上至眉间点,下至鼻下点,左右包括两侧鼻翼点的矩形区域.
ORL人脸数据库是基于表情和姿态变化的人脸数据库,但表情和姿态变化幅度都很小.该数据库有40个人,每人10张不同姿态和表情的人脸图像,共400张,这些图像在不同时间获取,具有不同的表情和面部细节,而且稍许倾斜(不超过20°),每张图片的大小是 112×92 像素,灰度级为256.实验中,对每幅人脸图像进行了裁剪,同时裁剪出鼻子区域构成鼻子样本库,如图3所示.
图3 ORL数据库中人脸与其对应鼻子图像示例
JAFFE 数据库包含10个人的213张图片,要求采集者分别做出7 种表情(中性、高兴、难过、惊奇、生气、恶心、害怕),每人每种表情采集2~4张,每张图片的大小是 256×256 像素.实验对每幅人脸图像进行了裁剪,同时裁剪出鼻子区域构成鼻子样本库,如图4所示.
图4 JAFFE数据库中人脸与其对应鼻子图像示例
FEI是一个巴西人脸数据库,取自FEI实验室的200名19岁到40岁的学生和员工,每个人有14张包括表情和光照变化的彩色图像,面部表情包含中性和微笑,大小为 640×480 像素,每张图像都具有相同的白色背景,人脸从侧面最左到最右旋转角度接近180°.实验选取数据库中的后50个人作为测试对象,对每幅人脸图像进行了裁剪,同时裁剪出鼻子区域构成鼻子样本库,如图5所示.
图5 FEI数据库中人脸与其对应鼻子图像示例
所截取的鼻子区域不可避免地包括了左右眼内角,而眼角和鼻子的位置距离相对比较固定,受表情、遮挡影响比较小,是人脸中的重要特征信息.因而所截取的鼻子图像保留了人脸中相对比较稳定的特征信息.
2 GKFA算法
生物学研究发现,Gabor小波可较好地模拟大脑皮层中简单细胞感受野的轮廓,能够捕捉空间定位、尺度变化、方向选择等视觉属性,特别是Gabor小波可像放大镜一样放大灰度的变化,可以将图像局部细节特征强化.人脸图像虽然属于弱纹理图像,但经Gabor小波变换后会包含丰富的纹理信息,能从不同方向和尺度有效表示人脸图像的局部特征,有利于区分不同的人脸图像,Gabor小波特征在人脸识别领域得到了广泛的应用并取得了较好的效果.而Kernel Fisher Discriminant Analysis (KFDA)方法中核函数的映射使得样本即使在特征线性不可分的情况下仍能进行较好的分类[11].笔者结合Gabor和KFDA算法的优点,用Gabor Kernel Fisher Discriminant Analysis(GKFA)算法对鼻子区域的识别效果进行了实验分析;首先对Gabor特征提取过程进行了优化,并用其对鼻子区域进行特征提取,然后采用KFDA方法进行特征分类.
2.1 Gabor滤波器
Gabor滤波器的频率和方向表示接近人类视觉系统对频率和方向的表示,常被用于纹理表示和描述;另外,二维Gabor小波变换对位置的响应特性允许图像特征的轻微几何变形,能减小图像噪声的影响.二维Gabor小波变换的这些响应特性十分有利于人脸图像局部特征的鲁棒表示[12].
二维Gabor滤波器是带通滤波器,在空间域和频率域均有较好的分辨能力,它在空间域有良好的方向选择性,在频率域有良好的频率选择性,能提取图像不同的频率尺度和纹理方向信息.二维Gabor小波滤波器组的参数体现了它在空间域和频率域的采样方式,决定了它对信号的表达能力.
2.2 KFDA算法
KFDA算法是核函数与线性Fisher判别分析(Fisher Discriminant Analysis,FDA)相结合的一种技术,即先通过一个非线性映射φ将输入空间的训练样本映射到一个高维线性可分的特征空间φ:x∈RN→φ(x)∈F,然后在特征空间F中进行线性FDA,找出使类间散度最大而类内散度最小的投影方向进行分类,这样在输入空间中就隐含地产生了很强的非线性判别式,从而实现相对于原空间的非线性判别分析[13].KFDA能有效提取非线性判别特征,已成为模式识别领域的研究热点[14].
2.3 Gabor参数优化
Gabor小波函数中的参数选择仍然是一个开放性问题,根据经验,一般采用5个尺度8个方向的Gabor滤波器组来提取人脸不同尺度和方向的特征信息构成特征向量[15].实际上,如果仅用8个固定的方向对不同的鼻子进行特征提取时,会存在很多冗余信息.为了能选取适合不同鼻子样本的Gabor方向进行特征提取,有效地降低Gabor特征的维数,对8个Gabor滤波方向的特征性能做了统计分析,最后选取部分特征比较强的方向信息.
图6 方向算子模板Sk(k=1,2,…, 8)
结合Gabor滤波器的对称特性,选用了图6所示的8个方向算子模板对应8个Gabor滤波方向,分别对每一个鼻子样本进行卷积计算
(1)
其中,f(i,j)表示图像的像素值,Sk(a,b)表示模板Sk的元素值.根据方向算子的方向特性,当对整个图像做如上操作之后,原图像的像素值就转换成了表示每个像素和其相邻像素之间位置关系的强度值,然后将所有强度值按
(2)
相加就会得到样本的一个方向强度(Os)[16].
对数据库中每个人的n个样本分别用8个方向算子按式(1)进行计算,每个样本就会转换成8个表示相邻像素之间位置关系的强度信息图,如图7所示(图7(a)、图7(c)和图7(e)分别为从数据库FEI、ORL和JAFFE中截取的鼻子原图;图7(b)、图7(d)和图7(f)分别为用方向算子计算后得到的对应强度信息);然后对每个方向信息图按式(2)计算就会得到每个方向算子所对应的方向强度值Os,这样,每个样本就会产生8个由方向算子模板计算得到的方向强度值Os1,Os2,…,Os8.方向强度值越大,表明该强度信息图中像素之间的位置关系特征越明显,用于计算该方向强度值所用的Gabor滤波方向性能就越优越.
图7 相邻像素之间位置关系的强度信息图
如果对数据库中所有人的全部鼻子样本分别计算其8个方向强度值并从小到大排序,则最后统计结果如图8所示.图中横坐标表示8个方向强度值,纵坐标表示方向算子模板,图中点的坐标表示得到该方向强度值与所用方向算子之间的对应关系.
图8 计算方向强度所用方向算子模板统计图
从图8中可以看出,3个数据库中样本方向强度值最大的Os8和Os7分别都是由方向算子s5和s1计算得到的.JAFFE库中每个人的样本只有表情变化,姿态几乎保持一致,裁剪得到的鼻子区域截去了表情变化丰富的嘴部信息,纹理方向比较一致,由样本计算得到最大的4个方向强度值所用的方向算子比较固定,如图8(a)所示,从大到小依次为s5、s1、s4和s6;ORL库中样本之间存在稍许旋转和倾斜(不超过20°),由样本计算得到方向强度值Os5和Os6所用的方向算子为s4或s6,如图8(b)所示,这表明其中一部分样本用方向算子s4计算得到比较大的方向强度值,而另一部分样本则要用方向算子s6计算求得;而FEI库中由于样本之间姿态变化比较大(左右旋转角度接近180°),纹理方向变化也比较大,因此纹理之间的位置关系变化也比较复杂,如图8(c)所示,方向强度值Os5对应多个方向算子,即不同的样本需要从不同的方向获得比较大的方向强度值.
根据以上分析,分别选取能获得最大的4个方向强度值所用的方向算子所对应的Gabor滤波方向去提取对应的Gabor方向特征,即在JAFFE库和ORL库上选取方向算子s5、s1、s4和s6所对应的4个Gabor滤波方向(0、π/8、4π/8、5π/8),而在FEI库上则选取方向算子s5、s1、s4、s6、s2和s8所对应的6个Gabor滤波方向(0、π/8、3π/8、4π/8、5π/8、6π/8).Gabor尺度仍然采用广泛使用的5个尺度.比较发现,所选取的Gabor滤波方向保留了人脸图像中像素之间比较显著的变化信息,忽略了变换非常小的冗余信息,对识别效果没有明显影响,但由于数据维数的减少,平均识别时间明显减小.
对每个输入原始训练样本,按选定的Gabor滤波方向和5个尺度分别提取Gabor小波特征,用分数次幂多项式核函数k(x,y)= sign(xy)(abs(x·y))d,将其非线性映射到核空间,然后计算类间离散度矩阵SB和类内离散度矩阵SW,求解Fisher基向量,再将训练样本的Gabor小波特征投影到Fisher基向量;同样计算测试样本的Gabor特征并非线性映射到核空间,将测试特征投影到Fisher基向量,然后计算训练特征和测试特征的距离并按最邻近距离进行分类判决.
3 实验仿真
用上述算法分别在ORL、JAFFE和FEI库对人脸和鼻子区域的识别效果进行了比较分析,首先利用Gabor滤波器组对输入样本进行处理,将滤波后的值作为Gabor特征量;然后利用KFDA方法分别对裁剪后的人脸图像样本和鼻子图像样本进行模式的分类判决.
在ORL人脸数据库中,对每个人的10个人脸和鼻子样本分别随机选取i(i=4,5,6,7,8)个图像作为训练集,剩下的作为测试集,重复进行10次,最后的实验结果取10次实验结果的平均值,实验结果如图9(a)所示;在JAFFE人脸数据库中,对每个人的人脸和鼻子样本分别随机选取i(i=12,13,14,15,16)个图像作为训练集,剩下的作为测试集,重复进行10次,最后的实验结果取10次实验结果的平均值,实验结果如图9(b)所示;在FEI人脸数据库中,对每个人的人脸和鼻子样本分别随机选取i(i=6,7,8,9,10,11,12)个图像作为训练集,剩下的作为测试集,重复进行10次,最后的实验结果取10次实验结果的平均值,实验结果如图9(c)所示.图9中横坐标表示从数据库中选取的训练样本个数,纵坐标表示用剩下的样本作为测试集时得到的识别率.
图9 鼻子区域与相应人脸识别效果比较图
实验用GKFA算法分别在ORL、JAFFE和FEI数据库上进行了测试,将人脸和对应鼻子区域的识别率作了比较.所选数据库分别侧重考虑常见的人脸3种状态:中性、表情变化和姿态变化.ORL是一个正面中性人脸数据库,姿态变化非常小,倾斜度不超过20°,表情也只限于微笑和正常两种,眼睛也只限于轻微闭合和正常两种;JAFFE是一个正面表情人脸数据库,面部表情丰富且变化幅度较大;FEI是一个姿态变化比较大的数据库,左右旋转接近180°,但表情只有微笑和正常2种,眼睛都是正常睁开的.
从实验结果可以看出,由于受表情和姿态变化的影响,当单独将鼻子区域作为生物特征进行识别时,其识别率不会比相应的人脸识别率差.但由于ORL数据库的姿态和表情变化比较微小,单独将鼻子区域作为特征进行识别时,和对应的人脸识别相比优势并不是很明显,如图9(a)所示;而JAFFE数据库是个正面表情数据库,当单独将鼻子区域作为特征进行识别时,由于截取了嘴部表情变化信息的影响,和对应的人脸识别相比较,鼻子区域的识别效果有所提升,如图9(b)所示;而FEI数据库由于姿态变化比较大,当将整个人脸作为特征进行识别时识别率比较低,但当将鼻子区域单独作为特征进行识别时,其识别率要明显高于相应的人脸识别,如图9(c)所示.同时,由于鼻子区域图像的数据量远少于人脸图像的数据量,所以在进行识别时,其平均识别时间都会远少于人脸识别所用的时间.
4 结 束 语
将鼻子区域这种生物特征应用于个体身份鉴别是一种新的尝试,目前仍处于研究的初级阶段.通过分析发现,利用鼻子区域进行识别,可以避免表情、发型、胡须、姿态等因素的影响,特征比较稳定,将鼻子区域单独作为生物特征进行身份识别确实可行,具有一定的研究价值和应用前景.实验仿真结果表明,在面部表情比较丰富或人脸侧面旋转角度比较大的情况下,用鼻子区域进行身份识别优势比较明显.
目前,国内外还没有专门的鼻子图像数据库,也没有专门针对鼻子特征的描述、表示和识别方法.如何提取鼻子的有效特征,尤其在人脸图像质量较差、表情和姿态变化较大,或者由于遮挡造成人脸图像信息缺损的时候,如何确定可识别的最小特征集,以及对整形后的鼻子识别效果如何,都是有待进一步研究的内容.
[1] Drira H, Amor B B, Srivastava A, et al. A Riemannian analysis of 3D nose shapes for partial human biometrics[C]//Proceedings of the 12th IEEE International Conference on Computer Vision. Piscataway: IEEE, 2009: 2050-2057.
[2] 韩松, 潘纲, 王跃明, 等. 三维鼻形:一种新的生物特征识别模式[J]. 计算机辅助设计与图形学学报, 2008, 20(1): 38-42.
Han Song, Pan Gang, Wang Yueming, et al. 3D Nose: a Novel Biometrics[J]. Journal of Computer-Aided Design & Computer Graphics, 2008, 20(1): 38-42.
[3] Chang K I, Ortiz E, Bowyer K W. Multiple Nose Region Matching for 3D Face Recognition under Varying Facial Expression[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10): 1695-1700.
[4] Moorhouse, A, Evans A N, Atkinson G A, et al. The Nose on Your Face May Not Be So Plain: Using the Nose As a Biometric[C]//Proceedings of 3rd International Conference on Imaging for Crime Detection and Prevention. Stevenage: IET, 2009: 1-6.
[5] Drira H, Amor B B, Daoudi M, et al. Nasal Region Contribution in 3D Face Biometrics Using Shape Analysis Framework[C]//Lecture Notes in Computer Science. Heidelberg: Springer Verlag, 2009: 357-366.
[6] Emambakhsh M, Evans A N. Self-dependent 3D Face Rotational Alignment Using the Nose Region[C]//Proceedings of 4th International Conference on Imaging for Crime Detection and Prevention. Stevenage: IET, 2011: 1-6.
[7] 郝凯飞, 张绍祥, 王斌全, 等. 中国数字化人体鼻部结构的三维重建和可视化[J]. 山东大学耳鼻喉眼学报, 2008, 22(2): 144-147.
Hao Kaifei, Zhang Shaoxiang, Wang Binquan, et al. 3D Reconstruction and Visualization of Nasal Anatomical Structures of the Chinese Digitized human[J]. Journal of Otolaryngology and Ophthalmology of Shandong University, 2008, 22(2): 144-147.
[8] Mann A, Robert W. Use of Bone Trabeculae to Establish Positive Identification [J]. Forensic Science International, 1998, 74: 91-99.
[9] Fasel B, Luettin J. Automatic Facial Expression Analysis: a Survey[J]. Pattern Recognition, 2003, 36(1): 259-275.
[10] Kwon, Young Ho, Lobo N D V, et al. Age Classification from Facial Images[J]. Computer Vision and Image Understanding, 1999, 74(1): 1-21.
[11] Wang J, Li Q, You J, et al. Fast kernel Fisher Discriminant Analysis Via Approximating the Kernel Principal Component Analysis[J]. Neurocomputing, 2011, 74(17): 3313-3322.
[12] 王科俊, 邹国锋. 基于子模式的Gabor特征融合的单样本人脸识别[J]. 模式识别与人工智能, 2013, 26(1): 50-56.
Wang Kejun, Zou Guofeng. A Sub-Pattern Gabor Features Fusion Method for Single Sample Face Recognition[J]. Pattern Recognition and Artificial Intelligence, 2013, 26(1): 50-56.
[13] 李映, 焦李成. 基于核Fisher判别分析的目标识别[J]. 西安电子科技大学学报, 2003, 30(2): 179-182.
Li Ying, Jiao Licheng. Target Recognition Based on Kernel Fisher Discriminant [J]. Journal of Xidian University, 2003, 30(2): 179-182.
[14] Yang J, Frangi A F, Yang J. A New Kernel Fisher Discriminant Algorithm with Application to Face Recognition [J]. Neurocomputing, 2004, 56(1-4): 415-421.
[15] Yu L, He Z, Cao Q. Fisher Discriminant Analysis of Gabor Texture Features for Face Recognition [J]. Journal of Computational Information Systems, 2009, 5(1): 153-162.
[16] Han W, Lee J. Palm Vein Recognition Using Adaptive Gabor Filter [J]. Expert Systems with Applications, 2012, 39(18): 13225-13234.