基于Gabor+PCA特征与粒子群算法的部分遮挡人耳识别研究
2014-03-21高艳霞
高艳霞
(怀化学院计算机工程系,湖南 怀化 418000)
基于人耳特殊的生理位置和结构特点,使其具备作为生物特征身份鉴证的唯一性、稳定性、易采集性等特点,使得人耳识别是近来生物识别领域的一个研究热点[1]。Chang等[2]人利用PCA算法对无遮挡人耳图像进行识别,可达到90.9%的识别率。Burger[3]提出了一种使用Voronoi图表的邻接图图标匹配方法进行人耳识别。Victor等[4]人使用标准PCA应用于人耳识别。Moreno等[5]人使用神经网络分类器对人耳进行识别。Hurley等[6]人利用力场转换方法对人耳进行识别。Yuizono等[7]人利用遗传算法进行全局搜索进行人耳识别。
目前为止,静态人耳图片的识别研究中关键问题是特征提取和特征分类器的设计两方面,其中特征的提取是人耳识别的重要环节。当前,特征提取的方法可以分为两大类:① 基于知识的特征提取方法。用对人耳的先验知识作为规则,将描述人耳结构特征、形状特征、纹理特征作为识别特征向量参数来检测人耳等。② 基于统计的特征提取方法。把人耳图像看作是由图像像素组成的高维向量,将人耳检测问题转化为高维空间信号分布的匹配问题等,考虑的是人耳的整体属性。由于使用不同的人耳图像库进行检测,且大多数检测方法是在图像的质量较高,噪声较少,人耳完整的较理想条件下进行实验,而作为一个能够实用的人耳识别系统, 人耳识别中遮挡问题是不可避免的。由于人耳或多或少总是会被头发、帽子或者其他饰物遮挡,这就造成部分特征的消失,导致人耳图像特征不完整,造成识别率下降。因此,很有必要对人耳受到部分遮挡的识别问题进行研究。
小波变换是近年来发展起来的一种有效的多分辨率分析工具,近年来广泛应用于图像识别中。其中Gabor小波变换与哺乳动物视觉系统的相关特性非常一致,具有良好的鲁棒性,因而可以捕获目标在空间域和频域的局部显著特征。因此,研究者将其广泛用于生物识别中,以提取出鲁棒的图像特征参数。然而,传统的Gabor滤波器提取的目标特征信息过于庞大,过高的维数需要大的存储空间造成冗余且使得识别过程非常耗时。为了降低Gabor特征的维数,本文采用Gabor小波与PCA相结合,提出了一种人耳图像的特征提取方法。首先采用Gabor滤波器把每一个输出图像分解成多个人耳样本,对其进行特征提取然后利用PCA进行降维,最后挑选出分类能力优秀的特征输入到神经网络分类器进行分类识别。
1 Gablor小波
二维Gabor小波是在一维Gabor小波的基础上发展起来的,是经正弦函数调制后的二维高斯函数。其定义为:
其中,和决定了高斯函数的标准差;u是决定滤波器径向中心频率的分量,x·y为空间位置坐标;θ确定了Gabor内核的方向。
人耳图像的Gabor 特征提取就是将该图像与Gabor小波卷积的结果。假设原始人耳图像为I(x)表示,则其Gabor 特征表示为:原始人耳图像的灰度分布与Gabor核函数的卷积结果,公式的卷积输出为复数形式,该复数的模,即为提取的Gabor 小波特征,如图1所示。
图1 由Gabor小波变换的人耳
通常来说,根据人耳图像的纹理特点和生物学的研究,在提取人耳图像的Gabor特征时,选择5个不同尺度参数和8个方向参数上的Gabor滤波器组成滤波器组,能够保证Gabor变换保持原有图像绝大部分特征信息。如图2所示,为5个不同尺度参数和8个方向参数上的Gabor滤波器组成的滤波器组在频域中的表示:
图2 5个不同尺度和8个方向的Gabor滤波器组
但是假设原始图像的大小为90×60,通过40个Gabor滤波器得到幅值特征和相位特征的维数高达216000,有的特征对于人耳识别是没有必要的,反而对后期的数据处理会造成非常大的困难,不利于分类识别。实验发现由于利用Gabor提取的特征值在相邻像素间是存在大量的冗余信息,只有对特征值进行降维和消除冗余数据处理才能解决这些问题。
2 主成分分析特征降维
人耳图像利用Gabor滤波器所提取的特征维数集非常大,导致后期计算研究工作的顺利进行,从而影响身份验证效率,因此在分类之前必须进行特征数据降维处理。本文中采用主成分分析(Principal Component Analysis,PCA)降维处理。传统的降维技术可分为线性和非线性两类。其中线性降维算法主要有PCA和多维分析。
PCA是最小均方误差意义上的最优维数据压缩技术,通过PCA方法能够提取原始数据中的主要特征,且所提取特征的各分量之间是互不相关的,其中包含信息成分最多的向量方向视为主要组成成分方向,摒弃其他方向及其系数,由此显著降低原图像的维数且充分保留分类信息[8]。
PCA的具体实现是根据PCA原理,基于PCA的降维特征提取算法如下:
设人耳图像为M×M维,将其排列成一维列向量,表示为下式:
用于训练的人耳图像样本总数为N,每个样本均为M维,将其按行抽取成对应的列向量为
2.1 计算全体训练样本的平均值向量
2.2 计算协方差矩阵
其中,X=(X1-m,X2-m,…,XN-m)故构造低维矩阵R=XTX,即根据SVD分解很容易求出R的特征值λi及相应的正交归一化特征向量νi,由此推论可知Cx的特征向量ui:
ui称为特征耳,记:
实验结果表明,将特征值按照降序排列时,从前向后取K(1
3 基于PSO训练的BP人工神经网络
人工神经网络是在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的模拟大脑分析过程的简单数学模型,而粒子群优化算法(Particle Swarm Optimization, PSO)是一类基于群智能的随机优化算法。利用PSO结合BP算法来训练前向神经网络对人耳图像进行身份识别用以替代人工识别。有效地利用PSO具有较好的全局收敛能力和强大的鲁棒性,以弥补BP神经网络易陷入局部极小、收敛速度慢和引起振荡效应等缺点,极大地提高神经网络的收敛速度与学习能力。
粒子群优化算法是一种全局优化进化算法,算法基本概念最初来自社会行为的模拟例如飞鸟和鱼类集群活动,通过种群间个体协作来实现对问题最优解的搜索。
PSO-BP算法训练网络过程为:
(1)首先根据神经网络的输入、输出样本集确定BP神经网络的拓扑结构。初始化粒子群,对粒子群参数进行设置,并确定粒子的初始位置和速度。
(2)将BP神经网络的各连接权值和各阈值编码成实数向量来作为粒子的位置向量,可用一个D维参数表示,其中则PSO优化算法中微粒的搜寻空间维数为:D= (q·n+q) + (m·q+m)。换句话说,先按行优先,扫描BP神经网络的权重矩阵,然后扫描所有的阈值,并编码成实数向量,从而得到D维X向量,用来表示对应的一个PSO中一个粒子。
(3)确定适应值函数作为神经网络的均方误差指标,公式如下:
式中,P是训练集的样本数,示第d次叠代第i个样本的第j个输入的网络理想输出,D为最大叠代次数,yj.i表示第d次叠代第i个样本的第j个输出的网络实际输出。计算所有样本通过神经网络产生的均方误差,直至找到一组使均方误差最小的最佳连接权值和阈值。
(4)由上述方法得到一组接近最优的网络权值与阈值后,然后对PSO输出的权值和阈值作为初始值训练BP神经网络,在此基础上,结合BP算法思想,计算出实际输出和误差测量值,从而对各隐层的权值和阈值进一步精确优化,重复直至得到网络权值和阈值的最优值。
由于粒子群算法的搜索优化模型操作简单,计算复杂度低,并利用粒子群算法训练BP神经网络结构下的连接权值和阈值,保证最优解,从而有效提高神经网络寻优速度和精度。
4 实验及结果分析
根据前面部分的阐述,本文提出的基于Gabor小波变换提取特征,PCA降维处理,由PSO训练神经网络的系统框图如图3所示。
图3 人耳识别系统
整个设计的基本思路是:首先判断人耳是否被遮挡,利用Gabor小波变换和PCA相结合,来提取局部未遮挡人耳图像的特征参数。将提取出的特征参数送入神经网络进行训练,从而得到身份验证结果,同时尝试对不同遮挡程度人耳的人耳数字图像进行识别研究。
实验测试主要使用北京科技大学人耳识别实验室提供的人耳图像库[9],如图4所示。该人耳库由60名志愿者,每人拍摄3幅右耳图像,分别是正面一幅,轻微变化角度一幅,光照变化一幅,256灰度级。共180张图像。每个人取3幅未遮挡图像作为训练集。
在此基础上人为添加遮挡物,按其遮挡部分位置的不同分别为上部、中部、下部、左部、右部,如图5所示。在遮挡人耳和完整无遮挡人耳图像一一对应的方式下,选取遮挡图像用于测试样本集。
图4 未遮挡的人耳图像库
图5 人造遮挡人耳
图6 由Gabor对人耳滤波结果
整个设计采用Matlab模拟实现人耳遮挡图像数字识别这一过程。首先经过图像预处理,平滑去噪,并归一化将图像统一为90×60像素。然后利用Gabor滤波器对处理后训练的样本集提取所有的人耳图像特征参数,且人耳图像的局部细节信息主要分布在0°, 45°, 90°, 135° 4个方向,如图6所示。所以通常只需要稀疏的提取部分节点上的Gabor特征并用PCA进行降维处理。用这些特征矢量作为网络的输入,其网络的输入是特征向量元素归一化后的值,本研究BP神经网络采用3层结构,隐层取了24个神经元,网络的输出采用二进制编码代表不同人身份。
本研究以60类人作为研究,则相应的样本二进制编码的位数有6位就足够,所以输出层的神经元个数取为6。隐含层神经元激励函数选取logsig函数,输出层神经元激励函数选取purelin函数。
将上述PSO算法优化后得到的网络连接权值及阈值代入上述BP神经网络,对人耳图像的训练样本(部分数据)进行训练。在网络满足训练目标,保存各网络。
此外,为了进一步说明文章所提出的算法优劣,对采用相同的人耳图像样本集的前提下,还选取BPNN方法和BPNN+Gabor算法与本文方法作为对比,进行了人耳身份识别实验,识别结果见表1。
表1 人耳图像识别结果
实验结果说明了人耳图像中部和右部区域对于识别起到的重要作用, 此两部分多含有丰富的人耳曲线结构和人耳沟回分布,所以在实际应用中,此部分遮挡情况是要尽量避免。同样可以看到利用PSO算法优化BP神经网络的节点之间的权重值与阈值,具有很好地逼近效果和训练速度。
5 结束语
针对当前人耳识别中特征识别存在的难题,文章提出了基于Gabor滤波器与PCA相结合,然后利用PSO训练的BP神经网络来进行局部遮挡人耳识别的方法。文章首先对人耳图像采用Gabor滤波器提取遮挡人耳特征集,然后用PCA方法对特征向量降维,大大提高识别效率,最后采用PSO和BP结合的算法训练人工神经网络,对部分遮挡人耳识别进行检测区分。通过人耳图像识别的仿真实验,结果表明,表明该方法可以有效解决人耳遮挡的典型问题,有效得到较多的人耳图像特征信息,与传统的方法相比较,识别率和准确率有明显提升。
[1]田 莹, 苑玮琦.人耳识别技术研究综述[J].计算机应用研究, 2007, 24(4): 21-25.
[2]Chang K, Bowyer K, Sarkar S, Victor B.Comparison and combination of ear and face images in appearance-based biometrics [J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003,25(9): 1160-1165.
[3]Burger M, Burger W.Ear biometrics in computer vision[C]//Proceedings of 15th International Conference on Pattern Recogni- tion, 2000: 822-826.
[4]Victor B, Bowyer K, Sarkar S.An evaluation of face and ear biometrics[C]// Proc.ICPR, 2002: 429-432.
[5]Moreno B, Sanchez A, Velez J F.On the use of outer ear images for personal identification in Security Applications[C]//IEEE 33rdAnnual 1999 International Carnahan Conference on Security Technology, 1999:469-476.
[6]Hurley D J, Nixon M S, Carter J N.A new force field transform for ear and face recognition[C]//Proceedings IEEE International Conference on Image Processing ICIP 2000, 2000: 25-28.
[7]Yuizono T, Wang Y, Satoh K, Nakayama S.Study on individual recognition for ear images by using genetic local search[C]//Proceedings of the 2002 Congress on Evolutionary Computation, 2002: 237-242.
[8]Nhat V D M, Lee S Y.Two-dimensional Weighted PCA algorithm for Face Recognition [C]//Proceedings 2005 IEEE International Symposium on Computational Intelligence in Robotics and Automation June 27-30, 2005, Espoo, Finland, 2005:219-223.
[9]穆志纯.北京科技大学人耳识别实验室-开放式人耳图像库[EB/OL].http://www1.ustb.edu.cn/resb/subject/subject.htm, 2013.