APP下载

基于神经网络的性别识别方法

2013-04-25田启川郝梦琳

电子科技 2013年9期
关键词:识别率人脸分类器

白 雪,田启川,郝梦琳

(1.太原科技大学 电子信息工程学院,山西 太原030024;2.北京建筑工程学院 电气与信息工程学院,北京100044)

性别识别的研究始于20世纪90年代,问题起初是由心理学家进行研究[1],其致力于了解人类如何分辨男女性别。随着计算机技术、数字图像处理技术和模式识别的发展,有学者从计算机视觉角度进行研究,主要目标是得到一个性别分类器,性别识别在各方面有着广阔的应用前景。其可在身份识别中充当“前滤镜”的功能,即可利用检测出的性别信息减小在身份识别时的搜索范围,从而提高身份识别的速度和精度,性别识别也能在安保系统起到较大作用。凭此优势,其在生物特征识别领域占有了一席之地,成为一项科技创新的课题[2-5]。

传统的性别识别方法都是基于人体第二性特征进行识别[6],比如眉毛的粗细浓厚、是否有胡子、喉结是否明显、头发长短等独有的性别特征。虽然利用此方法进行性别识别原理较简单,但特征提取时存在着一定的困难,特别是在复杂环境下,例如被检测对象没有胡子,眉毛受到眼镜遮挡等,其特征定位、提取效果较差,从而导致识别率下降,鲁棒性也大幅降低。因此,如何避免复杂环境带来的影响,提高算法的识别率和鲁棒性是性别识别的一大难题。

针对此问题,提出了一种基于神经网络[7-10]的性别识别方法,该方法先将人脸图像进行高斯滤波,以去除高斯白噪声、光线突变等带来的影响,将预处理后的图像进行归一化处理,然后选取足够多的归一化样本对神经网络进行训练,达到预期的指标后停止训练,保存各节点参数即可得到性别识别分类器,为验证分类器的有效性,将训练及测试数据输入到分类器中,查看其识别效果。最后为了说明本文方法的有效性,在正常情况下和特殊环境下分别与传统的性别识别方法进行比较。本文方法在训练分类器时已将各种复杂环境包括进去,故增强了分类器的鲁棒性,性别分类的特征依据由神经网络自动分析提取,简化了人体第二性特征的提取步骤,其性能优于传统的性别识别方法。

1 传统性别识别方法

传统的性别识别方法主要是基于人脸图像的特征提取后进行识别,如文献[11],也有基于步态、鞋子等作为研究对象的,但特征提取均是不可或缺的步骤。在图像进行预处理后,图像所包含的信息量还是相当大,为更有效地进行性别识别,必须对原始图像进行相应处理,以提取有效的信息,有助于模式分类。在数学上,上述特征提取过程就是从测量空间到特征空间的一种映射变换。该变换必须符合两个准则:特征空间必须包含测量空间的主要分类信息;特征空间的维数必须远低于测量空间的维数。

特征提取技术主要有:梯度方向直方图(Histogram of Oriented Gradient,HOG),其描述了像素点邻域内像素灰度值变化的特征,梯度的大小表示该像素点附近灰度值变换的剧烈程度,梯度的方向表示该像素点附近灰度值变化的方向,在轮廓明显的情况下提取效果较好,但也存在一定的问题,如背景和前景区分不明显时提取效果较差,也容易受噪声的影响。局部二元模式(Local Binary Pattern,LBP),其利用图像像素及其邻域位置内的其他像素信息一起进行计算,得到一种鲁棒的纹理信息表示,纹理信息的表示方法可以由编码表实现,量化后可以有效地消除光照对图像单个像素的影响,基本的LBP特征提取方法如下:(1)以像素点gc为中心,取其8邻域,即图1中灰度值为151的点。(2)以点的灰度值为阈值,对8领域进行二值化处理。(3)将二值化得到的二进制序列作为一个8位二进制数,并将该二进制数转化为10进制即为gc点处LBP算子的值,其具体原理如图1所示。

图1 LBP算子

由图1可知,点gc的灰度值为151,其LBP码为00111100。其它特征提取方式还有:尺度不变特征变换(Scale Invariant Feature Transform,SIFT)、形状上下文(Shape Context)等。

由于性别分类是个典型的二类问题,可根据经验值进行单阈值划分,也可使用机器学习理论,寻找特征数据的规律,以进行数据的分类和预测,常见的有基于支持向量机(Support Vector Machine,SVM),即根据特征数据来寻找决策函数f(x)。其主要优点有:专门针对有限样本情况下的最优解;算法最终将问题转化为一个二次寻优问题,理论上可以得到全局最优解;算法本质上将实际问题通过非线性变换转换到高维的特征空间,在高维特征空间中用线性判别函数来实现低维空间中的非线性判别函数的功能,故SVM有一定的推广能力。

为说明本文方法的有效性,将其与传统性别识别方法作比较,传统性别识别方法特征提取部分采用局部二元模式,其中检测数据采用CMU PIE图像集人脸库。

2 基于神经网络的性别识别方法

人工神经网络(Artificial Neural Network,ANN)是由大量简单且高度互联的神经元所组成的复杂网络计算系统,其反映了脑功能的若干基本特征,是模拟人工智能的一条重要途径。基于神经网络的性别识别方法是先将数据进行高斯滤波,以减少噪声、背景光源等带来的影响,然后将处理后的数据输入神经网络,对其进行训练,达到要求后保存神经网络,即可得到基于神经网络的性别分类器。

2.1 预处理

由于在获取图像时存在着一定的高斯白噪声,不均匀光照等,都会影响识别效果,故在进行性别识别前必须要对图像进行预处理,减少噪声等带来的影响,以提高识别率。较为典型的预处理方法有均值滤波、中值滤波、高斯滤波等,均值滤波对图像有平滑的作用,但容易使图像中物体轮廓边缘模糊,模板尺寸选取不合适会导致细节信息的丢失。中值滤波对椒盐噪声效果较好,考虑到人脸各部位油性程度不同,具体如图2(a)所示,脸颊、额头等部位相对油性较大,从而导致明暗差距较大,文中采用高斯低通滤波。二维高斯低通滤波函数如式(1)所示

式中,D(u,v)表示距傅里叶变换原点的距离;σ表示高斯曲线的曲张程度,也是其截至频率。图2为耶鲁大学人脸库中男子的一幅脸部图像,对其进行高斯低通滤波,滤波器尺寸为3×3,σ取0.5。

图2 高斯滤波

由图2可知,经高斯滤波后,有效地去除了白噪声,并对不均匀光照带来的影响有了一定的抑制,去除了图像中因噪声产生的灰度值阶跃畸变,减少了图像中人脸虚假特征点,使图像更加平滑,更有利于神经网络的判断识别。

2.2 训练神经网络

在对数据预处理后,为得到基于神经网络的性别分类器,需先设计一个神经网络,对其进行训练以得到分类器,最后对分类器进行测试,若不符合要求则重新设计神经网络并训练。根据神经网络的特点,选取了基于误差反向传播算法的多层前馈网络,其可以逼近任意精度的连续函数,广泛应用于模式分类、非线性建模、函数逼近等。

BP网络的设计主要考虑网络层数、输入输出层节点数、隐层节点数、传输函数、训练算法等。在模式样本较少的情况下,通常选取只含一个隐层的BP网络,其节点数也较少。但当模式样本较多时,若采用单隐层网络必将会导致隐层节点数大量增加,为减少单层网络的规模,提高训练、识别的效率,故可通过增加隐层数来解决。因为用于性别识别的人脸图像模式较多,以耶鲁大学人脸库为例,其图像大小为100×100,8位的灰度图像,其模式较多,故本文在设计时采用6个隐层。隐层节点数与求解问题的要求、输入输出单元数等有一定的关系,过多会导致学习时间过长,而过少会使容错能力下降,导致识别错误。根据研究经验,可参考式(2)进行设计

式中,n为隐层节点数;n1为输入节点数;n0为输出节点数;a为1~10之间的常数。

输入层维数和图像尺寸相同,输出层维数为2维,即男性或者女性。数据经高斯滤波后将其归一化到[0,1]之间,具体见式(3)

式中,g(x,y)为原始图像(x,y)处的灰度值;f(x,y)为归一化后的灰度值。

BP网路中的传输函数采用S型函数

该函数无内部状态且连续取值,其输入输出特性为一个有最大输出值的非线性Sigmoid曲线,反映了神经元的饱和特性,在有限范围内有抑制噪声的作用。训练算法采用变学习率动量梯度下降算法,在Matlab中为traingdx,其综合了附加动量法和自适应学习速率法,在同类算法中内存需求较小,学习速度快。在实际应用中运算速度快,只迭代了400次就达到了0.000 1的误差,基本符合要求。

3 实验验证及分析

为说明本文算法的有效性,将本算法与传统的性别识别算法作比较,并在加噪声、图像旋转情况下测试其识别率,以验证其鲁棒性。算法在PC机上运行,CPU为Intel i5 3210 3.0 GHz,RAM为DDR3 1600容量4 GB,以Matlab2012b为软件开发环境。训练用的人脸图像库采用CMU PIE图像集,其包括来自68个人的40 000张照片,每个人的13种姿态条件,43种光照条件和4种表情下的照片,测试用人脸图像库采用Yale图像集,其包括15人,每人11张照片,主要包括光照条件和表情的变化,图像分辨率均调整为100×100,灰度级为8位。

在文中传统的性别识别算法采用局部二元模式提取脸部第二性特征,主要是胡子、眉毛,并采用单阈值法进行识别。测试用部分人脸图像如图3所示。

图3 人脸库图像

由图像可知,单从人脸图像的第二性特征进行性别识别,其差异并不明显,故在识别时存在一定的误差。其识别率结果如表1所示。

表1 各算法识别率

如表1所示,本文算法在识别率上有了一定的提高,特别是在抗噪声方面比传统算法有所提高,其主要原因是神经网络通过学习、训练可以自动提取特征,并具有一定的容错能力。表1中加入椒盐噪声的情况如图4(a)所示。

图4 旋转、加噪图像

为进一步测试本文算法的鲁棒性,文中将图像(Yale图像集)进行逆时针旋转,具体如图4(b)所示,最大旋转角度为45°,并与传统算法相比,其实验结果如图5所示。

图5 旋转角度与识别率

由图5可知,文中算法具有一定的几何不变性,旋转角度在0°~45°变化时识别率保持在0.75以上,而传统算法识别率较低,均值约为0.4,最低仅为0.3。为兼顾收敛速度和准确性,算法采用6个隐层的BP网络,在训练时采用变学习率动量梯度下降算法。通过实验可知,基于神经网络的性别识别方法比传统算法具有更高的识别率,其鲁棒性也得到了一定的提高。

4 结束语

文中提出了一种基于BP神经网络的性别识别方法,该方法避免了目前性别识别方法中人体第二性特征提取步骤,由神经网络在训练时自动提取完成,并得到了基于人脸图像的性别识别分类器。由于在训练神经网络时已将人的各种表情、佩戴眼镜、图像旋转等问题考虑进去了,故训练得到的分类器鲁棒性较好,通过加噪声、图像旋转等实验也验证了这一点,并且提高了识别率。以后的研究工作可在更大的人脸库上进行,并可引入彩色图像的识别。

[1]COTTRELL G W,METCALFE J.EMPATH:Face,emotion and gender recognition using holons[J].Advances in Neural Information Processing Systems,1991(2):564-771.

[2] 路秀英,崔兴凯,霍新丽.基于人脸图像的性别识别方法[J].计算机仿真,2012,29(2):241-244.

[3]於东军,吴小俊,HANCOCK E R,等.广义SOM及其在人脸性别识别中的应用[J].计算机学报,2011,34(9):1719-1725.

[4] 付俊辉,杨献峰.基于人脸图像的性别识别建模与仿真研究[J].计算机仿真,2012,29(5):299-302.

[5] 李昆仑,廖频.基于级联支持向量机的人脸图像性别识别[J].计算机工程,2012,38(12):152-154.

[6]ROSS A,JAIN A K.Information fusion in biometrics[J].Pattern Recognition Letters,2003,24(13):2115-2125.

[7] 朱树先,张仁杰.BP和RBF神经网络在人脸识别中的比较[J].仪器仪表学报,2007,28(2):375-379.

[8] 王浩全.基于BP神经网络提高伪装目标识别概率的研究[J].光谱学与光谱分析,2010,30(12):3316-3319.

[9] 甘俊英,张有为.基于BP神经网络的人脸识别[J].系统工程与电子技术,2003,25(1):113-115.

[10]周志华,陈世福.神经网络集成[J].计算机学报,2002,25(1):1-8.

[11]陈晓倩,许孜奕,陆丽,等.基于脸部特征的性别识别[J].数据采集与处理,2010,25(5):595-599.

猜你喜欢

识别率人脸分类器
有特点的人脸
一起学画人脸
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
高速公路机电日常维护中车牌识别率分析系统的应用