基于BP神经网络的人脸识别系统研究
2018-09-05陈翔白创黄跃俊
陈翔 白创 黄跃俊
文章编号: 2095-2163(2018)03-0057-04中图分类号: 文献标志码: A
摘要: 关键词: (School of Physical & Electronic Science, Changsha University of Science & Technology, Changsha 410114, China)
Abstract: A face recognition system based on BP neural network is designed and its performance is analyzed in this paper. This system first uses discrete wavelet transform to obtain low-frequency components that contain most of the original information of the face image, and reduces the dimension of the image data. Then the PCA algorithm extracts the principal component features of the face image to further reduce the amount of image data processing; The trained face of the BP neural network is used to classify the face to be measured. Discrete wavelet transform, PCA feature extraction and BP neural network classification design are introduced in detail. Through system simulation experiments and analysis, it is found that the extraction of facial features is the key to this system; due to statistical characteristics of face gray information and the BP neural network classification by supervised training, the system is only to be used in the face recognition application scenario with a high recognition accuracy, in which the category is fixed, and the light is uniform . So it is applied in complex environments difficultly.
Key words:
基金项目: 作者简介:
通讯作者: 收稿日期: 引言
人脸识别技术是目前人工智能与机器视觉研究领域的重点技术之一,有着广阔的应用前景,如摄像头监控、刷脸支付及身份识别等。人脸识别的研究可前溯至于上世纪60年代末。早期的人脸识别方法主要分为2种:基于人脸几何特征法和模板匹配法。前者是将人脸图像进行归一化,并求取各特征点之间的距离、比率,再对特征点所构成的二维拓扑结构进行识别;后者则是通过计算人脸模板与待测人脸图像灰度值之间的相关性来划定分类\[1\]。90年代后计算机技术得到了快速的发展,对更加精确的人脸识别方法的需求也在增多,基于神经网络的人脸识别方法即已成为该领域的关键研发内容\[2\]。
基于神经网络的人脸识别方法能有效地利用神经网络的并行分布式处理及高速寻找最优解的能力,大大减少了以往的图像数据的运算时间。同时相比于其它人脸识别方法,神经网络的优势特点也更加鲜明,因其可通过训练学习的过程来获得人脸识别潜在规律的隐性表达,适应能力强,识别率也高\[3\]。
本文采用基于误差反向传播算法的BP神经网络的人脸识别方法设计人脸识别系统。该系统中,为提高BP神经网络的识别速率和准确率,采用PCA分析法对人脸图像经离散小波变换后获得的低频分量,进行降维并提取主成分特征。人脸识别结果由BP神经网络对主成分特征分类获得。最后对该系统进行了仿真测试实验。
1人脸系统的组成
本次研究中,基于BP神经网络的人脸识别系统是由3个部分组成,分别是:预处理、PCA特征提取和BP神经网络分类器。这里,将研究给出系统流程设计如图1所示。
如图1所示,针对本文提出的基于BP神经网络的人脸识别系统的各组成部分的功能研究阐析可分述如下。
(1)预处理。包含直方图均衡化和二维小波变换。其中,图像的直方图均衡化的主要思想是把原始图像的灰度直方图从比较集中的某个灰度区间转变为在全部灰度范围内的均匀分布\[4\]。如果一个数字图像的灰度级范围是\[0,L-1\],则其直方图是一个离散函数,公式表述可见如下:P(rk)=nkn(1)其中,n是图像像素总数;nk是图像中第k个灰度级的像素总数;rk是第k个灰度级,k=1,2,…,L-1。
均衡化是指对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同,从而加大像素灰度值的动态范围,增强图像高频分量与低频分量的对比度。整体研发效果如图2所示。
(2)PCA特征提取。二維离散小波变换可以把原始人脸图像分解成包含脸和五官轮廓的低频分量和包含一些高频噪声以及边缘细节的高频分量。本文的系统利用二维离散小波变换抑制高频、提升低频的特点,这就在设置了一定图像质量的情况下既保留了原始人脸图像的主要特征,又有效去除了噪声\[5-6\]。同时如图3所示,离散二维小波变换的每一次变换都对原始人脸图像进行了2次分解,保留低频分量后图像变为原图的四分之一大小,从而降低图像的分辨率,即:对原始人脸图像进行降维处理,更有利于此后的研究使用PCA方法来提取特征。研究处理效果可如图4所示。
PCA特征提取就是使用PCA算法对人脸图像灰度值组成的矩阵进行主成分分析,实现人脸特征提取。在图像特征提取过程中,通过线性变换将原始的人脸高维灰度特征数据映射到低维特征空间,可以得到反映原始图像大部分信息的主成分特征。因此,该方法不但能够降低图像数据的维度,大幅减少了图像数据的计算时间,而且还能抑制原始图像中存在的噪声干扰\[7-8\]。
(3)BP神经网络分类器。BP神经网络分类器是指采用BP神经网络对PCA提取的主成分特征进行分类识别。BP神经网络是由输入层、隐含层和输出层组成的多层神经网络。通过输入值与每层参数加权求和的线性计算以及层与层间激活函数的非线性映射,不但可对任意复杂非线性函数具有很强的拟合、逼近能力,而且还可用于非线性分类,是模式识别中常见优选的分类器\[9\]。
2人脸识別系统的研究方法设计
本文中,研究实现将依次经历3个阶段,分别是:获取PCA特征提取矩阵、BP神经网络设计以及图像小波变换中小波基函数的选择。对其设计论述如下。
2.1获取PCA特征提取矩阵
获取PCA特征提取矩阵的过程如图5所示。其中的人脸图像是来自ORL人脸库(Olivetti Research Laboratory人脸数据库)。该人脸库包括不同年龄、性别和种族的40个人,每个人提取10幅、共计400幅112*92的灰度图像,并且涉及了人脸部分表情、姿态的变化,戴或不戴眼镜等。图5中的人脸图像训练样本是通过随机选取每个人7幅、共280幅图片共同组成,剩余图片即用作系统仿真测试数据;X均值化是指按行展开的零均值化,即矩阵每行元素减去该行均值;协方差C计算公式如下所示: C=1mXXT(2)
由于协方差矩阵的特征值越大,其对应的特征向量对图像的影响越大,故而k值的选取对人脸特征提取越重要。引入参数β,通过β值可以获取PCA特征提取矩阵P。参数β的计算可详见式(3):β=前k行特征向量对应的特征值之和所有特征值之和(3)最终,人脸图像的主成分特征Y可由式(4)计算获得。其数学形式如下:Y=PA(4)其中, A为人脸像素矩阵拉伸后的n×1的列向量。可以看到k×n的P与A相乘,会得到k×1的图像主成分特征向量Y。
2.2BP神经网络设计
输入层神经元个数与输入的PCA特征维度一致,即k个;输出层神经元个数为40个;隐含层神经元个数根据经验公式设定,即取大于nm的最小整数;各层后的激活函数使用了修正线性单元(Rectified linear unit,ReLU),而由此呈现的非线性稀疏激活的特点,将有助于BP神经网络的快速优化\[10\]。ReLU的公式定义如下:ReLU(x)=max(0, x)(5)输出层的输出函数采用Softmax函数,其数学表达式为:pj=efyi∑jefj(6)其中,yi是第i个输入特征的标签; fj表示输出层输出向量f的第j个元素; pj表示此时输入特征属于第j类的概率。
使用图5中已有的样本数据训练BP神经网络,训练中采用批量梯度下降法最小化经损失函数计算的网络输出与训练样本标签间误差,从而达到优化网络参数的目标。计算公式为:L=-1N∑ilog(pi+ε), 且ε=1×10-10(7)其中,N为每次训练时输入的样本数目。ε作用是为了防止pi=0时,出现L=±