人脸表情识别:一种权值优化LGC特征直方图的方法
2019-03-04张波武高雨
张波 武高雨
摘要:人脸表情的主要信息集中在人的眉毛、眼睛、嘴巴等特征中。但是,人脸中还存在影响表情描述的干扰信息,并且特征向量会受这些信息的影响。为了尽可能减少这种干扰信息的含量,提出一种权值优化LGC特征直方图的方法。首先,提取基于LGC算子的特征直方图,其次,使用权值对特征直方图进行优化,最后,使用支持向量机对提取的特征进行分类。实验证明,该方法可以有效地提高面部表情的识别率。
关键词:表情识别;权值优化;LCC特征直方图;支持向量机
中图分类号:TP3-05 文献标识码:A
文章编号:1009-3044(2019)34-0192-02
1 概述
人与机器之间的高级智能交互是研究表情识别的重要目标之一,而面部表情识别(Facial expression recognition,FER)是实现这一目标的必经阶段。表情识别的内容主要包括:1)图像预处理;2)人脸检测;3)表情特征提取;4)表情分类。
在整个面部表情识别过程中,最重要的是表情特征提取。相较于其他特征提取方法,局部特征的方法对姿态变化、遮挡以及光照等因素的影响具有较强鲁棒性,其中局部二进制模式[1](LBP)和Gabo[2]小波变换是最具有代表性的两种方法。Ga-bor小波变换能够检测出多尺度、多方向纹理的变化,但是它的特征尺度巨大并且耗时相对较长。
和Gabor小波变换相比,LBP算法可以快速提取面部表情特征,并且具有强大的纹理识别能力。传统的LBP算法是通过对中心像素与周围的八个像素进行比较获得局部纹理特征,缺点是无法准确地描述面部肌肉、皱纹以及其他局部形变的纹理信息的分布趋势。针对这些问题,2014年,Ying Tongc3]等人提出了LGC算法,但这种方法仍然避免不了干扰信息。因此,本文提出了一种权值优化LGC (WLGC)特征直方图的方法,减少干扰信息的含量。
2 LBP和LCC方法原理
传统的LBP算子是中心像素与周围八个相邻像素的灰度值比较,如果比中心像素灰度值大的则为l,否则为0,从左上方顺时针读值,先读的值为二进制的低位,最后得到一个八位的二进制数,再转化为十进,即得到该中心像素的LBP算子。LBP算子的定义如公式(1)所示。
然而,传统的LBP算法仅考虑了中心像素与相邻像素,忽略相邻像素之间的灰度级关系。LGCc3]算子是针对八个相邻像素,分别对横向、纵向和对角线方向上的灰度值进行比较得到一个八位的二进制数。其公式定义如(2)所示。这种编码方式与人的眼睛,嘴巴,额头等特征点的变化趋势保持一致,并充分考虑了纹理变化对表情分类的影响。例如,图1中的两个示例经过改进后的LGC编码分别为(0000000012和f0001111112。
3 本文方法
特征提取阶段在任何模式识别系统中都是一个被关注的焦点。在本文中,提出了WLGC方法,该方法通过对LGC[3]做进一步的优化,来达到提高识别率的目的,整个方法的结构框架如上图2所示。
在人脸图像中,统计相同像素值得到对应直方块,链接不同像素的直方块得到特征直方图。同一像素块中的像素可能来自不同的部位,然而,这些信息并不确定能够描述表情特征,这就会使特征直方图中包含干扰信息进而影响表情分类。如图5所示,同一直方块中的灰度值可能来自眼睛,也可能来自头发,而头发并不能描述表情信息,即便将图像进行分块,这种情况也无法避免。针对这一问题,提出WLGC方法。该方法的主要思想是通过权值C减少一部分干扰信息在特征向量中的相对含量,同时也增加有用信息所占的比例,以此来达到优化已获取的LGC特征向量的目的,WLGC算法的公式定义如下:
FWLGC(X) =f LGC(X)xC (3)
特征提取步骤:1)将人脸图像处理成块;2)用LGC算子提取出每个子块的局部梯度差异的值[3],并对其进行直方图统计,链接所有子块的LGC直方图,并构建整个图像的识别特征fLGC( X);3)定义C的范围以及具体的权值,枚举(0,1)的范围内具有代表性的数值并对C进行赋值,取不同值分别对LGC特征直方图进行优化,得出优化的特征向量F1VLGC(X)。
4 表情分类方法
5 实验结果及分析
实验采用Cohn-Kanad[5]表情库,该表情库在当前的面部表情研究领域中是最全面的数据库之一。从表情库中一共选取540图像,这些人脸图像涵盖六种表情,即生气、厌恶、恐惧、高兴、悲伤和惊讶,每种表情90张,从每一类中任意选取30张图像作为训练样本,其余图像作为测试样本。
实验中,权值和分块是影响识别率的重要因素,适当的配置可以提高表情识别率,当图像被分割成4x4块时,识别率达到最高。一般情况下,干扰信息存在于各个直方块中,因此,将权值区间定在(0,1)之间并进行实验,权值为0.9时,识别率与原来相比有所提高并且分类时间并无明显差别。为了证明该方法的优越性,同其他的方法进行比较的结果如表1所示。
6 结束语
针对特征直方图中存在干扰信息并影响表情识别率的问题,提出了一种权值优化LGC特征直方图的方法。实验结果表明,该方法可以有效地减少无用信息在特征向量中的含量,突出有用信息在向量中所占的比例,突破算法本身的局限性,提高表情识别率,并且使分类时间保持稳定。但是,由于图像个体原因,例如,图像剪裁、旋转、人脸型大小等因素的影响,权值无法唯一确定,希望未来能够进一步研究该方法,在保证高识别率的条件下,使表情识别能够自适应于不同的条件。
参考文献:
[1]T.Ojala,M.Pietikainen. D.A. Harwood, Comparative study oftexture measures with classification Based on feature distribu-tions. Pattern Recogn,1996,29(1):5 1-59.
[2]J.G.Daugman, Uncertainty relation for resolution in space,spatial frequency,and orientation optimized by two-dimension-al visual cortical filters,J.Opt. Soc. Am, (1985,2 (7): 1160-1169.
[3]Y.Tong,R.Chen,Y.Cheng. Facial expression recognition al-gorithm using LGC Based on horizontal and diagonal priorprinciple[J]. Optik - International Journal for Light and Elec-tron Optics,2014.
[4] C.C Lai,C.H Ko,Facial expression recognition Based on two-stage features extraction[J].Optik- Optik - International Jour-nal for Light and Electron Optics,2014.
[5]T.Kanade,J.Cohn,Y.Tian, Comprehensive database for fa-cial expression analysis, in: Fourth lEEE International Confer-ence on Automatic Face and Gesture Recognition, 2000:46-53.
[通聯编辑:李雅琪]
收稿日期:2019-08-11
作者简介:张波(1978-),中国联合网络通信有限公司河南省分公司,工程师。