基于深度学习的面部表情识别分析
2019-10-21刘宣彤
刘宣彤
摘 要:在“互联网+”技术的发展推动下,人脸识别技术也逐渐趋于成熟,但是面部表情识别技术作为难点技术,尚未被有效攻克,如果将面部表情识别技术与物联网技术相结合,则会赋予计算机以人类的感情,有利于物联网时代的开启。本文通过对面部表情识别方法进行分析,希望对促進面部表情识别技术的发展有所帮助。
关键词:深度学习;面部表情;识别
面部表情是一种人类特有的情感表达方式,也是分析人类情感和行为的重要依据,在“互联网+技术”和人工智能技术发展的背景下,面部表情识别技术已经成为人们重点关注的话题,并出现了多种识别方法。伴随着芯片处理能力的不断加强,研究人员已经将目光转向深度学习,已经取得了初步的成效。因此,对基于深度学习的面部表情识别进行研究,具有十分重要的意义。
一、深度学习
深度学习指的是在多层神经网络上,应用不同种类的机器学习算法,对图像、文本等问题进行解决的算法集合。[1]基于深度学习,计算机可以对数据结构进行发现和调整,并依据前一个图层的表示,对每个图层表示进行计算。深度学习最显著的特点就是特征学习,其目的在于获取分层特征信息,以此来解决传统特征提取方法存在的问题。深度学习就是所谓的深度神经网络训练,伴随着硬件处理能力的不断提升,重新成为了相关领域重点关注的内容。
二、基于深度学习的面部表情识别分析
(一)面部表情图像预处理
预处理是面部表情识别的重要步骤,其主要目的在于排除干扰特征提取的各项因素,例如:环境、姿势和背景等,在干扰排除后,让人类面部表情直接与系统相对接,促使面部特征对应的语义位置准确无误。实现预处理的方法有以下几种:一是人脸检测;二是人脸对齐;三是数据增强;四是人脸归一。
1.人脸检测
人脸检测主要是对人类的面部进行检测,在检测的同时,排除干扰因素和其他区域。传统的人脸检测方法主要由人工操作完成,工作人员会利用专业的设备完成这项工作,但是这种检测方法,无法有效克服环境因素的干扰,检测效果十分有限。而隐马尔可夫人脸检测器应用效果却十分显著,取得了广泛的应用。在深度学习阶段,又出现了一系列先进的人脸检测器,不仅工作效率高,还能应对各种干扰因素的影响。目前,级联结构的卷积神经网络的应用,使人脸检测性能得到显著增强。
2.人脸对齐
为进一步强化人脸检测的效果,人脸对齐技术应运而生,人脸对齐好比在一个已经设置好固定点位的系统中,对这些固定点进行搜索,继而构成人脸的形状。人脸对齐首先会由一个大致的形状开始,然后不断对人脸形状进行细化和估计。[2]在搜索点的过程中,需要使用以下两种信息:一是人脸外观;二是人脸形状。形状是指为搜索提供一个大致的范围,目前使用最为广泛的方法是IntraFacc软件。
3.数据增强
深度学习虽然效果十分显著,但对于数据的要求十分严格,只有确保数据量的充足有效,才能强化工作效果。但是现阶段常用的FER数据集,却无法完全满足深度学习对数据的要求,继而会导致过拟合现象的发生。因此,数据增强成为了保证面部表情识别有效性的重要步骤。目前,应用效果显著的数据增强方法有以下几种:一是旋转反射变换法;二是缩放变换法;三是尺度变换法;四是对比度变换法;五是颜色变化法。这些数据增强方法的应用,促进了面部表情识别技术的发展。
4.人脸归一化
由于灯光和头部姿势的变化,会对面部表情识别效果造成直接的影响,因此,应用人脸归一化方法,消除这些变化的对识别效果的影响十分关键。常用的人脸归一化方法为两种:一是灰度归一化;二是几何归一化。增加图像的亮度,凸显图像的细节,消除外界环境因素对图像的干扰,是灰度归一化的主要功能。除了增加亮度功能之外,灰度归一化还可以调整对比度。对比度调整方法包括直方图均衡化、IS归一化、DCT归一化和高斯归一化法等。在这些方法中,比较适用于深度学习面部表情识别的方法为直方图均衡化,究其原因,主要是这种方法较为稳定,契合于网络模型。几何归一化的功能是生成面部视图,但现阶段,该方法的发展还不完善,尚存在一定的不足。
(二)基于序列特征的方法
基于序列特征的方法主要有两种:一种是光流法;另一种是模型法。其中光流法是指帧在变化过程中会凸显出来一些重要的特征信息,在明确图像序列目标的构造的基础上,对目标的形变和图像颜色在空间和时间上的变化情况进行把握,这种动态化序列特征提取,应用范围十分广泛。而模型法是指利用模型对人的面部进行追踪,并将通过追踪获取的模型和帧图像信息作为依据,对人的面部表情进行有效的识别。
(三)深度卷积神经网络
深度神经网络已经被广泛应用于视觉对象识别任务之中,它能够使神经网络的大数据处理能力得到显著提升,其方法是在神经网络内构建一个与人类大脑相似的学习结构。这个学习结构可以对一些多级表示和抽象进行学习,从而赋予计算法在声音、文字和图像中找到复杂模式的能力。研究人员在2012年发现将自动编码器应用于CNN之中,做逐层训练,可以对高层次的网络进行训练,但经过继续研究,发现初始化策略的效果要优于逐层训练,因而提出了批量归一化方法,这一方法的使用,促进了深层网络的发展,从而使深层学习面部表情识别成为了可能。
三、结论
综上所述,面部表情识别具有非常高的实用价值和商业价值。如今,对于面部表情识别的研究正在不断进行,在此期间,产生了多种方法和结构。通过对这些方法进行分析,有利于加深我们对面部表情识别的理解。
参考文献:
[1]陆嘉慧,张树美,赵俊莉.基于深度学习的面部表情识别研究[J].计算机应用研究,1-8[2019-03-07].
[2]夏晨.基于视频序列的人脸表情识别方法研究[D].合肥工业大学,2018.