人脸检测实现过程概述
2018-02-16段佳宁
段佳宁
摘 要:人脸检测,是从被测图像中检测出是否含有人脸,若含有人脸,就进一步给出人脸的位置、大小等信息的一种技术,是人脸跟踪、身份识别等应用功能的基础。本文简单介绍了人脸检测技术的发展现状与功能特点,以及详细介绍了人脸检测的实现过程包括采集样本、特征提取、建立模型和测试等几个步骤,提出了在人脸检测过程中存在的人脸的相似性、角度和图像质量等一些局限性,并针对这些局限性总结了一些改善和解决办法,例如样本处理、构建立体模型等,最后对人脸检测的发展和应用进行了展望。
关键词:人脸检测;样本采集;特征提取;随机森林
中图分类号:TP391.4 文献标识码:A 文章编号:1671-2064(2018)22-0040-02
人脸识别技术,已经广泛应用于安保、金融、社保、考试、考勤等领域,尤其是从iPhone X手机的人脸解锁开始,很多带摄像头的智能手机都增加了人脸解锁的功能,在使用中大大提高了便利性。随着人们生活水平的提高和应用领域的进一步拓展,人们对人脸识别技术的速度、准确度和安全等方面有了更高的要求。人脸识别是将静态图像或视频图像中检测出的人脸图像与数据库中的人脸图像进行对比,从中找出与之匹配的人脸的过程,以达到身份识别与鉴定的目的[1]。人脸检测是整个人脸识别系统的初始阶段和关键环节,只有快速、準确地检测出人脸,才能对其进行进一步的人脸跟踪和身份识别等。所以,理解人脸检测的实现过程和特点,提高检测速度和准确度,对人脸识别系统的发展和应用有着十分重要的意义。
1 人脸检测的发展与特点
1.1 人脸检测的发展
国外的人脸检测技术发展较早,现在也有很多机构从事此方面的研究,比较著名的有MIT、CMU等;国内的清华大学、中科院计算所和自动化所等一些大学和研究机构也长期进行着人脸检测相关的研究。随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,如IEEE的FG、ICIP、CVPR等重要国际会议上,每年都有大量关于人脸检测的论文,占有关人脸研究论文的1/3之多,由此可以看到世界对人脸检测技术的重视[2]。
1.2 人脸检测的特点
(1)非强制性:人脸检测不需要被检测对象的配合,即可自动完成采集人脸图像并进行分析。(2)并发性:人脸检测可以同时对一个图像中含有的多个人脸进行分析判断。(3)非接触性:人脸检测从采集人脸图像到完成检测的整个过程中,都不需要与被检测对象发生接触,随着硬件设备的进步,可以在更远的距离完成人脸检测。
2 人脸检测的实现过程
人脸检测一般分为以下四个步骤:采集样本,提取特征,建立模型,测试模型。人脸检测首先要对图像进行预处理,主要是利用中值滤波、直方图均衡等方法对人脸图像的对比度、光线强度、噪声、方向、距离等进行处理,得到大小、质量相近的人脸图像。
2.1 采集样本
人脸检测需要学习大量关于人脸图像的正、负样本,通过给出的正样本和负样本的集合中归纳产生出接受所有正样本同时排除所有负样本的规则,以实现系统对人脸图像的精确判断以及进一步分析处理,如图1所示。
在人脸检测的训练过程中,正负样本的采集同样重要。采集正样本,即图像中包含不同性别、年龄、表情、角度、光照等条件下的不同人脸。采集的正样本数量保证在万张级别,并对采集到的正样本进行筛选,剔除模糊、面部不完整等不符合要求的样本。负样本的采集简单说就是采集那些不包含人脸的图像,采集的负样本与正样本保持同一数量级。另外,为了提高训练效率,负样本的选取应与目标场景相关。例如,如果要进行火车候车室这类特定场景的人脸识别,那么负样本就应该是与候车室有关的列车时刻表、椅子、检票口、柜台等场景图片。
2.2 提取特征
特征提取是决定人脸检测成功率的重要步骤。特征提取的算法好,可以提高检测的速度、准确性和模型的泛化效果。在选择特征的过程中要去掉不相关的特征和避免特征之间的相互依赖。提取人脸特征就是利用人脸的几何特征、代数特征等建模的过程。基于面部器官的特征提取方法,是根据人脸器官的形状和之间的距离等数据作为检测人脸的特征。基于模板的特征提取方法,是先定义一个或者多个标准人脸模板,然后将采集的数据样品与标准人脸模型进行匹配,并利用阈值来判断是否存在人脸[3],如图2所示。
2.3 建立模型
将上述采集到的样本集以及特征输入到决策树中,将生成决策树的参数,包括每棵决策树的深度以及决策树棵数等。通过对样本多次重采样的方式,将得到多(n)颗决策树,即构成随机森林,由随机森林中的每棵决策树参与投票,之后依据少数服从多数的原则生成随机森林的结果,也就是最终的分类结果。
2.4 进行检测
取一部分未知属性的图片,输入到上述训练出来的模型中,对得到的结果进行分类。对于正样本漏检的和负样本误检的图像,分析采集的样本与特征以及模型的参数,不断调整优化,直至正确检出率达到设定值为止。
3 人脸检测的不足与改善
3.1 人脸检测技术的局限性
人脸检测技术虽然获得了较大的发展,但是还存在一些局限性,影响了检测的准确度及速度。主要有以下几方面:
(1)人脸的相似性及渐变性:长相接近的两人或者随着年龄增长脸部特征发生变化,影响人脸识别的准确度。(2)图像质量和遮挡物的干扰:图像分辨率低或者人脸上的眼镜、化妆等导致识别率降低。(3)人脸的角度和光线的变化:人脸的不同角度包含的特征不一样,包括光线的强弱变化也都会影响人脸的检测效果。(4)隐私问题:由于人脸检测的非强制性和非接触性特点,被检测人往往在不知情的情况下,自己的人脸特征和个人信息就被第三方采集利用。
3.2 改善人脸检测技术的局限性的方法
3.2.1 样本处理
在样本采集之前,针对应用的场景不同,对样本的图像进行人工的筛选,确保筛选出的正、负样本的数量基本平衡,减少某一样本的错误率,同时采用合理方法,提升训练效果。
3.2.2 构建立体模型
人脸是一个三维的空间结构,利用相关算法将一个人不同角度的脸部图像合成为三维模型结构,通过对三维结构的比对可以较大程度地提高准确度。目前许多新的提取人脸特征的算法比以前的算法有了较大的优化,更加的科学合理,其中最突出的就是结合3D人脸信息的特征点提取技术。基于代数特征的识别方法是目前在实际应用中使用得最多的一类方法,其主要原因是由于代数特征矢量(即人脸图像在特征空间的投影结果)对角度、表情等因素都具有一定的稳定性[4]。
3.2.3 层次分析
如果将人脸图像的每一帧都进行细致的数据处理能够提高检测的准确度,但是却大大延长了检测时间,降低了检测效率,使其在检测速度方面失去作用。所以,对检测数据处理应分层次进行,首先确定人种、性别、年龄段等大致范围,再具体到五官特征,最后进行具体细节的比对分析,这样可以兼顾人脸检测的速度和准确度。
3.2.4 清除无关因素
人脸检测采集的人脸图像四周不可避免会出现检测对象所处环境等背景因素,在进行检测比对之前应首先消除这些因素的影响,将其忽略,这样则可以进一步提高检测速度。对于图像的预处理就是通过人工干预,提高采样和建立模型的效率,降低光照和姿态等对人脸检测的影响。
4 总结与展望
人脸检测技术的准确率和可靠性在某些领域暂时还达不到要求,現阶段的应用主要是利用机器的优势替代人做一些人脸检测方面的简单重复性工作,用以提高工作效率,降低劳动强度。
人脸检测不同于其他传统识别模式,人脸图像较为复杂,包含的层次信息丰富,数据维数高。目前人脸检测的算法很多,通过优化算法,在不减少提取的数据量的情况下提高检测速度,可以通过随机森林、深度学习的方法,不断提升其判断的准确率、容错性等。随着人工智能、机器学习、计算机视觉等软硬件技术的不断发展,人脸检测系统必将满足并且超过人类的需求,逐渐扩展到其他更多的应用领域,实现更大的社会价值和经济效益。
参考文献
[1]吴巾一,周德龙.人脸识别方法综述[J],计算机应用研究,2009,26(9):3205-3209.
[2]余孟杰.基于小波变换图像融合算法的人看检测[D].浙江工业大学,2009.
[3]徐晓艳.人脸识别技术综述[J].电子测试,2015,(5X):885-894.
[4]孔祥栋.基于肤色和AdaBoost算法人脸检测的研究[D].燕山大学,2010.