人脸识别领域技术综述
2020-11-26崔茜国家知识产权局专利局专利审查协作天津中心
崔茜 国家知识产权局专利局专利审查协作天津中心
1 人脸识别技术发展历史及现状
计算机人脸识别的研究可以追溯到20 世纪70 年代,但是由于当时技术条件的限制,直到90 年代才正式发展起来。在国家的大力支持下,我国的人脸识别技术取得了很大的进展,如清华大学、中科院自动化所等自主研究的人脸识别技术已达到了国际先进水平。
目前,国内外对人脸识别领域技术的研究已经基本饱和,特征空间维数灾难带来的计算量大,存储需求高和冗余数据过多导致耗时等问题一直难以突破。因此,人脸识别技术遇到了瓶颈。
2 人脸识别算法概述
2.1 基于几何特征的识别方法
基于几何特征的人脸识别方法其思想主要是根据人脸已有的特殊几何构造,即人的面部五官特征,按照一定的顺序记录面部特征点,并建立特征点之间的边界连线,根据已有的先验知识,将提取到的人脸特征点与样本特征向量进行比对,从而得到比对结果。比较典型的算法包括AAM 和ASM。
2.2 基于神经网络的识别方法
人工神经网络是模仿动物神经网络行为的一种算法模型,其通过建立不同的隐层以及层次之间的运算关系构造出模拟动物的认知过程。将提取到的人脸图像的特征输入到训练好的神经网络中,输出匹配结果,该算法本身的难点和重点在于图像特征的提取以及网络中的层次构建。目前比较常用的有卷积神经网络(CNN)、深度学习、循环神经网络(RNN)。
2.3 基于特征脸的识别方法
人脸识别中还存在三大经典算法:LDA、PCA、LBP,其中LBP考虑的是局部特征,而另两种考虑的是全局特征。上述三种经典的算法目前更多的是用作人脸特征提取算法,将提取到的人脸特征通过其他的识别算法进行识别,从而达到识别的目的。
2.4 基于稀疏表示的识别方法
稀疏表示的概念来自于压缩感知理论,其在人脸识别被广泛应用。采用稀疏表示的方法识别人脸图像,其随机提取出的特征会包含更多的信息。稀疏脸针对噪声的鲁棒性相当强,即使有80%的人脸被随机噪声干扰,仍然能够得到很高的识别率。另外,针对于面部有遮挡的图像来说,稀疏表示的识别方法也能够保持较高的识别率,这两点也是任何传统人脸识别方法所达不到的。
3 面临的挑战和困难
3.1 图像采集条件
人脸识别率受到多种因素的影响,其中采集条件至关重要。例如,当采集到的图像受光照影响时,雨天、雾天采集到的图像会产生模糊,面部遮挡或者姿势改变等因素都会影响识别率。
针对上述问题,目前比较常见的改进方法包括限制采集条件,增加图像去燥等图像预处理过程,针对未遮挡的人脸区域或特征进行识别等。
3.2 识别算法
目前已有的具有较高识别率的算法基本都是建立在数学模型的基础上,通过将二维的人脸图像转换为计算机能够计算的数学矩阵的形式进行处理。但是由于算法本身的局限性和图像转换过程中带来的维数灾难,导致人脸识别运算过程缓慢,处理效果不佳,因此,如何兼顾计算效率和计算准确性是目前仍待解决的问题。
对于一幅N*N 的人脸图像来说,其转换为矩阵的列向量的形式后有N*N*1 维,若训练图像有M 个,那么矩阵的向量维数为N*N*M,即图像的维数与其图像的大小和训练图像数量有关。若再采用例如Gabor 小波等图像处理方法提取不同尺度的人脸图像特征,其维数将会成几何倍数增长,由此产生大量的计算量。而目前通常采用主成分分析(PCA)的方法进行降维,但是为了保证人脸的重要数据不丢失,其保留的维度也不能够太少,因此对于计算量的改进并无太大的效果。
3.3 人脸采集维度
目前的人脸面部特征多数是二维特征,即对图像的处理。由于人脸本身是三维特征,其在二维空间内会丢失掉一部分重要信息,带来了识别效果不佳的问题。但是三维特征本身又会带来一定的高维问题,因此,三维人脸是否能够逐渐取代二维人脸也是需要持续关注的问题。
3.4 硬件条件局限
几年来,虽然人脸识别率越来越高,但是却面临无芯片可用的困境。深度学习技术应用到人脸识别之后,逐渐解决了算法层面识别不准确的问题。但是经过几年的实践后发现,深度学习算法的处理芯片才是目前最主要的算力问题。由于没有专门的深度学习芯片,只能够从已有的CPU 、GPU、DSP、FPGA 等着手,但是不论是上述哪种芯片,都无法完全支撑先进的算法。因此,算法如何与芯片结合,从而推出符合需求的人脸识别芯片产品也是行业重点关注的方面。
4 .结语
人脸识别技术经过多年的发展已经成为生活中的不可或缺的一部分,其被广泛应用在各个领域,但是现阶段的人脸识别技术仍存在一定的挑战,相信会有越来越多的更新、更快、更准确的识别算法和对应的硬件逐渐被开发,使该技术更加完善。