计算机视觉在人脸识别领域中的应用研究
2020-11-26蒋木奇
蒋木奇
恒银金融科技股份有限公司 天津 300380
1 计算机视觉的基本概念
计算机视觉(ComputerVision)是指使用计算机和相关设备对生物视觉建模。通过处理收集的图像和视频来获取相关信息,可以实现诸如对象识别,形状和方向确认以及运动识别等功能,以适应和理解外部环境并控制其自身的运动。简而言之,计算机视觉试图学习机器如何学习“看见”,这是机器上生物视觉的延伸。ComputerVision 集成了许多学科,例如计算机科学与工程,信号处理,物理学,应用数学和统计学,并包括许多技术,例如图像处理,模式识别,人工智能和信号处理。特别是通过深度学习,计算机视觉技术的性能取得了重大突破,已成为人工智能最重要的应用技术之一,是实现自动化和智能化的必要工具。计算机视觉技术继承自机器视觉和机器视觉(MachineVision)技术,但却又不完全一样,图像处理主要基于数字图像的基本属性(例如颜色,形状和大小)来处理图像;机器视觉使用机器视觉产品而非人眼来测量和评估目标形态信息;计算机视觉通常包括图像处理和其他功能,例如模式识别。与专注于精确几何测量计算的机器视觉相比,计算机视觉专注于感知和识别。
2 人脸识别算法与实验结果
2.1 人脸采集
摄像机镜头可捕获各种人脸图像,包括静止图像,动态图像,人脸表情等。图1 显示了摄像机捕获的人脸,该图像包含两个人脸,较小的面部图像会影响识别效果,而较大的面部图像会影响识别速度。图像分辨率越低,识别它的难度就越大。过度曝光或过低的照明环境会影响人脸识别的效果。相对于摄像机的脸部运动通常会导致脸部模糊,最好的图片是不受阻碍的人脸特征和清晰的脸部边缘图像[1]。
2.2 人脸识别的经典算法
人脸识别算法经历了三个发展阶段:早期算法,人工字符+分类器和深度学习。特征脸法是将一系列脸图像转换为一组对象向量的对象,这是初始训练图像集(称为特征脸法)的主要组成部分。在识别期间,将新图像投影到人脸的子空间中,并且基于子空间中投影点的位置和投影线的长度来做出决定。特征脸部使用基本成分分析(PCA)方法执行空间变换,以获取脸部部分的分布。主要成分将属性值分解为训练集中所有图像的协方差矩阵,以获得特征向量。向量的每个元素用于描述人脸之间的特征或记录变化,因此,特征向量的线性组合可用于表示不同空间。本地二进制模式(Local Binary Patterns,LBP)。在图像处理领域,使用局部二进制模式(LBP)来描述图像的纹理特征并提取局部元素作为标准,使用灰度化中心像素的值作为阈值并与其他空间进行比较,以确定相应的二进制值并获得用于表达局部纹理的特征,该算法可以大大降低光敏性。
2.3 人脸检测
人脸检测是指使用某些策略提取图像或视频流,首先确定图像或视频上是否有人脸。然后确定该人脸的位置,位置和大小。这个过程看起来很简单,实际上存在一个主要问题,因为目标是动态的,具有难以避免的变化,例如外观,人脸特征,不同的表情,发型或配饰等,并且外部条件的变化,比如说光线影响,设备的焦距,拍摄距离等,都会给实际的人脸检测造成干扰[2]。
2.4 人脸识别
人脸识别法的基本原理是使用Karhunen-Loev 变换将图像从多维矢量转换为低维矢量,消除了每个分量的相关性,从而简化了数据处理。该方法的优点是易于实施和快速,缺点是它会受光照,表情和位置等因素变化的影响,导致检测率低。一种基于几何特征的方法。此方法用于确定脸部主要特征器官(如嘴,鼻子,眼睛等)的位置和大小,并使用特征器官的几何分布比例和比例进行比较和识别。这种方法的优点是速度更快,并且可以克服光强度对识别速度的影响,缺点是识别速度不够高,可靠性不够高,一旦表情姿态略有变化,识别效果大大降低。基于深度学习的方法。由于机器学习的不断发展,特别是深度学习和大数据研究的结合,人脸识别取得了革命性的成果。深度学习方法在面部识别中的特定应用包括:基于卷积神经网络(CNN)的面部识别方法,用于区分面部形状的深度非线性方法,基于面部姿势可持续建模的深度学习;在狭窄空间内的全自动人脸识别;基于深度学习的视频监控下的人脸检测。其中,CNN 权重分布结构的结构更像是生物神经网络。该方法通过感知面部图像,总权重以及局部时空下采样来分析局部数据中包含的特征,从而优化了模型结构。基于机器的向量支持方法。支持向量法(SVM)基于统计理论,其研究方向是解决样本分类问题。此方法将图像转换为一个空间,然后将其分类为其他空间。目前,它被广泛用于人脸识别,该方法的优点是结构相对简单,可以实现全局优化。缺点是它类似于神经网络方法,后者对计算能力和存储空间有更高的要求,并且需要更多的时间进行训练[3]。
3 结语
通过以上描述,我们发现通过使用各种手段,可以有效识别人脸。但还存在一种基于重要特征点的弹性图比较方法,不仅可以减少光照,缩放比例和畸变对人脸识别的影响,而且可以提高人脸识别的速度和准确性。但使用此方法的场景相对简单,对于复杂的动态场景无法完成有效的人脸识别。