基于融合分层视觉感知的人脸局部特征识别
2022-08-22韩笑,韩剑
韩 笑,韩 剑
(桂林电子科技大学信息科技学院,广西 桂林 541004)
1 引言
随着计算机技术和人工智能技术的飞速普及,信息安全领域的解决方案也需要满足越来越高的要求。传统的身份鉴别方式大多借助外物或者身份标识知识等,这种依托外物或者自身记忆力的验证方式,一旦证明身份的标识物被丢失或者窃取,其身份中的信息安全将面临十分严重的威胁。现阶段不同类型的生物个体主要具有以下几方面的特征:①稳定性较强;②安全性较高等。所以人体生物特征识别明显优于传统的身份鉴别方式[1,2]。生物识别技术能够借助计算机等各种智能技术实现管理和监控等相关工作,为更好实现信息化、自动化管理奠定了坚实的基础。
在大量的身份鉴定技术中,人脸识别是目前使用范围比较广,且最符合人类区分不同个体的有效方式,大部分的人脸识别技术主要利用摄像机完成图像采集,为身份鉴别提供了全新的发展路径。国内外相关专家也针对人脸局部特征识别进行大量的研究,例如郭蓓等人[3]通过多尺度形状变化指数对人脸图像的关键点进行检测,同时提取直方图描述子,将各个子集中的描述子进行匹配;同时采用关键点提取协方差矩阵中的描述子,通过成功匹配的关键点数量对人脸进行匹配,获取最终的识别结果。余璟等人[4]优先对人脸图像中的旋转向量进行编码,将获取的局部旋度模式作为表情特征,通过ICNP算法和最小投影偏差算法对人脸不规则区域进行划分,同时将含有权重取值的旋度模式输入到分类器中,完成人脸识别。上述两种识别方法未能对人脸图像进行去噪处理,导致测试时间大幅度增加,识别率下降。
针对上述问题,提出一种融合分层视觉特征感知的人脸局部特征识别方法,仿真结果表明,所提方法能够有效提升识别率,同时还能够有效减少测试时间。
2 人脸局部特征识别方法
2.1 人脸图像去噪处理
小波变换是目前使用比较广泛的信号分析方法[5,6],主要优势为多分辨率分析,具有较强的信号表征能力。当信号经过小波变换后,能够通过小波系数进行描述,通过小波系数全面体现信号的不同性质。
(1)
如果f(x)∈L2(R)代表未进行分析的信号,设定a>0,则连续小波变换能够表示为
(2)
式中,WTf(a,b)代表连续小波变换。
(3)
当f(x,y)代表图像信号时,则说明二维小波变换分别沿着x和y方向采用不同的一维滤波器进行滤波处理,获取高低频子带图像。利用图1给出一层小波变换示意图。
图1 图像的一层小波变换示意图
小波包分析是在小波分析的基础上提出的,通过小波包能够更加精准且全面地描述图像的高频部分,同时还能够有效提升算法的信号分析能力。
随着尺度的不断增加,空间分辨率也会随之增加,但是频率分辨率则呈直线下降趋势。小波包的出现有效改善了正交小波变换中存在的不足。其中,小波包的去噪处理步骤如下所示[7,8]:
1)人脸图像的小波分解:
选取一个小波,设定L为分解层数,对人脸图像进行L层小波分解。
2)最佳小波包基的获取:
针对已经给定的熵标准进行最佳数计算,实现最佳小波基的获取。
3)阈值量化:
选取满足算法需求的阈值,结合阈值对图像各个层中的高频系数进行量化处理。
4)小波包重构:
通过小波分解对低高频系数进行小波重构,最终实现人脸图像去噪。
2.2 融合分层视觉特征感知的人脸局部特征识别
优先通过Adabost算法对经过去噪处理的人脸图像进行五官检测,其中Adabost模型的具体组成结构如图2所示。
图2 Adabost模型的组成结构
为了有效提取人脸局部特征[9,10],需要借助SITF算法和MTLBP算法实现。由于LBP算子中全部模式携带的信息重要程度完全不同,在一幅图像中只有少数模式代表的特征比较集中。当使用LBP算法进行图像纹理处理的过程中,需要将其它类划分到同一类中,对应的计算式为
(4)
对各个尺度下的人脸图像进行分析,同时确保认知是一致的,结合SIFT算法进行尺度空间的建立。通过视觉系统对物体进行识别和分析的过程中构建高斯尺度空间,当人脸图像通过高斯函数进行卷积操作后,会产生不同的模糊效果。人脸图像I(x,y)的尺度空间是通过卷积核进行卷积操作获取,具体的计算式如下
L(x,y,σ)=G(x,y,σ)*I(x,y)
(5)
式中,L(x,y,σ)代表空间尺度;G(x,y,σ)代表高斯函数,具体的表达形式为
(6)
式中,σ代表高斯正态分布的标准差取值,即尺度空间中的尺度因子。σ的取值越大,说明得到的人脸图像模糊程度越严重,同时图像的尺度因子也会增加,通过尺度因子能够更好地反映人脸图像的模糊程度。
建立尺度空间是为了实现不同尺度下的特征点检测,其中检测点性能比较好的算子为Δ2
(7)
式中,∂代表图像中全部检测点的数量。
通常情况下,可以通过DOG来近似估计LOG。其中,DOG定义能够表示为
(8)
式中,D(x,y,σ)代表高斯差分;k代表两个邻近尺度空间的比例因子。
根据已经建立完成的尺度空间,在多尺度下对人脸图像中的全部像素点进行比较和分析。在DOG中,需要将图像中的所有像素点和在同一尺度的邻近像素点进行对比分析,如果像素点小于或者大于相邻像素点,则说明该像素为人脸图像中的极值点。
当通过尺度空间完成人脸图像中各极值点检测后,需要为局部图像分配各个方位的关键点,同时结合SIFI,依据特征点的方向信息获取人脸图像旋转不变性的核心。
通过DOG金字塔确定图像中各个极值点的坐标位置,获取对应的尺度空间σ和尺度图像。对于样本图像L(x,y)而言,需要获取当尺度规模为σ时图像的梯度幅度m(x,y)和方向θ(x,y),具体计算过程如下所示
m(x,y)=
(9)
(10)
通过式(9)和式(10)能够获取人脸图像的梯度幅值和方向,主要通过前值获取图像中各个极值点的方向和幅值信息。同时,设定坐标系中的横坐标为人脸图像的梯度方向,而纵坐标设定为梯度方向的幅值累加和。
在上述操作的基础上,能够精准确定图像中各个关键点的坐标和方位信息。对关键点各个位置上优先设定的幅值和方向进行描述,整个过程就是描述子的形成过程。将各个关键点对应的方向、幅值信息和邻域内的像素点极值进行对比,使描述子中含有大量的人脸像素点信息。以下详细给出描述子的形成过程,如下所示:
1)将经过去噪处理的人脸图像进行旋转调整,使其能够保持旋转不变性,同时还能够将坐标轴旋转到对应的中心点。其中,人脸图像进行旋转的过程能够表示为
(11)
式中,θ代表原始人脸图像各轴和特征点方向之间的角度。
2)在经过旋转后的图像上,将特征点设定为中心,将全部图像区域进行统一化处理,将图像区域划分至对应的图像子区域中,利用各个子区域图像中像素点的方向进行梯度模值计算。同时绘制各个方位的梯度直方图,组建维数为128的SIFT特征向量。
当使用LBP算法进行人脸特征无差别提取时,首先针对图像各个分区内的像素进行遍历处理,同时对对应区域的频数直方图进行求解,即采用权重对人脸表情较为丰富的区域进行加强处理。为了有效避免特征提取过程中出现的外界干扰,将LBP算法和SIFT算法两者相结合进行人脸局部特征识别。以下给出详细的操作流程:
1)优先对人脸图像进行预处理,提取Harr特征值,将其输入到弱分类中进行训练,获取级联分类器,同时通过级联分类器对人脸图像中各个器官进行检测。
2)通过SIFT算法对人脸图像已经选定区域内的关键点进行检测,设定(x,y)代表关键点pi所在的坐标位置,通过计算pi能够得到人脸图像特征向量。
3)选取pi作为人脸图像的中心,获取规格为8×8的图像区域。
4)将SIFT和LBP中的特征向量进行加权组合,获取人脸图像中关键点和对应邻域区域内的特征向量。
最后,建立一个分层视觉特征感知模型,该模型分为初级、终极和高级视觉特征感知模型,各个分层模型中具体包括池化层、卷积层和全连接层,其中,运用Q表示卷积核的大小,o表示池化步长,g(x)表示激活函数,则分层视觉特征感知模型可以通过式(12)进行表示
(12)
式中,Di-1代表各层输出特征图的大小;Di代表各层感知模拟单元。
通过分层视觉特征感知模型对各个分层进行感知,根据感知结果实现人脸局部特征识别。
3 仿真研究
为了验证所提融合分层视觉特征感知的人脸局部特征识别方法的有效性,在FERET人脸数据库中选取部分样本作为测试对象,利用图3给出:
图3 测试图像
为了分析各个方法对人脸局部特征的识别效果,优先对图3中的6个人脸局部特征进行识别,具体识别结果如图4所示:
图4 不同方法的人脸局部特征识别结果
分析图4中的实验数据可知,所提方法能够准确识别人脸局部特征,但是文献[3]方法和文献[4]方法只能够识别人脸中的部分特征,甚至还有些特征无法识别,充分证明了所提方法的优越性。
以下给出14次实验测试各个方法的识别率和测试时间变化情况,具体实验结果如图5和表1所示。
图5 不同方法的识别率对比结果
表1 不同方法的测试时间对比结果
对图5和表1中的实验数据进行分析可知,文献[3]方法和文献[4]方法的识别率明显低于所提方法,同时测试时间高于所提方法。由此可见,所提方法能够以较快的速度和较高的识别率完成识别。
为了更进一步验证所提方法的性能,以下实验测试对比各个方法在表情库和姿态库的平均识别率变化结果,如图6所示。
图6 不同方法在表情库和姿态库的平均识别率变化情况
分析图6中的实验数据可知,不论是在表情库还是在姿态库,另外两种方法的平均识别率都明显低于所提方法。由于所提方法在人脸局部特征识别的过程中加入了去噪环节,有效滤除图像中的噪声,促使整个方法在表情和姿态方面都能够获取比较理想的识别结果。
4 结束语
为了有效弥足现有人脸局部特征识别方法存在的不足,提出一种融合分层视觉特征感知的人脸局部特征识别方法。测试结果表明,所提方法能够全面提升人脸局部特征识别率,同时还能够有效减少测试时间,在表情和姿态库均能够获取理想的识别结果。