基于最优奇异值占比的融合特征人脸检测

2022-12-08贾澎涛雷文华

西安科技大学学报 2022年6期

贾澎涛，雷文华，张婧

（西安科技大学计算机科学与技术学院，陕西西安 710054）

0 引言

信息安全的重要性随着数字化时代的到来日益凸显。在信息安全领域，如何快速准确获取个人身份信息成为众多学者的研究重点。人脸识别作为生物特征识别技术的一种，因其生物自然性、非接触性等优势而被广泛应用。人脸识别的关键技术是人脸检测，人脸检测技术中使用的人脸图像是一种高维含噪数据，不利于提高人脸检测的速率和准确率。因此，如何有效去噪且保留有效信息的前提下实现图像降维压缩，从而快速准确的定位到人脸区域，是人脸检测研究领域急需攻克的关键技术难题[1-2]。

目前人脸图像降维方法主要有线性降维方法和非线性降维方法，线性降维方法相比非线性降维方法思路比较简单，时间复杂度较低，但是针对非线性关系的远距离点存在降维后失真问题。线性降维方法中的线性判别法（LDA）存在过度拟合数据的现象，主成分分析法（PCA）的特征维度含义不够清晰，忽略较小方差所包含的重要信息[3-4]。非线性降维方法中基于核函数的方法主要包含有核独立成分分析（KICA）从样本信号中提取同维数源信号，无法对含噪信息的样本信号进行去噪降维，基于核主成分分析方法（KPCA）采用非线性映射函数将数据从低维映射到高维空间，获取主元个数并计算非线性主成分[5-7]。非线性降维方法中基于特征值的方法有等距映射（ISOMAP）、局部线性嵌入（LLE）等，主要针对局部结构进行降维，通过局部估算全局，如果数据之间存在较小差异性，会导致特征结果不具备代表性[8-9]。综合来看，线性和非线性降维方法各有优缺点，适用于不同的场景需求。线性降维方法更适用于对人脸检测耗时有较高要求的应用场景。

奇异值分解（SVD）作为线性降维方法的一种，可降低图像数据维度并有效提取图像特征。早在1992年洪子泉、杨静宇采用SVD方法抽取图像特征，并提出图像奇异值可以作为图像的能量信息，其特征具有旋转不变性、比例不变性、稳定性等[10-12]。目前采用SVD对图像进行降维，首先拟定奇异值个数，根据奇异值个数对图像实现降维，奇异值个数k的选取存在很大的随机性，不能保证在保留有效特征的前提下，对人脸图像实现降维重构。因此，如何量化k值，针对不同的人脸图像自适应确定较优值，在较优压缩率和图像识别的准确率之间找准均衡点显得尤为重要。

基于降维预处理的图像，进行人脸图像检测。近年来主要用于人脸检测的方法有基于隐马尔可夫的检测方法、基于神经网络的检测方法[13-15]、基于小波变换的检测方法等[16]，这些方法所耗费的时间较长，空间复杂度较高。相比较而言，基于哈尔（Haar）和梯度方向直方图（HOG）特征的人脸检测方法较优。Haar特征最早是由VIOLA和JONE提出的，其检查速率较快[17]。HOG特征算法是由DALAL教授提出的，该方法的运行速率相比Haar较低，但检测率较高[18]。

为了有效提高人脸检测速率和准确率，笔者提出基于最优奇异值占比的融合特征人脸检测模型ProSVD-HH（Proportion Singular Values Decomposition-Haar HOG）。对人脸图像实现降维的基础上，根据人脸检测效果择优选取最优奇异值占比值，根据集成分类思想融合Haar和HOG特征人脸检测方法建立更高效人脸检测模型。

1 ProSVD-HH人脸检测方法

1.1 最优奇异值占比原理

SVD是线性代数中的一种高效的矩阵分解变换方法，可将任意类型的矩阵分解为左、右奇异矩阵和奇异值矩阵。奇异值分解描述如下[19-20]。

定义1：假设有一个m×n阶（m

（1）

式中U和V是一个正交实矩阵，奇异值矩阵∑m×n是一个对角阵，可表示为

∑m×n=diag[σ1,σ2,…,σm]

奇异值矩阵中，对角线上的元素σ称为矩阵A的奇异值[21-22]。

定义2：奇异值分解方法对图像进行特征提取，奇异值占比θ定义为k个奇异值之和与全部奇异值之和的比值。奇异值占比θ作为奇异值σ的函数，可表示如下。

（2）

例如：用于人脸检测的人脸图像如图1所示。

图1 人脸图像示例Fig.1 Face image samples

对图1（a）、图1（b）进行SVD图像分解处理后获取92个奇异值，图1（c）、图1（d）有250个奇异值。针对图1（a）展开深入分析，从92个奇异值中选取前27个奇异值对人脸图像实现降维重构，重构结果如图2所示，可以看出奇异值个数越多，重构人脸图像越高清。

图2 选取不同奇异值重构后的人脸图像Fig.2 Reconstructed face images with different singular values

在图1（a）中92个奇异值中前27个奇异值之和占总量的90%，可表示为

同理，在图1（b）中需32个奇异值，在图1（c）中需27个奇异值，在图1（d）中需30个奇异值。因此，选取相同的奇异值个数不能确保每幅图像表达足够的信息量，采用最优奇异值占比的概念进一步量化分解图像，实现更高效的降维重构。

定义3：设f（θ）为人脸检测率，检测率差ω定义为前i个与前i+1个奇异值占比下人脸检测结果的差值，检测率f（θ）和检测率差值ω的函数关系见式（3）。

ω=f（θi+1）-f（θi）=f（p（σi+1）-f（p（σi））,

（i=1,2,…,m）,ω≤ε

（3）

当检测率差值ε大于等于检测率差ω时，当前的奇异值占比θ值确定为最优奇异值占比值。

1.2 Haar和HOG方法

1.2.1 Haar方法

Haar特征检测方法主要反映出图像局部梯度变化的趋势，采用矩形特征对目标进行检测[23]。通过LIENHART等不断研究，矩形特征种类增加为16种，分为边缘特征、线性特征、中心特征3类[24]，如图3所示。

图3 Haar矩形特征集Fig.3 Haar rectangular feature set

基于Haar特征的人脸检测方法的主要任务是收集正负样本并训练分类器，分类器的分类效果取决于样本质量。可将包含有人脸的清晰图像作为正样本，无人脸的图像作为负样本。基于Haar特征检测方法检测速率较高，但检测准确率较低。

1.2.2 HOG方法

HOG特征检测方法主要获取图像局部的梯度方向和幅值，通过局部图像的梯度方向直方图特征对目标进行检测[25]。基于HOG特征的人脸检测方法主要思想是：将图像局部单元得到的梯度方向直方图数据串接起来组成一个Block的特征，再将全部Block串联起来组合为该图像的特征图，根据HOG特征图进行人脸检测。基于HOG检测方法的检测准确率较高，但检测速率较低。

1.3 融合Haar特征和HOG特征的人脸检测

为改进Haar和HOG特征人脸检测方法的性能，笔者提出ProSVD-HH人脸检测模型，模型结构如图4所示。该模型分为2部分：第1部分对人脸图像实现重构，采用最优奇异值占比方法对人脸图像进行降维、重构；第2部分实现更加高效的人脸检测，采用基于Haar和HOG特征的人脸检测方法的构建串行集成分类器，首先利用检测速率较快的Haar检测器进行人脸检测，若未检测成功，将调用检测准确率较高的基于HOG检测器实现加强型人脸检测，以此提高人脸检测的准确率。

图4 ProSVD-HH人脸检测模型Fig.4 Model of ProSVD-HH face detection

ProSVD-HH方法的人脸检测流程如图5所示。

图5 ProSVD-HH人脸检测流程Fig.5 Process of ProSVD-HH face detection

2 实验结果与分析

2.1 实验数据集

为验证ProSVD-HH方法的有效性，采用人脸库ORL（Olivetti Research Laboratory）作为实验数据集。该数据库是由英国剑桥大学提供，包含40个不同种族、性别、年龄的对象，每个人物对象包含不同角度、表情和姿态的10幅灰度图像，ORL数据集总大小为4 024 KB，包含有400幅灰度级为256的人脸图像，每幅图像像素大小为112×92，数据库部分人脸图像如图6所示。

图6 数据库的部分人脸图像Fig.6 Partial face images of the database

2.2 实验步骤

应用ProSVD-HH方法进行人脸检测的实验步骤有

1）人脸图像特征提取。在不同的奇异值占比下对人脸图像进行SVD分解，实现降维重构。

2）获取最优奇异值占比值θ。在不同的奇异值占比下，通过对比基于HOG，Haar特征人脸检测结果与设定的阈值检测率差ω获取最优值。

3）构建ProSVD-HH人脸检测模型。基于集成分类思想，融合2种人脸检测方法实现高效人脸检测，并验证ProSVD-HH方法的可靠性。

2.3 最优奇异值占比的确定

在不同奇异值占比下，基于Haar，HOG特征人脸检测方法的检测率见表1，根据实验结果可以得出奇异值占比越高人脸图像的压缩率越低，奇异值占比是影响人脸检测率的关键因素。基于2种人脸检测方法，检测率f（θ）与奇异值占比θ的对比结果如图7（a）所示，检测率差ω与奇异值占比θ的对比结果如图7（b）所示。

从图7（a）可以得出，人脸检测率随着奇异值占比的增大而增高；从图7（b）可以得出，随着奇异值占比提高，前后检测率差值明显降低。为获取最优奇异值占比，设定式（3）阈值ε为0.005，图7的标记处满足前后检测率差同时不大于阈值ε，综合考虑人脸检测率和空间复杂度，标记处表现较优，此处为最优奇异值占比值为98%。基于最优奇异值占比，ORL数据集的大小由4 024 KB缩小为865 KB，有效降低了人脸检测的空间复杂度。

表1 不同奇异值占比人脸检测结果分析

图7 人脸检测率和检测率差对比结果Fig.7 Comparison results of face detection rates and difference between face detection rates

2.4 不同方法的人脸检测结果与分析

采用不同的人脸检测方法，基于最优奇异值占比的人脸检测结果见表2，部分检测效果如图8所示。从表2可以看出，ProSVD-HH方法的检测准确率较高，相比于HOG特征、LBP特征和Haar特征的人脸检测方法提高了2%,17%和10%，相比基于CNN检测方法检测率降低了0.5%；根据检测耗时情况来看，基于CNN的人脸检测方法时间复杂度最高，ProSVD-HH方法相比HOG，CNN检测方法其检测速率分别提高了14.6%，99.2%。综合来看，ProSVD-HH方法人脸检测率较高的同时检测速率较快，取得了较好的人脸检测效果。