基于最优奇异值占比的融合特征人脸检测
2022-12-08贾澎涛雷文华
贾澎涛,雷文华,张 婧
(西安科技大学 计算机科学与技术学院,陕西 西安 710054)
0 引 言
信息安全的重要性随着数字化时代的到来日益凸显。在信息安全领域,如何快速准确获取个人身份信息成为众多学者的研究重点。人脸识别作为生物特征识别技术的一种,因其生物自然性、非接触性等优势而被广泛应用。人脸识别的关键技术是人脸检测,人脸检测技术中使用的人脸图像是一种高维含噪数据,不利于提高人脸检测的速率和准确率。因此,如何有效去噪且保留有效信息的前提下实现图像降维压缩,从而快速准确的定位到人脸区域,是人脸检测研究领域急需攻克的关键技术难题[1-2]。
目前人脸图像降维方法主要有线性降维方法和非线性降维方法,线性降维方法相比非线性降维方法思路比较简单,时间复杂度较低,但是针对非线性关系的远距离点存在降维后失真问题。线性降维方法中的线性判别法(LDA)存在过度拟合数据的现象,主成分分析法(PCA)的特征维度含义不够清晰,忽略较小方差所包含的重要信息[3-4]。非线性降维方法中基于核函数的方法主要包含有核独立成分分析(KICA)从样本信号中提取同维数源信号,无法对含噪信息的样本信号进行去噪降维,基于核主成分分析方法(KPCA)采用非线性映射函数将数据从低维映射到高维空间,获取主元个数并计算非线性主成分[5-7]。非线性降维方法中基于特征值的方法有等距映射(ISOMAP)、局部线性嵌入(LLE)等,主要针对局部结构进行降维,通过局部估算全局,如果数据之间存在较小差异性,会导致特征结果不具备代表性[8-9]。综合来看,线性和非线性降维方法各有优缺点,适用于不同的场景需求。线性降维方法更适用于对人脸检测耗时有较高要求的应用场景。
奇异值分解(SVD)作为线性降维方法的一种,可降低图像数据维度并有效提取图像特征。早在1992年洪子泉、杨静宇采用SVD方法抽取图像特征,并提出图像奇异值可以作为图像的能量信息,其特征具有旋转不变性、比例不变性、稳定性等[10-12]。目前采用SVD对图像进行降维,首先拟定奇异值个数,根据奇异值个数对图像实现降维,奇异值个数k的选取存在很大的随机性,不能保证在保留有效特征的前提下,对人脸图像实现降维重构。因此,如何量化k值,针对不同的人脸图像自适应确定较优值,在较优压缩率和图像识别的准确率之间找准均衡点显得尤为重要。
基于降维预处理的图像,进行人脸图像检测。近年来主要用于人脸检测的方法有基于隐马尔可夫的检测方法、基于神经网络的检测方法[13-15]、基于小波变换的检测方法等[16],这些方法所耗费的时间较长,空间复杂度较高。相比较而言,基于哈尔(Haar)和梯度方向直方图(HOG)特征的人脸检测方法较优。Haar特征最早是由VIOLA和JONE提出的,其检查速率较快[17]。HOG特征算法是由DALAL教授提出的,该方法的运行速率相比Haar较低,但检测率较高[18]。
为了有效提高人脸检测速率和准确率,笔者提出基于最优奇异值占比的融合特征人脸检测模型ProSVD-HH(Proportion Singular Values Decomposition-Haar HOG)。对人脸图像实现降维的基础上,根据人脸检测效果择优选取最优奇异值占比值,根据集成分类思想融合Haar和HOG特征人脸检测方法建立更高效人脸检测模型。
1 ProSVD-HH人脸检测方法
1.1 最优奇异值占比原理
SVD是线性代数中的一种高效的矩阵分解变换方法,可将任意类型的矩阵分解为左、右奇异矩阵和奇异值矩阵。奇异值分解描述如下[19-20]。
定义1:假设有一个m×n阶(m (1) 式中U和V是一个正交实矩阵,奇异值矩阵∑m×n是一个对角阵,可表示为 ∑m×n=diag[σ1,σ2,…,σm] 奇异值矩阵中,对角线上的元素σ称为矩阵A的奇异值[21-22]。 定义2:奇异值分解方法对图像进行特征提取,奇异值占比θ定义为k个奇异值之和与全部奇异值之和的比值。奇异值占比θ作为奇异值σ的函数,可表示如下。 (2) 例如:用于人脸检测的人脸图像如图1所示。 图1 人脸图像示例Fig.1 Face image samples 对图1(a)、图1(b)进行SVD图像分解处理后获取92个奇异值,图1(c)、图1(d)有250个奇异值。针对图1(a)展开深入分析,从92个奇异值中选取前27个奇异值对人脸图像实现降维重构,重构结果如图2所示,可以看出奇异值个数越多,重构人脸图像越高清。 图2 选取不同奇异值重构后的人脸图像Fig.2 Reconstructed face images with different singular values 在图1(a)中92个奇异值中前27个奇异值之和占总量的90%,可表示为 同理,在图1(b)中需32个奇异值,在图1(c)中需27个奇异值,在图1(d)中需30个奇异值。因此,选取相同的奇异值个数不能确保每幅图像表达足够的信息量,采用最优奇异值占比的概念进一步量化分解图像,实现更高效的降维重构。 定义3:设f(θ)为人脸检测率,检测率差ω定义为前i个与前i+1个奇异值占比下人脸检测结果的差值,检测率f(θ)和检测率差值ω的函数关系见式(3)。 ω=f(θi+1)-f(θi)=f(p(σi+1)-f(p(σi)), (i=1,2,…,m),ω≤ε (3) 当检测率差值ε大于等于检测率差ω时,当前的奇异值占比θ值确定为最优奇异值占比值。 1.2.1 Haar方法 Haar特征检测方法主要反映出图像局部梯度变化的趋势,采用矩形特征对目标进行检测[23]。通过LIENHART等不断研究,矩形特征种类增加为16种,分为边缘特征、线性特征、中心特征3类[24],如图3所示。 图3 Haar矩形特征集Fig.3 Haar rectangular feature set 基于Haar特征的人脸检测方法的主要任务是收集正负样本并训练分类器,分类器的分类效果取决于样本质量。可将包含有人脸的清晰图像作为正样本,无人脸的图像作为负样本。基于Haar特征检测方法检测速率较高,但检测准确率较低。 1.2.2 HOG方法 HOG特征检测方法主要获取图像局部的梯度方向和幅值,通过局部图像的梯度方向直方图特征对目标进行检测[25]。基于HOG特征的人脸检测方法主要思想是:将图像局部单元得到的梯度方向直方图数据串接起来组成一个Block的特征,再将全部Block串联起来组合为该图像的特征图,根据HOG特征图进行人脸检测。基于HOG检测方法的检测准确率较高,但检测速率较低。 为改进Haar和HOG特征人脸检测方法的性能,笔者提出ProSVD-HH人脸检测模型,模型结构如图4所示。该模型分为2部分:第1部分对人脸图像实现重构,采用最优奇异值占比方法对人脸图像进行降维、重构;第2部分实现更加高效的人脸检测,采用基于Haar和HOG特征的人脸检测方法的构建串行集成分类器,首先利用检测速率较快的Haar检测器进行人脸检测,若未检测成功,将调用检测准确率较高的基于HOG检测器实现加强型人脸检测,以此提高人脸检测的准确率。 图4 ProSVD-HH人脸检测模型Fig.4 Model of ProSVD-HH face detection ProSVD-HH方法的人脸检测流程如图5所示。 图5 ProSVD-HH人脸检测流程Fig.5 Process of ProSVD-HH face detection 为验证ProSVD-HH方法的有效性,采用人脸库ORL(Olivetti Research Laboratory)作为实验数据集。该数据库是由英国剑桥大学提供,包含40个不同种族、性别、年龄的对象,每个人物对象包含不同角度、表情和姿态的10幅灰度图像,ORL数据集总大小为4 024 KB,包含有400幅灰度级为256的人脸图像,每幅图像像素大小为112×92,数据库部分人脸图像如图6所示。 图6 数据库的部分人脸图像Fig.6 Partial face images of the database 应用ProSVD-HH方法进行人脸检测的实验步骤有 1)人脸图像特征提取。在不同的奇异值占比下对人脸图像进行SVD分解,实现降维重构。 2)获取最优奇异值占比值θ。在不同的奇异值占比下,通过对比基于HOG,Haar特征人脸检测结果与设定的阈值检测率差ω获取最优值。 3)构建ProSVD-HH人脸检测模型。基于集成分类思想,融合2种人脸检测方法实现高效人脸检测,并验证ProSVD-HH方法的可靠性。 在不同奇异值占比下,基于Haar,HOG特征人脸检测方法的检测率见表1,根据实验结果可以得出奇异值占比越高人脸图像的压缩率越低,奇异值占比是影响人脸检测率的关键因素。基于2种人脸检测方法,检测率f(θ)与奇异值占比θ的对比结果如图7(a)所示,检测率差ω与奇异值占比θ的对比结果如图7(b)所示。 从图7(a)可以得出,人脸检测率随着奇异值占比的增大而增高;从图7(b)可以得出,随着奇异值占比提高,前后检测率差值明显降低。为获取最优奇异值占比,设定式(3)阈值ε为0.005,图7的标记处满足前后检测率差同时不大于阈值ε,综合考虑人脸检测率和空间复杂度,标记处表现较优,此处为最优奇异值占比值为98%。基于最优奇异值占比,ORL数据集的大小由4 024 KB缩小为865 KB,有效降低了人脸检测的空间复杂度。 表1 不同奇异值占比人脸检测结果分析 图7 人脸检测率和检测率差对比结果Fig.7 Comparison results of face detection rates and difference between face detection rates 采用不同的人脸检测方法,基于最优奇异值占比的人脸检测结果见表2,部分检测效果如图8所示。从表2可以看出,ProSVD-HH方法的检测准确率较高,相比于HOG特征、LBP特征和Haar特征的人脸检测方法提高了2%,17%和10%,相比基于CNN检测方法检测率降低了0.5%;根据检测耗时情况来看,基于CNN的人脸检测方法时间复杂度最高,ProSVD-HH方法相比HOG,CNN检测方法其检测速率分别提高了14.6%,99.2%。综合来看,ProSVD-HH方法人脸检测率较高的同时检测速率较快,取得了较好的人脸检测效果。 表2 人脸检测率和耗时实验结果 图8 不同方法的部分检测结果Fig.8 Partial test results of different methods 1)提出最优奇异值占比的概念,基于最优奇异值占比对人脸图像进行重构,有效降低人脸检测的空间复杂度。 2)基于集成分类的思想,综合Haar和HOG算法的优势,提出了融合Haar和HOG特征的人脸检测模型(ProSVD-HH)。对比其他检测方法,ProSVD-HH在检测率较高的同时耗时较短,取得较好的人脸检测效果。 3)ProSVD-HH人脸检测效果较好,但检测速率还有待进一步提升。下一步的研究重点是在此基础上,构建高性能的人脸识别模型,有效提高算法的运行效率。1.2 Haar和HOG方法
1.3 融合Haar特征和HOG特征的人脸检测
2 实验结果与分析
2.1 实验数据集
2.2 实验步骤
2.3 最优奇异值占比的确定
2.4 不同方法的人脸检测结果与分析
3 结 论