APP下载

双重降维HOG结合SVM的快速手指静脉识别

2022-04-08褚洪佳陈光化汪凯旋

红外技术 2022年3期
关键词:降维区间准确率

褚洪佳,陈光化,2,汪凯旋

双重降维HOG结合SVM的快速手指静脉识别

褚洪佳1,陈光化1,2,汪凯旋1

(1. 上海大学 微电子研究与开发中心,上海 200444;2. 上海大学机电工程与自动化学院,上海 200444)

为减少手指静脉识别时间,提出一种双重降维方向梯度直方图特征(Histogram of Oriented Gradient,HOG)结合支持向量机(Support Vector Machine,SVM)分类的手指静脉识别方法。针对传统HOG算法特征维数高的问题,首先通过Fisher准则衡量梯度方向区间HOG特征的分类能力,然后使用序列前向选择法挑选出分类能力较优异的梯度方向区间构建部分方向区间HOG特征,最后使用主成分分析(Principal Component Analysis,PCA)降维。在公开的手指静脉数据库FV-USM和THU-FV上使用SVM多分类器进行分类识别,实验结果表明:双重降维HOG方法相较于HOG+PCA方法提取的特征维数降低了40%,识别时间减少了29.85%,识别准确率分别为99.17%和100%,等误率分别为1.07%和0.01%。

手指静脉识别;方向梯度直方图;特征选择;主成分分析;支持向量机

0 引言

手指静脉识别技术使用手指内部的静脉作为特征信息,使用近红外光作为光源进行图像采集,相比于传统的人脸识别和指纹识别方式,具有活体性、高稳定性和高安全性,在银行、监狱以及老年医疗等场合有着极大的优势。近年来手指静脉识别技术成为生物特征识别领域的研究热点。

现有对手指静脉识别的研究方法中,常采用基于纹路拓扑结构的模板匹配方法[1-2],首先从手指静脉图像中分割出静脉拓扑结构作为特征信息,然后计算模板间的Hausdorff距离进行匹配识别。但是此方法鲁棒性较差,识别准确率容易受光照和图像背景噪声等因素的影响。除了基于纹路拓扑结构的模板匹配方法外,还有神经网络方法[3-4]和局部特征描述方法[5-6]。基于神经网络的方法,无需对手指静脉进行特征提取[7],可以根据已有的数据集学习到有价值的信息特征,然后对待识别手指静脉图像进行识别。但是神经网络方法对数据集的数据量要求比较高,当训练数据集的数据量较少时,所训练的网络识别效果欠佳。局部特征描述方法主要包括局部二值模式[8](Local Binary Pattern,LBP)和方向梯度直方图[9](histogram of oriented gradient,HOG),此类方法使用局部特征描述算子对手指静脉特征进行编码获得图像特征,然后使用支持向量机[10](support vector machines,SVM)、线性判别分析[11](linear discriminant analysis,LDA)、adaboost[12]等方法进行分类识别。文献[8]使用改进LBP描述符提取手指静脉特征,时间远高于HOG方法。虽然HOG特征提取时间开销少,但是采用部分区域重叠的方法逐区域进行特征提取[13]使得特征的维度非常高,导致后续特征识别过程的计算复杂度高,增加了识别过程的时间开销。文献[14]引入Harr积分图简化HOG计算过程,减少了特征提取时间,但没有解决HOG特征维数高的问题。文献[9]使用主成分分析(Principal Component Analysis,PCA)算法对手指静脉HOG特征降维后进行分类,特征识别时间有明显改善。但是PCA针对全局HOG特征进行降维,降维准则是保留对方差贡献度大的特征,未考虑局部的HOG特性,存在降维不充分的问题。

鉴于上述分析,本文提出一种双重降维HOG特征结合SVM分类的手指静脉识别模型,模型的总体结构如图1所示。首先,使用Sobel边缘检测算法提取手指静脉图像的感兴趣区(region of interest,ROI)。其次,使用序列前向选择法挑选出识别能力较优异的梯度方向区间构建部分方向区间HOG特征,并使用PCA降维输出PCA子空间模型。然后,使用SVM对降维后的特征训练输出SVM分类模型。最后,使用训练过程输出的PCA子空间模型和SVM分类模型识别待识别图像。

1 双重降维HOG手指静脉特征提取

1.1 ROI提取

静脉中的血红蛋白对近红外光的吸收能力较强,通常使用近红外光作为光源来采集手指静脉图像。采集到的手指静脉图像进行预处理,定位手指静脉图像感兴趣区,去除背景区域,有利于后续进行特征提取。本文使用Sobel边缘检测算法定位手指边缘,利用手指边缘信息和手指指节信息提取感兴趣区域,最后将感兴趣区尺寸标准化,过程如图2所示。

图1 手指静脉识别总体结构图

图2 手指静脉图像预处理过程

Sobel边缘检测算法使用区域模板与图像进行卷积得到图像在两个方向上的梯度GG,然后对两个方向上的梯度求模得到梯度幅值,通过梯度幅值与预设的阈值进行比较来确定图像的边缘。使用图3中模板计算的过程如式(1)、(2)、(3)。

G=(13+223+33)-(11+221+31) (1)

G=(11+212+13)-(31+232+33) (2)

1.2 部分方向区间HOG特征

HOG特征是一种基于图像局部梯度信息统计的特征描述符,其理论依据是一幅图像中的局部形状和边缘特征能够被梯度方向和梯度幅值所描述。

使用图4所示Sobel模板对图像做卷积运算,计算像素点水平方向和垂直方向的梯度幅值GG,根据两个方向上的梯度计算像素点的梯度幅值和梯度方向

将梯度方向范围均匀分成9个方向区间,每个方向区间对应cell直方图的一个特征维度,根据像素点的梯度信息将其投影至直方图的对应特征维度中,投影权重为像素点的梯度幅值。按照cell、block和图像三者间的构成关系,分别将所有cell中相同的方向区间特征进行串联,得到9个单方向区间HOG特征向量。

以Fisher准则作为衡量标准,将9个单方向区间HOG特征向量按照Fisher值从大到小排列。Fisher准则寻求一个最优子空间使样本类间散度尽量大,类内散度尽量小,二者比值越大说明分类能力越强。Fisher计算公式如式(5)所示:

式中:tr(·)是矩阵迹运算;是样本进行线性变换的子空间;b是样本的总类间散度;w是样本的总类内散度。总类间散度和总类内散度的计算方法如式(6)和式(7)所示:

使用序列前向选择法选择单方向区间HOG特征向量中的个构建部分方向区间HOG特征向量。序列前向选择法流程如图5所示,依次增加排序后的单方向区间HOG特征的数目,直到分类准确率满足要求。

1.3 PCA降维

PCA把原始的维特征映射到维空间上,映射后的维是在原有维特征的基础上构建出的全新的正交特征,在降低数据集维数的同时保留了对数据集的方差贡献度最大的特征。

根据公式(8)计算手指静脉样本库的部分方向HOG特征向量的协方差矩阵。求取协方差矩阵的特征值=(1,2, …,)及其对应的特征向量=(1,2, …,v),并根据特征值降序排列特征向量。

式中:m为样本数量;X为样本特征向量;为样本均值。

根据公式(9)计算协方差矩阵特征值的累计贡献率,贡献率取值通常取85%~99%之间,根据贡献率取值要求选择前个较大的特征值所对应的特征向量V=(1,2, …,v)作为主成分分析的特征子空间的投影矩阵pca=(1,2, …,v)。最后将输入数据投影至子空间。

2 基于SVM的手指静脉识别

支持向量机通过寻找一个超平面把两类样本完全分开并且两类间的几何间隔最大。设超平面的方程式为:·+=0,则可以把·+>0的数据归为1类,把·+<0的数据归为-1类。支持向量机求解超平面问题可以表示为式(10)所示的约束最优化问题:

式中:惩罚因子和松弛变量用于对目标函数和约束条件进行修正。引入拉格朗日乘子,超平面参数和可以使用对偶问题的解来确定,由此可以得到支持向量机的最优分类函数:

式中:为核函数,用于解决非线性分类问题,常用的核函数有线性核函数(Linear Kernel)、多项式核函数(polynomial kernel)、径向基核函数(RBF kernel)和sigmoid核函数(sigmoid kernel)。在训练集对4种核函数进行测试,相关指标如表1所示,线性核函数训练的支持向量数量少于其他3种,识别准确率最高。此外线性核函数复杂度较低,故本文设计分类器使用线性核函数。

表1 核函数分类训练数据

基于线性核函数的支持向量机还需要确定惩罚因子来获取更好的识别性能。使用倍增的惩罚因子2-4, 2-3, 2-2, 2-1, 20, 21, 22, 23, 24进行测试,分类器识别准确率如图6所示,在惩罚因子为4时识别准确率达到最高,因此选用=4作为支持向量机的惩罚因子。

图6 惩罚因子与准确率关系图

实际应用中,手指静脉识别过程为多分类问题,基本的二分类SVM模型无法满足实际需求。本文对任意两类手指静脉都训练一个二分类SVM模型,并根据决策函数确定二分类SVM的分类结果。最后,对所有的二分类SVM模型的分类结果进行投票表决,得票数最多的分类结果即为多分类SVM的分类结果。图7所示为基于二分类SVM的四分类器,其中SVM[,]为使用第类和第类样本训练的二分类器。

3 实验与分析

本文使用的计算机配置为8.0G内存和1.6GHz主频CPU,实验平台为Matlab2018a,使用的数据集为马来西亚理工大学的FV-USM手指静脉数据库和清华大学的THU-FV手指静脉数据库。FV-USM数据库中共有492个分类,每个分类在两个阶段共采集12张图像。THU-FV数据库中共有610个分类,每个分类采集8张图像。本文实验将每个分类中的前4张图像作为训练样本,其余作为测试样本,所有图像尺寸标准化为128×64像素。

图7 基于SVM的四分类器

3.1 方向区间数目的确定

为确定部分方向区间HOG特征中包含的方向区间数目,本文使用FV-USM数据集中的手指静脉图像进行实验,得到方向区间数目与手指静脉识别准确率的关系如图8所示。从图中可知,选择前3个方向区间时的识别准确率为98.83%,十分接近包含9个方向区间的传统HOG的识别准确率99.02%,选择前4个方向区间的识别准确率首次取得最大值99.17%。继续增加方向区间数目,识别准确率非但没有增加,反而在某些组合情况下出现轻微下降。原因在于不同的方向区间HOG特征向量之间存在相关性,后续增加的特征没有提供新的更具区分能力的信息,反而可能引入噪声信息,导致识别准确率降低。综上所述,后续实验中部分方向区间HOG特征包含的方向区间数目确定为4。

图8 方向区间数目与识别准确率关系图

3.2 时间开销分析

为评估本文提出的双重降维HOG特征提取方法,将其与经典的局部特征算法LBP和HOG以及HOG+PCA方法在FV-USM数据库上进行实验,结果如表2所示。LBP算法的特征提取时间远高于HOG算法的提取时间,原因在于LBP算法对于每个像素点要与周围的8个像素点进行比较后进行编码和直方图统计,计算量大。本文提出的双重降维HOG方法的特征提取时间开销略高于传统HOG算法,与HOG+PCA方法基本持平,原因在于本文提出的双重降维HOG特征没有改变HOG算法的编码原理,增加的仅是特征降维的过程。在识别时间方面,可以发现支持向量机识别时间与特征维数呈正相关关系,本文提出的双重降维HOG方法提取的特征维数最少,相比于传统HOG+PCA算法特征维数降低了40%,特征识别时间减少了29.85%。

表2 时间开销比较

3.3 识别性能分析

准确率(Accuracy)和等误率(equal error rate,EER)是手指静脉识别研究中常用的性能指标。准确率是测试时正确识别次数所占的比率,表示模型对当前数据集的适用程度。等误率是拒识率(false rejection rate,FRR)和误识率(false accept rate,FAR)近似相等时的拒识率或误识率,等误率的数值越小,说明识别效果越好。

为评估本文提出的手指静脉识别模型,将提出的算法模型与其他方法在FV-USM和THU-FV数据库上进行测试,数据如表3所示,图9为根据FV-USM数据库的测试结果绘制的使用接受者操作特性(receive operating characteristic,ROC)曲线图。从实验数据中可以看出,本文提出的方法在两个数据库上都取得了最优的准确率和等误率,原因在于:在特征构建过程中,依据Fisher准则选择特征,使样本类内散度尽量小,类间散度尽量大;使用PCA保留对样本方差贡献度大的特征。表3中最后4组数据将欧式距离计算相似度的识别方法和SVM分类的识别方法进行对比,结果显示使用SVM分类可以获取更好的识别性能,原因在于SVM通过核函数将线性不可分的数据映射到高维空间进行求解,并通过改变惩罚因子的值来寻求更优的分类能力。

表3 不同方法实验数据比较

图9 ROC曲线图(FV-USM数据库)

实验中各种方法在THU-FV数据库的实验数据优于FV-USM数据库的数据,是因为THU-FV数据库中的手指静脉图像质量高并且来自同一手指的不同图像间的差异极小,而FV-USM数据库的图像较为模糊,静脉纹路不明显,具体图像如图10所示。此外最大曲率+MHD方法和宽线检测+LTS-HD方法都是基于静脉纹路分割的手指静脉识别方法,由于FV-USM数据库中静脉纹路比较模糊不易分割出完整的静脉纹路拓扑,导致算法的识别准确率和等误率数据较差。

图10 不同数据库手指静脉图像

4 结语

本文提出一种双重降维HOG特征结合SVM分类的手指静脉识别模型。依据Fisher准则衡量各梯度方向区间的分类能力,并使用序列前向选择法挑选出分类能力强的梯度方向区间的组合构建部分方向区间HOG特征,实现HOG特征的第一次降维。对部分方向HOG特征使用PCA降维,实现HOG特征的第二次降维。基于二分类SVM构建多分类器用于所提取特征的分类识别。在公开的手指静脉数据库FV-USM和THU-FV上进行实验的结果表明:本文提出的双重降维HOG特征方法能够有效降低特征维数,使用SVM分类识别的时间有明显改善,并且获得了较高的识别准确率和较低的等误率,能够实现手指静脉的精准识别。

[1] YANG L, YANG G P, YIN Y L, et al. Finger vein recognition with anatomy structure analysis[J]., 2018, 28(8): 1892-1905.

[2] CHEN G H, DAI QH, TANG X, et al. An improved least trimmed square hausdorff distance finger vein recognition[C]//, 2018: 939-943.

[3] LI S Y, ZHANG H G, YANG JF. Finger vein recognition based on local graph structural coding and CNN[C]//, 2019, 11069: 110693I-110693I-8.

[4] ZHANG Y K, LI W J, ZHANG L P, et al. Adaptive Gabor convolutional neural networks for finger-vein recognition[C]//(Hpbd&Is), 2019: 219-222.

[5] LIU H Y, YANG L, YANG G P, et al. Discriminative binary descriptor for finger vein recognition[J]., 2018, 6: 5795-5804.

[6] WANG X, WANG H B, HE Y, et al. Novel Algorithm for finger vein recognition based on inception-Resnet module[J]., 2019, 11179: 111791D-111791D-9.

[7] 陶志勇, 胡亚磊, 林森. 基于改进AlexNet的手指静脉识别[J]. 激光与光电子学进展, 2020, 57(8): 58-66.

TAO Zhiyong, HU Yalei, LIN Sen. Finger vein recognition based on improved AlexNet[J]., 2020, 57(8): 58-66.

[8] 刘超, 王容川, 许晓伟, 等. 基于改进LBP的手指静脉识别算法[J]. 计算机仿真, 2019, 36(1): 381-386.

LIU Chao, WANG Rongchuan, XU Xiaowei, et al. Finger vein recognition algorithm based on improved LBP[J]., 2019, 36(1): 381-386.

[9] 李菲, 李小霞, 周颖玥. 基于改进HOG特征和稀疏表示的手指静脉识别[J]. 传感器与微系统, 2018, 37(11): 38-41.

LI Fei, LI Xiaoxia, ZHOU Yingyue. Finger vein recognition based on improved HOG features and sparse representation[J]., 2018, 37(11): 38-41, 44.

[10] Veluchamy S, Karlmarx L R. System for multimodal biometric recognition based on finger knuckle and finger vein using feature-level fusion and k-support vector machine classifier[J]., 2017, 6(3): 232-242.

[11] 徐子豪, 陈光化, 傅志威. 改进型LDA结合LBP的手指静脉识别[J]. 现代电子技术, 2020, 43(12): 1-4.

XU Zihao, CHEN Guanghua, FU Zhiwei. Finger vein recognition of improved LDA combined with LBP[J]., 2020, 43(12): 1-4.

[12] 徐铸业, 赵小强. 基于Agast-Adaboost的图像匹配算法[J]. 兰州理工大学学报, 2020, 46(4): 110-115.

XU Zhuye, ZHAO Xiaoqiang. Image matching algorithm based on Agast-Adaboost[J]., 2020, 46(6): 1-4.

[13] 贾楚. 基于改进HOG特征的行人检测算法研究[D]. 秦皇岛: 燕山大学, 2016.

JIA Chu. Research of Pedestrian Detection Based on Improved HOG Features[D]. Qinhuangdao: Yanshan University, 2016.

[14] 蒋政, 程春玲. 基于Haar特性的改进HOG的人脸特征提取算法[J]. 计算机科学, 2017, 44(1): 303-307.

JIANG Zheng, CHENG Chunling. Improved HOG face feature extraction algorithm based on Haar characteristics[J]., 2017, 44(1): 303-307.

Fast Finger Vein Recognition Based on a Dual Dimension Reduction Histogram of Oriented Gradient and Support Vector Machine

CHU Hongjia1,CHEN Guanghua1,2,WANG Kaixuan1

(1.,,200444,;2.,,200444,)

An identification model using a dual-dimension reduction histogram of oriented gradients (HOG) combined with a support vector machine (SVM) is proposed to reduce the time required for finger vein recognition. To solve the problem of high feature dimensionality in the traditional HOG algorithm, the classification ability of the gradient direction interval is first measured using the Fisher criterion. Next, the sequence forward selection method is used to select the gradient direction interval with optimal classification ability to construct a partial direction interval HOG feature. Finally, principal component analysis (PCA) is used to reduce the number of dimensions. An SVM multi-classifier was used for the classification of the FV-USM and THU-FV datasets. The experimental results demonstrate that compared to the HOG+PCA method, the feature dimensions extracted by the dual-dimensional reduction HOG method are reduced by 40%, the recognition time is reduced by 29.85%, the recognition accuracy is 99.17% and 100%, respectively, and the equal error rate is 1.07% and 0.01%, respectively.

finger vein recognition, HOG, feature selection, PCA, SVM

国家自然科学基金项目(61671285)。

TP391.4

A

1001-8891(2022)03-0262-06

2021-01-23;

2021-04-08.

褚洪佳(1994-),男,山东省枣庄市人,硕士研究生,研究方向为图像处理、模式识别。E-mail: chu_hongjia@163.com

猜你喜欢

降维区间准确率
你学会“区间测速”了吗
混动成为降维打击的实力 东风风神皓极
基于数据降维与聚类的车联网数据分析应用
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
全球经济将继续处于低速增长区间