基于广义高斯分布FDCT_Wrap和FSVM的虹膜识别
2016-11-30何振红
何振红
(甘肃民族师范学院计算机科学系,甘肃 合作 747000)
基于广义高斯分布FDCT_Wrap和FSVM的虹膜识别
何振红
(甘肃民族师范学院计算机科学系,甘肃 合作 747000)
为了提高虹膜识别的准确率,提出了一种改进曲波变换的虹膜识别算法。首先对预处理后的虹膜图像进行Wrapping算法的快速离散曲波变换,提取不同尺度和不同方向的曲波子带系数矩阵的均值、方差和能量,然后利用广义高斯分布估算各子带的权值,为分类能力较强的特征向量赋予较大权值,构成虹膜图像的特征向量。最后采用模糊支持向量机和二叉决策树相结合的分类器进行匹配识别。采用UBIRIS和CASIA虹膜数据库对算法性能进行测试。实验结果表明,该算法能更好地提高虹膜识别准确率和效率,具有可行性。
广义高斯分布;虹膜识别;曲波变换;模糊支持向量机;二叉决策树
1 引言
近年来,随着小波技术的发展,采用小波变换进行虹膜特征提取取得了良好的效果[1-7]。但是小波变换具有各向同性,在表示线奇异的二维图像时,不满足空间各向异性的要求,从而影响虹膜识别的准确性。curvelet(曲波)变换能有效弥补小波变换的不足,以边缘曲线为基本元素,体现出多方向性和各向异性,能更好地表示虹膜图像的边缘信息。因此利用curvelet变换提取虹膜特征比小波变换更实际有效。Rahulkar等人[5]提出了一种基于快速离散curvelet变换的虹膜特征提取算法。该算法将归一化的虹膜图像划分为6个子图像,对每个子图像进行curvelet变换,提取curvelet系数的定向能量作为子图像的特征向量。在UBIRIS V1和CASIA-Iris V2.0数据库中进行实验,分别获得97.73%和97.81%的识别准确率,比Gabor小波算法和Haar小波算法的识别效果好。但该方法在眼睑和睫毛遮挡较严重的情况下表现一般。
为了更好地消除采集到的虹膜图像中不感兴趣信息因素对虹膜特征提取的影响,本文提出一种基于广义高斯分布Wrapping算法的快速离散curvelet变换虹膜识别算法。首先对预处理后的虹膜图像进行Wrapping算法的快速离散curvelet变换,提取不同尺度和不同方向的curvelet子带系数矩阵的均值、方差和能量,然后利用广义高斯分布(generalized Gaussian distribution,GGD)估算各子带的权值,为分类能力较强的特征向量赋予较大权值,构成虹膜图像的特征向量。最后采用模糊支持向量机(fuzzy support vector machine,FSVM)和二叉决策树相结合的分类器进行分类识别。采用UBIRIS和CASIA虹膜数据库对算法进行性能测试,实验结果表明,该方法提取的特征向量维数较少,相比小波变换具有较高的识别率和良好的顽健性。
2 基于广义高斯分布FDCT_Wrap和FSVM的虹膜识别
一个典型的虹膜识别系统由虹膜图像采集、虹膜预处理、虹膜特征提取、匹配识别4个主要部分组成,其中,特征提取是虹膜识别的关键环节,决定了识别系统的性能。因此,本文重点阐述虹膜识别中的特征提取和匹配识别。
2.1 虹膜预处理
虹膜图像在采集的过程中,由于受光照、眼睑、睫毛等因素的影响,采集到的图像会含有不同程度的噪声,为了准确地将虹膜纹理区域从采集到的虹膜图像中分割,消除不利因素对虹膜特征提取及匹配识别的影响,要先进行虹膜预处理。虹膜预处理包括图像灰度化、虹膜定位、归一化和图像增强。整个虹膜的预处理过程如图1所示。
2.2 虹膜特征提取
2.2.1 Wrapping算法的快速离散curvelet变换
Candès和 Donoho在脊波(ridgelet)变换基础上提出了曲波变换,之后又提出快速离散曲波变换 (fast discrete curvelet transform,FDCT)。FDCT采用新框架结构,减少了参数,实现起来更加快速、简单。根据实现方法的不同,可分为基于Wrapping算法的快速离散曲波变换 (FDCT_Wrap)和基于非均匀空间抽样二维FFT算法的快速离散曲波变换(FDCT_USFFT)。本文采用FDCT_Wrap方法[8],实现过程如下:
· 在给定笛卡尔坐标下对图像 F[t1,t2]∈L2(R)(0≤t1,t2<ω,ω 为频域参量)进行二维 Fourier(傅里叶)变换,得到二维频率函数 F[n1,n2],-n/2≤n1,n2<n/2(n 为矩阵行数);
· 在频域中对每一对尺度方向(j,l)组合重采样,得到新的采样函数 F[n1,n2-n1tan θl],-π/4≤θl≤π/4;
· 计算 fj,l[n1,n2]=F[n1,n2-n1tan θl]×Uj[n1,n2],其中,Uj(n1,n2)为窗函数;
·围绕原点使用Wrapping算法做局部化处理;
·对每一个fj,l进行二维逆Fourier变换,得到离散curvelet系数 cD(j,l,k),D 代表discrete。
其中,j、l、k分别为尺度参量、方向参量、位移参量。
2.2.2 特征提取
图1 虹膜图像预处理过程
对预处理的虹膜图像进行Wrapping算法的快速离散curvelet变换,得到不同尺度和不同方向的curvelet子带,图2为curvelet变换各层系数重构结果。虹膜图像经curvelet变换后,被划分为5个尺度层。第1层为coarse尺度层,由低频系数组成,包含虹膜图像的基本信息,反映虹膜图像概貌;第2、3、4层为detail尺度层,每层系数被分解为4个方向,由中、高频系数组成,体现虹膜图像的细节信息和边缘特征;第5层为fine尺度层,由高频系数组成,反映虹膜的斑点、收缩褶、细丝等纹理特征的分布情况及边缘特征。分别计算每层系数矩阵的均值、方差和能量,计算式分别为式(1)~式(3)。
其中,c(k1+i,k2+j)为对应图像在第i层j方向子带的系数矩阵,m×n为子带系数矩阵的大小。
curvelet变换各层系数重构结果如图2所示。
图2 curvelet变换各层系数重构结果
对虹膜图像进行FDCT_Wrap获取虹膜图像局部特征后,针对图像不同子带系数矩阵分类能力的不同,利用广义高斯分布估算各子带的权值,为分类能力较强的特征向量赋予较大权值,为分类能力较弱的特征向量赋予较小权值。通过特征加权,将利用FDCT_Wrap提取的不同子带信息的重要性反映到虹膜图像最终特征向量中。
GGD概率分布函数为:为Γ函数,ξ为尺度参数,σ为形状参数。
构造δ函数:
则:
ξ估计值为:
利用尺度参数ξ,求得特征加权数值为:
经特征加权后的不同尺度和方向的curvelet子带系数矩阵的均值、方差和能量分别为。,融合每层特征向量vi为用于匹配识别的特征向量由此获得每层特征向量(k为通道数量)。
2.3 匹配识别
2.3.1 模糊支持向量机原理
Vapnik等人[9]提出的统计学习理论的支持向量机(support vector machine,SVM),通过引入结构风险,在寻找最优分类超平面作为决策函数的前提下,将分类问题转化为线性约束的凸二次规划。针对小样本问题,支持向量机已成为当前模式识别领域中的优选分类器,实现对假设函数集的控制,使学习机在经验风险和过拟合之间取折中,获得较好的推广能力。但在虹膜图像的分类识别过程中,如果训练样本中含有噪声点等“异常”信息,SVM分类过程就容易出现过学习或者欠学习现象,因而不能获取真正最优分类面。针对此情况,Lin等人[10]提出了模糊支持向量机,引入模糊集理论,依据不同的训练样本在分类中对SVM的贡献不同,赋予不同的模糊隶属度[10],来削弱噪声点对分类的不利影响,以区分噪声等异常信息与有效样本。
设n个独立同分布训练样本集X={(xi,yi,)|xi∈Rn,yi=±1,∈[ε,1],i=1,…,n}和核函数 K(xi,xj),根据统计学习理论,求解FSVM最优分类面可归结为如下二次规划:
其中,C为惩罚因子且 C>0,b取类中心点的值,ξi为松弛因子且 ξi≥0。
利用Lagrange(拉格朗日)函数,上述规划的Wolfe对偶规划为:
这样模糊支持向量机的决策函数为:
2.3.2 FSVM与二叉决策树相结合的分类算法
当训练样本数和类别数较多时,FSVM算法的时间复杂度较大,因而采用与二叉决策树相结合的方法来降低算法时间复杂度。
设训练样本集为X,总类别集为M。
步骤1 定义一个二叉决策树Bdt={node(i)}。变量node(i)包含4个域:node(i).C存放当前节点所包含的类别号;node(i).P+和node(i).P-分别存放当前节点指向的正子节点和负子节点的指针;node(i).S表示训练的顺序。令node(i).C={1,2,…,M}(M 为类别数),node(i).P+=node(i).P-=0,node(i).S=0,终节点数Endnode=0。当前节点指针i=1,新生成节点指针j=1,训练次数s=1。
步骤2 在节点i上,判断node(i).C中的元素个数是否为1。如果是,节点i是终节点,转向步骤4;否则继续。
步骤3 用聚类算法将node(i).C中的类别号分成两组,同时生成两个子结点node(j+1)和node(j-1)。令node(i).P+=j+1,node(i).P-=j-1,node(i).S=s,node(j+1).P±=node(j-1).P±=0,node(j+1).S=node(j-1).S=0。
在node(j+1).C中存放正样本组类别号,在node(j-1).C中存放负样本组类别号。此时训练样本集X等于node(i).C所含类别的所有样本,对应的输出为Y=其中,class(xi)表示样本xi的所属类别。用FSVM训练,得到Lagrange乘子和阈值{as,bs}。令 i=i+1,j=j+1,s=s+1,转向步骤 2。
步骤4 令Endnode=Endnode+1,判断终节点个数Endnode是否等于类别数M。如果是Bdt,保存Bdt,算法结束;否则i=i+1,转向步骤 2。
3 实验结果及分析
为了对本文提出的虹膜识别算法性能进行分析评价,采用UBIRIS V1[11]和CASIA-Iris V2.0[12]虹膜数据库进行仿真实验。其数据库中的部分虹膜图像如图3和图4所示。
图3 UBIRIS虹膜数据库中的部分虹膜图像
图4 CASIA虹膜数据库中的部分虹膜图像
为了验证本文提出的基于广义高斯分布Wrapping算法的快速离散curvelet变换分解后,低频均值、方差和高频能量组成的特征向量是虹膜图像的最优特征表示,利用FDCT_Wrap分别对两个数据库中的虹膜图像进行分解,提取出低频分量和高频分量,并将低频分量、高频分量以及它们的组合分别输入同一分类器中进行分类识别,通过正确识别率 (correct recognition rate,CRR)和错误识别率(error recognition rate,ERR)进行比较,实验结果见表1、表2。
由表1和表2可看出,特征加权能进一步提高虹膜图像识别率。在UBIRIS虹膜数据库中进行仿真实验,选用广义高斯分布FDCT_Wrap提取的低频子带系数矩阵的均值、方差作为特征向量,识别准确率为93.23%;选用高频子带能量作为特征向量,识别准确率仅为83.48%;将低频均值、方差和高频能量组合作为特征向量,识别准确率达到98.16%。在CASIA虹膜数据库中进行仿真实验,选用广义高斯分布FDCT_Wrap提取的低频子带系数矩阵的均值、方差作为特征向量,识别准确率为93.86%;选用高频子带能量作为特征向量,识别准确率仅为84.57%;将低频均值、方差和高频能量组合作为特征向量,识别准确率达到98.83%。由此可见使用广义高斯分布FDCT_Wrap分解后的低频子带系数矩阵的均值、方差能较好地表征虹膜纹理的基本特征,将其与高频子带能量组成特征向量组进行识别,提高了识别准确率,是用于虹膜识别的较佳特征组合。
表1 UBIRIS库测试结果
表2 CASIA库测试结果
表3 不同方法的UBIRIS库性能比较
表4 不同方法的CASIA库性能比较
为了验证本文算法的效果和性能,将该算法与基于小波变换的虹膜识别算法进行对比实验。实验采用识别准确率较高且变化速度较快的Gabor小波和Haar小波,对虹膜图像进行分解,提取虹膜纹理特征,分别采用汉明距离(hamming distance,HD)、SVM、二叉决策树FSVM进行匹配识别。对错误接受率 (false acceptance rate,FAR)、 错误拒绝率(false rejection rate,FRR)和正确识别率 (correct recognition rate,CRR)3个指标进行比较,实验结果见表3、表4。
通过对表3和表4的分析可知,对于不同的特征提取方法和不同的匹配识别方法,本文提出的改进curvelet变换的虹膜识别准确率比其他方法高,识别错误率相应降低,说明采用广义高斯分布FDCT_Wrap和二叉决策树FSVM的虹膜特征提取与识别算法的性能更优,能有效提高虹膜识别效果,具有较好的稳定性和较强的顽健性。
为了更好地评价算法的优劣,采用ROC曲线表示。ROC曲线越接近坐标轴,说明匹配识别性能越好。对 UBIRIS和CASIA虹膜数据库,分别采用Farouk[2]算法、Rajbhoj[3]算法、Rahulkar[5]算法以及本文提出算法的ROC曲线对比如图5、图6所示。从图5可知,本文提出的算法在相同FAR下FRR更小,这表示本文提出的算法提取虹膜纹理特征性能更好,识别准确率更高。
图5 UBIRIS虹膜数据库不同算法的ROC曲线
图6 CASIA虹膜数据库不同算法的ROC曲线
4 结束语
本文提出的基于广义高斯分布Wrapping算法的快速离散curvelet变换和二叉决策树模糊支持向量机的虹膜特征提取与识别算法的识别性能有较明显的改进。该方法适合应用在对安全性要求较高的实时性身份认证系统中。利用广义高斯分布Wrapping算法的快速离散curvelet变换提取虹膜特征向量,有效地避免了小波变换不具有空间各向异性的缺陷,结合二叉决策树FSVM算法,获得了较理想的识别效果。
[1]孙冬,周俊,魏勇.基于Haar小波的虹膜特征提取算法[J].科学技术与工程,2014,1(14):81-85.SUN D,ZHOU J,WEI Y.Iris feature extraction based on Haar wavelet[J].Science Technology and Engineering,2014,1(14):81-85.
[2]FAROUK R M.Iris recognition based on elastic graph matching and Gabor wavelets[J].Computer Vision and Image Understanding,2011,115(8):1239-1244.
[3]RAJBHOJ S M,MANE P B.Haar wavelet approach of iris textureextraction forpersonalrecognition[J].International Journal of Innovative Technology and Exploring Engineering,2013,3(2):22-25.
[4]KARTHIKEYAN V.Novel algorithm for iris biometrics using fast wavelet transforms[J].International Journal of Engineering Sciences and Research Technology,2014,3(3):1481-1484.
[5]RAHULKAR A D,JADHAV D V,HOLAMBE R S.Fast discrete curvelet transform based anisotropic iris coding and recognition using k-out-of-n:a fused post-classifier[J].Machine Vision and Applications,2012,23(6):1115-1127.
[6]DHAGEA S S,HEGDEA S S,MANIKANTANA K,et al.DWT-based feature extraction and radon transform based contrast enhancement for improved iris recognition[J].Procedia Computer Science,2015,1(45):256-265.
[7]ABDULLAH H N,ABDULLAH A A.Iris recognition using wavelet transform and artificial neural networks[J].Engineering&Technology Journal,2015,33(6):877-888.
[8]CANDES E J,DEMANET L,DONOHO D L,et al.Fast discrete curvelet transforms[J].Multiscale Modeling&Simulation,2006,5(3):861-899.
[9]VAPNIKV N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[10]LIN C F,WANG S D.Fuzzy support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):464-471.
[11]PROENCA H,ALEXANDRE LA.UBIRIS:a noisy iris image database[J].Lecture Notes in Computer Science,2005(3617):970-977.
[12]CASIA-Iris V2[EB/OL].(2007-12-20)[2015-12-14].http://www.cbsr.ia.ac.cn/Iris Database.htm.
Iris recognition based on generalized Gaussian distribution FDCT_Wrap and FSVM
HE Zhenhong
Department of Computer Science,Gansu Normal University for Nationalities,Hezuo 747000,China
In order to improve the accuracy rate of iris recognition,an improved curvelet transform algorithm for iris recognition was proposed.Firstly,the iris image was decomposed with fast discrete curvelet transform by wrapping algorithm.Mean variance and energy of curvelet sub-band coefficients in different scales and different orientations were extracted.The weights of sub-bands were estimated by generalized Gaussian distribution.The feature vectors with stronger classification ability had large weight,which were calculated to constitute feature vectors of iris image.Finally,feature vectors were matched and recognized by classifier combined with fuzzy support vector machine and binary decision tree.The algorithm performances were tested with UBIRIS and CASIA iris database.Simulation results show that the proposed algorithm has higher recognition accuracy rate and efficiency.It is feasibility.
generalized Gaussian distribution,iris recognition,curvelet transform,fuzzy support vector machine,binary decision tree
Scientific Research Project in Gansu Provincial Colleges and Universities(No.2015B-119)
TP391
A
10.11959/j.issn.1000-0801.2016200
2015-12-24;
2016-07-12
甘肃省高等学校科研项目(No.2015B-119)
何 振 红 (1979-), 女 , 甘 肃 民 族 师 范 学 院 讲师,主要研究方向为图像处理、模式识别。