改进典型相关分析的虹膜鉴别算法
2014-07-07冯莹莹余世干刘辉
冯莹莹,余世干,刘辉
阜阳师范学院信息工程学院,安徽阜阳 236041
◎图形图像处理◎
改进典型相关分析的虹膜鉴别算法
冯莹莹,余世干,刘辉
阜阳师范学院信息工程学院,安徽阜阳 236041
针对典型相关分析(CCA)无法准确刻画虹膜图像的局部遮挡变化缺陷,提出一种改进典型相关分析相融合(ICCA)的虹膜识别方法。以全局和局部特征间的相关性特征作为有效的判别信息,通过划分子模,并以简单投票进行结果矫正,提高方法的稳定性,以CASIA数据集验证ICCA的有效性。结果表明,ICCA的识别率明显优于参比方法。
典型相关分析;特征融合;虹膜识别;子模型;小样本问题
虹膜识别是一种模式识别问题,主要包括特征提取和分类设计两个关键步骤,能否提取到有效的特征对虹膜识别的结果具有决定性的影响,因此对于虹膜识别而言,抽取有效的虹膜特征成为计算机视觉领域的一个重要研究课题[1]。
虹膜特征提取包括单模(unimodal)和多模(multimodal recognition)两类方法[2]。单模虹膜特征提取方法主要有分量分析(Principal Component Analysis,PCA)、线性判别分析(Linear Discriminant Analysis,LDA)、独立分量分析(Independent Componen Analysis,ICA)及其改进等多种方法[3-5],单模特征提取方法仅能获得一组目标的一组特征值,仅考虑全局特征,因此存在模型单一、信息利用率低等缺陷,导致虹膜识别率低。多模可以从一组样本中提取多组特征,成为当前虹膜特征主要提取方法,典型相关分析(Canonical Correlation Analysis,CCA)作为一种经典的多模特征提取方法,通过研究两组变量之间的相关关系来进行特征提取,在模式识别领域应用广泛[6-7]。但在虹膜识别问题为代表的高维、小样本问题的应用过程,CCA存在如下不足:(1)虹膜识别的小样本特性使CCA两组特征矢量构成的总体协方差矩阵奇异,难以直接应用;(2)作为一种全局线性投影(或特征提取)方法,不足以很好地描述非线性的虹膜识别问题;(3)仅考虑了全局特征,缺乏对局部变化的识别鲁棒性,在处理虹膜图像遮挡、光线变化明暗变化时,易丢失了局部图像变化信息,识别效果不理想。近年来,随着模式识别中子模式方法兴起,为解决CCA在虹膜识别过程面临的难题提供了新的思想与方法。
为了提高虹膜识别率,综合子模式和CCA算法优点,提出一种改进典型相关分析的虹膜识别方法(Imporved Canonical Correlation Analysis,ICCA)。ICCA将局部与全局特征矢量之间的相关性特征作为有效的判别信息,既达到了融合局部与全局信息的目的,又消除了特征之间的信息冗余;通过子模式的划分,ICCA避免了小样本问题,更好地描述了非线性的虹膜识别问题;并通过投票方式融合结果,增强了对局部变化的鲁棒性,最后通过采用CASIA Ver1.0和Ver2.0虹膜数据集验证其有效性。
1 基于ICCA的虹膜识别算法
1.1 基于ICCA的虹膜系统工作流程
ICCA的虹膜识别过程为:首先对虹膜图像进行定位,眼睑、睫毛检测和归一化的预处理,然后将初始模式以矩阵分割法分解成为N个小的子集,提取其子集的图像局部特征;采用PCA提取整幅图像全局特征,并采用CCA对局部特征和全局特征进行融合,最后以N个子模型的识别结果进行投票决策,确定测试样本的最终归属。
ICCA通过CCA对全局和局部特征进行融合,不仅考虑了样本的全局信息,而且考虑了局部变化信息,并消除了多个特征之间的冗余信息;另外将样本划分为N个子集,以所有的子集识别结果对样本的最终归属进行校正,有效降低了每个子集对样本的全局性影响,使得睫毛、眼睑遮挡、光线明暗等局部变化被控制在个别子集中,每一个样本子集在最终判别中仅占1/N的权重,可较大幅度提高虹膜识别算法的稳定性。基于ICCA的虹膜识别系统工作流见见图1。
图1 基于ICCA的虹膜识别系统工作流程图
1.2 虹膜图像预处理
1.2.1 虹膜定位
虹膜与瞳孔像素区别较大,在确定瞳孔中心后,确定其垂直和水平方向的4个方位点,然后以最小二乘法拟合圆,实现瞳孔内边缘的粗定位,最后以非二次初始化的变分水平集方法进行瞳孔内边缘的精细定位[8]。虹膜与巩膜的边界(虹膜外边界)并不如内边界一样明显,其定位方法也不一样。首先以多尺度形态边缘检测确定虹膜的候选外边界,然后以Hough变换快速确定虹膜外边缘[9]。
1.2.2 眼睑、睫毛检测
对虹膜边缘进行定位,并截取包含上下眼睑的虹膜图像,以水平Sobel算子对眼睑边缘进行粗定位,最后以最小二乘法对粗定位边缘进行抛物线逼近,确定眼睑最终边缘[10]。根据虹膜内边缘粗定位的结果,获得含有睫毛的局部图像,以规定的阈值对该局部图像二值化,然后取反得到睫毛区域。
1.2.3 虹膜图像归一化
为便于虹膜图像对比,本研究将定位后的圆环状虹膜图像以极坐标转换全部归一化为64×512的矩形。极坐标转换如下:
1.3 局部特征的提取
假设以M个人的N张像素为W1×W2的虹膜图形组成训练集Train=(x1,x2,…,xN)W1W2。以矩阵分割法将全部图形不重叠的分割为L张大小相等的子图形(此时每个子图形特征维数k=(W1×W2)/L),为保证以该特征矢量构成的总体协方差矩阵是非奇异矩阵,k要满足k≤N-M。图形被分割后开始构建局部特征子集,用处于原图形中相同位置各子图像组成一个独立的特征子集,共得到L个独立的特征子集Train1,Train2,…,TrainL,其构建过程见图2。
图2 虹膜识别特征子集构建示意图
在上述图形分割中,在满足k≤N-M的约束条件外,k值大小对算法的识别率存在较大影响,k值过小,子集划分就会多,使得算法过分地注重局部变化,图形信息被过度零碎化,最终导致算法识别率降低;而k值过大,子集划分少,使得算法趋向于整体识别方法,忽略了局部变化,算法识别率同样不佳。针对k值大小的选择,本研究以训练集识别率出现拐点为标准,以确定k值的大小。
1.4 全局特征的提取
虹膜识别领域,传统特征提取方法主要有PCA、图像转换、结构纹理等,它们各有特色,在各自的领域中都有广泛的应用。由于PCA计算复杂度较低,因此选择PCA进行虹膜全局特征得取,作为CCA融合特征的第二组特征矢量。具体如下:
对于训练集Train,先以PCA对其进行特征提取,得到投影矩阵WPCA,随后对Train中所有的样本基于WPCA进行投影,即可新产生一组低维特征Trainx= (x1,x2,…,xN)k2×N。同样,为保证该特征矢量构成的总体协方差矩阵也是非奇异性的,在全局特征提取过程中,其特征维数k2也应该满足k2≤N-M的约束条件。
1.5 CCA融合特征
在提取局部特征得到L个Traini特征子集与全局特征Trainx后,每个局部特征子集都可以与全局特征组成一个训练集对(Traini,Trainx),即可以CCA进行特征融合,具体融合过程如下:
式(3)即为广义特征问题,式中∧i为该问题前r个最大的非负特征形成的一个对角矩阵,的列向量即为这些特征值对应的特征向量。将所有局部特征子集Traini(i=1,2,…,L)分别与全局特征Trainx构建上述CCA投影矩阵,即得到L个投影矩阵对(i=1,2,…,L),然后以该投影矩阵分别对其对应的特征子集提取特征。
经CCA融合特征后可得两组特征向量,第一组特征向量为各个局部的特征,第二组特征为是全局特征,经过CCA投影后,第一组特征的L个向量中的每一个向量变为以某块的局部特征为主,融合了整体特征;第二组特征的L个向量中的每一个向量变为以全局特征为主,融合了某块的局部特征。由于在下面的分类过程中,还需要通过投票方式组合L个子块的结果,如果使用第二组特征则会过于偏重全局特征,从而丧失了部分子模式方法对局部变化的鲁棒性,因此本研究仅取第一组特征的投影向量作为判别向量。
1.6 虹膜图像分类与识别
采用上述相同方式将待识别虹膜图像划分为L个子集,然后重构得到L个待测的特征子向量(t1,t1,…,tL)。两个特征子向量yi,ti之间的相似性定义如下:
首先计算待测样本第i个子样本与其对应位置的子模式Traini中各特征子向量之间的相似度,并选择相似性度最大者的类别作为ti类别,并记为Ci,即未知虹膜第i个子样本的分类结果,这样L个独立的子模式可以得到L个独立的判别结果。最后以简单投票对该待测样本的最终归属进行矫正。
待测样本被识别为第k类的概率可以定义为:
最后对待识别虹膜图像的识别结果为:
2 仿真实验
2.1 数据来源
为验证ICCA对于虹膜识别的有效性,采用CASIA Ver1.0和CASIA Ver2两个标准虹膜数据集进行仿真测试。CASIA Ver1.0虹膜图像库为8位灰度的280×320虹膜图像,采集了108只眼睛虹膜图像,每只眼睛拍摄7幅,共756幅图像,其采用接触式设备拍摄,受光照、睫毛遮挡情况较少,每只眼睛随机选择幅图像作为独立测试样本,共产生216个测试样本;CASIA Ver2.0虹膜图像库为8位灰度的480×640虹膜图像,采集了60只眼睛虹膜图像,每只眼睛拍摄20幅,共1 200幅图像,其采用非接触式设备拍摄,受光照不均、睫毛遮挡等影响较大,每只眼睛随机抽取5幅,共300幅作为独立测试样本。两个数据集子集的划分都以训练集识别率初次最大为标准,Ver1.0数据集了选择3×6分块方式,Ver2.0数据集上选择5×10分块方式。
2.2 结果与分析
为使ICCA的虹膜识别结果具有可比性,构建了3个特征提取算法,分别为:PCA算法(该算法仅以PCA方法直接提取图像全局特征作为判别特征,不考虑局部特征);ICCA-G算法(该算法以全部特征为主,且融合一部分局部特征向量作为判别特征);ALL算法(该算法直接将全局特征和局部特征进行混合在一起作为判别特征)。在给定子集大小情况下,各算法识别率见表1。
表1 各算法识别率
对表1的实验结果进行对比分析可知,相对于参比算法,在两个数据集上,ICCA均取得了较高的识别率,且可以得到如下结论:
(1)仅以PCA提取的全局特征作为虹膜识别信息时,因CASIA Ver1.0数据采用接触式设备拍摄虹膜图像,受光照不均、睫毛遮挡等局部变化影响较少,其识别率达到了92%;而CASIA Ver2.0数据库图像采用非接触式设备拍摄,受局部变化影响较大,当仅以全局特征建模时,不能反映局部变化而导致识别率较低。
(2)ICCA-G算法同样以全局特征构建识别算法,但通过CCA融合了部分局部变化信息,对CASIA Ver1.0数据而言,使其较PCA算法识别率有了一定的提高;而CASIA Ver2.0数据识别率提高了10个百分点,进一步说明了局部变化特征有利于提高虹膜的识别正确率。
(3)ALL算法同时使用了全局和局部合特征,识别率较ICCA-G算法有了较大幅度的提高,但还是低于ICCA算法识别率,这对比结果表明,并不是特征越多越好,将全局特征和局部直接进行混合,而没有采用CCA融合技术去消除特征间的冗余信息或者噪音信息,会导致虹膜的识别率不够理想。
图3对比显示了本研究子模式矫正方法与全局特征方法在两个不同数据集上的效果。从图中可以发现,融合了局部特征的子模式矫正方法在应用于遮挡较严重的CASIA Ver2.0数据集中时,其识别率相比仅用全局特征识别率提高了15个百分点,而CASIA Ver1.0数据集变化并不明显。可见,通过子集划分,将局部变化控制在小范围内,能更好地处理带遮挡数据集。
为了更一步说明ICCA的优越性,采用Garbor滤波器、Harr小波和离散余弦变换等[11]常用虹膜特征提取算法进行对比实验,对比结果如表2所示。从表2可知,相对于当前常用虹膜识别方法,ICCA的识别率更高,对结果表明表明ICCA是一种识正确率高、结果可靠的虹膜特征提取算法。
图3 两个数据不同特征的识别率
表2 ICCA与常见虹膜识别方法识别性能对比
3 结束语
特征提取是模式识别的重要组成部分,其有效性关系到分类识别算法的选取与识别正确率,本研究提出了一种基于子模式与CCA的虹膜识别算法。ICCA不仅能够有效提取图像的局部与整体特征,使得其对睫毛遮挡、光照不均等局部变化有较高的稳定性,而且采用子模式划分解决了传统CCA无法处理虹膜识别等小样本多特征的问题。仿真对比结果表明,相对于其他虹膜识别算法,ICCA不仅有更优的虹膜识别性能,而且更具有稳定性和鲁棒性。
[1]孙即祥,王晓华,钟山,等.模式识别中的特征提取与计算机视觉不变量[M].北京:国防工业出版社,2001.
[2]林金龙,石青云.一种基于结构特征的虹膜识别方法[J].计算机工程与应用,2003,39(13):83-84.
[3]田启川,潘泉,程咏梅,等.基于过零检测的虹膜特征提取算法[J].电子与信息学报,2006,28(8).
[4]Sanchez-Avila C,Sanchez-Reillo R,Martin-Roche D.Irisbased biometric recognition using dyadic wavelet transform[J].IEEE Aerospace and Electronic System s Magazine,2002,17(10):3-6.
[5]Xie M,Shao S.Iris recogniton based on fearure extration in kernel space[C]//Proceeding of International Conference on Communications,Circuits and Systems,Kokura,2007.
[6]Hotelling H.Relations between two sets of variates[J]. Biometrika,1936,28(3):321-377.
[7]孙权森,曾生根,杨茂龙,等.基于典型相关分析的组合特征抽取及脸像鉴别[J].计算机研究与发展,2005,42(4):614-621.
[8]王斌,高新波.基于水平集接力的图像自动分割方法[J].软件学报,2009,20(5).
[9]罗忠亮,林土胜.用于身份鉴别的虹膜图像预处理方法[J].华南理工大学学报:自然科学版,2009,37(5):43-48.
[10]Daugman J.How iris recognition works[J].IEEE Trans on Circuits and System for Video Technology,2004,14(1):21-30.
[11]罗忠亮.虹膜生物特征的提取与识别[D].广州:华南理工大学,2010.
FENG Yingying,YU Shigan,LIU Hui
College of Information Engineering in Fuyang Teachers College,Fuyang,Anhui 236041,China
Canonical Correlation Analysis(CCA)can not better portray the local changes in the iris image,a novel iris recognition method is proposed based on improved CCA algorithm in this paper.Firstly,the correlation between global features and local features are integrated to form the recognition features,the redundant information between the features is eliminated and the global information and local information is integrated effectively at the same time,the performance of ICCA is tested by CASIA datasets.The result show that ICCA’s recognition accuracy is significantly better than the reference model.
Canonical Correlation Analysis(CCA);fusion features;iris recognition;sub-pattern;small samples size
A
TP391
10.3778/j.issn.1002-8331.1208-0473
FENG Yingying,YU Shigan,LIU Hui.Iris recognition algorithm based on improved canonical correlation analysis.Computer Engineering and Applications,2014,50(16):146-149.
安徽省高等学校省级自然科学研究项目(No.KJ2012B138,No.KJ2013B206,No.KJ2013B207);安徽省高等学校省级教学研究项目(No.20101985)。
冯莹莹(1982—),女,讲师,主要研究领域为无线传感器网络安全及计算机图形学;余世干(1982—),男,讲师,主要研究领域为嵌入式系统开发;刘辉(1979—),男,讲师,主要研究领域为计算机图像处理。
2012-08-04
2012-10-29
1002-8331(2014)16-0146-04
CNKI网络优先出版:2012-12-28,http://www.cnki.net/kcms/detail/11.2127.TP.20121228.1007.002.htm l