APP下载

一种基于核主成分分析和组合分类器的虹膜识别方法

2012-07-07伍尤富

图学学报 2012年3期
关键词:虹膜度量特征提取

伍尤富

(韶关学院物理与机电工程学院,广东 韶关 512005)

随着信息技术的飞速发展,信息高度交互,身份识别的难度和重要性越来越突出。基于生物特征的身份识别技术作为一个新兴的领域,具有非侵入和自然交互等优点,已经吸引了越来越多的研究人员[1]。目前,主要的识别技术包括人脸识别、声音识别、指纹识别和虹膜识别等技术。虹膜是人体瞳孔与巩膜之间的环状部分,它具有唯一性、稳定性、虹膜图像获取的非侵犯性等特点,与人脸、声音识别相比,虹膜识别具有更高的准确性,所以虹膜识别已成为当前生物识别研究的热点。

目前,在虹膜识别研究方面,Daugman首先提出了利用2D-Gabor滤波器对虹膜纹理进行局部相位量化和编码,该算法准确性高,速度快,是目前虹膜识别商用系统的基础,但这种算法需要处理纹理的二维信息,增加了特征提取和运算时间;Wildes采用高斯型滤波器在不同分辨率下分解虹膜图像,并把结果进行存储比较,计算量比较大;Boles提出了一种新颖的基于小波变换过零检测的虹膜识别算法,只在小样本集里取得了有限的结果,这种算法对灰度值比较敏感,因而识别率比较低[2]。本文提出了一种基于核主成分分析和支持向量机相结合虹膜特征提取与识别方法,该方法首先利用KPCA进行非线性特征提取,并根据SVM和距离度量各自的特点,采用了SVM和距离度量相结合的两极分类方法,以减少进入支持向量机训练的样本数目,实验表明该方法能有效地提高识别率,加快了识别速度,具有较好实用性。

一般来说,虹膜识别系统主要包括虹膜图像的获取,虹膜图像的预处理,虹膜图像特征提取,模式匹配4部分组成,如图1所示。

图1 虹膜识别系统

1 虹膜图像预处理

1.1 虹膜定位

虹膜定位就是要找出瞳孔与虹膜之间、虹膜与巩膜之间的两个边界。根据虹膜的几何特性采用粗定位和细定位相结合的方法来快速定位其中心及内外半径,这样可以减少定位搜索的盲目性及计算时间[3]。先通过粗定位找到瞳孔的大致位置,然后在这个位置附近较小的范围内利用Canny边缘检测和Hough变换进行细定位。图 2(b)是虹膜定位的结果。

图2 虹膜定位

1.2 虹膜图像的归一化

为了消除平移、缩放和旋转对虹膜模式匹配的影响,为了实现精确匹配,还须对定位后的虹膜图像进行归一化,即将每幅原始图像调整到相同的尺寸和对应位置[1],使用极坐标方法进行归一化,以瞳孔中心为起点,以虹膜内外边界的交点坐标分别为ys( r,θ) ) ,则利用式(1)可将虹膜图像中的每一个点一一映射到极坐标(r,θ)中。

图3 虹膜图像归一化

2 虹膜特征的提取

目前,已有的虹膜识别方法大多是利用线性变化(Gabor小波)来提取虹膜纹理的局部特征。然而,线性变换方法在提取特征时变换基固定且独立于处理数据。此外,传统的方法还必须为固定基选择参数(如空间、频率、方向等)。实际中遇到的问题往往较复杂,呈现出非线性特性,对于这种非线性问题,可以利用核函数加以解决,基于核主成分分析(KPCA)特征提取的基本思想是,通过一个核函数Φ:Rd→ H ,将原空间 Rd中每个向量x映射到一个高维特征空间H中,使之变为线性问题,然后在这高维空间H中进行线性主分量分析(PCA)[4]。

特征向量v是由iΦ张成的空间,由此式(3)可等价于

通过求解方程(7)即可求出特征值λ和特征向量α。结合式(5)可知,C 的特征向量v可由核矩阵的特征向求出,将α归一化可得取主元特征,计算测试样本在H空间中向量v的投影为

实验证明[6],KPCA方法在H空间内具有与线性 PCA相同的数学和统计特性,而且它比线性 PCA能够提取更多的样本信息,在达到相同分类性能的前提下,KPCA所需的主元个数要少于PCA,同时与其它非线性特征提取方法相比,它不需要解决非线性优化问题而只涉及矩阵的特征值分解计算。

这样,虹膜特征提取KPCA算法的主要步骤可以归纳如下:

1)选取核函数并确定其参数;

2)对训练集中的虹膜图像根据式(2)求出其在特征空间的协方差矩阵C;

3)根据式(7)求出C的特征向量α和特征值λ;

4)选取若干个较大的特征值,根据式(8)求出对应的特征向量在特征空间的投影作为编码;

5)将虹膜图像的特征分为2b个等级,这样,每个特征仅需要b位就可以存储,节省存储虹膜特征的空间。

3 分类识别

通过KPCA算法得到了虹膜图像的特征编码,接下来的工作就是选择合适的分类算法对编码进行分类。目前在虹膜识别算法中普遍采用基于海明距离和欧式距离的分类方法。本文采用支持向量机(SVM)方法完成对虹膜码的分类识别。

支持向量机是一种基于结构风险最小化(SRM)原理的通用的学习方法,按照 SRM 的要求,SVM 学习的结果就是寻找一个最优分类超平面,把此平面作为分类决策面,该平面不仅要能够将两类训练样本正确分开,而且要使分类间距最大。

3.1 支持向量机(SVM)

于是,可从训练集中得到描述最优分类超平面的决策函数即支持向量机

对于线性不可分问题,我们一般先将样本映射到高维空间,选择适当的映射函数(核函数)K ( xi, x)就可以使样本映射后线性可分,核函数K(xi,x)应满足Mercer定理。则决策函数为采用不同的内积核函数将形成不同的算法。

3.2 分类器的设计

由以上分析可知,SVM算法是基于小样本统计理论和最大分类间隔思想的算法,因此,它具有优良的分类性能,但如果输入的数据太大,则会导致训练时间过长,根据SVM和距离度量方法各自的特点,本文采用了将支持向量机和距离度量相结合的两级分类算法,即ISD(Integrated SVM and Distance Classification)分类算法,先利用距离度量进行前级分类,然后根据虹膜图像的纹理统计特征,采用欧式距离来度量虹膜图像间的相似性,若符合条件,则给出分类结果,否则就转入后级分类器——支持向量机进行分类。

4 实验结果及分析

为了验证算法的有效性,实验中,采用了自己采集的虹膜图像。采用了 100只不同眼睛的虹膜图像样本,每只眼睛有 5幅图像,每类中前3幅图像参加训练,后2幅图像用于识别,虹膜图像经过预处理后,为了比较主成分分析(PCA)和核主成分分析(KPCA)在虹膜图像特征提取方面的差别,分别用PCA和KPCA进行特征提取。实验中采用的核函数为目前广泛使用的q阶的多项式核函数:K (xi,x)=(xi⋅x+c)q。由于多项式核函数q的变化对分类识别率和特征提取时间有一定影响,在进行相关实验后最佳核参数q被确定为2。其比较结果见表1。

表1 基于PCA和KPCA特征提取的识别率比较

从表1可以看出,KPCA高于PCA的识别率,这主要是因为 PCA仅能提取虹膜图像的线性成分,而KPCA对图像中的非线性成分也能提取,因而,KPCA提取的特征更丰富。

实验中,分别对3种分类器的分类性能进行了比较,距离分类器采用度量特征向量间的方差倒数加权欧氏距离作为分类依据,其分类结果如表2所示。

表2 ISD算法与距离分类器、SVM的性能比较

从表2可见,与单纯采用距离分类器、支持向量机分类器相比,ISD算法具有更高的正确识别率,而且采用距离度量与支持向量机相结合的分类方法,能减少进入SVM的样本数,从而减少了训练和测试时间,其性能优于单独采用距离度量或SVM的分类方法。

5 结 论

本文中提出了采用核主成分分析(KPCA)提取虹膜特征,距离度量和支持向量机(SVM)相结合设计分类器进行分类识别。核主成分分析方法对具有非线性高维数据特点的虹膜原始特征进行提取,不仅实现了降维,而且取得比传统主成分分析(PCA)更好的识别性能,分类识别时采用了距离度量和支持向量机相结合的两级分类方法, 减少进入支持向量机的样本数目,大大减少了支持向量机训练时间。实验证明,该方法能有效地提高识别率,加快了识别速度,具有较好实用性。

[1]王蕴红, 朱 勇, 谭铁牛. 基于虹膜识别的身份鉴别[J]. 自动化学报, 2002, 28(1): 1-10.

[2]李 峰,刘国彦, 章登勇, 等. 基于ICA和SVM的虹膜识别方法[J]. 小型微型计算机系统, 2005,26(12): 2203-2206.

[3]Daugman J. High confidence visual recognition of persons by a test of statistical independence [J]. IEEE Trans. Pattern Analysis and Machine Intelligence,1993, 15(11): 1148-1161.

[4]Seholkopf B, Smola A, Muller K R. Nonlinear component analysis as a kernel eigenvalue problem [J].Neural Computation, 1998, 10(5): 1299-1319.

[5]李弼程, 邵美珍, 等. 模式识别原理与应用[M]. 西安: 西安电子科技大学出版社, 2008: 82- 92.

[6]Cao L J, Chua K S, chong W K. A Comparision of PCA, KPCA and ICA for dimensionality reduction in support vector machine [J]. Neurocomputing, 2003,55(2): 321-336.

猜你喜欢

虹膜度量特征提取
鲍文慧《度量空间之一》
双眼虹膜劈裂症一例
基于轮廓匹配和多项式拟合的虹膜分割算法
代数群上由模糊(拟)伪度量诱导的拓扑
基于Gazebo仿真环境的ORB特征提取与比对的研究
突出知识本质 关注知识结构提升思维能力
一种基于虹膜识别技术的车辆启动系统
基于Daubechies(dbN)的飞行器音频特征提取
“刷眼”如何开启孩子回家之门
Bagging RCSP脑电特征提取算法