指纹识别中未匹配细节点信息的挖掘与利用
2014-04-12李天平李亚硕王帅强尹义龙任春晓
李天平,李亚硕,王帅强,张 擎,尹义龙,任春晓
(1.山东师范大学物理与电子科学学院济南250014;2.山东大学计算机科学与技术学院济南250101;3.山东财经大学计算机科学与技术学院济南250014)
0 引 言
指纹识别的核心步骤指纹匹配主要有四种方法:①基于细节点的匹配方法[1-7];②基于纹线的匹配方法[8-9];③基于纹理的匹配方法[10-11];④基于人工神经网络的匹配方法[12-13]。其中基于细节点的指纹匹配方法,由于所使用的特征相对稳定、可靠,一直是指纹识别中最为基础、最为主流的匹配方法。但是,现有基于细节点的指纹匹配中,匹配结果只由成功配对的细节点数量来决定。未能形成匹配的细节点都被视为无用信息,没有加以利用。而实际上,未能形成匹配的细节点中,包含着较多的区分性信息,也应该用于提高指纹识别系统的性能。
基于上述思路,本文对未能形成匹配的细节点中包含的区分性信息进行了挖掘和利用,将其作为辅助特征,与一种已有的基于细节点的指纹匹配方法进行得分级融合,实现指纹识别,从而有效提高了识别性能。
1 问题分析
1.1 相关概念
(1)同源指纹与异源指纹:采集自同一手指的指纹图像,称为同源指纹;采集自不同手指的指纹图像,称为异源指纹。
(2)同源匹配与异源匹配:如果模板指纹和输入指纹是同源的,则称它们之间的匹配为同源匹配;如果模板指纹和输入指纹是异源的,则称它们之间的匹配为异源匹配。
(3)匹配区域:指一对模板指纹和输入指纹(实际上是特征提取后得到的一对平面细节点集合)在完成配准、进行匹配(同源匹配或异源匹配)后,所有成功配对的细节点所围成的最大区域。本质上,匹配区域是可用于相似程度度量的、模板指纹和输入指纹的有效重叠区域。
(4)未匹配细节点:虽位于匹配区域内、但却没有形成配对的细节点。
1.2 未匹配细节点信息的区分性分析
在同源匹配中,未匹配细节点的成因主要有三个方面:①由于图像本身存在形变、图像预处理技术不够完善等因素的影响,使得部分细节点定位存在较大偏差;②匹配过程中,匹配算法对成功匹配的条件要求比较高,使得部分本应形成匹配的细节点对难以实现匹配;③个别伪细节点的存在。
对于异源匹配而言,由于模板指纹和输入指纹来自不同的手指,匹配的结果只是找到模板指纹和输入指纹相似性最大的局部区域作为匹配区域。显然,异源指纹的匹配本质上是一种“伪匹配”,但是,当图像质量比较差、面积比较大、提取的伪细节点数量很多、分布比较密集时,也有可能在局部重叠区域(匹配区域)产生足够多的、满足匹配条件的细节点对,这也是指纹识别中产生误识的最主要原因。异源匹配中,未匹配细节点的产生,本质上只是一个随机性质的问题。
宏观上看,同源匹配和异源匹配,匹配区域内未匹配细节点信息是有明显差异的:①对同源匹配而言,一般来说,匹配区域内未匹配细节点的数量会很少;而对异源匹配来说,匹配区域内未匹配细节点的数量往往会比较多;②对同源匹配而言,本应形成匹配、但未能成功匹配的点对,在位置上仍存在着很强的对应关系(尽管有一定的定位偏差);③对同源匹配而言,匹配区域内的未匹配细节点在分布上存在着较高的一致性和规律性;而对异源匹配而言,匹配区域内的未匹配细节点在分布上几乎没有任何一致性和规律性。
所以,从成因和特点来看,同源匹配和异源匹配中未匹配细节点是包含了一定的区分性信息的。如果能有效挖掘其中的区分性信息并加以利用,可以提高指纹识别系统的性能。
2 未匹配细节点的特征定义与提取
2.1 未匹配细节点比例
一般来说,同源匹配和异源匹配中匹配区域内的未匹配细节点数量会有一定差异。如在图1和图2中,红色点表示匹配细节点,蓝色点表示匹配区域内未匹配细节点,红色框框出匹配区域。两幅图中,虽然匹配细节点对数量都为10,但同源匹配(图1)中未匹配细节点数量明显少于异源匹配(图2)中未匹配细节点数量。
本文用未匹配细节点与匹配细节点的比例来刻画未匹配细节点数量上的特点,此比例可以在一定程度上分辨同源匹配和异源匹配,是可以利用的区分性信息。将此比例记为R,计算式如下:
式中:N1为模板指纹匹配区域内未匹配细节点个数;N2为输入指纹匹配区域内未匹配细节点个数;Nc为两副指纹匹配成功的细节点对数。
图1 两幅同源指纹的匹配结果Fig.1 Matching result of two homologous fingerprints
图2 两幅异源指纹的匹配结果Fig.2 Matching result of two heterologous fingerprints
R越小,两副指纹的匹配得分越高,因此,用公式(2)中的归一化方法将R归一化到[0,1]之间,给出匹配得分Sa。
式中:max R和min R分别代表R的最大值和最小值。
2.2 紧互对原型对距离
对同源匹配而言,本应形成匹配、但未能成功匹配的点对,在位置上仍存在着很强的对应关系(尽管有一定的定位偏差)。但异源匹配中,由于未匹配细节点的产生在本质上是随机的,因此,未匹配成功细节点在位置上不存在任何对应规律。本文定义了紧互对原型对,并用其描述两个未匹配细节点在位置上的对应关系。
定义1 对A和B两幅指纹进行匹配,若在A和B匹配区域内的两个未匹配细节点pi和qi满足式(3),则称细节点对(pi,qi)为紧互对原型对:
用函数d(·)计算两点间的欧式距离;Am为指纹A中匹配区域内未匹配细节点的集合;Bm为指纹B中匹配区域内未匹配细节点的集合。
图3中的模板指纹和输入指纹是同源指纹。红色点代表匹配成功的细节点,蓝色点代表匹配区域内未匹配成功的细节点。模板指纹中绿色点代表输入指纹匹配区域内未匹配细节点在模板指纹中的位置。可以看到,有几个绿色细节点与蓝色细节点距离很近,根据定义1,这些细节点对为紧互对原型对。
图3 两幅指纹中的紧互对原型对Fig.3 Tight pair-wise prototypes in two fingerprints
根据上文分析,在同源匹配中,可能存在较多数量的紧互对原型对,并且紧互对原型对中两细节点间的距离相对较近。而异源匹配中有可能无法提取出紧互对原型对,在提取出的紧互对原型对中两个细节点的距离也相对较远。由此,紧互对原型对中两细节点的距离信息应该是具有区分性的信息。统计两副指纹中所有紧互对原型对,并用式(4)计算平均距离Davg作为衡量指纹相似度的指标,平均距离越小,两副指纹的匹配得分越高。
式中:Np为紧互对原型对的个数;d(pi,qi)为第i个紧互对原型对中两细节点的欧式距离。
在计算过程中若未匹配细节点个数为0,则置Davg为0,若未匹配细节点个数不为0,但紧互对原型对个数为0,则置Davg为较大值。最后,采用与2.1节中相同的归一化方法将Davg归一化到[0,1]之间,给出匹配得分Sb。
2.3 网格集合距离
利用网格集合距离来对未匹配细节点的分布一致性进行衡量。将一幅指纹图像划分成M×N个大小相同的网格,计算每个网格内未匹配细节点的个数,其中只计算匹配区域内的未匹配细节点,设与匹配区域没有交集的网格中未匹配细节点个数为0。将两副待匹配指纹中第i(i=1,2,…,M×N)个网格中的未匹配细节点集合分别记为Ai和Bi,则两副指纹的网格距离G由公式(5)给出:
式中:|Ai|和|Bi|分别代表集合Ai、Bi中的元素个数。网格距离G越小,认为两幅指纹中未匹配细节点在分布上越一致(相似),从而,两副指纹的匹配得分越高。最后,采用与2.1节中相同的归一化方法将G归一化到[0,1]之间,给出匹配得分S c。
2.4 Hausdorff距离
从另外一个角度,如果把匹配区域内的未匹配细节点集看作一个集合,则可以直接通过计算两个集合的相似度来衡量两幅指纹中未匹配细节点在分布上的一致性。本文用Hausdorff距离[14]来衡量两个未匹配细节点集合的相似度。
对于集合A=(a1,a2,…,am)与集合B=(b1,b2,…,bn),Hausdorff距离的计算公式为:
在计算两个未匹配细节点集合的Hausdorff距离时,用公式(9)(10)中的欧式距离代替公式(7)(8)中两元素的差运算:
具体过程如下:设集合A=(a1,a2,…,am)和集合B=(b1,b2,…,bn)分别为模板指纹和输入指纹匹配区域内的未匹配细节点集合。首先针对A中每个细节点,计算其到B中所有细节点距离中的最小距离,然后取集合A中得到的所有该最小距离中的最大值作为集合A到集合B的距离,记为h(A,B)。同理,算得集合B到集合A的距离,记为h(B,A)。最后,取h(A,B)与h(B,A)中较大的值作为集合A和集合B的Hausdorff距离。但上述过程极易受到伪细节点的影响。例如一个集合中的某伪细节点与其他细节点距离都较远,则用上述方法得到的Hausdorff距离将是一个较大的噪声值。因此,本文使用Hausdorff距离的改进算法:用集合A中每个细节点到集合B中所有细节点距离的平均值代替最小值,取集合A中所有细节点得到的平均值中的最大值作为集合A到集合B的距离。同理,计算集合B到集合A的距离。最后,取二者的最大值作为集合A和集合B的Hausdorff距离。两个集合的Hausdorff距离越小,两幅指纹中未匹配细节点分布一致性越高,从而,两副指纹的匹配得分越高。将Hausdorff距离用与2.1节中相同的归一化方法归一化到[0,1]之间,给出匹配得分Sd。
3 得分级融合
本文通过得分级融合方法,将上述从未匹配细节点中提取的四方面特征的匹配得分与一种已有的细节点方法[15]的匹配得分进行融合,实现指纹识别。文献[15]提出了一种多模板融合的指纹识别方法,将指纹模板视为空间中的点,利用同一手指的两两模板之间的距离建立空间多面体,通过计算输入模板与空间多面体中心的距离得到匹配得分。该方法在竞赛数据库FVC2000及FVC2002上得到了较好的识别效果。拟通过此融合策略达到两个目的:①验证未匹配细节点中的确存在可利用的区分性信息;②证明将从未匹配细节点中提取的区分性信息作为辅助特征用于指纹识别能够提高指纹识别系统的性能。
在识别阶段,将输入指纹逐一与每个用户的模板指纹进行匹配。采用线性加权的得分级融合方法将基于四个辅助特征的匹配得分(Sa、Sb、Sc和Sd)与已有匹配算法的匹配得分(So)进行融合,得到最终匹配得分Sf。计算公式如下:
(1)依据具体数据特性设置权值。不同应用背景下的数据特点并不相同,存在指纹质量等因素的差异,融合方法(1)对不同的数据库设置不同的权值。原始匹配得分包含较多信息,仍作为主要的衡量标准,因此,设置权重k1为稍大于0.5的值,然后在每个数据库上,根据多次实验的经验值确定较高识别精度时k2~k5的组合。
(2)依据匹配得分设置权值。匹配得分本身可以在一定程度上反映其对应特征的重要程度。此方法考虑了不同指纹对匹配时的个性化特点。ki(i=1,…,5)的计算公式如下:这里为了方便表达,分别用S1~S5替代So~Sd。
得到最终的匹配得分Sf后,设置阈值τ,如果Sf大于τ,则认为输入指纹和模板指纹是同源指纹,将模板指纹对应的用户ID返回;如果Sf小于等于τ,则认为输入指纹和模板指纹为异源指纹,用相同方法将输入指纹与模板库中其他用户的模板指纹进行匹配,直到遇到同源指纹,返回相应用户ID。如果输入指纹与模板库中所有用户的指纹都被认为是异源指纹,则返回错误或报警信息。
4 实验结果及分析
4.1 实验设置
实验中选择文献[15]的方法为对比方法。该方法属于典型的基于细节点的指纹匹配方法,其识别性能优于当前同类方法。通过实验将本文提出的融合方法(1)和融合方法(2)的识别性能与文献[15]的方法进行了对比。
实验使用国际指纹识别竞赛的三个数据库FVC2000、FVC2002和FVC2004,每个数据库均包含4个子库,分别称为DB1、DB2、DB3和DB4。其中的每个子库中都包含采集自100个手指的指纹,每个手指均采集8幅指纹图像,即每个子库包含800幅指纹图像。FVC2000、FVC2002和FVC2004每个数据库包含3200幅指纹图像,三个数据库共包含1200个不同手指的9600幅指纹图像。
对每个手指,取数据库中该手指的前3幅指纹图像作为模板指纹,剩余的5幅指纹图像作为测试指纹。分别用等错误率(EER)和ROC曲线两个指标对识别性能进行评价。
4.2 实验结果及分析
表1~表3列出了在FVC2000、FVC2002和FVC2004所有数据库中本文提出的融合方法和已有方法获得的EER。可以看出,本文方法的EER全部低于已有匹配方法。虽然在不同指纹库中,本文方法对系统识别性能提高的效果不同,但总体性能都有显著提高。其中,第(2)种融合方法性能提高幅度最大。融合方法(2)优于融合方法(1)的主要原因是其对权重的设置考虑了每次两幅指纹匹配时的具体情况。
图4~图6分别展示了本文方法和已有方法在FVC2000、FVC2002和FVC2004中所有数据上的ROC曲线。ROC曲线更加直观和全面地展示本文提出方法在识别性能方面的优越性。在FVC所有数据库上的实验结果可以充分说明以下两点:(1)未匹配细节点中的确含有能够有效分辨同源指纹和异源指纹的区分性信息。(2)本文定义和提取的4种辅助特征可以有效挖掘未匹配细节点的区分性信息,融合4个辅助特征的匹配方法可以大幅度提升系统性能。
表1 FVC2000数据库上各方法的EER(%)Table 1 EER(%)of different methods on FVC2000
表2 FVC2002数据库上各方法的EER(%)Table 2 EER(%)of different methods on FVC2002
表3 FVC2004数据库上各方法的EER(%)Table 3 EER(%)of different methods on FVC2004
需要特别说明的是:①本文实验主要是为了验证所挖掘的未匹配细节点特征信息的区分性以及将其与已有的细节点指纹匹配方法进行融合,是否可以有效提升指纹识别系统的性能。理论上,已有的各种基于细节点的指纹匹配方法,都可以作为被融合方法。所以,本文实验中选择的对比方法(文献[15]的方法)本身是否为当前性能最优的方法、融合后的性能是否为当前算法中最优的与本文的贡献并无直接关系。②本文方法造成系统性能提升的根本原因在于两点,一是利用了在已有方法中被忽视的未匹配细节信息,对区分性信息的利用更加充分;二是未匹配细节点信息与成功匹配的细节点信息之间存在一定的互补性。例如在2.1节的图1和图2中,虽然匹配细节点对数量都为10,但是未匹配细节点的数量成为了有效的补充,为区分同源匹配和异源匹配提供了证据。显然,这种得分级融合策略,与具体融合哪种已有的基于细节点指纹匹配方法并没有直接关系。可以预见,将所挖掘的未匹配细节点信息和各种已有的细节点匹配方法融合,可以在不同程度上提升识别的性能。
图4 FVC2000数据库上各方法的ROC曲线Fig.4 ROC curves of different methods on FVC2000
图5 FVC2002数据库上各方法的ROC曲线Fig.5 ROC curves of different methods on FVC2002
图6 FVC2004数据库上各方法的ROC曲线Fig.6 ROC curves of different methods on FVC2004
5 结 论
(1)突破了指纹识别中未匹配细节点属于无用信息的思维定势,提出了挖掘和利用未匹配细节点中所包含的区分性信息,从而提高指纹识别系统性能的新思路。
(2)基于同源指纹匹配和异源指纹匹配中未匹配细节点的成因和特点不同,定义和提取了4个方面的特征,实现了对未匹配细节点中区分性信息的有效挖掘。
(3)将在未匹配细节点中提取的区分性信息作为辅助特征,通过在得分级上与一种已有的基于细节点的匹配算法进行融合,有效提升了指纹识别系统的性能,验证了未匹配细节点中确实存在可以利用的区分性信息。
[1]He X,Tian J,Li L,et al.Modeling and analysis of local comprehensive minutia relation for fingerprint matching[J].IEEE Transactions on Systems,Man,and Cybernetics—Part B:Cybernetics,2007,37(5):1204-1211.
[2]Feng J.Combining minutiae descriptors for fingerprint matching[J].Pattern Recognition,2008,41(1):342-352.
[3]Chen F,Zhou J,Yang C.Reconstructing orientation field from fingerprint minutiae to improve minutiae matching accuracy[J].IEEE Transactions on Image Processing,2009,18(7):1665-1670.
[4]Jain A K,Feng J.Latent fingerprint matching[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(1):88-100.
[5]Cao K,Yang X,Chen X,et al.A novel global feature for minutiae-based fingerprint matching[J]. Pattern Recognition Letters,2012,33(10):1411-1421.
[6]Paulino A A,Feng J,Jain A K.Latent fingerprint matching using descriptor-based hough transform[J].IEEE Transactions on Information Forensic and Security,2013,8(1):31-45.
[7]Zhao Q,Zhang Y,Jain A K,et al.A Generative model for fingerprint minutiae[C]∥In Proc International Conference on Biometrics(ICB),Madrid,Spain,2013:1-8.
[8]Wand Y L,Ning X,Yin Y.A new fingerprint matching algorithm[J].Journal of Image and Graphics,2003,8(2):203-208.
[9]Feng J,Ouyang Z,Cai A.Fingerprint matching using ridges[J].Pattern Recognition,2006,39(1):2131-2140.
[10]Jain A K,Prabhakar S,Hong L,et al.Filterbankbased fingerprint matching[J].IEEE Transactions on Image Processing,2000,9(5):846-895.
[11]Yang J C,Park D S.A fingerprint verification algorithm using tessellated invariant moment features[J].Neurocomputing,2008,71(10-12):1939-1946.
[12]Queka C,Tana K B,Sagarb V K.Pseudo-outer product based fuzzy neural network fingerprint verification system[J].Neural Networks,2001,14(3):305-323.
[13]Labati R D,Genovese A,Piuri V,et al.Contactless fingerprint recognition:A neural approach for perspective and rotation effects reduction[C]∥IEEE Workshop on Computational Intelligence in Biometrics and Identity Management(CIBIM),Singapore,2013:22-30.
[14]Huttenlocher D P,Klanderman G A,Rucklidge W J.Comparing images using the Hausdorff distance[J].IEEE Trans Pattern Anal Mach Intell,1993,15(9):850-863.
[15]Ren C,Yin Y,Ma J,et al.A novel method of score level fusion using multiple impressions for fingerprint verification[C]∥IEEE Conference on System,Man and Cybernetics Society(SMCS),San Antonio,TX,2009:5196-5201.
[16]Ross A,Jain A K,Reisman J.A hybrid fingerprint matcher[J].Pattern Recognition,2003,36(7):1661-1673.