基于非特征点的指纹自动识别方法研究进展
2018-12-28袁颖
袁 颖
(贵州警察学院刑事技术系 贵州 贵阳 550000)
1 引言
指纹因其人各不同且终身不变的性质成为了应用最为广泛的生物特征识别技术之一,目前,指纹自动识别技术已在教育、金融、公安、社保等行业开始广泛应用,并在移动支付、考勤、门禁等人身识别领域取得良好的应用效果。在公安领域,通过指纹自动识别系统对入库指纹与犯罪现场指纹进行比对来锁定犯罪嫌疑人,缩小侦查范围是指纹识别的主要应用形式。传统的指纹自动识别系统使用的特征点为指纹的二级特征即高尔顿细节特征[1],在指纹自动识别中以终点、分歧点及小点为基础,该方法经历了几十年的演变已经十分成熟。然而,近年来随着人工智能和深度学习技术的发展,已有不少研究者尝试在该领域使用不基于指纹细节特征点的算法对指纹进行识别。
2 国内外指纹自动识别系统概述
指纹自动识别系统最早始于20世纪60年代,随着人口的增多城市变得越来越拥挤,犯罪率飙升,各国警局积累的指纹档案越来越多,美国联邦调查局FBI、英国内政部、法国巴黎警方及日本警察厅[2]等各国警政部门开始研究指纹的自动识别系统。法国内政部和形态数学实验室在国立巴黎矿业大学一起开发的Morpho系统,英国Logica公司为新苏格兰厂开发的logica[3]系统,该系统可以捕捉细节特征点、记录特征点的方位和方向,探测脊线数量,这是纹线数量第一次被AFIS的供应商所使用。日本NEC指纹自动识别系统是直接比对单面或者滚动捺印的三面指纹图像,采用类似于FBI系统细节点提取的方法来处理指纹图像。美国的IAFIS、AFIX Tracker、Printrak,其中最著名的是1999年美国FBI使用的IAFIS系统(Integrated Automated Fingerprint Identification System)[4],该系统是基于比对指纹纹线的细节特征点,如比对纹线的终点、分叉点等信息,如果两枚指纹拓扑等价,那么这两枚指纹可以被判断为认定同一。
我国的指纹自动识别系统的应用起步较晚,从20世纪80年代初开始,目前国内各地公安系统使用的指纹识别系统供应公司,主要为北大高科、北京东方金指、北京刑科所、北京众城巨元、海鑫科金萨基姆、汉林信通。除此以外还有清华大学的CAFIS系统、北京大学的Delta系统等。传统的AFIS系统的识别特征点都是基于高尔顿所提出的指纹细节特征点,虽然不同的系统具体方法各异,但主要步骤都是分为指纹图像增强、细节特征提取、细节特征匹配三步,如图1所示。所使用指纹特征点(端点、分叉点)的位置和角度等信息对指纹进行识别,是目前各类指纹自动识别系统中最常见的方法。比对的关键是找到指纹图像样本和输入的指纹图像中特征点的最佳的校准点,然而,由于模糊的图像质量及复杂的输入条件,在指纹图像不清晰时指纹细节特征点难以提取,在面临需要和与日俱增的指纹数据库中图像进行比对时,指纹自动识别系统效率低精度下降。并且,基于特征点的识别算法并不能完全利用日益高清的指纹图像里的丰富特征信息。
图1 传统指纹识别步骤
3 指纹无特征区域定义
无特征区域是指在一定范围内,在手印没有变形的正常条件下,形成的手印中没有高尔顿细节特征点的区域,即无起点、终点、分歧、结合、眼形线、短线、勾形线、桥形线、点9种细节特征,这一区域成为无特征区域[5],在国外文献中也称为“Open Field”开放区域[6]。指纹的细节特征都以细节点的形式出现,作为一个没有出现特征点的空白范围区域,本身就是质量较高的细节特征,具有较高的鉴定价值。
根据Osterburg等人[7]早在1977年建立的数学模型对39枚指纹进行了区域的划分,对划分出来的8591个1平方毫米的区域进行统计,根据该统计结果显示,如图2所示的无特征点的区域在指纹中占有的比例是76.60%,其中起点终点是指纹特征点中比例最高的特征,比例为8.32%。Lin等人[8]也在同一时期做了相似的研究,对76个指纹14280个特征点进行了统计,根据统计发现无特征区占有的比例是83.90%,这个比例远远高于指纹中特征点的比例,起点终点占比为9.60%。除此以外,还有大量的研究在定性定量的分析过指纹特征点位置关系以后得出结论,指纹纹线是连贯的整体,单独来看指纹特征点可能存在局限性,指纹中无特征点的区域的面积比有特征点的区域面积比例要大很多,即使没有细节特征点的区域也具有重要意义。
图2 无特征点的区域
对于指纹无特征区域的分布问题,洛桑大学的Champod[9-10]用统计学理论统计了指纹特征点的分布情况,研究结果显示细节特征在指纹的三角区域和中心区域分布比其他区域的密度要大很多,该研究使用了泊松分布公式,泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率,该研究还基于指纹细节特征点的位置及密度进行了分析,根据指纹中的主要位置进行了平均密度评估。此外,使用泊松分布统计指纹特征点分布情况,让我们能够预测一定范围内特征点数量和一定区域内指纹细节特征的变化,以及一定区域内的无特征区域分布。这项研究强调了无特征区域的重要性,广阔的只有连续纹线而没有特征点的区域,也具有指纹鉴定价值。
4 指纹无特征区识别的必要性
首先,挖掘指纹图像的更多可识别的信息是未来指纹识别的趋势。指纹无特征区在被科学化的前提下会对指纹筛查起到一定作用[11]。现有的基于指纹细节点的AFIS指纹库中,还有大量的指纹特征信息未被利用,大大限制了我国刑事案件的破案率和办案效率。特别是犯罪现场的样本指纹中大部分是特征点少的残缺指纹,按照传统的指纹鉴定标准是不足以进行指纹的认定,然而,在国内外关于指纹鉴定数量标准的讨论表明,指纹的同一性不仅仅由细节点的数量决定,还与指纹特征的种类、特殊性、图像局部质量及特征之间的相互关系等密切相关。而且,随着指纹采集设备采集到的指纹图像清晰度的不断提高,捕获残缺指纹图像中的更多信息成为可能,瑞士联邦技术研究所研究了汗孔和指纹的细节点特征在残缺指纹匹配中的应用价值[12],研究表明在残缺指纹中指纹的细节点信息严重不足时,指纹三级特征的价值就十分重要,特别是在分辨率足够高时,在残缺指纹图像中的指纹的汗孔、细点线、纹线形态等信息有很高的识别价值。美国的研究人员构建了利用1000dpi分辨率指纹图像中多重特征的AFIS 演示系统,进行分级识别,在这样的分辨率下还有很多指纹信息可以作为识别特征。图3是用我国公安系统常用的AFIS指纹自动识别系统(北京东方金指)发送的正查匹配分数为1000分的比对指纹图,左边为在犯罪现场找到的粉末刷显的汗潜指纹一枚,右边为指纹库指纹,指纹库的容量为千万级。左图中指纹中心有一大块的模糊区域,该区域能隐约看到纹线的走向,但却并不足以能够提取指纹特征点,尽管如此,在纹线清晰的部位仍然可以找到大片没有细节点特征。如图3中所示,这样的模糊样本中存在大量纹线清晰的区域可以进行肉眼识别,但AFIS无法标注特征点的区域。此外,一般的指纹图像中可以提取的细节特征点大约是60~80个细节点,而不同的指纹细节点个数也不尽相同,对于模糊指纹这个数量会更少,但纹线的数量、形态、流向特征却清晰可见。
图3 AFIS指纹比对图
其次,传统基于特征点的经典指纹自动识别算法,面临大库衰减,急需提高效率。历经几十年的演变,传统细节特征点算法对于十指比对的查重任务,算法准确度与效率都非常可观。但随着十指库和案件库的不断积累,经典算法在面对大库衰减的问题上缺点逐步显现,面临比对效率下降的问题。细节特征点算法的不足日益明显,单纯的提取局部细节特征点丢失了大量的指纹其他特征的信息,如局部脊线和谷线的走向并没有被考虑在内。使用非特征点信息对指纹进行匹配是基于指纹图像的匹配,不用对指纹图像进行预处理、二值化,可以提高算法的效率和特征利用率。据相关研究显示适当增减细节特征,控制指纹细节特征点的相对密度,可以达到提高比重率的效果[14]。
最后,使用非特征点的识别算法可以排除人工对指纹识别的影响。传统的细节特征识别的算法最后仍然需要人工进行标注,国内外已有学者研究表明,在指纹自动识别系统中指纹检验人员对特征点的标注方式受人的经验和知识背景的影响[13],不同的指纹检验人员对标注的指纹发送正查比对分数有不同程度的影响。使用基于无特征点的识别可以避免人工干扰,避免这样的影响。
5 基于非特征点的指纹识别算法
国内现有的指纹自动识别系统应用中,还没有直接使用指纹非特征点信息进行识别的系统上线,钱荣欣[15]将算法部署在分布式环境下,在多节点下并发处理大量指纹数据,并提供实时查询功能和自动特征提取,提取的是指纹图像的信息,使用计算机视觉领域的深度学习技术、图像复原、编码领域和自适应小波框架技术,提出的新的指纹图像智能比对系统,可以实现完全自动化指纹特征提取无需人工干预。
基于非特征点的指纹识别提取的特征信息有两类,一类是指纹图像的全局或者局部纹理信息,另一类是指纹的三级特征。
基于纹理识别的研究。Ross等人[16]使用了综合指纹识别算法,使用特征点和脊线特征地图来构建一系列八方向的Gabor滤波。并在2007年也提出了一种新的基于特征点纹理方向的地图综合指纹识别算法,应用了八向滤波方向来生成衡量方向的特征码,用于边缘提取的线性滤波器对指纹图像进行特征提取。Nanni和Lumini[17-19]提出了一种基于局部二进制模型LBP的综合指纹识别算法。LBP一种具有灰度不变性和旋转不变性的高效的纹理描述算法。Yang 等人[20-21]提出了一种不变瞬间IM的指纹识别算法,该算法使用学习向量量化神经网络LVQNN来进行匹配,并提取7个不变的的瞬间作为指纹向量对指纹进行识别。Yang等人还使用棋盘格不变瞬间或是浅区域IM和特征值加权余弦EWC距离和非线性反向传播神经网络BPNN来处理指纹识别不同的输入条件。基于深度学习的研究还包括神经网络(ANN)[22]、反向神经网络(BPNN)[23]、 线性矢量量化(LVQ)[24]、极限学习机(ELM)[25]等。
基于指纹三级特征的识别,主要是基于汗孔识别的研究。Zhao[26]等人提出了一种直接用汗孔进行匹配的方法,利用指纹汗孔周围的脊线纹理等信息进行特征的粗匹配,然后利用粗匹配的结果建立特定的数学模型提出粗匹配过程中的错误特征点,以此来提高匹配的精度和效率。Roddy和Stosz[27]基于指纹自动比对算法提出了一种可以评估汗孔作为指纹识别效果的模型,并在国家安全局的指纹自动识别系统中使用,该系统是那时唯一利用汗孔作为识别特征的比对系统。他们还研究了汗孔的统计学信息,从统计学的角度证明了两个不同人的指纹中20个汗孔都重复的概率是5.18 x 10-8,以此来证明了汗孔作为人身识别的意义。Aditya Abhyankar和Stephanie Schuckers[28]在文献中使用小波变换提升指纹三级特征的识别精度,提出基于校准匹配精度的三角形匹配方法,算法把指纹特征按照一定的规则相连接起来,连接的特征点构成一个三角,统计出两副指纹的相似角形个数,就可以进行匹配,该研究对114个像素为686PPI的指纹进行了测试,通过组后的统计图表显示,其匹配性能得到了提高。Ray等人[29]尝试从500PPI的指纹图像中提取汗孔,来识别汗孔的位置并在指纹比对系统中使用。Arun Ross[30]等人提出的指纹配算法考虑到了指纹的非线性形,要利用板条函数算出指纹的非线性形,采用校准配的方法。
其中还包括一些经典的先进的描述符,Tico等人[31]提出了一种基于变换的识别算法使用离散沃尔什变换DWT来对特征进行变换。沃尔什函数为基本函数的一种非正弦正交变换特征,是从指纹图像细节在不同规模和方向上的数字小波DWT系数标准的偏差来进行分析的。Amornraksa和Tachaphetpiboon[32]提出了另一种基于数字余弦变换DCT的识别算法对特征进行分析,该方法显示了输入指纹与指纹库指纹的高比对率。Jin等人[33]提出了一种基于变换的识别算法,基于整合小波及傅立叶-梅林变换WFMT的框架工作来实现特征点的提取。大量的WFMT特征通过FMT的线性特征可以用于形成相关的定值特征,来减少输入指纹图像的变化。
总之,现有使用不基于指纹特征点的识别算法主要是将含有指纹特征点特征、中心、三角等纹线特征作为完成的指纹图像来进行识别,使用指纹图像本身的纹理信息和神经网络结合进行识别。一方面,指纹的纹理信息是指指纹的纹线方向、纹线数量、纹线形态、纹理信息等。纹理是物体表面的自然特性,纹理通过像素及其周围空间邻域的灰度分布来表现。它描述图像像素点与图像领域之间的灰度空间的分布关系,纹理特性的随机牲很强,使用指纹的纹理信息进行识别可以提取更多更丰富的指纹信息,并且不进行预处理阶段的二值化、骨架化处理。优点是精度高、速度快,与其他系统的耦合性高。另一方面,深度学习算法是将特征提取的设计和特征选择这两个步骤合二为一。此外,还伴随一些经典和最先进的非细节的基础描述符的使用,如Gabor滤波器,DWT,DCT,WFMT,LBP,HOG,IM等。
6 困难与展望
与传统基于细节特征的经典算法相比较,基于非细节特征的算法在实际应用方面还存在一定的技术困难,基于深度学习的识别方式,虽然高效准确,但使用上还是有许多需要注意的地方,例如选择恰当模型的前期训练时间较长,以及对于前期的学习训练材料的质量和数量要求敏感等问题。但随着模式识别技术、人工智能技术的应用,高分辨率指纹采集设备的普及,长远看基于非特征点识别的方式是解决目前传统基于特征点识别算法面临的大库衰减等问题,为解决可识别特征点少的残缺指纹的识别问题,以及指纹自动识别中人工干预带来的误差等问题提供可能,应用前景广阔。