指纹测试样本采集系统关键技术研究
2015-03-07丁增喜王旭祁卫炜
丁增喜 王旭 祁卫炜
1.证件防伪公安部重点实验室 2.公安部第一研究所
一、概述
在各种人体生物特征中,指纹识别由于其具有唯一性、稳定性、识别率高等特点,在目前使用的各种生物特征识别技术中成为最为成熟、最为广泛的生物特征识别技术[1]。
指纹识别技术有两种应用模式:一是1:1的认证,二是1:N的辨识。目前最多的应用场景是1:N辨识,尤其是在刑侦领域中,1:N辨识功能对于案件的侦破有着很大的帮助。对于指纹识别技术来说,无论1:1认证还是1:N辨识都是围绕如何提高识别准确性和识别的速度来进行的,其研究内容包括指纹图像增强、指纹特征提取、指纹特征匹配以及指纹分类等算法。而这些指纹识别算法无论是警用还是民用,都需要基于一定容量的指纹库进行性能测试,指纹库中数据组织的分布规则以及数据库容量的大小都对指纹识别算法的性能产生一定的影响。此外,随着指纹识别技术的大规模应用,国内外市场上指纹识别类产品种类越来越多,其性能指标、技术参数参差不齐,各种产品的宣传往往偏重商业目的,这些问题为公安行业以及其他指纹识别技术应用部门在产品的选择上造成了困难,迫切需要相关部门建立评价体系对指纹识别类产品进行客观的性能评测,为应用部门提供科学合理的选择依据。而指纹测试样本库是评测指纹识别算法性能的重要依据,只有基于大规模指纹测试样本数据才能真实有效的完成指纹识别算法核心性能指标的评测[2]。如何合理、高效、快捷地完成指纹测试样本的采集将是指纹测试评测首先面临的重要问题,而完成这项工作需要解决测试库建库规则、采集设备接口、采集模式设计、系统架构方式等多个技术难题。
二、指纹测试样本采集问题分析
首先,需要确立测试样本库的建库规则。我国幅员辽阔、人口众多,是一个多民族聚居的地区。居民在聚居区域、民族、性别、年龄以及职业等多个方面具有一定的分布特点,这些因素对指纹的质量均具有一定程度的影响。因此在测试样本库建库之前就要制定一套规则,使测试样本库中指纹的分布符合我国现有国情。
其次,近年来我国指纹生物特征技术发展迅速。市场上的采集设备品种繁多,接口类型千差万别。各个厂家设备应用领域各不相同,应用方式千差万别,采集设备的接口和采集的输出结果也没有得到统一。因此在采集前如果不能很好的统一接口和输出结果,会为采集工作增添很多困难,也会为进一步影响指纹识别算法的评测工作。此外,由于采集系统需要同时挂接多款采集设备,在系统设计时还要确保多款采集设备在实时调用时互不影响。
最后,一般情况下指纹采集工作需在多个采集地点同时进行,因此在系统设计和采集方式选择上如何让工作人员能够方便操作,实现快速、准确、高效地采集到符合要求的指纹样本也是需要解决的问题。
三、指纹测试样本采集关键技术
(一)建库规则的确定
从测试样本库建库角度出发,为了建立一套客观、科学、完整的指纹应用技术评价体系,需要针对指纹应用人群分布特点采集特定人群的指纹样本。以居民身份证指纹测试样本库建库为例,该项工作目标为选出全国范围应用的指纹识别算法,因此测试库设计时,参考我国第六次全国人口普查数、《2009年度人力资源和社会保障事业发展统计公报》等文献资料,编制建库规则(如图1所示)。测试库建库规则按照性别、产业、民族以及地域/环境等五个方面进行属性划分,其中年龄按照小于15岁、15-59岁以及大于等于60岁三个年龄段进行划分。在职业上按照第一产业、第二产业以及第三产业三部分进行分类,这样就很好地涵盖了我国当前多种职业,具有很好的代表性[3]。建库样本规则的确定为指纹测试样本采集工作奠定了基础。
(二)采集设备选取及接口统一
针对指纹采集设备品种多、可选范围大等情况,需参考市场占有率及设备试用情况,从各类指纹采集设备中选择了最有代表性的产品用于样本采集。为了统一指纹采集设备接口,便于将来系统调用,系统设计时需参考已得到广泛应用的行业标准,例如《活体指纹图像应用程序接口规范第1部分:采集设备》[4,5]、《指纹采集器接口规范》等,以用于指导和规范参与指纹测试样本采集的采集设备动态库接口,只有符合了该接口规范的采集设备才能够接入采集系统;通过这种方式能很好地解决采集设备接口不统一的问题。
(三)设备间的无缝切换
在指纹测试样本采集系统设计时,对指纹采集器厂家提供的接口文件格式,均要求以Windows动态库格式提供。Windows动态库格式是微软提出的一种标准函数调用格式,它可以将共享的程序代码编译成独立模块以供调用,库函数的任何修改都不对应用程序产生影响。通过对动态库的动态调用,操作人员可以决定在何时加载和释放指纹采集设备,使各个设备之间的加载和释放不存在任何影响。在设计开发的时候,系统列出厂家设备名称,通过选择某个厂家,系统自动调用该厂家对应采集动态库,激活设备进行指纹采集。而调用该动态库时候,会自动释放上次调用的动态库,使多个设备在调用过程中互不影响。对采集设备按照统一的规则进行编号和命名,如图2所示。
(四)自动采集和人工采集模式
为了满足指纹测试样本的采集数量大、次数多、速度快、随机性高等特点,在采集系统中设计了自动采集模式。厂家要根据自动采集函数接口要求,提供设备采集动态库。系统对质量满足基本要求的指纹图像自动采集入库保存。此外,为了防止在采集过程中有些指纹图像由于伤病、磨损、脱皮等情况而导致无法自动采集的情况下,系统又提供了人工采集模式,可以实现人工手动实时采集指纹图像并入库保存。系统启动成功并选取设备之后会自动进入自动采集模式,在规定的时间内自动采集按压的手指指纹图像,在系统连续采集规定数量的指纹图像后由操作人员核验采集图像质量然后提交保存,采集界面如图3所示。采集后在未提交前如果发现某一幅指纹图像质量不符合基本要求,则实时选取该幅指纹图像进行再次采集,而不用影响其他几幅图像。在采集过程中如果有些手指指纹图像质量较差,指纹采集设备无法自动成功采集,可以选择人工采集模式进行手动采集。通过人工采集模式可以强制采集一幅指纹图像,从而确保了采集到的指纹测试样本的真实性。
(五)系统架构方式的选取
指纹测试样本的采集可以采取多种系统架构方式,既可以联网集中采集,也可以脱机移动采集。联网集中采集将采集机器集中联网,采集数据集中统一入库。这种方式采集效率高、速度快,采集的指纹数据记录编号连续,便于后期处理。每次采集的指纹数据自动进入统一的数据库,不需要后期的数据归纳整理。此外,每台机器也可以不必挂接所有指纹采集设备,系统负荷压力小,但是这种架构方式只适合采集地点固定、采集时间相对集中的情况。
而脱机移动采集方式却可以在多个地点同时进行指纹测试样本的采集。通过对采集设备的接口以及对设备采集库提供方式进行统一,每台采集系统均可以挂接所有指纹采集设备,并可以在采集设备间实时切换进行样本采集。这样每台采集系统都可以成为一台采集服务器,可以实现多台采集系统在多个采集点进行集中采集,多台采集系统之间互为冗余。这种采集方式存在的问题是要在采集前根据预先规定的采集人数需要事先为每个采集地区的分配采集编号范围。在采集结束后需要对每台机器中采集的数据进行整理集中。脱机移动采集方式如图4所示。
此外,在采集质量上控制上,通过培训讲解和实际操作等方式,使操作人员快速掌握指纹测试样本采集系统的使用,避免由于主观因素而导致采集指纹测试样本图像下降的问题。图5给出了几种不合格指纹图像的情况,如采集指纹图像面积过小、图像太暗或太浅、手指按压方向错误以及采集部位错误等。这样尽可能确保指纹测试样本的质量,减少不必要干扰因素对测试样本库图像质量的影响。
四、结论
指纹测试样本的采集是一项复杂工作,本文从指纹测试样本采集的背景和目的出发,对指纹测试样本采集所面临的问题以及需要解决的几项关键技术进行详细介绍。通过笔者及同事多年多地的采集实践证明,按本文设计的指纹测试样本采集系统在应用上是成功高效的,无论是刑侦用大面积滚动指纹测试样本采集,还是证件用平面指纹测试样本的采集,都可以顺利完成。这不仅为指纹识别算法的测试工作提供强有力的支持,同时也为相关类似项目的设计和开发提供了有益的参考。
[1] 田捷,杨鑫, 等.生物特征识别理论与应用[M].北京:清华大学出版社,2009.
[2] GA/T 894.6-2010, 安防指纹识别应用系统 第6部分:指纹识别算法评测方法.
[3] GA 1012-2012, 居民身份证指纹采集和比对技术规范.
[4] GA/T 893-2010, 安防生物特征识别应用术语.
[5] GA/T 626.1-2010, 活体指纹图像应用程序接口规范 第1部分:采集设备.