基于卷积神经网络实现指纹图像的配准
2018-12-27陈雷
陈 雷
上海市浦东公安分局刑事科学研究所,上海 200125
用指纹进行身份识别,虽然目前有很多的研究成果,在某些方面也非常成熟,但是这些成果作用于低质量的指纹图像时,往往难以获得较高的准确率。而且鉴于系统资源的有限性,在某些环境中,指纹的识别对实时性要求很高,所以在时间的限制下获得较高的识别结果非常重要。有鉴于此,本文引入基于卷积神经网络的深度学习模型,使用卷积神经网络对图像配准中的旋转问题进行处理,从而实现利用有限的资源进行快速的配准。
一、卷积神经网络
在深度学习领域中,应用最广泛的是卷积神经网络,也称之为卷积网络,是一种专门用来处理具有类似网格结构的数据的神经网络。卷积神经网络在诸多应用领域都表现优异,譬如时间序列数据。卷积神经网络中一个典型层包含三级:在第一级中,这一层并行地计算多个卷积产生一组线性激活响应;在第二级中,每一个线性激活响应将会通过一个非线性的激活函数,该级有时也称为探测级;在第三级中,利用卷积神经网络提供的池化函数再次优化其输出。池化函数负责对卷积层提取的特征进行处理,以代替网络在该位置的输出,例如,最大池化函数给出相邻矩形区域内的最大值。不管采用什么样的池化函数,当输入做出少量平移时,池化能够帮助输入的表示近似不变。使用池化操作可以认为是添加了足够强的先验:通过该层学习获得的函数务必具备少量平移不变性的要求。当这个假设成立时,池化可以极大地提高网络的统计效率。
二、图像配准
图像配准是指求解几幅图像之间的空间变换关系,从而使一对或多幅图像达到空间上的对齐。目前从技术角度讲,可以将图像配准分为:图像融合下的多模态配准、识别或定位下的模板配准、图像深度变换和变形下的观察点配准、检测物体生长变化下的时间序列配准等。图像配准的一般流程如下:
(一)特征空间
特征空间是点、边缘等,是从图像中抽取出来的用于配准的特征。从某种角度来看,特征空间直接关系到图像中特征对配准算法的敏感性。
(二)搜索空间
搜索空间是对浮动图像进行变换的方式以及范围。随着搜索空间的增大,算法时间复杂度呈指数增长。因此,搜索空间在一定程度上影响搜索的速度。
(三)相似性度量
相似性度量会影响空间变换模型的选择,是衡量不同变换之下结果是否可靠的准则,在一定程度上与配准算法对干扰的抗性有关。
(四)搜索策略
搜索策略直接影响着配准的速度,是算法优化的重要方向。在理论上,通过穷举的搜索策略一定可以找到最优的参数,但是需要付出很大的时间代价,因此这往往是应用所无法接受的。
三、网络训练
(一)数据预处理
在指纹图像库中,提取参考图像和浮动图像,数据集为34300(5*7*7*7*20)对图像。为了增强网络的泛化能力,对每幅图像添加了高斯白噪声。在数据格式上,将图像数据转为HDF5格式,且对超过2GB的数据进行切分。切分后的数据按照4:1:1生成相应的训练集、验证集和测试集。
在数据预处理中,还有一项重要的工作就是对数据进行标准化,这样做的目的是加快梯度下降获得最优解的速度,为了方便实现,整幅图像灰度值均减去60,因为其灰度均值在60上下浮动。通过零均值化处理,可以提高模型的精度。
(二)网络结构
根据图像大小,以LeNet-5为基础,在其微小改动的基础上,使其能够处理100*100的输入图像,具体结构,见表1。
表1 网络结构
本结构通过传统的参数共享,以及参考图像与浮动图像在通道维度的合并,成功地提高了精度。为了方便预测,将输入图像的大小200*100分割为两张100*100的图像,然后依次经过卷积网络各层的处理。在网络内部,为了提升网络的处理效果,使用小卷积核替代大卷积核,从而减少了网络参数。
(三)网络配置
在深度网络学习过程中,还需要对一些参数进行设置,比如每次批处理的图像数,可以根据实际对batch_size进行赋值。通常情况下,该参数设置太小,很难保证网络快速收敛;如果设置过大,又会占用太大的内存空间。因此,在综合考量后,结合指纹处理的实际,将batch_size的值设定100。除此之外,为了有效激活神经元,还需要对negative_slope参数进行初始化,在参考相关文献和多次试验的基础上,本文最终将negative_slope设置为0.01。
(四)结果分析
本试验是在Ubuntu操作系统下进行的,具体硬件配置为:处理器(型号:i7-8750H;速度:2.2GHz;核心:6核)、内存(容量:8G+8G;插槽数量:2 x SO-DIMM)、硬盘(容量:1T;转速:7200转/分钟;接口类型:M.2接口)、显存(独显;芯片:GTX1070;容量:独立8GB)。
在试验中,针对不同的网络结构进行了对比试验,具体网络结构有:五层双分支、五层双通道、八层双分支、八层双通道。通过测试发现,采用八层并将双通道图像作为输入所得结果最好,其输出指标数据为:训练集loss为0.001236,测试集loss为0.001477,整个训练时间为1671.373秒。
在深度学习中,网络层数越多,网络结构的表达能力就越强,但是从时间上来看,训练持续的时间会更长。在多次测试调优的过程中,针对不同的网络结构,在不同参数设置对比后发现,初次学习率设置为0.16,收敛会有更好的效果。综合来看,通过卷积神经网络,可以实现指纹图像配准过程中的角度旋转以及平移等操作,而且从学习的时间来看,图像数据集越大,深度学习的优势体现得就会越充分。
四、结束语
近年来,在信息技术的辅助下,指纹识别的研究取得了可喜的成绩,但也存在精度不高等问题。为了弥补传统指纹识别的缺陷,高分辨率的指纹识别得到推广。本文针对两幅图像平移和旋转的配准问题,采用卷积神经网络进行图像数据的学习,在构建有效网络结构的基础上,通过不同网络的对比和参数的调优,成功降低了网络的loss,充分体现了卷积神经网络在大数据量下的数据处理优势。