APP下载

基于卷积神经网络的掌纹识别

2019-11-16陈杰张雷张睿解丹闫耀东叶子维柴钰杰

软件工程 2019年10期
关键词:卷积神经网络深度学习

陈杰 张雷 张睿 解丹 闫耀东 叶子维 柴钰杰

摘  要:随着社会的发展,身份信息的安全问题日益凸显。为解决用户身份识别过程中受环境影响较大,以及掌纹识别时提取掌纹特征复杂的问题,本文进行了“基于卷积神经网络(CNN)的掌纹识别”的研究。运用该算法的优势在于简化了掌纹识别的前期预处理,可以直接将采集的原始图像进行输入,然后识别。通过卷积操作和最大池化操作,减少了训练参数量,大大节约了时间。最后使用Softmax分类器对结果进行分类。实验结果显示,该方法对不同人的掌纹有较高的识别率,克服了传统掌纹识别精度差,识别时间长,人工提取特征困难的缺点。

关键词:卷积神经网络;掌纹识别;深度学习;非接触式掌纹识别

中图分类号:TP391     文献标识码:A

Abstract:With the progress of society,the security of identity information has become increasingly prominent.In order to solve the problem of complex environmental impact and complex extraction of palmprint features in the process of user identification,the paper studies palmprint recognition based on convolution neural network.The advantage of this algorithm is simplifying the pre-processing of palmprint recognition,by directly inputting and recognizing the collected original image.Through convolution operation and maximum pooling operation,the method reduces the amount of training parameters and saves time greatly.Finally,the results are classified by using Softmax classifier.The experimental results show that this method has high recognition rate for different palmprints,overcoming the shortcomings of traditional palmprint recognition,such as low recognition accuracy,long recognition time and difficulties in manual feature extraction.

Keywords:Convolutional Neural Network (CNN);palmprint recognition;deep learning;non-contact palmprint recognition

1   引言(Introduction)

掌紋识别是起步较晚但优势明显的非侵犯性生物特征识别技术[1],近几年受到国内外研究人员的广泛关注。相比于其他技术,掌纹识别的优势在于图像采集简单且图像信息清晰丰富;对采集设备要求不高;安全性相对较高。虽然掌纹识别技术在近几年才慢慢成熟。但相比其他传统生物识别技术来说,具有识别精度高、所需时间短,接收率高,硬件成本低等优势[2]。

现在广泛使用的掌纹图像采集方式分为两种:接触式和非接触式[3]。接触式采集方法存在手掌滑动、挤压、出汗等情况造成掌纹难以采集和失真;非接触式采集法可以避免接触过程中的卫生问题,但也会导致成像的不稳定因素产生。然而,结合掌纹多项特性识别是将来的发展趋势,非接触式掌纹采集刚好有助于采集手掌上面的多项信息[4],提高识别安全性和可用性。

近些年来,卷积神经网络模型在车牌识别、手写文字识别[5]、人脸识别[6]、步态识别[7]、交通车辆[8]识别等领域取得了很大的成功和长远的发展。因此,将掌纹识别与卷积神经网络结合将是未来研究的重点。

2  卷积神经网络结构(Convolution Neural Network architecture)

人脑是一种深层结构,通过逐层过滤和采样输入信息来认知。深度学习[9]是一种通过模仿人类大脑对现实抽象世界的感知变成可以被用来认知具体事务的过程的模型。其发明的原因是由于传统浅层学习在大量数据下不能很好地识别。深度学习又称为深度结构学习,其中包括许多结构。卷积神经网络就是深度学习中比较常用的结构。在20世纪60年代,Hubel和Wiesel两个人在对猫的大脑皮层进行电击实验时发现了分层的神经网络结构,在此基础上提出了感受野的概念。之后,日本学者又在感受野的基础上提出神经感知机器的概念。此后,许多研究人员开始尝试运用多层感知器来代替手工提取特征,并取得了成功。

2.1   卷积层

卷积层的操作就如同一个多维的拼图游戏,因为图像卷积操作中图形不是一维存在的,只有卷积操作完成特征才变成线性的结构,然而,在分类中,线性函数存在无法分类的尴尬境地,所以引入激活函数把线性变为非线性。深层的卷积通过不断循环的方式提取充分可靠性强的更复杂的特征。

在传统图像识别过程中,预处理是第一步,因为在图像采集的时候采集环境和光照明暗程度不同等降低了特征提取的可靠性。第二步才可以顺利地提取图像可视化特征,最后根据所提取的特征进行归类分析,并输出分类之后的结果。传统分类模型如图1所示。卷积神经网络分类模型中,不需要对采集的图像进行处理,直接将图像输入到网络中,通过卷积和池化操作进行特征提取,最终输出分类结果,如图2所示。

CNN的特点主要由以下几点体现:第一,相邻两层神经元之间的连接不是完全连接而是使用局部连接,局部连接的好处是减少参数的数目,CNN认知如同人类对外界的认知,先从局部认识了解,然后才是全局。

2.2   池化层

训练卷积神经网络的主要问题是超大的数据及计算量,特别是对于分辨率较高的图像进行卷积操作,网络的训练速度缓慢且耗费大量时间。为了解决网络训练时间过长,数据量过大的问题,科学家发现在卷积层之后连接下采样层压缩图像可以减少数据量,从而达到节约训练时间的目的。通常采用最大池化方法,来提取最明显的特征,以及使数据量尽可能小。简单地说,池化就是把相邻部分的特征信息进行压缩聚合提取使卷积层提取的数据特征尺寸变小。其次,网络的过度拟合程度也有所降低,网络性能得到提高。第三,图像的池化不会导致图形变化,即使在样本已经平移、等比例缩放、旋转等处理之后。

2.3   全连接层

通过卷积操作得到局部特点,全连接层的作用就是通过权重矩阵将局部特征重新组合成完整的图。由于全连接操作中使用了所有局部特征,因此称为全连接。整个网络各个卷积层获取的原始图片的特征,在经过各个池化层过滤后通过全连接层第一层的操作组成一个线性的特征分布列。

这个特征分布列在全连接层的各个隐藏层中不断映射到各个隐藏层的节点中,即不断地将所有特征转换到不同的特征空间。

在全连接层中,最后一层类似于一个分类器的出口,使用sigmoid函数输出节点的个数也就是分类个数。每个节点的输出大小在0到1,即前一层的特征空间中的各个特征对这些类別的贡献率,也就是之前提取的各个特征可能属于各个类别的概率。

卷积神经网络的提出及应用极大简化了图像识别过程,降低了训练参数,使图像识别问题不再那么复杂,如同一个黑盒,只有入口的输入,出口的输出而不关注中间隐藏层。多个卷积层和池化层之间进行交替连接用作网络的输入端,然后全连接层的每个节点与前一层的所有节点进行连接,以组合从前面提取的特征。最后将多分类器用作输出层。

2.4   TensorFlow框架

2015年谷歌宣布对TensorFlow[10]计算框架进行开源,以便使其得到充分的发展。它的优点是可操作性强、支持多种计算平台、系统性能稳定、计算速度快、简单通用、支持各种不同的深度学习算法,所以在开源之后便得到了广泛的应用。

如今,TensorFlow受到越来越多的关注,已在Google中被广泛使用。例如,基于TensorFlow开发的排名系统RankBrain已成功启动和使用。相比传统的排序算法,RankBrain能够很好的满足用户的需求。基于TensorFlow的RankBrain已经在Google的核心网络搜索业务中发挥了关键作用,展示了TensorFlow的强大功能。如今,国内外主要科技公司已加入使用TensorFlow的行列[11]。

3 实验过程、结果与分析(Experimental process,

results and analysis)

3.1   图像预处理

本实验的掌纹图像是由作者拍摄的图像。掌纹数据库分为8只手掌,分别为4只左手和4只右手,每只手数据集有200张图像,经过简单的旋转和等比例缩放,将200张图像通过过采样的方式扩大为1000张图像的数据。然后训练集和测试集按照4比1的比例在所有图片中随机选取。掌纹图像的特征包括手掌内侧的全部纹理,由照相机在固定背景下拍摄而成,原始照片大小为2976×2976像素。因为图像的大小与卷积核大小的选取紧密关联,所以图像的大小就非常重要,图像太大会导致过多的计算量和时间;如果图像太小,图像的细节不明显,分辨率不够又会引起图像关键细节的丢失或者采集不清晰。为了能更好地提取特征,就必须将掌纹图像进行等比例缩小成224×224像素大小的图片,这样对掌纹简单的预处理不仅可以减少在运算中的数据量,也不至于因图像过小导致采集的特征不清晰,还能够提高整个识别系统的实时性以及准确性。

3.2 训练算法

在CNN中通常运用Adam算法[12]训练和优化网络。Adam算法不同于随机梯度下降而是运用训练数据进行迭代的方式进行神经网络的更新,通过计算梯度的第一矩估计和第二矩估计的方法为不同参数设计独立的自适应学习率。

具体而言,超参数,β1和β2控制算法计算梯度指数移动平均值的衰减率,移动平均线的初始值和β1、β2值接近1,因此矩估计的偏差接近于零。通过首先计算偏差的估计然后在偏差校正之后计算估计来改善该偏差。Adam优化算法的优点包括梯度对角缩放的不变性,计算高效,所需内存小,这是解决优化大量数据集和参数,以及非平稳目标问题的理想选择。同时也适于解决在图像处理过程中包含极高噪声或稀疏梯度影响的问题,可以直观地解释超参数,只需要很少的调参工作。

3.3   Dropout原理与实现

Hinton等人2012年提出了Dropout[13]作为防止CNN过度拟合的正则化方法。由于训练数据集受到卷积神经网络深度的限制,因此部分学习到的特征关系存在一定的偶然性,这些随机特征关系只存在于训练数据中。很容易导致CNN过度拟合。

在深度卷积神经网络(DCNN)中,通过训练得到一些网络模型相对困难,并且训练相对大一点的网络计算量非常大,所以训练模型时找到最好的超参数异常困难。Dropout在改善机器学习方面,表现非常有效。此外,DCNN通常需要大量的训练数据训练不同的模型。Dropout的作用就是防止训练过程中的过拟合,“Dropout”是指CNN中的“丢弃”神经元,“丢弃”是指随机删掉网络中一半的隐藏神经元,输入输出神经元保持不变。Dropout的缺点是收敛速度可能减慢:因为每次迭代中只更新一部分参数,而不是更新所有的参数,所以可以减慢梯度。

公式中的*表示逐项乘法。在任意层l中,rl表示独立的随机变量向量,这个向量乘以当前层的输出Yl得到一个“稀疏”输出,然后稀疏输出用作下一层的输入。通过对每个层执行此操作,便完成原始模型中提取稀疏模型的操作。

3.4   基于CNN的掌纹分类方法

掌纹识别CNN框架如图3所示。

有关掌纹识别CNN框架的详细描述如下:

该实验使用12层的卷积神经网络框架,其网络结构由5层卷积层(C)和5层池化層(S)还有2层全连接层(FC)组成。卷积层C1使用64个大小为3×3的卷积核,步长为1,边缘填充使用默认模式,对224×224大小的图片进行卷积运算,然后得到224×224×64的特征图。S1是第一个池化层,其通过2×2最大池化方法将C1层输出的224×224×64的特征映射转换为112×112×64的特征映射。然后,在卷积层C2中,S1的输出也使用3×3的卷积核进行卷积,使用128个卷积核,步长为1,并且边缘填充采用SANE方法,然后获得112×112×128的特征图。S2是第二池化层,通过2×2最大池化方法将C2层输出的112×112×128的特征映射转换为56×56×128的特征映射。C3卷积层由256个卷积核组成,步长为1,边缘填充使用与S2层输出相同的112×112特征映射卷积,得到112×112×256的特征映射。接着S3层通过2×2最大池化方法,将C3层输出的112×112×256的特征图转换为56×56×256的特征图。C4、C5层原理同C3层一样;S4、S5原理同S3层,最后得到7×7×256的特征图。S5层之后是FC1层,为全连接层,将S5层输出的7×7×256的特征图转化为一维矩阵,然后作为输入,即输入节点为7×7×256=12544个,输出节点设置为1024个,则权重矩阵的大小为12544×1024。通过输入矩阵和权重矩阵进行乘积,再加上一个偏置,得到1024个结点的输出。由于数据集用来训练的样本并不是特别多,整个数据集一共有8000张图片,为了防止网络过拟合,在隐藏层中使用Dropout方法,之后为FC2层,运用sigmoid分类,输入的就是FC1输出的1024个节点,则输出为8个节点,即类别数。使用Softmax函数作为激活函数。最后使用交叉信息熵cross_entropy计算损失,然后用Adam优化器进行训练和测试,得出结果。网络设置详见表1。

3.5   数据集展示

本次实验所选用的数据集使用手机拍摄,来自四名志愿者,每名志愿者采集了左右手掌的图像。如图4—图11所示。

3.6   实验结果分析

掌纹库中包括每个志愿者的左右手掌的掌纹。每只手掌掌纹有200张样本,经过简单的旋转和等比例缩放,将200张图像通过过采样的方式扩充为1000张图像的数据。训练数据是从1000张图片中随机的选取800张,剩下的200张作为测试数据,一共选取四个志愿者共8000张图像作为实验数据。

本文实验的数据完全由自己拍摄。掌纹数据分为八类,分别拍摄的是四个人的左右手掌纹。一共8000张图片。首先需要将图像格式转化成三维数组的格式,以便下一步进行掌纹特征提取的卷积操作。卷积神经网络的实验需要大量的样本支持才行,故拍摄大量的样用来深度学习和测试。每一个类一共有1000张的图片用于测试集和训练集,训练和测试按4:1比例分配,其中200张作为掌纹的识别集。图12中的横坐标表示实验测试中输入样本的数量,纵坐标表示识别率,图中显示的最大检测率为99.99%。

实验结果对比详见表2。

通过实验结果对比可得,应用不同的方法得到的识别正确率差别较大,卷积神经网络相比其他三种传统方法的识别效果提高了很多,较于传统算法更加简洁,省去了图像预处理过程。

4   结论(Conclusion)

本文是对非接触式掌纹识别在卷积神经网络结构下进行的初步研究,然后又与传统的掌纹识别方法进行了正确率和识别时间两项指标的对比。相较于传统算法,卷积神经网络处理图像的优点在于,图像不需要经过前期的过度预处理,降低了图像预处理的难度。使用局部连接和权值共享技术减少了参数,同时减少了数据量的运算,节省了大量的时间。使用Adam计算梯度的第一矩估计和第二矩估计来设置不同参数的独立自适应学习率,减轻了调试参数的负担。因此,掌纹识别通过使用经典的卷积神经网络,很好地解决了传统识别方法中存在的复杂度高,训练参数多,耗时长的问题,与传统算法相比,准确率也相对提高了。

参考文献(References)

[1] 苑玮琦,魏明月,方婷.全手掌掌纹主线提取方法[J].光电子光,2013,24(07):1399-1405.

[2] Lu J,Tan Y P.Improved discriminant locality preserving projections for face and palmprint recognition.[J]Neurocomputing,2011,4(18): 3760-3767.

[3] 丛鑫,孙劲光.一种图像检索中纹理特征提取的方法[J].现代计算机,2006(9):90-91;97.

[4] 陈熙,张家树.Biometric feature extractionsing local fractal auto-correlation[J].Chinese Physics B,2014,23(9):335-340.

[5] 李新炜,殷韶坤.深度学习在文字识别领域的应用[J].电子技术与软件工程,2018(24):40.

[6] 胡亚洲,周亚丽,张奇志.基于深度学习的人脸识别算法研究[J/OL].计算机应用研究,2019,37(5):1-7.

[7] 梁海军.基于人脸和步态特征的生物识别系统的研究与实现[D].河北科技大学,2019:1-43.

[8] 卢妍辉.智能交通系统中车辆路径识别方法[J].交通世界,2018(35):15-16.

[9] 周瞳.基于深度卷积网络的主掌纹提取方法[D].广东工业大学,2018:1-61.

[10] Hailong Xi.Ecognition and Optimization Algorithm of MNIST Dataset Based on LeNet5 Network Structure[A].武汉志诚时代文化发展有限公司,2018,10:1-7.

[11] 邢艳芳,段红秀,何光威.TensorFlow图像识别系统中的应用[J/OL].计算机技术发展,2019(05):1-5.

[12] 杨观赐,杨静,李少波,等.基于Dopout与ADAM优化器的改进CNN算法[J].华中科技大学学报(自然科学版),2018,46        (07):122-127.

[13] Dahl,George E,Sainath,et al.Improving deep neural networks for LVCSR using rectified linear units and dropout[P].2013:1-5.

[14] 劉玉珍,赵娜,李新春,等.基于混合滤波LBP和PCA的掌纹识别[J].测控技术,2018,37(2):11-15.

[15] 赵强,崔畅.基于多尺度LBP和SVM的掌纹识别算法研究[J].激光杂志,2015 (1):27-30.

[16] 吴婕,任江涛.基于子空间特征融合的两级掌纹识别算法[J].计算机工程与应用,2015(11):175-178.

作者简介:

陈  杰(1994-),男,本科生.研究领域:软件工程.

张  雷(1994-),男,硕士生.研究领域:图像处理与模式识别.

张  睿(1987-),男,博士,讲师.研究领域:智能信息处理.本文通讯作者.

解  丹(1994-),女,硕士生.研究领域:图像处理与模式识别.

闫耀东(1994-),男,硕士生.研究领域:图像处理与模式识别.

叶子维(1998-),男,本科生.研究领域:软件工程.

柴钰杰(1999-),男,本科生.研究领域:软件工程.

猜你喜欢

卷积神经网络深度学习
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于卷积神经网络的树叶识别的算法的研究