APP下载

基于深度学习的虹膜识别方法研究

2018-05-23陈虹旭李晓坤郑永亮邵娜杨磊刘磊

智能计算机与应用 2018年2期
关键词:深度学习人工智能

陈虹旭 李晓坤 郑永亮 邵娜 杨磊 刘磊

摘 要: 随着信息化社会的高速发展,人们生活水平的不断提升,与此同时人们开始越来越注重身份验证的准确性、安全性、稳定性。人体生物特征表现出了几大特点:唯一性、稳定性、不可复制。本文通过深度学习技术简述、分析特性、探究支持,研究了生物特征识别中的虹膜识别方法。虹膜识别性能指标在应用中相比其他生物指标高,具有很高的研究价值。希望通过本次对虹膜识别方法的探究,促进虹膜识别在人工智能方面的新发展。

关键词: 深度学习;生物特征识别;虹膜识别;人工智能

Abstract:With the rapid development of the information society people's living standard has been continuously improved. At the same time more and more attention has been paid to the accuracy security and stability of authentication. The biological characteristics of human body shows several characteristics: uniqueness stability and non-reproduction. In this paper through technical discussion characteristics analysis and support exploration of deep learning iris recognition of the biometric recognition is researched. Simulation shows that the technological index of iris recognition performance in the application is higher than other biometric identification index,which has high research value. It is expected that this research could promote the new development of iris recognition in artificial intelligence.

Key words: deep learning;biometric identification;iris recognition;artificial intelligence

引言

在科技高速发展的今天,生物特征识别已经开始进入人们的日常生活工作中。目前指纹识别、人脸识别、语音识别已广泛用于手机等终端设备解锁,通过深度学习手机端实现虹膜识别解锁也将会成为潮流趋势。虹膜识别技术属于一种人工智能,并因其所具备的唯一性、不可复制、稳定性等特征,而使其在验证识别身份领域得到重要应用[1],同时也深受该领域科研工作人员的青睐与高度关注。

1993年,Daugman博士提出了虹膜识别的理论框架。该框架将虹膜识别分为4个重要组成部分[2]:虹膜点位置、图像归一化、特征提取和匹配。Daugman[3]首先提出了模糊虹膜图像检测方法。该方法使用了特定的模板来对原始的虹膜图像进行卷积。其中模板的傅里叶变换是2个sinc函数之间的差值,图像的中频和高频会被提取为模糊特征。另一种经典的虹膜图像模糊检测方法是基于能量谱分布特征和SVM分类器的图像模糊决策方法[4]。该方法计算了虹膜区域低频、中频和高频能量的比值,根据这些比值判断图像的离焦和运动模糊,同时判断是否有睫毛遮挡。此外,Kalka等人[5]研发了一种分开检测离焦模糊和运动模糊的虹膜图像检測方法。Jang[6]则发现可以通过计算不同频段小波变换系数的均值作为模糊图像的模糊特征。Chen[7]又相继设计分析了可以利用墨西哥草帽小波提取不同尺度的虹膜图像小波系数来作为模糊特征。Zhou等人[8]提出利用虹膜图像中光斑特征进行运动模糊检测。在此基础上,Park[9]的研究又指出可根据光斑的大小判断虹膜图像是否存在离焦模糊。

1 数据来源

本文所采用的数据库为CASIA V4.0虹膜库[10],是中国科学院自动化研究所免费公开的数据库。CASIA V4.0已经成为国际上具有较高认知度的虹膜图像库,而且国际上已有超过70个国家及地区的3 000多家科研单位申请使用。

2 虹膜识别

虹膜是研究的一个重要组成部分。虹膜位于眼角膜之后和晶状体之前,直径约为12 mm、厚度约为0.5 mm的盘状膜[11]。为了合理控制外界光线进入眼睛,瞳孔将随着光线强弱调节自身大小,虹膜也会随之发生变化。虹膜识别可以解析为模式识别和计算机视觉问题。通过收集虹膜,可以对采集到的图像进行分析和处理,并通过结果信息识别身份。虹膜识别的研究流程可表述为:图像采集、预处理、提取特征,并对其编码、匹配识别,而预处理中又包含有定位及归一化。

具体来说,虹膜图像处理主要通过采用预定的光学及电路设计,来提取高质量的虹膜图像。所得到的图像包含眼睑及睫毛等,需要对虹膜展开定位研究。此时,在定位处理中需要将虹膜区域的边界近似为2个圆,通过定位获得圆心位置及半径大小。每个人的虹膜大小不同,同一个人的虹膜在外界光线刺激下也会随着光线的不同而改变,这些弹性变化会影响到识别结果,因而还需对采集到的虹膜引入归一化处理。通过归一化处理可以有效地表达和描述虹膜的特征信息,对信息进行编码处理。特征匹配识别时,则将通过比对提取信息的编码与数据库编码来分析确认身份。

3 虹膜识别原理

3.1 虹膜图

基于深度学习的虹膜识别是将图像进行预处理,在图像中获得感兴趣的区域,采用暗道去雾理论进行去雾增强,实现图片灰度处理;利用EMD方法进行分块特征提取,得到特征向量,最终获得虹膜识别结果。运行后结果可如图1所示。

3.2 PCHIP-LMD

PCHIP-LMD算法是对LMD与EMD算法的优缺点整合,将PCHIP运用到LMD方法中获取局域包络估计函数和局域均值函数。PCHIP可以保证相邻两点之间插值曲线和单调性,有效消除了欠包以及过包络现象。

3.3 虹膜归一化

每个人的虹膜大小各异,同一个人的虹膜在外界光线刺激下也会随着光线的不同而改变。瞳孔会随着外界光线强弱发生收缩或扩张,从而影响虹膜的大小。在进行虹膜采集时,眼睛距离采集设备的远近,也直接影响瞳孔的大小。采集虹膜时的这一变化将会影响比对结果,不同大小的虹膜难以用作匹配识别,虹膜归一化可以有效地纠正瞳孔缩放失真。这里,也研究给出了EMD归一化虹膜识别系统的功能设计解析即如图2所示。

3.3.1 弹性模型

目前得到广泛使用的归一化方法,就是由Daugman教授提出的橡皮圈(Rubber-sheet)模型[3] Rubber-sheet假定虹膜为弹性模型,具有弹性和各向同性。根据固定模式将虹膜转换为固定矩形区域。

3.3.2 归一化结果

通过弹性模型,可以将虹膜转换为固定的矩形,归一化后就能够获得不受遮挡的虹膜图像,舍弃识别率较差的部分。而且,理论可以证明,虹膜的归一化处理还表现出良好的尺度不变性和平移不变性。

4 深度学习

机器学习是时下具有快速发展势头的活跃学术领域之一。深度学习就是机器学习中一种基于任务的算法。深度学习采用分层结构来加工处理复杂的数据,而每一分层均由含有特征检测器的单元组成,底层主要检查简单特征,再将特征信息传输给高层,从而可以检查更为复杂的图像特征。深度学习是通过整合多个非线性处理单元以生成输出更加抽象和更富有价值的特征值。借助深度学习就使得无论是生物特征识别、虹膜识别,还是语音识别、声纹识别等方面的研究都将获得识别率的大幅提升。深度学习并非预先定制方程来获得设计驱动,而是在运行中通过收集数据,进行自我学习、训练来实现处理加速。

4.1 递归神经网络(RNN)

递归神经网络(RNN)是一种人工神经网络,主要通过网络的内部状态来描述系统的非线性动态行为,具有很强的动态逼近能力。而且,还可以描述任何非线性动力系统。Hopfield网络[12-13]是全局反馈递归网络的经典成果,但只是一个单层对称反馈神经网络。根据网络的输出,可将其分为离散网络和连续网络两种。其中,离散网络往往用于优化计算,而连续网络则用于联想记忆。离散网络与连续网络都具有初始状态收敛到稳定状态的能力。

如各神经元在初始状态和外部输入作用下,发生状态变化,神经元与神经元之间形成环路,神经元输出到其它的输入相连接,进而产生了特定设计输出。这种反馈状态将继续在稳定的网络状态下激荡反复,以达到稳定的平衡状态。Hopfield网络采用全连接网络方式进行连接,网络节点数目增多时网络将过于复杂。在应用中若要达到简单优化,可以采用部分反馈网络结构,就能保留原有动态特性。

4.2 卷积神经网络(CNN)

卷积神经网络(CNN)是人工神经网络的一种。这是一种带有前向反馈的神经网络,是深度学习常用方法之一[14]。CNN由多个可训练层采用层层堆叠的方式聚集构成,通过在输出层增加监督分类器来获得分类功能。CNN在图像分类、识别问题上独具优势,而在机器学习中还可以更有效地提高准确率。在处理图像方面,CNN的网络结构可以实现平移、缩放、倾斜等情况下高度不变的特性;在提取像素中可以给出一层到二层近原图的像素级别提取特征;在图像发生维度变化时,还可以基本保持图像全局性。关于CNN的重点研究内容可阐释分述如下。

4.2.1 卷积层

卷积层是CNN的核心设计。卷積层由若干张特征图组成,每张特征图都是在输入图像上采用固定卷积对其进行内积操作所得到,在特征图转发过程中,过滤器需要在输入卷积高度与宽带上采用卷积,在过滤器输入和条目间计算点积,并针对过滤器生成二维激活影像。不同的卷积核可以对不同的特征进行提取,卷积操作的卷积区域就是卷积神经网络(CNN)的局部感知域。如果网络处于某个空间位置时会对其展开检测,并在检测到特定类型特征时进行学习过滤。

4.2.2 池化层

池化层主要通过降采样方式来处理得到的图像区域并获得关键的模态特征,但还要对此特征图进行深度的抽象与降维。前者将输入图像进行图像块均值或最大值的采集以做到进一步的结果抽象解析。而降维则是通过对采集图像进行无重叠的降采样来实现。对特征图像进行平均池化类似于均值滤波器,也就是对图像进行平滑处理,避免噪点的影响。

4.2.3 激活函数

对于卷积层的卷积以及池化层的降采样来说,都需要对采集图像及特征图像进行线性处理。对于采集样本中获得的特征分类样本并不都是线性可分的,还要对其引入激活函数,并追加非线性因素,这样才可以得到适用于非线性的分类模型。

4.2.4 全连接层

在经过卷积、池化、激活函数等一系列操作后,将得到的特征表达映射到标记空间中。在采集数据中,RGB图片是三维的,而对应的采集标签是一维的。考虑到此后的计算梯度所需,就要将三维的RGB图片与一维的标签进行关联映射处理,因此设计研发了全连接层将信息转换保存到一维空间中。

4.2.5 改进的深度学习模型

采用一个单层的下采样层,针对不同大小的特征映射统一对其进行下采样归一化处理,使其达到相同的尺寸。多尺度在传统特征算子中发挥了重要作用,在卷积网络中同样可以采取类似的形式,例如卷积层就采用了3种不同的下采样。下采样过程是通过控制池化卷积模板来自适应生成尺寸和步长,与前卷积层设定比例输出,以保证下采样输出子图固定大小。这里将给出本次研究的设计模型如图3所示。

5 实验结果

5.1 实验一

本节实验从CASIA V4.0虹膜库中选取150人作为训练样本,随机分别抽取50人成为测试样本。

实验步骤:设置阈值为0.157 1,取得最高识别率。错误拒绝次数FR为68,错误接受次数FA为23,最高正确识别率CRR为99.968%。实验运行结果如图4所示。

5.2 实验二

本节实验从CASIA V4.0虹膜库中选取150人作为训练样本,随机分别抽取50人作为测试样本。

实验步骤可表述为:

(1)将原始采集虹膜经过归一化处理后得到特征图;

(2)将特征图作为原样本输入卷积神经网络;

(3)设置阈值为0.157 1。

在此基础上,得到的识别结果可见表1。

根据以上结果分析得出:CNN算法得到的识别率超过90%,而传统的LMD算法识别率较低。

5.3 实验三

本节实验从CASIA V4.0虹膜库中选取200人作为训练样本,随机分别抽取每人100组为测试样本,其中50组作为测试集。设置实验参数,PCHIP-LMD阈值为0.157 1,最后得到试验结果可见表2。

根据以上结果得出:CNN算法得到的识别率超过95%,而传统的PCHIP-LMD算法识别率为89%。

6 结束语

综上结论可以看出,虹膜识别的结果会受到阈值的影响。阈值可通过对图像的分解处理后来提取识别特征图,再对特征图进行移位匹配,最后计算匹配向量得到。当阈值过高或过低都会影响识别结果,通过实验可知阈值为0.157 1时,识别准确率最高。经过比较不难发现,CNN方法的识别率远高于LMD与PCHIP-LMD的识别方法。但是也需指出,由于卷积神经网络在训练和设置参数方面难度较高,因此还需要通过大量实验的辅助佐证支持。本次研究表明,CNN可以在虹膜识别领域得到广泛应用,只要再加以改进,这种算法就可以在更大程度上提升虹膜研究的识别率。

参考文献

[1] 李欢利,郭立红,陈涛,等. 基于PCHIP-LMD的虹膜识别方法[J]. 光学精密工程 2013 21(1):197-206.

[2] DAUGMAN J G. High confidence visual recognition of persons by a test of statistical independence[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 1993,15(11): 1148-1161.

[3] DAUGMAN J G. How iris recognition works[J]. IEEE Transactions on Circuits Systems for Video Technology 2004 14(1): 21-30.

[4] MA Li TAN Tieniu WANG Yunhong et al. Personal identification based on iris texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 2003 25(12): 1519-1533.

[5] KALKA N D,ZUO Jinyu SCHMID N A et al. Estimating and fusing quality factors for iris biometric images[J]. IEEE Transactions on Systems Man and Cybernetics Part A: Systems and Humans 2010 40(3): 509-524.

[6] JANG J PARK K R KIM J,et al. New focus assessment method for iris recognition systems[J]. Pattern Recognition Letter 2008 29(13): 1759-1767.

[7] CHEN Y DASS S C JAIN A K. Jain. Localized iris image quality using 2-D wavelets[C]//Proceedings of International Conference on Biometrics. Berlin/Heidelberg:Springer-Verlage,2006: 373-381.

[8] ZHOU Z DU Y,BELCHER C. Transforming traditional iris recognition system to work on non-ideal situation[J]. IEEE Transactions on Industrial Electronics 2009 56(8): 3203-3213.

[9] PARK K R KIM J. A real-time focusing algorithm for iris recognition camera[J]. IEEE Transactions on Systems Man and Cybernetics Part C 2005 35(3): 441-444.

[10]CASIA. Database of human iris [EB/OL]. [2009-09-21]. http://www.cbsr.ia.ac.cn/english/Iris Database.asp.

[11]倪綽. 眼的解剖组织学及其临床应用 [M]. 上海:上海医科大学出版社 1993.

[12]杨行峻,郑君里. 人工神经网络与盲信号处理[M]. 北京:清华大学出版社,2003.

[13]吴启迪,汪镭. 反馈式神经网络智能控制[M]. 上海:上海科学教育出版社,2004.

[14]BOUVRIE J. Notes on convolutional neural networks[J]. Neural Networks,2006(1):38-44.

猜你喜欢

深度学习人工智能
人工智能之父
2019:人工智能
人工智能与就业
数读人工智能
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现