基于改进型LBP算法的虹膜特征提取仿真
2020-12-29谭静仪杨双玲李颖瑜陈键聪夏阳马丽娟陈思娟黄丹蓝陆清健黄文淑刘硕麦晓研
谭静仪 杨双玲 李颖瑜 陈键聪 夏阳 马丽娟 陈思娟 黄丹蓝 陆清健 黄文淑 刘硕 麦晓研
摘要:随着信息社会的建立,个人身份信息的保护越来越重要,生物识别技术将成为一种对信息进行更安全利用的模式。在人体结构中,虹膜结构复杂,也具有更强的安全性、不可复制性,因此利用虹膜进行识别具有不可替代性。虹膜特征提取与编码是在虹膜预处理之后,特征匹配之前关键的一步。该实验将选取LBP算法来研究虹膜特征提取,因其算法简单,具有灰度不变性、鲁棒性较强等优点,在实验中选用该算法。经实验证明,该方法可以耗时更短地完成虹膜特征提取,具有较高的识别率并得出特征向量。该文介绍虹膜特征提取设计的背景、意义以及目的,介绍LBP算法的概况、国内外发展的历史现状以及特征提取的设计原理、设计过程、结合理论知识进行实验,记录实验过程,分析实验结果,并对结果进行评价。
关键词:LBP算法;虹膜特征提取;虹膜识别;局部二值模式
中图分类号:TP3 文献标识码:A
文章编号:1009-3044(2020)32-0009-05
1 前言
信息科技日新月异,个人数据不断产生,并建立了庞大的链接,在促进社会发展的方面,这些链接将发挥着巨大的作用。但其也挑战了信息社会的安全性,如:信息泄露、支付宝、微信等个人账户信息被盗用,传统的信息身份鉴定措施不再发挥其完整的作用。因此,高速发展的社会中,需要一种对信息进行更安全应用的模式--生物识别技术。
一个人身上的生物特征—指先天性的指纹、虹膜、掌纹等及后天性的笔迹等,成为一种表明身份的信息。与传统身份信息鉴定措施相比较,生物识别技术拥有更强的安全保护作用,更具有便携性。如今,该技术在金融、医疗、安检、安防等各领域广泛得到应用。
如今,国内外十分关注虹膜识别研究。虹膜是人体不可复制的存在,是重要的身份标志之一,具有稳定性、可采集性、无法伪造等优点[1]。法国在1885年诞生了虹膜识别。因为英国剑桥大学的Daugman教授,20世纪90年代的虹膜识别技术真正发展到了应用阶段[2]。虹膜识别的错误率低,安全性强。在经过富士通的研究分析后,有1/1500000的错误率是经虹膜识别得出的,而著名的苹果公司虹膜识别软件具有 1/50000的失誤率[3]。与其他生物特征识别技术相比,非侵犯式的虹膜识别准确率多高30倍,因此虹膜识别具有较高的识别率。虹膜识别系统有固定的流程,采集图片、虹膜图像预处理,虹膜特征提取以及特征匹配构成虹膜识别的整体流程。流程如图1所示。
1.1 研究背景及意义
生物特征提取是生物识别技术的核心之一,其主要基于颜色特征、纹理特征等完成特征提取的过程,再计算出特征向量。
人体结构中的虹膜是眼表中黑色瞳孔和白色巩膜之间的组织,呈现出凹点、隐窝、色素点、斑点、细纹等丰富的纹理信息[4]。其具有不可替代性、难以复制性、较强的稳定性、低错误率等特点,也兼具结构复杂性,会受到外部睫毛和上下眼睑的遮挡、因年龄衰老导致的眼球结构变化以及对外界光照敏感产生的不同程度的径向形变,成为生物识别技术中具有最高商用安全系数的生物认证技术 [5]。
虹膜特征提取是采用特定的算法从虹膜图像中提取出虹膜识别所需的特征点,并对其进行编码[6],其重要性越来越突出,依据提取的特征不同,虹膜特征提取方法主要分为全局特征提取和局部特征提取。虹膜图片是处于不同光线环境下采集的图片,局部特征提取可以消除在采集环节中光照不均对虹膜识别的影响,其有很好的识别效果。John Daugman提出Garbor滤波器方法对虹膜纹理相位特征的粗量化和编码;接着,Wildes等人提出了一套用金字塔分解方法提取特征的虹膜识别原理及架构;小波变换零点的特征提取方法由Boles提出,采用过零点数目一致的方法和具有良好的抗干扰性,从而使平移、旋转和比例缩放等问题得到解决。
本文主要围绕生物特征提取的一个方向——虹膜特征提取进行介绍,虹膜特征提取是虹膜识别系统的一个重要部分,其可以更好地降低错误率,提高虹膜匹配的正确率。
1.2 目的及解决的问题
研究员使用虹膜识别技术时, 光线、采集设备、图像处理算法等会影响虹膜系统识别的正确率。因此,需要虹膜特征提取的“参与”,提取特征,从而降低因眼部结构对虹膜特征识别造成的影响。
本文主要研究虹膜特征提取技术中的LBP(Local Binary Patterns)局部二值模式算法,研究其优点及缺点、国内外的发展现状,进行实验方案设计,以及基于MATLAB软件进行虹膜特征提取算法的实现,评价虹膜特征提取算法实验的优缺点。
1.3 论文创新点
(1)研究视角创新。传统论文主要研究虹膜识别的整个流程或者将虹膜识别的特征提取与匹配一起进行研究,而本论文重点主要研究虹膜特征提取这一部分,对虹膜特征提取进行设计,对特征提取结果进行评价。
(2)研究内容创新。国内对LBP算法的研究较少,本论文以LBP算法为基础进行设计,并且研究LBP算法在实验中产生的问题。
2 虹膜特征提取之LBP算法
2.1 LBP算法简介
对各个LBP模式直方图进行统计,主要面向描述那些小而密的纹理,是做图像局部特征比较的主要方式,这些概念构成LBP算法[7]。同时,易于实现、方便计算、性能较高的LBP算法,还具有旋转不变性、对均匀光照的影响表现为不敏感、具有灰度不变性等特点,成为一种在数字图像检索领域中进行广泛应用的纹理特征提取方法。Matti Pietik?in—en提出LBP模式,因在纹理类图像的局部特征提取方面的旋转不变的特性,近几年得到广泛应用[8]。
LBP算法也具有特征表示单一,样本间的相互关系计算缺乏等问题。同时,LBP算法依赖于灰度值,丢弃了局部图像纹理的其他重要属性--即对比度。LBP算子具有鲁棒性,可以一定程度解决光照所造成的问题,但是当光照变化程度过大,LBP算子也会发生变化,使LBP特征算子出现错误。
作为基础的原始LBP算法,经过对其的改进,总体可发展為多种模式,如:加强旋转不变性的LBP算法、圆形LBP算法,LBP等价模式等。LBP算法基于原始LBP算法进行改进,经过多年的发展,LBP算法成了一个很好的度量结构的局部图像纹理算法。
2.2 LBP算法在国内外的发展概况
如今,特征提取算法有多种,在这些提取算法中,一些算法是将虹膜特征用二值编码来表示;一些算法的表达方式是非二值编码数;有根据提取的纹理特征中的特性信息,对特征进行描述的方法;也有小波变换纹理提取方法,是最近发展起来的方法。
LBP算法的概念经由学者Pietik?inen 等人在1994年第一次提到[9]。过了两年,为了对局部图像进行对比度补偿,T.Ojala正式提出了局部二值模式(Local Binary Patterns,LBP)[10]。Maenpaa 博士建立旋转不变模式的 LBP (rotation invariant)算法,弥补 LBP 算子因位置的问题而造成的缺陷。之后,LBP算子做了大量的研究分析与改进,得出新的算法,Ojala称其为LBP等价模式(Uniform Pattern)[11],其解决了运算量大、速度慢以及大量占用内存的问题。同时,Ojala博士等人对传统的LBP算子进行改变,弥补LBP算法只能在固定范围内的区域进行分析的缺点,提出圆形LBP算子(Circular LBP or Extended LBP),采用圆形邻域代替3*3的九宫格区域采样方式。Heikkiloi在2009年提出了中心对称局部二值模式(Center-symmetrical Local Binary Pattern,CS-LBP)。
在国内,众多进行虹膜识别相关研究的研究所中,谭铁牛教授领导的中科院自动化研究所是最典型性的存在[12]。其最早正式开展虹膜研究,并获得专利,开创了中国研发虹膜识别的先河。国内研究所以及学者也在不断研发,如,上海交通大学图像处理与模式识别研究所和湖北工业大学的付波、徐超等教授研发了一种基于改进LBP特征提取的图像分类方法。另外,国内优秀的大学,如:清华大学、南京大学等高校都在开展虹膜识别的相关研究。
3 虹膜特征提取的设计
3.1 数据来源
国内外常用的虹膜图像数据库有以下几种:Bath大学的MMU;Beiria Interior大学的UBIRIS;我国吉林大学的JLUBRIRIS;中国科学院自动化研究所的CASIA(Research Projects Sponsored by National Science Foundation of China) 虹膜图像数据库。
CASIA虹膜图像数据库是本实验图片的来源。国内外的研究者以及多家科研机构广泛采用数据库图片,是因为其具有图片质量好,数量丰富的优势。自2002年成立以来,虹膜库被多达来自70个国家,超过千名的使用者所使用,因此库中图片分为6大类,图片数量有54601张,其样本如图2(a)(b)所示。
3.2 设计方案
LBP算子是性能最佳的纹理描述符之一,并且广泛用于各种应用中,它被证明具有高度的辨别力,使其适用于图像分析任务[14]。
经过考虑,本文在LBP算法(Local Binary Patterns)基础上做细微改进以作为特征提取算法。
3.3 设计原理
虹膜特征提取是提取虹膜中反映虹膜独特性的纹理信息——卷缩轮、坑洞以及它所在的位置等。从已经进行预处理的图像中,把图片进行分区,采用一种或几种特征提取算法对虹膜像素点进行特征提取。其主要是依据灰度值的大小,进行比较,得出一幅记录LBP值的图。用公式表示如下:
之后,依据特征点得出统计直方图,每一个直方图都表达了一个图片的信息。使用特定的特征表达方式对直方图进行归一化和连接编码,用数学形式表达,产生一个可以表达整个图片特征的特征向量,为以后的特征匹配提供准备。
3.4 设计过程
实验设计主要分为两个大方面,第一个方面是对图像进行归一化,第二方面是虹膜特征点的提取并提取特征向量。
1)对图像进行归一化
为了缩小图像信息的大小,便于以后的特征提取与特征匹配,把圆形的虹膜图像转变为矩形的图像。把虹膜从图像中分割出来,变换虹膜区域,使其具有固定的尺寸,以便进行比较。归一化的过程将产生虹膜区域,这些区域具有相同的恒定尺寸,因此同一虹膜在不同条件下的两张照片将在相同的空间位置上具有相同的特征[15]。归一化示意图如图3所示。
因为LBP算法在直方图生成之后,会进行归一化,连接成为一个特征向量,所以在特征提取前不进行归一化操作。而相应的,特征提取前需要均衡光线。但虹膜图是由虹膜库统一进行采集,对光线有所控制,图片有统一的标准,因此不需要进行均衡光照的操作。因此,在本设计中不设计归一化的操作。
2)提取虹膜特征点及特征向量
人类虹膜纹理不同的特性是特征提取的理论基础,虹膜特征点是虹膜特征的体现,特征点的成功提取将有利于纹理特征向量的获取。
(1)读取处理过的图像后,先将一个彩色虹膜图灰度化变为黑白的虹膜图,如果虹膜图非彩色,就可以直接使用。
(2)特征提取的模式选择为lbp 8圆形算子,圆的半径设置为1,构建8领域模式。8领域模式如图4所示。
(3)原始LBP算法是划分为3*3的小区域进行特征提取,但是它具有明显的缺陷——即特征提取要在固定的领域进行提取,而且二进制模式过多,因此选用将邻域扩展到任意邻域,并可减少模式种类,减少数据量的算法。
依据任意多个像素点与中心像素值的大小比较,得出1或0,记为1则图像中央像素点的值小于相邻的8个像素值,反之依据规则,0成为代表的记号[16]。提取虹膜图的像素点特征值设计如图5所示。
所谓的双线性插值,是有两个变量的插值函数的线性插值扩展,利用已知的位置点,经过2次x方向插值的计算以及1次y方向的插值计算,得出所要求的位置点[17]。其是一种广泛应用于数字图像处理领域的算法。双线性差值示意图如图6所示。
使用像素值大小对比的方法以及双线性插值方法计算出图像特征点的LBP值。
(4)二进制数从0到1的转变或从1到0的转变总共有两次,不能超过两次,是该Uniform LBP算法的规则[18]。将周围领域的特征点与中心像素经Uniform LBP算法进行比较,得出反映该区域纹理信息的中心像素点LBP值。
(5)特征向量的提取:一个表达整幅图LBP值的特征向量的流程是对中心像素点的LBP值计算出直方图,并对其进行归一化操作。保存特征向量,用于特征匹配。
整个设计流程如图7所示。
4 特征提取试验的结果及评价
4.1 试验过程及结果
利用实驗来验证算法的有效性和可靠性,该算法从虹膜库选择图片进行特征提取,虹膜库的图片有统一的要求,图像的尺寸统一为320*280。
在虹膜图像中,特征点提取是关键,特征点是否正确提取将影响后续特征向量的准确性。以CASIA-Iris-Interval中的一张图片S1001L01.jpg为例子,图片样本如图8所示。在图像预处理后,使用定位过的图片进行LBP算法特征点提取。测试结果是一张经LBP算法处理的LBP特征点图谱,实验结果如图9所示。
之后将特征点进行分析,计算出直方图,归一化直方图,得出一个特征向量,以下实验结果是归一化后的直方图,如图10所示。
将直方图进行归一化操作,进而得到一个表现整幅图的LBP纹理特征的1*X的特征向量。特征向量与特征匹配紧密相连,特征匹配的基础就是虹膜图的特征向量。最终实验的测试结果是一个特征向量,实验结果如表1所示。
4.2 试验评价
本文将特征提取的数据进行统计分析,使用LBP算法进行虹膜特征提取,成功运行代码,取得较为理想的结果。同时,为了更好的评价算法,选用100张虹膜图,采用LBP算法与三个经典虹膜特征提取算法进行比较——Daugman算法[19]、Wildes算法[20]、Boles[21]算法,从速度与识别率两个方面进行对比。
4.2.1 实验速度测试
为了评价实验性能,测试图片的实验耗时,选用100张虹膜图,进行速度测试,总体用时为43.043s,实验结果如表2所示。
与其他三个著名算法进行比较,如表3所示。本文算法进行特征提取的平均用时为0.43S,与Daugman算法、Wildes算法相比,平均耗时更低;与Boles算法相比,花的时间更多。总体来说,从实验中可以得知,运用的LBP算法,与其他算法相比,花费更少的时间,计算时具有一定的效率,表明该算法具有计算便捷的特点。
4.2.2 实验识别率测试
选用100张图片运用LBP代码进行识别率测试,识别率比较如表4所示。从本文实验可以看出LBP算法特征提取的成功率为100%,100张图片完成了特征提取,0张图片没有实现特征提取,与Daugman算法的成功率相同,与Wildes算法相比,成功率没有明显差别, 与Boles算法相比,成功率较高。
从实验中可以得知,本文使用的LBP算法,成功实现虹膜特征提取,有高度的识别率,可以成功提取特征点,提取的特征向量可以用于特征匹配,说明本算法是有可行性的。
4.2.3 测试评价
虹膜识别的总体流程分为:采集图片、虹膜图像预处理,虹膜特征提取以及特征匹配。特征提取实验是位于虹膜识别研究的中间部分,发挥着承上启下的功能。
使用本文方法有很强的适用性,即使在昏暗情况下拍摄的图片,也可以进行特征提取。其减少了直方图的数量,特征向量的维数更少,可以从256维降到59维,减少了90%的维度[22]。同时减低存储空间,提高计算速度,并且可以减少高频噪声带来的影响。
虹膜特征提取的算法有很多,每种算法都有其特点,确定进行研究的算法也具有难度,虹膜特征提取的过程数据量大,耗时大。同时,LBP算法也具有问题,它需要依赖于灰度值进行计算,对于彩色图片要进行灰度化操作。LBP算法只能产生1*X的特征向量作为特征匹配的依据,特征的数学表示方式单一。LBP算子在改进后,加强了旋转不变性,却缺少了方向信息。
5 虹膜识别流程结果
虹膜识别主要分为三个部分,虹膜定位,特征提取,特征匹配。使用中科院虹膜数据库的材料,系统经过Hough算法虹膜定位,LBP算法的虹膜特征提取,汉明距离特征匹配的实验。虹膜识别的两个模板生成的Hamming距离值小于0.35,表示这两个模板来自同一个虹膜,总体正确识别率最好,如图11的ROC图所示,真阳性比例为0.8,正确识别率为80%以上。
6 结语
本文运用LBP算法进行虹膜特征提取的研究,基于虹膜图像数据库的图像以及MATLAB软件,对完成定位的图像进行特征提取的试验,分析实验结果。特征提取的好坏将影响图像匹配的效率。经实验证明,LBP特征提取算法具有很好的鲁棒性,具有较好的识别率,得到高效的计算速度,得到100%的识别率。但其还具有特征表示单一、过度依赖灰度值等缺点。通过实验结果得知,使用的LBP算法进行虹膜图像特征提取具有可行性。以目前的研究而言,LBP算法还具有缺陷,为了达到更好的实验目标,该算法有待进一步的研究。
参考文献:
[1] 李磊东.虹膜识别算法研究及实现[D].武汉:武汉理工大学,2009.
[2] 周晓宇.虹膜识别算法的研究和优化[D].大连:大连海事大学,2009.
[3] 工程师2.浅谈生物特征识别六大技术未来发展趋势[Z].http://m.elecfans.com/article/670439.html,2018-05-02.
[4] 王新华,王晓鹏.受限条件下智能虹膜图像采集终端设计考虑[J].电子技术,2010,47(8):41-42.
[5] 李鹏飞,淡美俊,姚宇颤.生物识别技术综述[J].电子制作,2018(10):89-90.
[6] 吕立波.门禁控制系统中常用的几种生物特征识别技术之比较[D].济南:山东警察学院,2017.
[7] 吕康东,吕晓琪,赵瑛.虹膜区域预处理及纹理特征提取方法的研究[J].现代电子技术,2017,40(16):112-116.
[8] 韩友德,杨鹏,任高山,张元龙,林泉.基于DWT和LBP的紋理特征提取研究[J].计算机与数字工程,2018,46(3):566-569.
[9] 沈叶峰.基于ELM与非负矩阵分解的机器学习算法研究[D].杭州:杭州电子科技大学,2015.
[10] 李欢利,郭立红,李小明,等.基于统计特征中心对称局部二值模式的虹膜识别[J].光学精密工程,2013,21(8):2129-2136.
[11] 张军.基于中心对称LBP算子的虹膜识别改进算法研究[D].赣州:江西理工大学,2017.
[12] 王林.基于虹膜的身份识别算法研究[D].秦皇岛:燕山大学,2007.
[13] Timo Ahonen, Student Member, IEEE,Abdenour Hadid, and Matti Pietika¨inen, Senior Member, IEEE,Face Description with Local Binary Patterns: Application to Face Recognition[J].IEEE Transactions on Pattern analysis and Machine Intelligence, December 2006(2).
[14] Libor Masek.Face Description with Local Binary Patterns: Application to Face Recognition[D].The University of Western Australia,2003.
[15] 曹振亮.基于鲁棒稀疏表示的人脸识别算法[J].电子技术,2014(6):1-3.
[16] 算法学习者,最临近、双线性、三次卷积插值(图像放缩).https://blog.csdn.net/amds123/article/details/53791522,2016-12-21.
[17] 谢新文.基于计算机视觉的电气化铁路绝缘子识别技术的研究[D].成都:西南交通大学,2016.
[18] DAUGMAN J.How iris recognition works[J].IEEE Trans on Circuits and Systems for Video Technology,2004,14(1):21-30.
[19] BOLES W W,BOASHASH B.A human identification technique using images of the iris and wavelet transform[J].IEEE Trans on Signal Processing,1998,46(4):1185-1188.
[20] WILDES R P.Iris recognition: an emerging biometric technology[J].Proceedings of the IEEE,1997,85(9):1348-1363.
[21] 电子发烧友网工程师.LBP 的算法介绍.http://www.elecfans.com/kongzhijishu/jiqishijue/580 977.html.2017-11-17.
[22] Ojala T,Pietik?inen M,M?enp?? T.A generalized Local Binary Pattern operator for multiresolution gray scale and rotation invariant texture classification[C].Second International Conference on Advances in Pattern Recognition, Rio de Janeiro, Brazil, 2001:397-406.
【通联编辑:代影】