面向残差网络多元特征的轻量级虹膜分类
2021-07-15刘元宁朱晓冬张齐贤
丁 通, 刘元宁, 朱晓冬, 刘 帅, 张齐贤, 张 阔
(1. 吉林大学 符号计算与知识工程教育部重点实验室, 长春 130012; 2. 吉林大学 软件学院, 长春 130012; 3. 吉林大学 计算机科学与技术学院, 长春 130012)
虹膜特征是一种重要的生物特征, 具有稳定性和安全性等优势[1]. 传统虹膜分类主要以人工提取特征为主, 以频域或空域信息进行滤波. Gabor滤波器常用于对虹膜图像进行特征提取[2]. Boles等[3]提出了用虹膜周边纹理的小波过零点信息进行虹膜分类; 吕林涛等[4]提出了一种基于能量补偿的特征提取算法; 李欢利等[5]提出了一种基于加权Gabor滤波的虹膜识别; 霍光[6]使用多尺度的Gabor滤波器提取特征; 刘帅等[7]提出了一种基于自适应优化Log-Gabor滤波器与动态径向基函数(RBF)神经网络的虹膜分类算法; 文献[8]提出了使用多个方向的LBP(local binary pattern)算子进行虹膜的特征提取. 但人工提取的特征较浅, 并且面对不同的数据集, 可能会需要不同的特征提取方法. 随着深度学习的发展, 卷积神经网络(CNN)展现了在特征提取方面的优越性. Krizhevsky等[9]提出的卷积神经网络AlexNet广泛应用于目标识别和目标检测等领域; Minaee等[10]研究了卷积神经网络在虹膜分类中的应用; DeepIrisNet网络结构[11]取得了优异的结果. 之后, Minaee等[12]开始探讨虹膜分类在迁移学习中的应用, 后续提出的DenseNet网络结构应用在大型数据集分类上也有较好的效果[13]. 但传统卷积神经网络结构未能充分学习到虹膜图像特征, 并且参数较多, 训练时间较长.
本文基于上述研究, 将虹膜图像和Gabor提取的特征相结合, 使用多尺度卷积核, 使网络结构能充分学习到虹膜图像频域和空域的多尺度信息. 基于上述设计的网络结构参数更少, 与其他算法相比, 将其应用在轻量级虹膜分类上, 训练速度更快, 准确率更高.
1 网络结构
1.1 Resnet残差模块
Resnet[14]是一个应用广泛的框架结构, 其通过跳过一个或多个连接加快收敛速度, Resnet网络结构中的残差块如图1所示.
图1 Resnet残差块Fig.1 Resnet residual block
1.2 Inception模块
Inception模块[15]如图2所示. Inception模块结构具有很多优点, 如在Inception模块中1×1卷积用于降维, 减少了权重大小和特征图维度; 增加了网络的深度和宽度; 同时使用1×1,3×3,5×5的卷积, 增加了网络对尺度的适应性.
图2 Inception模块Fig.2 Inception module
1.3 多尺度残差网络结构
本文在结合Resnet残差块和Inception模块的基础上, 设计一个多尺度残差网络结构——Mul-resnet, 为使网络结构学习到尽可能多的尺度特征, 模块融合了1×1,3×3,5×5,7×7的卷积核, 如图3所示.
图3 多尺度残差模块Fig.3 Multi-scale residual module
基于多元特征虹膜分类的网络结构可用于训练和学习虹膜数据集, 对于一个卷积神经网络模型, 过深或过浅的模型都不利于结果收敛. 本文设计一个良好的网络结构, 同时集成了CNN中比较流行的组件, 如Dropout[16]、 深层网络结构设计、 ReLU激活函数、 Batch Normalization(BN)[17]. 本文网络结构由大量的卷积层和Mul-resnet模块叠加而成, 同时在Conv1,Conv2,Conv5,Conv6后添加了BN层. BN层具有加快网络的训练和收敛速度, 控制梯度爆炸、 防止梯度消失和过拟合的作用. 多尺度残差网络结构列于表1.
表1 多尺度残差网络结构
2 实 验
2.1 虹膜库
JLU虹膜图像库是由吉林大学生物识别与信息安全技术实验室采用自主研发的虹膜采集设备建立的虹膜图像库(http://www.jlucomputer.com/index/irislibrary/irislibrary.html). 在JLU虹膜图像库中选取一张如图4所示的原始虹膜图像, 可通过基于形态学与灰度分布的序列虹膜质量评价算法[18]选取清晰的虹膜图像进行后续处理. 由于采集的原始虹膜图像具有非常多的冗余信息, 在虹膜图像使用前, 需通过虹膜质量评价、 定位、 归一与增强, 将环形虹膜展开成一个512×64的矩形. 从增强图像左上角截取纹理最强的部分, 形成256×32尺度的矩形作为虹膜识别区域, 归一化后的虹膜图像如图5所示.
图4 原始虹膜图像Fig.4 Original iris image
2.2 Gabor滤波处理
由于传统针对虹膜分类的网络结构不能很好地利用虹膜图像的频域信息, 因此可使用Gabor滤波提取虹膜频域信息, 用于表示虹膜的纹理信息[19]. Gabor滤波对数据集处理后的图像如图6所示.
为使神经网络能更好地学习到输入的空域和频域信息, 在数据预处理中将图5和图6拼接在一起, 组合成一张256×64的图像, 如图7所示.
图5 归一化后的虹膜图像Fig.5 Normalized iris image
图6 Gabor处理后的图像Fig.6 Image processed by Gabor
图7 结合空域和频域的虹膜图像Fig.7 Iris image combining spatial domain and frequency domain
2.3 数据集
实验采用JLU-V6.0虹膜库, 选择50类虹膜组成实验数据样本, 将其随机分为两个包含40类别的小型虹膜数据集, 分别命名为JLU-V6.0-1和JLU-V6.0-2, 每种类别有300张虹膜图像, 按6∶2∶2 将其分为训练集180张、 验证集60张和测试集60张, 数据集划分结果列于表2.
表2 数据集划分
本文实验参数设置为Epoch=50, Batch size=64, 初始学习率为3×10-2, 动量为0,9, 使用SGD优化器.
2.4 实验结果
本文共进行3组比对识别率对照实验, 将本文提出的多尺度残差网络结构算法与其他3种算法进行对比, 用Softmax(xi)表示网络模型判断输入图像属于某一类的概率, 实验结果列于表3. 将类别扩充到50类时, 实验结果如表4所示. 不同算法的网络结构参数列于表5.
表3 不同算法的识别率(%)对比(40类)
表4 不同算法的识别率(%)对比(50类)
表5 不同算法网络结构的参数量(KB)
由表3~表5可见, 本文算法识别率略高, 网络结构的参数更少, 训练速度更快, 应用在轻量级虹膜分类上更有优势, 同时证明了输入多元特征和多尺度卷积核提取图像信息对识别率的提升有较大帮助.
综上所述, 针对传统虹膜分类需手工设计滤波器提取虹膜特征, 提取特征单一, 且通常需大量手工调参, 泛化能力较差的问题, 本文提出了一种面向残差网络下多元特征的虹膜分类算法, 使用Softmax分类器进行虹膜的多分类. 一方面将虹膜图像与Gabor特征相结合, 另一方面在网络结构中使用多个尺度的卷积核, 从而在网络结构中学习提取不同尺度的多元特征, 使学习到的虹膜特征更丰富, 从而提高图像特征的表征能力, 进而提高网络分类的性能, 极大减少了网络结构的参数数量, 使训练速度更快.