APP下载

深度卷积神经网络的宫颈癌细胞图像识别

2018-07-12夏哲雷

中国计量大学学报 2018年2期
关键词:错误率宫颈宫颈癌

谢 欣,夏哲雷

(中国计量大学 信息工程学院,浙江 杭州 310018)

宫颈癌是威胁广大女性身体健康的常见恶性肿瘤[1].为实现宫颈癌细胞识别的智能化,将深度学习应用到宫颈癌细胞识别,以降低识别过程中出现的假阴性率、假阳性率,其中减小识别错误率成为智能识别宫颈癌细胞的关键.

深度学习在图像识别应用中发挥着越来越重要的作用,它主要是通过组合低层特征形成高层抽象来表示图片特征,这种方式能够更好的表达出数据的最本质特征[2].卷积神经网络是深度学习的重要组成部分.1998年,Lecun等提出的LeNet-5[3]采用了基于梯度反向传播模型对网络进行有监督的训练,该网络主要用于识别10个手写数字,对图像识别效果较差.为提高卷积神经网络的识别效果,2012年,Krizhevsky等提出了AlexNet,该网络在大型图像数据库ImageNet[4-5]的图像分类竞赛中取得优异成绩,卷积神经网络获得了学术界的广泛关注,可是将AlexNet应用于宫颈癌细胞数据集并没有取得令人满意的结果.继AlexNet之后,2014年Karen Simonyan和Andrew Zisserman提出了更深的VGG(Visual Geometry Group)[6],它的提出证明网络的深度是模型优良性能的关键部分,但是该网络存在大量无关参数,以致耗费计算资源,识别效率低.

针对以上问题,本文基于深度卷积神经网络,提出一种由七层卷积层和两层全连接层串联的模型,通过并联卷积层增加该网络宽度,减少网络参数来优化网络结构.将该模型应用到宫颈癌细胞识别中,对中间层特征图像采用批量归一化方法进行预处理,以加快网络训练,降低分类错误率.与其他同类相关文献相比,识别效果更好.

1 卷积神经网络模型

卷积神经网络(Convolutional Neural Network, CNN)是一种前馈神经网络,它主要由输入层、卷积层、激活函数、池化层、全连接层组成[3].

卷积层中通过可学习的卷积核(Filter)按照一定步长与图像像素做对应相乘再相加的运算,进行特征提取得到特征图.上一卷积层得到特征图经过激活函数作为下一卷积层的输入.卷积过程如图1.

图1 卷积过程Figure 1 Convolution process

卷积过程计算公式如下[7]:

(1)

激活函数为卷积神经网络引入非线性部分,增强网络的表达能力.近几年的卷积神经网络中多采用不饱和非线性函数ReLU,在训练梯度下降时ReLU比传统的饱和非线性数有更快的收敛速度,因此在训练整个网络时,训练速度也比传统的方法快很多.

池化层又称为下采样层,主要分两种:最大池化和平均池化.池化操作对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;另一方面进行特征压缩,提取主要特征.池化过程计算公式如下[7]:

(2)

2 改进的卷积神经网络模型

本文学习和研究经典串连卷积神经网络模型,提出一种改进的深度卷积神经网络模型,通过增加并联卷积神经层拓展网络宽度、调整网络参数来优化网络结构.网络的深度和宽度,训练数据集大小,卷积核的大小及个数等是影响卷积神经网络分类性能的重要因素[8].先设计一个由7个卷积层和2个全连接层串联卷积神经网络,然后在卷积层Conv1与卷积层Conv4中间并联一个Conv2′与Conv3′串联的结构,增加网络的宽度,实现多尺度特征提取、融合.网络输出经过Softmax分类器进行分类,调整网络的参数,优化网络模型.

本文设计优化的深度卷积神经网络结构如图2,利用宫颈癌细胞图片数据集训练测试网络,调整卷积神经网络中卷积核的个数及大小,优化网络结构.该模型以pad(增加图片的维度)后的RGB图片作为输入,将32×32的宫颈癌细胞RGB图片扩充为40×40作为网络输入.Conv1的输出分别作为Conv2和Conv2′输入,经过并联模块后输入到Conv4之后的串联部分,通过分类器输出分类结果.卷积层中将上一卷积层输出的特征图进行批量归一化(Batch Normalization)[9]处理,经过激励层ReLu作为下一卷积层的输入,批量归一化方法可有效地防止“梯度弥散”,加速网络训练,本结构中采用最大池化来压缩特征图.

图2 本设计优化的卷积神经网络结构Figure 2 The optimized convolution neural network structure

3 实验分析及结果

由于癌细胞的细胞核很大,一般核、质比例与正常细胞恰好相反;癌细胞的外形不规则,而正常细胞外形规整,多为圆形或椭圆形;癌细胞核内染色质出现团块,而正常细胞核内染色质均匀等,根据是否病变及病变程度将宫颈细胞分为四类[10]:正常宫颈细胞(Normal)、非典型意义不明确(ASCUS)、低度鳞状上皮内病变(LSIL)、高度鳞状上皮内病变(HSIL).宫颈细胞的图片如图3.

图3 不同病变程度的宫颈细胞Figure 3 Cervical cells with different pathological changes

实验采用包含四类宫颈细胞的图像数据集共2 180张,四类细胞的张数如表1.模型输出层经过Softmax分类器进行分类,与经典卷积神经网络对比着手实验,研究本文网络模型的分类效果.

3.1 与经典模型相比

将本文模型与经典模型做对比,采用2 180张宫颈细胞,观察宫颈癌细胞分类错误确率.经典模型LeNet网络由三个卷积层,两个池化层,一个全连接层和一个输出层构成,输出层函数采用RBF函数.AlexNet相比LeNet,加入了dropped out方法来抑制过拟合的发生.VGG网络与前两个网络相比更“深”,增加了卷积的层数以及卷积中卷积核的个数.与这三个网络做对比,采用相同大小的宫颈细胞样本,比较相同实验样本下,经典模型与本文网络模型的分类错误率如表2;相同迭代次数下,经典模型与本文模型在训练时分类错误率的变化趋势如图4.

表1 宫颈细胞数据集

表2 本文方法与不同模型分类错误率对比

图4 模型错误率随迭代次数的变化趋势Figure 4 Change trend of the inaccuracy of the model with the number of iterations

由表2可以看出在相同的宫颈癌细胞训练、测试样本情况下,LeNet与AlexNet的分类效果较差,VGG网络分类错误率低于LeNet和AlexNet,但略高于本文设计的卷积神经网络结构.图4四种网络的训练错误率经过500次迭代的变化趋势.由图4可以看出开始训练时,四种网络的错误率都迅速下降,最后四种方法下降的趋势都趋于平缓.AlexNet随着迭代次数的增加,分类错误率低于LeNet,而VGG和本文方法在100次迭代后,错误率明显低于前两种,随着迭代次数的增加,本文设计的网络错误率低于VGG网络.

3.2 与同类文献相比

将本文实验与同类相关文献相比.文献[11]在LeNet的基础上增加了卷积两层卷积层和两层池化层,实验数据采用精子、红细胞、白细胞.文献[12]在卷积层3与卷积层6之间并联了一层卷积,数据集采用中西方绘画图像.用宫颈癌细胞数据集对上述文献进行训练测试,实验结果与本文方法相比如表3.

表3 本文方法与同类相关文献错误率对比

实验结果证明与经典的网络模型相比,本文设计的网络通过增加的宽度,并联了一个两层卷积串联的模块来优化网络模型,减少学习参数,能更好的学习宫颈细胞图片特征,与其他同类方法相比分类效果更好.

4 总 结

本文提出一种深度卷积神经网络模型,通过改变网络模型的宽度,并联卷积层实现;对中间层特征图像采用批量归一化方法进行预处理,加快网络训练.利用宫颈癌细胞图像数据集训练测试网络,与同类方法相比,本文方法对宫颈癌细胞图像识别分类效果更好.后续将继续学习卷积神经网络模型,研究影响模型性能的因素,如图片的格式、预处理的方法、分类器的改进等.实验目标为实现更低的宫颈癌细胞错误率,将卷积神经网络更好的应用在细胞识别中去.

猜你喜欢

错误率宫颈宫颈癌
硫利达嗪抗宫颈癌的潜在作用机制
中老年女性的宫颈癌预防
宫颈癌护理及心理护理在宫颈癌治疗中的作用及应用
预防宫颈癌,筛查怎么做
把好宫颈这道“安全门”
小学生分数计算高错误率成因及对策
怀孕后宫颈管短怎么办
这几种“宫颈糜烂”需要治疗
HPV感染——“宫颈的感冒”
正视错误,寻求策略