APP下载

卷积神经网络在肝穿刺图像分类中的应用

2018-12-17王岩

电脑知识与技术 2018年25期
关键词:卷积神经网络图像识别深度学习

王岩

摘要:肝穿刺病理学检查主要在医学中用于各种肝脏疾病的鉴别与诊断,了解肝脏病变的程度和活动性,发现早期、静止期或尚在代偿期的肝硬化,判别临床治疗。卷积神经网络作为深度学习的一个重要组成部分,在图像识别方面有很多重要应用。针对肝穿刺图像分类中病理图像分类问题,提出一种基于卷积神经网络的分类方法。设计并训练卷积神经网络,得到用于分类的模型。实验结果表明,该方法可以有效地对其进行分类,提高识别准确率。

关键词:肝穿刺图像;卷积神经网络;深度学习;图像识别;人工智能

中图分类号:TP183 文献标识码:A 文章编号:1009-3044(2018)25-0203-03

Application of Convolution Neural Network in Image Classification of Liver Puncture

WANG Yan

(Institute of Computer Application, China Academy of Engineering Physics, Mianyang 621900, China)

Abstract:Liver biopsy is mainly used for the identification and diagnosis of various liver diseases in medicine. It was used to diagnose the degree and activity of liver lesions, and to detect early, static or compensatory cirrhosis of the liver, and to identify clinical treatment. As an important part of deep learning, convolution neural network has many important applications in image recognition. A method based on convolution neural network was proposed to classify the pathological images in liver biopsy image classification. The experimental results show that this method can effectively classify and improve the recognition accuracy.

Key words:liver biopsy image; convolution neural network; deep learning; image recognition; artificial intelligence

肝穿刺就是肝脏组织活检。目前在医学领域方面多用于多种肝脏疾病的鉴别诊断,如鉴别黄疸的性质和产生的原因,了解肝脏病变的程度和活动性,为各型病毒性肝炎的病原学诊断提供依据,发现早期、静止期或尚在代偿期的肝硬化,尤其在确定肝纤维化严重程度上是国际公认的标准。由于其准确率可以达到80%以上,故被认为是目前比较好的检查手段。

在检测过程中,在B超、CT的定位和引导下经皮肤穿刺,获取样本后再通过显微镜观察肝脏组织和细胞形态。传统的分类方法受限于医师的经验、判断标准的主观性差异和病变特征的非线性特点,会对检测结果的准确率造成一定程度的影响[1]。近几年在计算机方向热门的人工智能技术,尤其是在图像处理领域应用广泛的深度学习算法,在医学图像领域也有很多的应用。为了消除传统方法中,由于人的原因而造成的准确率受影响的问题,本文提出了一种基于卷积神经网络的肝穿刺图像分类的方法,对图像进行基本的判断。进而希望可以作为一个辅助手段来帮助医师进行判断。另一方面,也可以减轻医师的工作量,为患者节约检验成本。

本实验所采用的样本主要分为三个类别---健康、轻微病变、严重病变,如图1所示。

随着病变程度的不同,损伤区域的特征也不同。因此,很难设计一种将病变区域和背景区域可以很好区分的特征提取算法。而深度学习就是用来进行特征提取、训练然后进行分类的一个很好的工具。而作为深度学习中重要组成部分的卷積神经网络,则是近几年被国内广泛应用的一种人工神经网络。本文也是基于这种人工神经网络进行实验。

卷积神经网络是受猫视觉皮层生理研究启发,有人提出了卷积神经网络。而后Yann Lecun最早将其成功应用于MNIST手写体数字识别任务中[2],并持续保持了其在该问题上的霸主地位。由此,卷积神经网络开始被大众所熟知。近年来卷积神经网络在多个领域都开始发挥自己的优势,如医学图像识别及分类[3]、语音识别[4]、人脸识别[5]、行为判断[6]、情感预测[7]等。

本文以肝穿刺图像自动分类为目标,设计了一种基于卷积神经网络的实现方法。通过对数据进行训练,得到所需的分类器。本文内容的具体安排如下:第二节介绍深度学习及卷积神经网络的基本原理;第三节介绍本实验中所用的卷积神经网络的模型;第四节中介绍实验数据以及处理方式;第五节介绍实验结果及分析;第六节总结与展望。

1 深度学习及卷积神经网络

深度学习的结构基础是多层神经网络,而卷积神经网络则是一种特殊的多层神经网络。在生物体的神经网络中,每个神经元与其他神经元之间相连。当神经元发生兴奋时,就会向相邻的神经元之间发送神经递质,从而改变这些神经元内部的电位,产生相应的变化。多层神经网络和生物的神经网络类似,它是由输入层、隐藏层、输出层组成的。相邻的各个位于不同层的神经元节点间均有权值相连接。如图2所示,展示了一个具有一个隐含层的神经网络。

其对应的公式(1)如下:

[a(2)1=f(ω(1)11x1+ω(1)12x2+ω(1)13x3+b(1)1)]

[a(2)2=f(ω(1)21x1+ω(1)22x2+ω(1)23x3+b(1)2)] (1)

[a(2)3=f(ω(1)31x1+ω(1)32x2+ω(1)33x3+b(1)3)]

[hω,b(x)=a(3)1=f(ω(2)11a(2)1+ω(2)12a(2)2+ω(2)13a(2)3+b(2)1)]

其中[ω] 为层间的参数矩阵,[b] 为偏移参数向量,[x] 为输入,[f] 为激活函数。

卷积神经网络与普通的人工神经网络的区别在于,卷积神经网络在原来的人工神经网络的基础上加入了特征学习部分,而这部分就是模拟人脑在对接收到的信号处理上的分级的方法。具体操作就是在全连接层前加入了由卷积层和下采样层构成的特征抽取器。在卷积神经网络中的每一个卷积层中,又包含了若干个特征平面,每个特征平面由一些矩阵排列的神经元组成。卷积核的初始化一般是以一个随机小数的矩阵的形式,在训练的过程中得到合适的权值。下采样也叫作池化,通常包括均值下采样和最大值下采样两种形式。卷积和下采样很大程度地简化了网络模型的复杂程度,减少了模型的参数。

2 实验所用到的网络模型

本实验中所采用的卷积神经网络结构如下图3所示:

如上图,其中Conv表示卷积层,Sub表示下采样层,Fc表示全连接层。该网络结构中卷积层和下采样层交替出现。在卷积层中,样本会经过卷积核的卷积计算等一系列处理,形成特征图。在下采样层中,样本数据会根据下采样算子进行下采样操作。

在本文网络模型的卷积层中,采用的是修正线性单元(Rectified linear unit,ReLU)激活函数。而在前两个全连接层中采用的是双曲正切函数(Tanh)作为激活函数。在最后一层全连接层采用softmax激活函数。为了防止卷积神经网络出现过拟合问题,本文采用了Dropout技术[8]。

3 实验数据

数据集是对分类其中参数进行分类的样本,对于分类器的最终效果影响很大。本实验中所用的数据为肝穿刺图像,目前在医学图像处理领域里,尚未存在一个标准化的肝穿刺图像数据集,且本实验中的应用背景是肝穿刺活检样本的分类,训练所需的数据集也应取自实际医院中进行肝穿刺检测的患者,故样本收集难度较大。

为了有一个标准的训练及检测数据集,本实验进行前对其他图像处理方向的领域进行了调研,分析了他们的标准数据集。发现其有几个共同的特点:1、数据集中数据的量很大,通常图片数目超过5000张且每个类中图片的数目相差不大;2、与训练数据集相类似,分别设置了对应的测试样本数据集,用来对其训练好的模型进行测试。并且训练数据集和测试样本数据集中的数据不重复,保证了测试结果的真实性。而本实验所原有的数据由于病患群体的特殊性,导致三个类别的样本数目分部严重不均衡。健康类图片的样本数目远远多于其他两个类的样本数目。

通过对上述样本数据集及自有样本集的分析。本实验通过调研发现,对现有数据进行旋转、翻折等操作可以产生大量可用的伪数据样本[9]。增加可用的样本数量且不会影响模型的训练。如图4来扩展两个数量不多的样本库,使其数量与健康类数量相差不大,以保证训练效果。

受到原始数据集的影响,本次实验所用的数据集仍达不到公开数据集的样本数量。经过对数据集进行处理后,本次实验所用的训练集为健康样本720张,轻微病变类样本612张,严重病变类样本584张,共计1916张。而测试集中的健康类样本为104张,轻微病变样本为86张,严重病变类样本82张,共计272张。且训练集和测试集中的样本无重复。

4 实验结果及分析

本次实验的实验环境为Windows 7系统+TensorFlow+python3.5,应用GPU对卷积运算进行加速,所用GPU型号为GTX1050Ti。在本次实验中,由于设备性能受限,只进行了400次循环,学习率设置为0.001。采用分批训练方式,每批次含有样本数目70个,训练样本集分为28个 批次。这样训练的好处是相比于逐一训练是有全局性的,也提高了提高机器的使用率。而相对于整体训练来说,能大幅度节约训练时间。当所有训练样本批次训练完毕后,一次循环完成。如此往复进行400次循環,共计11200个批次。

图4是使用tensorboard记录的训练图中准确率的变化情况。可以看出在完成10000个批次训练时准确率已经达到88.47%。最终,在400次循环完成后,用测试集进行测试的准确率为91.54%。

对实验中数据进行分析后发现,测试集中分类错误的图片大部分都在轻微病变类测试样本中,是因为对于病变程度的界定目前没有一个准确的界定方式,模型只能根据训练数据中,它所学到的训练数据样本的特征进行分辨,所以才造成这种问题。

5 总结

在本文和相关工作中,设计了一种基于卷积神经网络进行训练,从而获得分类器模型的方法,并在肝穿刺图像分类中取得了比较好的效果。在制作数据集的过程中,利用图像的各种变换方式,获取了一定数量的伪数据;依据分类结果,给出病变程度的诊断。肝穿刺图像的这种分类方法在现有数据中达到了预期的效果。

对比于传统的依靠医师主观经验进行判别的诊断方法,本实验证明了采用卷积神经网络也可以进行判别,且准确率高于传统方法的平均准确率。在今后的研究工作中,会进一步对卷积神经网络在图像处理方面进行探索、学习、研究,并在实际中加以应用,继续提升识别效果以及识别准确率。

参考文献:

[1] 杨晶晶, 王骞, 宣晓华. 基于深度卷积神经网络算法的肺结节检测模型[J]. 数学建模及其应用, 2017(4).

[2] Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.

[3] Hatipoglu N, Bilgin G. Classification of histopathological images using convolutional neural network[C]// International Conference on Image Processing Theory, TOOLS and Applications. IEEE, 2015:1-6.

[4]张晴晴, 刘勇, 王智超,等. 卷积神经网络在语音识别中的应用[J]. 网络新媒体技术, 2014, 3(6):39-42.

[5]叶浪. 基于卷积神经网络的人脸识别研究[D]. 东南大学, 2015.

[6] Park E, Han X, Berg T L, et al. Combining multiple sources of knowledge in deep CNNs for action recognition[C]// IEEE Winter Conference on Applications of Computer Vision. IEEE Computer Society, 2016:1-8.

[7]蔡国永, 夏彬彬, CAIGuoyong,等. 基于卷积神经网络的图文融合媒体情感预测[J]. 计算机应用, 2016, 36(2):428-431.

[8] Murphy K, Van G B, Schilham A M, et al. A large-scale evaluation of automatic pulmonary nodule detection in chest CT using local image features and k-nearest-neighbourclassification[J]. Medical Image Analysis, 2009, 13(5):757-770.

[9]劉岩. 卷积神经网络在光学元件损伤检测中的应用[J]. 电脑知识与技术, 2017, 13(4):178-182.

[10]周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6):1229-1251.

[11]吕国豪, 罗四维, 黄雅平,等. 基于卷积神经网络的正则化方法[J]. 计算机研究与发展, 2014, 51(9):1891-1900.

[12]许可. 卷积神经网络在图像识别上的应用的研究[D]. 浙江大学, 2012.

[13] 陈先昌. 基于卷积神经网络的深度学习算法与应用研究[D]. 浙江工商大学, 2014.

[14]郭以河, 张闽峰, 孟家榕,等. 肝穿刺活检标本处理方法的改进[J]. 临床与实验病理学杂志, 2004, 20(6):747-748.

[15]徐成润, 张闽峰, 郑瑞丹,等. 4200例肝穿刺活检组织病理与临床分析[J]. 肝脏, 2008, 13(2):115-117.

[16]周春辉, 孙雷, 李晓楠,等. 127例乙型病毒性肝炎肝穿刺活检结果的比较分析[J]. 临床肝胆病杂志, 2005, 21(5):271-272.

【通联编辑:唐一东】

猜你喜欢

卷积神经网络图像识别深度学习
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
基于深度卷积神经网络的物体识别算法
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望