基于深度学习的膀胱肿瘤MRI图像分级分期预测
2021-03-15蔡亚洁李畅杜悦张文龙白羽黄道斌
蔡亚洁 李畅 杜悦 张文龙 白羽 黄道斌
摘要:膀胱癌的发病呈现增高的趋势,对放射科医生来说,检测和分类膀胱恶性肿瘤是一项耗时较大的工作。近年来,计算机辅助诊断系统的进步以及深度学习(Deep learning)的发展,使其成为医学图像处理的有力工具。文章提出一种基于深度卷积神经网络的膀胱癌MRI图像的优化模型,得到适合膀胱肿瘤MRI图像分级和分期预测的算法,取得较好的预测诊断效果,膀胱肿瘤分级预测准确率93.75%,膀胱肿瘤分期预测准确率98.96%,为膀胱肿瘤的无创预测提供了新的手段。
关键词:膀胱癌;MRI;计算机辅助诊断;深度学习;卷积神经网络
中图分类号: TP183 文献标识码:A
文章编号:1009-3044(2021)01-0029-03
Abstract: The incidence of bladder cancer is increasing. For radiologists, detecting and classifying bladder malignant tumors is a time-consuming task. In recent years, the progress of computer-aided diagnosis system and the development of Deep learning have made it a powerful tool for medical image processing. In this paper, based on the depth of the convolution of bladder cancer MRI images of neural network optimization model, suitable for bladder tumor MRI image classification and staged prediction algorithm, make better effect on predictive diagnostics, bladder tumor classification prediction accuracy 93.75%, forecast accurate staging rate 98.96%, provides a new noninvasive prediction of bladder tumor.
Key words: bladder cancer; MRI; computer aided diagnosis; deep learning; convolutional neural networks
膀胱癌作为一种世界流行的癌症[1],在全球癌症诊断中排名第九,在我国,膀胱癌作为一种泌尿系统常见的恶性肿瘤,可发生于包括儿童在内的任何年龄段的人群,且发病率随年龄增长而增加,高发年龄为50~70岁,男性的发病率比女性更高,为女性的3~4倍[2]。近几年来,由于吸烟人群增多、人口老龄化加剧、生态环境污染加重以及职业防护不完善,我国膀胱癌发病率呈现逐年增长趋势[3]。
因为膀胱形状的变化,尿液中强烈的强度不均匀性和人群特异性,以及肿瘤的外观变化,都会为后续处理工作带来困难。目前膀胱癌术前分期及病理分级主要依赖于膀胱镜活检,局部病理活检易导致过低分期,无法观察到肿瘤对膀胱壁外的侵犯情况[4],且其为有创检查,对患者造成再次损伤,因此术前进行全面而准确的影像学分级和分期预测评估尤为重要。人类对于图像的解释是有限的,传统的人工手动分级分期方法耗时长且准确度不高。与其他医学影像检查相比,MRI具有較高的组织对比度和软组织分辨率,可进行多参数、多方位成像,并且具有多种扫描参数可选择,在膀胱癌术前诊断分期、病灶分级及临床疗效监测等方面具有很大的优势[5],准确鉴别肿瘤的分期和分级对于患者的治疗和预后具有极其重要的临床意义。
1 方法
1.1深度学习
深度学习的概念由 Hinton 等人于2006年首次提出[6],作为机器学习算法中的一个新兴技术,其动机在于建立,模拟人脑进行分析学习的神经网络,其本质是对观察数据进行分层特征表示,实现将低级特征进一步抽象成高级特征表示。随着人工智能和计算机视觉等相关领域的快速发展,深度学习也被运用于医学图像分类检测,并取得了显著的效果[7],深度学习正在成为通用成像和计算机视觉领域的领先机器学习工具,并且由于其对机器视觉及自然语言处理领域的探索与应用带来革命性的突破以及在补充图像解释,增强图像表示和分类等方面的潜力,使其能在医学图像处理领域也能得到广泛应用[8]。特别是卷积神经网络(Convolutional Neural Network, CNN),采用局部连接和权值共享的方式将图像直接作为网络的输入,避免传统识别算法中烦琐的特征提取和数据重建的过程[9, 10],增强了其迁移能力,使其在医学图像的处理过程中有很大的优势[11]。
1.2 VGGNet
牛津大学视觉几何组(Visual Geometry Group)提出的VGGNet深度卷积网络,取得ILSVRC-2014中定位任务第一名和分类任务第二名的成绩,其突出贡献在于证明使用通过很小的卷积(3*3),增加网络深度能有效提升模型的训练效果。
VGGNet-16在整体上可以划分为8段,前5段为卷积网络,后3段为全连网络。每层卷积层中包含2~4个卷积操作,卷积核的大小是3*3,卷积步长是1,池化核是2*2,步长为2,将卷积层的深度提升到了16-19层[12, 13],VGGNet最明显的改进就是降低了卷积核的尺寸,增加了卷积的层数,且对其他数据集也具有良好的泛化能力[14],随着深度的增加,分类性能也逐渐提高,被广泛运用于医学图像处理工作。但由于深度的增加,使用更多参数,将会耗费更多的计算资源,给实验带来困难,必须在其基础上,利用VGGNet的优势,通过改进的方式,使其更好地适用于目标图像的处理工作。
2 实验
2.1数据采集和预处理
训练数据的数量与质量水平,对于深度学习中网络模型有着很大的影响。实验所采用的数据集来源于2019年中国大学生计算机设计大赛人工智能组挑战赛,数据集包含480张512*512的膀胱扫描MRI 图像,两类已标注的标签信息包括膀胱肿瘤的分级与分期情况。一个成功的神经网络需要大量参数,使得这些参数得以正确工作则需要大量数据,由于本数据集图片数量不大,可以通过数据增强来增加训练样本的多样性,提高模型的鲁棒性和泛化能力,避免过拟合。
为了提高模型性能,对原始数据集进行以下预处理:
1.针对数据集较小的情况,为了防止过拟合,我们对于原始图像进行旋转、翻转、随机裁剪和灰度值变换来扩充增强数据集;
2.调节图像的对比度,增强磁共振组织边缘的差异;
3.将数据集划分为两个互斥的集合,作为训练集和测试集。在训练集得出最优模型后,使用测试集进行模型预测,用来衡量该最优模型的性能和分类能力,作为对泛化误差的估计。本数据集可按照二分类任务进行划分,数据增强后我们采取5/1分样,对其进行划分,为了避免因数据划分过程引入额外的偏差而对最终结果产生影响,划分过程会尽可能地保持数据分布的一致性,在分类任务中为保持样本的类别比例相似,采用了保留类别比例的采样方式,即分层采集(stratified sampling)。
2.2训练
所有实验都是在Ubuntu16.04操作系统上,使用Nvidia GeForce 970 GPU计算卡进行。在Keras深度学习框架上构建CNN模型使用随机初始化权重进行训练,采用Adam优化器,学习率设置为1e-5,衰减指数为1e-5,使用交叉熵(binary crossentropy)损失函数,采用accuracy计算预测值上的正确率。
3 结果
在膀胱MRI 图像数据集上进行膀胱肿瘤分级和分期模型训练操作,在训练过程中,若学习率设置过小,则收敛过程缓慢;若学习率过大,会导致梯度在最小值附近来回震荡,难以进行收敛。根据多次实验观察以及调试经验,将学习率Ir设为0.00001较合适。模型最后得到膀胱肿瘤分级预测准确率为93.75%,膀胱肿瘤分期预测准确率为98.9583333333%。在目标任务的完成中两者准确率都达到90%以上,表现较为出色,相较于膀胱肿瘤分级的准确情况,神经网络在分期中表现更好,准确率达到98.958%。
目前的研究成果尚有不足和提升空间,如小样本易导致过拟合;图像的采集和特征提取存在个体差异;仅对腹部MRI图像提取出的PNG图像进行了实验,未对MRI原始图像(数字影像和通讯DICOM)进行处理;MRI成像中存在噪声,磁场非均匀性对特征计算的影响等,都会影响最终的准确率,这也是我们后期需要进一步优化和改进的地方。
4 结论
伴随着时代的进步,医学影像逐渐成为人工智能的热门研究领域之一,深度学习在医学图像处理上取得了不俗的成绩,同时计算机辅助治疗也减轻了医生的工作量。文章以膀胱肿瘤MRI图像作为主要研究对象,从经典神经网络模型入手,进一步找出适用于该疾病图像分级和分期的网络模型,实现膀胱肿瘤MRI图像的预测诊断,未来将继续优化和改进,弥补不足,使之能够真正为临床工作减轻负担。
参考文献:
[1] 张苗苗.磁共振成像在膀胱癌T分期中的应用[J].癌症进展,2017,15(3):227-230.
[2] 曹利蓉,钱文燕,詹生虹.膀胱癌患者围手术期的观察及护理[J].中国保健营养(上旬刊),2013(12):7362-7363.
[3] 韩苏军,张思维,陈万青,等.中国膀胱癌发病现状及流行趋势分析[J].癌症进展,2013,11(1):89-95.
[4] 温机灵,周祥福,高新,等.膀胱癌术前活检分级低估现象分析[J].中华泌尿外科杂志,2006(12):833-835.
[5] 杜鹏,王焕军,石宇强,等.基于多参数磁共振成像影像组学特征的膀胱癌复发预测[J].中国医学装备, 2018, 15(11): 46-50.
[6] LeCun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[7] Schmidhuber J.Deep learning in neural networks:an overview[J].Neural Networks,2015,61:85-117.
[8] Shen D G,Wu G R,Suk H I.Deep learning in medical image analysis[J].Annual Review of Biomedical Engineering,2017,19(1):221-248.
[9] Kim Y.Convolutional neural networks for sentence classification[EB/OL].2014:arXiv:1408.5882[cs.CL].https://arxiv.org/abs/1408.5882
[10] 庞丝丝,黄呈铖.基于卷积神经网络的图像分类研究[J].现代计算机,2019(23):40-44.
[11] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.
[12] Shelhamer E,Long J,Darrell T.Fully convolutional networks for semantic segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4):640-651.
[13] Zhang X Y,Zou J H,He K M,et al.Accelerating very deep convolutional networks for classification and detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(10):1943-1955.
[14] Billings S.Categorical mixture models on VGGNet activations[EB/OL].2018:arXiv:1803.02446[cs.CV].https://arxiv.org/abs/1803.02446
【通聯编辑:唐一东】