基于改进EfficientNet-B4模型的病理图像分类
2022-06-06贾梦菊
【关键词】皮肤肿瘤;组织病理图像;迁移学习;EfficientNet-B4;Adam
【中图分类号】R739.5 【文献标识码】A 【文章编号】2026-5328(2022)03--01
1 引言
在临床上皮肤肿瘤主要分为黑素细胞性和非黑素细胞性两大类,黑素细胞性主要包括恶性黑色素瘤、色素痣等,非黑素细胞性主要包括基底细胞癌、鳞状细胞癌、角化棘皮瘤等[1]。随着我国老龄化程度的不断加深,皮肤肿瘤的发病率也呈现上升趋势。
近年来,随着深度学习[2]等人工智能算法在计算机视觉领域的不断成功,以图像分类为核心的计算机辅助诊断技术得到极大的发展,为深度学习在医学图像的处理领域打下了良好基础。深度学习算法可以提取具有代表性的高层特征,避免了传统的机器学习算法中复杂的特征提取等过程,因此在图像识别和分类方面具有极大的优势和潜力。
本文提出一种残差结构与EfficientNet网络相结合的模型来对四类皮肤肿瘤进行分类,包括基底细胞癌、黑色素瘤、毛发上皮瘤和毛母细胞瘤。其中引入的残差结构提高了网络模型的精度,并将改进后的模型与不同的优化器进行结合,最后再对比分析其他的网络模型验证改进后模型的性能效果。
2 研究方法
2.1 EfficientNet网络
EfficientNet[3]系列网络模型自2019年首次提出以来受到了广泛的关注,它采用一种新的模型缩放方法对网络深度、网络宽度和模型输入图像的分辨率三个不同维度进行合理且高效的调整搭配,不仅提高了模型训练速度,也提升了模型精度。
EfficientNet-B4网络是在EfficientNet-B0的基础上,放大网络深度、网络宽度的倍数分别为1.4、1.8,输入分辨率调整为380x380。基准网络主要是由16个倒置瓶颈卷积模块、2个Conv卷积层、1个全局平均池化层和1个全连接层组成。其中倒置瓶颈卷积模块中又包含深度可分离卷积、批处理归一化、Swish激活函数以及通道注意力模块。
2.2 基于残差结构的 EfficientNet 模型改进
神经网络在一般情况下呈现网络越深,模型效果也会更好的现象,但是随着网络深度的不断增加,梯度消失和梯度爆炸问题也随之而来。He[4]等人提出的残差结构网络有效的解决了上述两个梯度问题以及网络性能的退化问题。因此本文采用残差结构去优化网络,保证网络深度的同时,又可以减少梯度带来的问题,更好地提取特征信息,提升网络性能。
本文采用3x3的卷积核来改进残差结构,更强的提取病灶区域在低层中的表征信息。改进后的EfficientNet-B4的整体网络模型结构如图1所示,其中不同的颜色代表着不同的阶段。
3.1 实验环境与数据集
实验所采取的数据为某医院皮肤科提供,并出具相应诊断信息。数据集中使用 HE 染色制成病理切片,经全切片数字扫描仪放大 40 倍后制成的无损数字病理图像。
3.2 评价指标
在分类阶段本文采用准确率(ACC)、灵敏度(sensitivity)和特异性(specificity)作为评价指标,三者计算公式如下所示。
但是由于测试集采取的方法是用整张病理图像分块去测,因而四种皮肤肿瘤的测试集数目并不一致,所以模型研究的准确率等于模型灵敏度。因此模型的评价指标增加一个F1分数,其公式如式(4)所示。
3.3 实验结果及分析
分类模型的实验结果如表1所示。可以看出,本文提出的模型分类准确率最高,模型的特异性、灵敏度与F1分数也占据优势。
结束语
本文以四类皮肤肿瘤的组织病理图像为研究对象,在分类阶段分析了不同模型对于分类的影响,得到最优的模型EfficientNet-B4网络并进行改进,同时选择不同的优化器进行实验对比分析,最终得出模型最优的改进方式为EfficientNet-B4网络与残差结构相结合并选用Adam作为优化器。本文提出的研究方法与原始EfficientNet-B4模型相比,在速度相近的情况下其准确率与灵敏度提高了2.5%,特异性提高了0.6%。
实验结果表明,所提出的模型是适合于多分类皮肤肿瘤组织病理图像的,但该模型的大小以及速度并不具备优势。在之后的研究中将进一步对网络进行优化,增强网络分类准确率的同时缩短训练时间。
参考文献:
唐志铭,傅宏阳,荆梦晴等.皮肤镜在皮肤肿瘤诊断中的应用[J].皮肤病与性病,2021,43(03):352-354+361.
LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436–444.
Tan M, Le Q. EfficientNet: Rethinking model scaling for convolutional neural networks[C]//Proceedings of the 36th International Conference on Machine Learning. New York:PMLR, 2019:6105-6114.
He K,Zhang X,Ren S,et al.Deep Residual Learning for Image Recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. New York: IEEE, 2016: 770-778.
作者简介:贾梦菊(1994—),女,汉族,沈阳工业大学信息科学与工程学院硕士,主要从事图像处理、智能信息处理方面的研究。