APP下载

基于DenseNet的COVID-19CT图像识别

2021-11-07叶佳超钟宝荣

电脑知识与技术 2021年25期
关键词:掩码图像识别卷积

叶佳超 钟宝荣

摘要:本文讨论了基于卷积神经网络中的DenseNet的网络模型在COVID-19 CT图像识别中的应用。首先解释了基于CT图像判别病例的事实依据,并介绍了DenseNet模型的特点及其优势所在,接着描述了实验中的数据集的来源,最后采用DenseNet-169模型进行了费雷实验,并对最终损失函数进行了优化。最终实验训练的模型验证集上运行得到了精确率为91%,召回率为79%,F1值为85%,准确率为85%,AUC值为94%的结果,模型较好的达到了预期,能够较为准确的识别输入的CT图片是否为COVID-19的病例。

关键词:卷积神经网络;DenseNet;COVID-19;CT图像

中图分类号:TP18         文献标识码:A

文章编号:1009-3044(2021)25-0106-03

1引言

2019年12月以来,湖北省武汉市部分医院陆续发现了多例有华南海鲜市场暴露史的不明原因肺炎病例,现已证实为2019新型冠状病毒感染引起的急性呼吸道传染病。2020年2月11日,世界卫生组织总干事谭德塞在瑞士日内瓦宣布,将新型冠状病毒感染的肺炎命名为“COVID-19”。2020年3月11日,世界卫生组织总干事谭德塞宣布,根据评估,世卫组织认为当前新冠肺炎疫情可被称为全球大流行[1]。截至2020年6月1日,全球约有600万确诊病例,累计死亡人数达到了约37万人。

随着疫情的突然爆发,世界各地的医疗系统都受到了严重的冲击。控制这种疾病传播的一个主要障碍是检测手段的短缺,目前的检测方法多以逆转录聚合酶链反应(病毒核酸检测)为主,但在COVID-19疫情暴发的高峰期,核酸检测试剂盒非常短缺。因此,很多疑似病例无法及时检测,他们在不知不觉中继续传播疾病。为了缓解核酸检测试剂盒的短缺,各医院纷纷利用其他诊断方法。

计算机断层扫描(CT)已被用于COVID-19的筛查和诊断[2]。例如,在我国国家卫健委和国家中医药管理局制定的《新型冠状病毒肺炎诊断与治疗规程(试行第5版)》中,CT等胸部影像学检查技术被列为诊断COVID-19的重要方法。在疫情暴发之外,CT判断患者是否为COVID-19的确诊病例其实是不准确的,因为在CT图像中,通过有经验的医生观察,可以发现患者是否有病毒性肺炎,但是引起肺炎的病毒不止新冠病毒一種。然而,在疫情暴发期间,大部分病毒性肺炎都是由引起的。也就是说,如果一个病人被CT诊断为病毒性肺炎,这个病毒性肺炎很可能是COVID-19。由于这个事实,CT图像在疫情暴发的时候,对诊断COVID-19很有帮助。

当下,基于卷积神经网络的病理CT图像识别相关研究已经有一些成熟的方法,如乳腺癌病理CT图像的分类[3]、基于CT图像的肺结节良恶性判断等[4]。其中主要采用了卷积神经网络中的如LENET5、VGG等经典模型来进行学习、分类和识别。而DenseNet模型是2017年新提出的一种卷积神经网络模型,因此,本文基于DenseNet对COVID-19 CT图像识别进行了研究,并对其结果进行了讨论。

2 DenseNet模型

在2017年,清华大学的两位学生黄高和刘壮,在借鉴了ResNet的算法思想后,提出了一种全新的卷积神经网络模型DenseNet[5]。DenseNet以前馈的方式将每一层与其他每一层连接起来。在传统的卷积神经网络中,如果你有[L]层,那么就会有[L]个连接,但是在DenseNet中,会有[LL+12]个连接。其原因在于每一层的输入来自前面所有层的输出[6]。

在每一个密集块中,层与层之间级联了三个必要操作,分别是进行归一标准化,调用激活函数,进行卷积计算,如下公式:

在每一个密集块中,存在一个增长率参数[k],假定经过一层后会产生[k]个特征图,那么对于第[x]层网络来说,一共会有[k0+kx-1]个特征图作为输入,其中[k0]是当前层的特征图数量。正是由于DenseNet每个密集块中每层要求同样的输出,而每层的输入会由于层数的叠加而增加,最终的特征图的通道仍然会比较大而成为网络的负担。因此在这里使用每层使用[1×1]的卷积核作为特征降维的方法来降低通道数量。经过改善后的非线性变换变为以下公式,来降低运算过程中产生的参数。

下面的图2表示的则是一个DenseNet的结构图,在这个结构图中包含了3个密集块。分成多个密集块,原因是希望各个密集块内的特征的大小统一,这样在做连接时就不会有图片大小不匹配的问题[7]。

DenseNet的核心思想在于建立了不同层之间的连接关系,通过这种连接做出了比ResNet更好的网络结构,进一步减轻了梯度消失问题,并且网络很窄,极大的减少了参数量,有助于抑制过拟合的问题。参数量的减少也带来计算量的减少。因此,其在图像识别中有着很多的应用。

3实验数据集

在疫情暴发初期的2月以及3月,世界各地的科研人员对世界范围内的疫情进行了各种研究,其中在4月初,美国加州大学提供了开源的COVID-19CT图像数据集,其中包含349张COVID-19阳性的CT图像和397张COVID-19阴性的CT图像[8]。349张COVID-19阳性CT图像具体是从760个关于COVID-19的相关图像报道中提取的,并通过阅读这些图像的标题,手动选择那些包含COVID- 19的图像来进行人工分类。对于每张CT图像,其还收集了从论文中提取的详细信息,如患者年龄、性别、位置、病史、扫描时间、患病严重程度、放射学报告等,对于一张图中包含多张CT图像作为子图的,在数据集中都被手动的分割成多张单个CT图像。397张COVID-19阴性的CT图像来源包括: LUNA10数据集(包含888名患者的888张肺癌CT扫描)和Radiopaedia网站(包含36559例患者的放射学图像),正是如此,COVID-19阴性的CT图像中不仅存在有健康人的肺部CT图像,还包含了那些肺部有其他病变的CT图像。数据集部分CT图像如图2和图3所示:

猜你喜欢

掩码图像识别卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
从滤波器理解卷积
低面积复杂度AES低熵掩码方案的研究
图像识别在物联网上的应用
图像识别在水质检测中的应用
基于傅里叶域卷积表示的目标跟踪算法
基于布尔异或掩码转算术加法掩码的安全设计*
基于掩码的区域增长相位解缠方法