基于深度学习的新冠肺炎影像学诊断

2022-11-01魏鹏磊雷菊阳

农业装备与车辆工程 2022年9期

魏鹏磊，雷菊阳

（201620 上海市上海工程技术大学机械与汽车工程学院）

0 引言

新冠病毒疫情之下，医生需要寻求更加快捷的诊断方式来确定疑似病例。除核酸检测外，胸部X 射线影像识别成为筛查病人的主要手段。在国家卫健委发布的《新型冠状病毒感染肺炎诊疗手段（试行第八版）》里，具有新冠肺炎影像学特征的临床表现已被明确纳入确定疑似病例的诊断标准中[1]。新冠肺炎很多患者是干咳，采集痰液困难，而咽拭子核酸检测的总阳性准确率为30%～60%，敏感性欠佳，可能会漏诊。胸部影像诊断敏感性好，准确率高达97%。故疑似病例较多的情况下，单凭核酸检测容易漏诊，胸透筛查更有优势，可早发现、早隔离、早治疗。而在实际临床中，疑似病患、密切接触者筛查会产生大量胸透影像，医生肉眼辨别胸透影像效率较低[2-4]。

鉴于此，本文使用加州大学圣地亚哥分校的开源数据集，通过构建卷积神经网络模型对影像进行识别，并进行数据可视化。实验结果表明，本文的模型和方法有较好的效果和很强的可行性。

1 相关模型和算法

1.1 卷积神经网络

卷积神经网络（CNN）非常适合做图片分类任务。通过制定卷积大小、窗口移动大小，一步一步地学习数据特征。每次学习计算卷积层后，计算一次最大池化层，就是对输入图像进行下采样。之后，通过dropout 对结果进行正则化，这样可以防止过拟合，降低维度，经过反向传播训练，直到最优。随着卷积网络的不断发展，图像变得越来越小，但由于卷积层的存在，图像也越来越深（即具有更多的特征图），如图1 所示。在堆栈顶部添加一个常规的前馈神经网络，该网络由几个全连接层组成，最后一层输出预测。

图1 典型的CNN 架构Fig.1 Typical CNN architecture

1.2 模型设计

本文所采用的CNN 为一种深度神经网络，其基本模型如图2 所示。

图2 深度神经网络基本模型Fig.2 Basic model of deep neural network

2 实验设计

2.1 实验数据采集

本文所用数据集为加州大学圣地亚哥分校的开源数据集，该数据集共包括542 张附有标签的胸部X 射线影像，其中确诊患者胸部影像数据共289例，未确诊患者胸部影像数据共253 例。本实验选取的训练集、验证集和测试集数据如表1 所示。

表1 新冠肺炎胸部影像数据集Tab.1 New coronary pneumonia chest imaging dataset

2.2 数据预处理

本实验中，使用Keras 的ImageDataGenerator加载所需数据，并且做数据增强与处理。对于训练数据，分别做以下处理：将像素值归一化；剪切强度（逆时针方向的剪切变换角度）为0.2；随机缩放的幅度为0.2 以及水平翻转。对测试数据只做归一化处理，即将RGB 对应的具体数值转换成0～1之间的值，便于神经网络计算。本实验采用最大最小标准化，计算公式为

2.3 数据可视化

随机查看9 张病理图片，图片以3 行3 列的方式显示，每张图片下面都显示出对应的病理类别，其中covid_with_PNEUMONIA 表示阳性，covid_without_PNEUMONIA 表示阴性。可视化输出图如图3 所示[5]。

图3 病理图Fig.3 Pathological image

2.4 网络构建

本文创建的CNN 模型主要由卷积层、最大池化层和Dropout 层组成，最后有一个全连接层作为输出层。首先输入预处理后得到的224×224×3 大小的图片，经过64 个卷积核的2 次卷积后，采用一次最大池化；再经过2 次128 的卷积核卷积之后，采用一次最大池化；再经过3 次256 的卷积核卷积之后，采用最大池化；继续重复两次3 个512 的卷积核卷积，之后再最大池化；最后经过3 次全连接层后输出。其中，该模型每个卷积层的卷积核大小均为3×3×3，步长为1，边缘填充也是1，最大池化层大小采用2×2，Dropout 层丢弃的比例为0.5。构建的神经网络具体参数如图4 所示。

图4 网络模型概况Fig.4 Network model overview

2.5 训练及仿真

本文使用的优化算法为Adam 算法，因为它实现简单，计算高效，适用于大规模数据和参数的场景，设置学习率为0.000 1，batch_size 为16，迭代次数为10 次，并对验证集的精确度添加提前终止监控，patience 设置为3。

首先用498 张病理图片训练样本进行模型训练，其训练结果的准确率以及损失函数分别如图5、图6 所示。

图5 准确率Fig.5 Accuracy

图6 损失函数Fig.6 Loss function

再用54 张病理图片测试样本进行评估。测试结果如图7 所示。

图7 测试集准确率Fig.7 Test set accuracy

3 实验结果

由图7 的测试结果可知，在现有样本下基于深度学习的新冠肺炎影像学诊断方法准确率可达96.23%。为更好地说明本模型的可行性以及实际效果，对未知标签的新冠肺炎病理图片进行预测，结果如图8 所示。即有97.61%的概率表明该病理影像为阳性，有2.38%的概率表明该病理影像为阴性。由此可知，该模型有较好的效果[6]。