基于深度学习和M型超声的张力性气胸检测
2022-08-29李争平栗卓然王立军李晓雪郝昱文
李争平,栗卓然,王立军,李晓雪,姚 远,郝昱文
(1.北方工业大学 信息学院,北京 100144;2.解放军总医院医学创新中心,北京 100039;3.解放军联勤保障部队第903医院,浙江 杭州 310004)
0 引 言
张力性气胸是造成急性呼吸困难最常见的原因之一,临床上以突发一侧胸痛、胸闷气促,甚至呼吸衰竭为主要特征。由于胸膜腔内压力突然改变导致静脉回心血流受阻,影响心肺循环的稳定性,急需早期诊断与处理。在交通事故、灾害救援以及战创伤救治环境下,张力性气胸是一种常见的创伤。
临床上对于张力性气胸的检查和诊断一般以X光和CT断层扫描居多。X光对于气胸诊断的特异度较高,CT断层扫描在临床上可作为诊断气胸的“金标准”。目前,将X光、CT断层扫描和深度学习等模式识别方法相结合运用于气胸诊断的研究已取得一定进展。ChenYi Kao等人研制了自动放射学报警系统,通过深度学习模型检测胸片中的气胸,并与现有自动报警系统进行比较,性能提升明显;Cho Yongil等研究了基于人工智能和Kim-Monte Carlo算法的胸部X射线气胸检测方法;Sebastian Röhrich等开发了基于深度残差UNet和像素级分类算法对气胸CT图像进行分类识别,以提高深度学习诊断气胸的稳定性。Xiang Li等研究了基于深度学习的CT自动检测气胸技术,并对深度学习模型对CT检测气胸的准确性进行评估。但CT和X射线均具有一定的电离辐射,对使用者和患者都存在一定的副作用,且CT和X射线设备体积大、重量大,无法在灾害救援现场或战场环境中快速部署。
随着图像处理和信号处理技术的发展,超声设备逐渐小型化并更多的运用于灾害救援现场和战创伤救治现场中。超声设备具有结构简单、方便携带,且对人体无电离辐射等特点,逐渐受到救援人员的青睐。鉴于超声的成像机理,超声图像噪声较多,清晰度、分辨率相较于CT和X光等医学影像而言明显较弱。此外,超声的使用者需要进行专业培训,检测结果也往往受限于使用者的临床技能水平。为降低超声设备使用者技术水平造成的影响,提高张力性气胸的诊断准确率,可将便携式超声设备引入智能化设计。将机器学习等模式识别方法引入本文,探究两类深度学习模型GooLeNet和VGG19对5类肺部超声图像的识别效果。M模式图像结构示意图如图1所示。
图1 M模式图像结构示意图
1 数据集建立
本文将对有A线、沙滩征、条码征、肺点以及被肋骨遮挡这五种特征图像进行分类识别。A线是超声波遇到胸膜后,经过多层反射后形成的多条与胸膜线平行的线形伪像,表现为与胸膜线平行、等间距、强度依次减弱的高回声水平线,每条A线之间的距离与壁层胸膜和皮肤表面之间的距离相等。A线多出现于肺密度正常的情况,通常可表示为正常肺的特征。M模式和B模式下A线的超声图像如图2所示。
图2 M模式(左)和B模式(右)A线超声图像
沙滩征是M型超声特有的征象,它表现为一种颗粒状间断的沙质图案,因此被称为沙滩征。在M模式下,当扫描对象为运动的器官时,就会出现沙滩征。由于肺部的呼吸作用,使得M模式下正常肺部的征象呈现为沙滩征,因此肺超声出现沙滩征一般可表示为正常肺的特征。和沙滩征相对应的是条码征,条码征顾名思义,表现为一种条形码形状的图案。与沙滩征不同的是,条码征的出现一般表示被扫描对象无相对运动的器官或物体,因此在M模式下检查肺部出现条码征时,表示被扫描的部分无呼吸运动,进一步可得出此部分为出现病理的肺组织,如图3所示。
图3 沙滩征(左)和条码征(右)
在临床上,肺点是超声诊断气胸的“金标准”,当出现肺点时,气胸诊断的特异性为100%。肺点也是M模式超声下特有的图像特征,当出现气胸时,M模式下会观察到沙滩征和条码征交替出现,沙滩征和条码征之间的交界点即为肺点。本文将借助肺点模拟模型来采集肺点图像。用水袋和吸水性树脂建立肺点模拟模型,手动按压模型来模拟沙滩征和条码征交替出现的情况,采集肺点图像。肺点模拟模型以及采集的肺点模拟图像分别如图4和图5所示。此外,本文也将采集M模式下被肋骨遮挡后的超声图像作为反例。被肋骨遮挡后的M模式超声图像如图6所示。
图4 肺点模拟模型
图5 模拟肺点图像
图6 扫描到肋骨后M模式超声图像
本文采集的上述5种M模式超声图像共计800余张,分别将上述5种M型超声图像的类标签设为“A-line”“Seashore”“Barcode”“lung-point” 以 及“Rib”,为避免类不平衡问题,采集的5种M型超声图像各类之间数目相当。5种M型超声图像如图7所示。为避免过拟合,将训练集和数据集划分比例分别分为90%和10%,具体分类情况见表1所列。
图7 5种M型超声图像
表1 训练集和测试集划分
2 深度学习网络模型
本文主要聚焦于使用深度学习模型对M型超声典型特征图像的快速分类识别的研究,以了解深度学习网络模型对M型超声典型特征图像的分类识别效果,因此不对深度学习模型的网络结构进行修改。本文将利用目前使用较为广泛的深度学习网络模型GoogLeNet和VGG对上述5种M型超声典型特征图像进行分类识别研究。GoogLeNet深度学习网络由谷歌团队最早应用于ImageNet大规模视觉识别挑战领域,并取得了比较理想的结果。GoogLeNet可以在增加网络宽度和深度的同时,将全连接转化为稀疏连接,从而降低过拟合、减少计算量,GoogLeNet的Inception结构可以保证网络结构稀疏的同时,又提高矩阵的计算性能,大大减少了网络运行的参数。Inception结构如图8所示。VGG网络由Oxford的Visual Geometry Group团队提出,通过改进卷积核大小以及增加网络深度等方法,提高网络识别的准确性。VGG网络共有2种结构,分别为VGG16和VGG19,它们在卷积核结构上无差异,在网络深度方面存在不同。本文将选用VGG19网络。VGG19网络包含19个隐藏层,其中包括16个卷积层和3个全连接层,网络整体结构较为一致,均为3×3的卷积和2×2的最大池化操作。
图8 Inception结构示意图
上述2种网络均借助迁移学习,使用预训练的VGG和GoogLeNet网络进行训练。两种深度学习模型均使用ImageNet数据集上超过一百万张图像进行预训练,以减少训练时间,提高识别效率。深度学习模型运行的硬件环境为配置有R5-3600处理器,Nvidia RTX2060 6 GB显卡以及16 GB内存的计算机。软件环境使用MATLAB深度学习工具箱搭建并训练网络模型。两种深度学习模型的超参数设置见表2所列。两种模型均使用SGDM优化器,损失函数均使用交叉熵损失函数。
表2 超参数设置
3 结 果
根据上章介绍方法,得到的结果见表3所列。由表3可知,在相同模型下设置不同的训练轮数和学习率,整体准确率相同,横向对比VGG19和GoogLeNet可知,VGG19对5种M型超声典型特征图像的分类准确率相较于GoogLeNet的识别效果较好。在相同超参数条件下,2种网络对5种M型超声典型图像的统计分析见表4所列,选取超参数为最小批16,轮数30,学习率0.000 1。
表3 训练结果
表4 VGG19分类评价指标
由于测试集中不同类之间特征图像数量基本相同,因此类不平衡问题所带来的统计指标不准确的问题可以忽略不计。从表4和表5可以看出,VGG网络整体查准率(精度)和查全率(召回率)相比GoogLeNet更好。但由于VGG网络结构中有3个全连接层,导致网络运算的参数过多,最终模型大小约500 MB,而GoogLeNet由于用稀疏连接代替了全连接,使得模型整体大小约20 MB。在分类识别中,发现这2种网络均对A线和沙滩征的识别出现较多的错误,可能是因为在M型超声扫描出现A线时,本身就会出现沙滩征,同时采集的A线图像有时在M模式下并不明显,导致网络对A线和沙滩征2种特征的识别出现误差。同时,这2种网络对于肺点、条码征以及扫描到肋骨后的识别效果较好,甚至可达100%的查全率和查准率。
表5 GoogLeNet分类评价指标
4 结 语
本文研究了2种深度学习网络模型对5类M型超声图像的分类识别效果。实验结果表明,2种网络对这5类超声图像的识别准确率都较高,识别效果很好。横向比较2种网络,VGG19的识别准确率略高于GooLeNet。本文通过研究2种深度学习网络对5类M型超声的图像分类效果,证明了深度学习模型在M型超声图像分类识别领域具有广阔的应用前景,同时可以借助深度学习模型大大降低M型超声的使用门槛,实现快速诊断的目的。