基于CheXNet辅助诊断系统在肺部常见病诊断中的应用研究
2021-02-18窦瑞欣黄鹏白永明张晓曦李琼
窦瑞欣 黄鹏 白永明 张晓曦 李琼
肺部肿瘤和肺部感染是最常见的两种肺部疾病,发病率及死亡率都逐年升高,准确诊断与快速治疗尤为重要。胸部X线(CXR)检查是筛查呼吸系统疾病的重要方式之一,因辐射剂量底且便于移动,广泛应用于体检、入院筛查和危重症床旁检查[1],CXR检查结果中正常者占多数,借助人工智能(artificial intelligence,AI)及 计 算 机 辅 助 诊 断(computeraided diagnosis,CAD)技术,可以从大量检查中筛选出少量异常者,对肺癌、肺炎和肺结节等单一疾病的CXR自动诊断已有研究[2],但在实际临床场景中对多种疾病自动分类诊断的研究目前未见报道。本研究使用CheXNet对CXR进行多分类自动诊断,探究对肺部肿瘤和肺部感染进行胸部X线辅助诊断的应用价值及临床意义。
方 法
1.研究对象
回顾性分析2018年1月—2019年9月在我院经胸部CT和临床确诊的肺部常见病患者。纳入标准:①肺部常见病患者;②所有患者均接受胸部X线和胸部CT检查,并有手术病理证实或临床明确诊断。排除非甲级胸部X线片及未确诊的肺部常见病的患者。共纳入100例,肺部肿瘤50例,肺部感染50例,其中普通X线后前位投照71例,床旁前后位投照29例,男63例,女37例,45~80岁,平均62岁。
2.研究方法
2.1 模型
采用CheXNet神经网络,使用来自ImageNet上已经训练的权重初始化模型,对网络的最后一层进行修改,用Sigmoid非线性激活函数作为输出层代替全连接层,采用SGD+Momentum的优化算法代替CheXNet中的Adam。
2.2 数据
使用由NIH Clinical Center(https://nihcc.app.box.com/v/ChestXray-NIHCC)发布的全球最大的公共胸部X线数据集进行模型训练和验证,该数据集包含了30 805个患者112 120幅正位胸部X线图像,每一副图像都对14种胸肺部疾病进行标注,随机的对数据集进行划分,分别用于模型的训练集(97 456幅图像)、验证集(7 341幅图像)。将图像输入模型之前,将所有图像统一下采样为224×224的分辨率,并根据ImageNet训练集中的平均值和标准差对所有胸部X线图像进行标准化,采用随机水平翻转对训练数据进行数据扩张。
2.3 训练
使用小的批处理(batch=16)和初始学习率(lr=0,001)训练模型,训练过程中每当损失函数的值下降10倍自动保存模型。
2.4 设备
普通胸部X线采用Philips DR后前位投照;床旁胸部X线采用西门子移动X线机前后位投照。由两位高年资放射医师分别采用直接读片和CheXNet模型的辅助,独立对CXR进行诊断,以胸部CT和临床确诊为金标准。
3.统计学分析
利用SPSS 22统计学软件,计数资料以n描述,对所有数据行配对资料McNemar卡方检验及Kappa一致性检验,P<0.05为差异有统计学意义,Kappa>0.75为一致性较好。
结 果
2名医师直接读片对肺部肿瘤诊断分别检出41例和40例,漏诊为4例和5例,误诊均为5例,精确率(precision)均为0.89,召回 率(recall)为0.91和0.89;借助CheXNet辅助对肺部肿瘤诊断分别检出48例和49例,均无漏诊,误诊为2例和1例,准确率(accuracy)为0.96和0.97,精确率(precision)为0.96和0.98,召回率(recall)均为0.96。
2名医师直接读片对肺部感染诊断分别检出40例和39例,漏诊均为6例,误诊为4例和5例,精确率为0.91和0.89,召回率均为0.89;借助CheXNet辅助对肺部感染诊断分别检出48例和48例,漏诊均为0,误诊均为2例,精确率均为0.96,召回率为0.96和0.98。详见表1。
表1 直接读片与CheXNet辅助诊断的准确率比较
直接读片和CheXNet辅助下对肺部肿瘤和肺部感染的检出率存在差异,且具有统计学意义(χ2=5.005,χ2=5.316,P<0.05,表2)。2名 医 师 在CheXNet辅助下对肺部肿瘤和肺部感染的检出率与金标准的一致性高于直接读片与金标准的一致性,差异具有统计学意义(Kappa=0.939,Kappa=0.959,P<0.05,表3)。
表2 直接读片与CheXNet辅助诊断的漏诊率误诊率比较
表3 CheXNet辅助诊断与金标准的一致性比较
利用神经网络输出可视化技术Grad-CAM生成预测热图对病灶进行突出显示,可以看到预测的病灶范围与实际病灶范围基本吻合,详见图1~4。
图1 双肺门影增大,左下肺感染
图2 右肺中下野团块影
图3 左下肺野团块影
图4 右肺门巨大团块影
讨 论
本研究使用基于CheXNet神经网络模型,该模型由Andrew等[3]于2017年提出,使用ChestX-ray14数据集训练的121层深度卷积神经网络[4]。CheXNet采用DenseNet结构,并将网络最后的全连接层替换为一个二进制输出,再连接一个Sigmod函数输出疾病的概率值。DenseNet是最常见卷积神经网络之一,大量应用于机器视觉领域,CheXNet采用加权二分类交叉熵及Adam优化算法[5],使得网络性能大大提高。本研究将CheXNet的单一输出扩展为多维输出,并在真实的临床场景中对肺部肿瘤和肺部感染进行自动识别。近年来,相关学者对于卷积网络的视觉可解释性进行了很多探索,本研究利用Grad-CAM[6]输出可视化技术,对不同类别的特征权重加权求和得到热图,通过热图可以对网络模型分类进行可视化的解释。另外,Kohli等[7]已经证明在不同器官中进行深度学习算法的研究是具有普遍适用性的,在非造影剂头部CT的自动诊断研究中,最终算法具有90%(45/50)的灵敏度,85%(68/80)的特异度以及0.91的AUC,可用于检测出血、肿块和脑积水,该模型可以很好地迁移和应用到其他系统和脏器上[8]。
肺部肿瘤和肺部感染是最常见的两种肺部疾病,据WHO估计,全世界2/3的胸部X线被检者缺乏有效的诊断[9],主要归因于缺乏解读胸部X线的放射诊断医师和专家,甚至有些地方虽然配备了先进的X线机,反而因误诊或漏诊导致死亡率不降反升[10]。CXR辐射剂量低、移动方便,仍是呼吸系统疾病筛查的首选影像学检查方式[11],但检查存在大量正常者,对其进行自动分类诊断对减轻放射诊断工作量及实施临床决策都至关重要[3,12]。在本研究中,2名高年资放射诊断医师在CheXNet的辅助下对于肺部肿瘤和肺部感染诊断的准确度均高于直接读片。对于肺部肿瘤和肺部感染的鉴别诊断,2名放射医师在CheXNet辅助下的准确度也均高于直接读片。漏诊和误诊在临床诊疗过程中受到极大关注,尤其是漏诊很容易产生医疗纠纷。本研究中直接读片对肺部感染的漏诊率多于肺部肿瘤,同时肺部感染的检出率也低于肺部肿瘤,经过与医学影像专家分析,导致这种结果的原因主要有3个方面。①靠近双肺内侧的肺部肿瘤和肺部感染,由于心脏、大血管及纵隔的重叠,导致病变难以分辨而易漏诊。②由于肋骨前后重叠,若病灶的密度和范围都与肋骨相近时亦容易导致漏诊。③老年人肺感染愈后可能发展为肺实变,其密度和形态与肺部肿瘤相近而易误诊。因此,还需要收集更多相关的训练样本优化模型,提高模型的泛化能力。另外,人工和计算机对胸部X线图像阅览的方式有很大区别,放射诊断医师一般是以双侧肺野-纵隔-肋骨-胸壁软组织这样的顺序进行阅片,不同的医师有各自不同的阅片顺序,机械式的重复劳动又致漏诊和误诊时有发生,而计算机不知疲倦,且CheXNet卷积神经网络面对每一幅胸部X线图像都会无差别地从图像的第一个像素识别到最后一个像素,因此,借助CheXNet时,对肺部肿瘤和肺部感染的漏诊数与误诊数均有明显下降,这与神经网络模型进行预测时具有较高的灵敏度和假阳性率相符。
本研究随机抽样的29例床旁胸部X线检查,均为肺部感染病例,2名放射医师直接读片诊断时无漏诊,但误诊的共9例病例中有3例是床旁检查。床旁CXR投照为了避免辐射污染,投照条件都会低于普通CXR检查,且由于卧床患者不能很好地配合,X线投照距离和角度等参数不能做到统一,以致图像变形、灰阶不一致,尤其是对需要反复多次复查床旁CXR的患者,极易导致诊断结果过于严重,甚至误诊[13]。借助CheXNet诊断时,上述情形对于模型影响甚微,既无漏诊病例亦无误诊病例。这可能是由于危重症患者因长期卧床或心肺功能较差,容易引起坠积性肺炎或肺水肿等,故相关肺部感染性疾病较多。同时,CheXNet的训练集ChestX-ray14中存在大量已经标签化的床旁X线图像,卷积神经网络从训练集中学习相关的特征时不会受到图像变形、扭曲或亮暗的影响,因此2名高年资医师借助CheXNet辅助诊断的检出率、漏诊率及误诊率都优于直接读片。
辅助诊断在临床应用的基本要求是与临床场景和流程整合,国内外研究人员进行过很多探索,均认为把辅助诊断结果通过影像归档与通信系统(picture archiving and communication system,PACS)以文字形式甚至是结构化的影像学报告返回到临床是较好的解决方案。在临床场景中,肺部肿瘤和肺部感染的鉴别诊断在围手术期至关重要。肺是所有恶性肿瘤最主要的转移靶器官,约30%~40%的恶性肿瘤在自然病程中发生肺转移。据尸检报告,几乎1/3死于癌症的患者伴有肺转移。围手术期的肺部感染是普遍存在的医院感染问题,通过医学影像学确定感染的程度和进程是临床必不可少的手段之一。医院感染的危害不仅表现在增加患者发病率和病死率,增加患者的痛苦及医务人员工作量,降低病床周转率方面,还给患者及社会造成重大的经济损失。因此,快速准确地对肺部肿瘤和肺部感染进行诊断及鉴别诊断对临床施治策略影响重大。本研究中2名放射医师在CheXNet辅助下对上述2种肺部常见病的检出率均高于直接读片,将诊断结果以简短文字迅速返回到临床,能明显提高临床工作效率。
本研究还存在一些局限性:首先,我们对模型进行训练的样本数据来源于公共数据,有必要使用来自不同设备的实际胸部X线图像数据进行训练和研究。其次,在测试期间仅向诊断医师和模型提供了正位胸部X线图像,但高达15%的准确诊断需要侧位像[14]。最后,诊断医师和模型都不允许参考患者性别和年龄,以及追溯患者病史,这会降低放射诊断医师在解释胸部X线图像时的诊断效能,例如有发烧、咳嗽及吸烟史的患者,在鉴别诊断时会更有帮助[15-16]。
综上所述,利用基于CheXNet神经网络模型的辅助诊断系统可以对肺部常见病进行肺部肿瘤和肺部感染的分类辅助诊断,有利于提高放射诊断的工作效率,有助于临床快速决策和施治。