人工智能在肺部疾病影像诊断中的应用现状及前景
2020-01-08阎庆虎王春雷于德新
阎庆虎,崔 嘉,王春雷,于德新
(1.山东大学临床医学院,山东 济南 250012;2.山东省胸科医院影像科,山东 济南 250013;3.山东省潍坊市人民医院急诊科,山东 潍坊 261000;4.山东大学齐鲁医院放射科,山东 济南 250012)
近年来,以深度学习为核心的人工智能技术取得了一系列重大突破,被广泛应用到各个领域,包括制造业、服务业等,如人脸识别及语音识别技术均采用人工智能技术。人工智能技术也逐步应用到医疗领域中,包括医学影像学(如CT),主要体现在使用以深度学习为代表的方法对影像大数据进行挖掘、搜索和提取相关信息,而影像组学则是此类工作模式的代表[1]。现就人工智能的产生、发展及在肺部疾病诊断中的应用现状及前景等进行综述。
1 人工智能医学影像的产生、发展
从1956 年达特茅斯会议首次定义“人工智能”开始[2],人工智能研究经历了多次高潮和低谷。目前人工智能的研究热潮主要源于结构模拟方法方面的突破,由于解决了深度神经网络的训练问题,加上大数据高性能计算平台(云计算、GPU 等)的支持,使人工智能的研究和应用变成现实。
深度学习在实际应用中的成功案例首推图像识别,目前基于深度学习的图像识别功能已超越了人类[3]。医学影像的本质主要是图像识别,人工智能医学影像的概念于20 世纪60 年代被提出[4],但直到今天以深度学习为代表的新一代人工智能结合的医学影像的产生,才将其应用于临床实践中。不同疾病有不同的影像表现特征,人工智能依靠医学图像识别技术辨别疾病的影像特征,挖掘人眼不能识别的信息,并进行提取,建立诊断和鉴别诊断模型,从而产生了影像组学。
影像组学是应用高通量计算从体层图像(MRI、CT、PET)中快速提取大量的量化影像特征,并转换为可发掘的高保真数字化数据[5],通过影像的量化分析可解析影像所包含的各种病理生理学进程及其相互关系。目前,影像组学在医学领域中实践性应用较多,包括乳腺癌的检测、皮肤癌图像的分析[6]、糖尿病视网膜病变检测[7]、放疗靶区勾画及脏器三维重建等。人工智能技术在肺部疾病影像诊断中也有巨大的潜力和价值。
2 人工智能在肺部疾病影像诊断中的应用现状
近几年,肺部疾病的人工智能研究快速发展起来,较成熟的应用是通过胸部X 线片诊断肺部疾病及早期肺癌的CT 筛查。其他肺部疾病的CT 诊断相关研究相对较少,且样本量不大,结果的可靠性需进一步验证。
2.1 人工智能在胸部X 线片中的应用 目前,人工智能主要用于胸部X 线图像的分割和骨骼抑制。对于复杂的胸部X 线图像,研究人员需很长时间才能找到一组有助于提高计算机辅助诊断(computer-aided diagnosis,CAD)性能的功能。近年来,由于深度学习在不同图像识别任务(如图像分类和语义分割)中得到广泛应用,且深度学习技术和大型数据库建设的快速进展,使其诊断水平已超越普通工作人员。
人工智能的价值在于帮助早期识别肺部病变,分析多重呼吸道感染的影像学特征,通过CAD 设计定义和测量疾病特征,并提出治疗策略。如肺结核是全球第九大死因,是单一传染源的主要死因(高于艾滋病),其影像特点复杂多变,一些研究根据病变的形状、质地和局部特征检测肺结核。为了模拟放射科医师对肺部疾病影像纹理特征的视觉诊断,有研究[8]使用纹理特征作为描述符,将图像分类为结核和非结核,结果表明,利用图像直方图中的统计特征可检出肺结核。另有研究[9]提出了一种基于分段肺区域纹理特征的肺结核指数,并利用决策树对正常和异常的胸部X 线片进行分类,准确率达94.9%。最近,深度学习在结核病分类中的作用被证实是有效的。HWANG 等[10]提出了第一个基于卷积神经网络(convolutional neural networks,CNN)的结核病自动检测系统,采用一种转移学习策略提高系统的性能,克服了神经网络训练困难的问题。LAKHANI 等[11]采用深度卷积神经网络的方法进一步提高了诊断准确度(AUC 0.99)。在间质性肺病检测方面,早期文献[12-15]使用CAD 系统通过纹理分析检测胸部X 线片中的间质性肺病。Kun Rossman 实验室的CAD 系统将肺部划分为多个ROI,并分析肺部的ROI 以确定是否异常[16]。随着深度学习在肺部疾病检测中的应用,因没有大型胸部X 线数据集,目前尚无X 线数据集检测间质性肺病的相关文献,大多数文献使用CT 数据集检测间质性肺病。除肺结节、肺结核和间质性肺病外,深度学习通过胸部X 线片还可监测到其他疾病,如心脏肥大、肺炎、肺水肿、肺气肿等,但相关研究较少。如检测心脏肥大常需分析心脏大小,并计算心胸比(cardiothoracic ratio,ctr)。CANDEMIR 等[17]以1d-ctr、2d-ctr 为特征,采用支持向量机对250 幅心脏扩张图像和250 幅正常图像进行分类,准确率76.5%。而ISLAM 等[18]使用多个CNN 检测心脏肥大,在560 个图像样本上对流量工程网络进行了精确调整,并对100 个图像进行验证,得到了最大精度为93%。肺炎和肺水肿可通过提取纹理特征来分类,如PARVEEN 等[19]使用模糊C 均 值(fuzzy C-means,FCM)聚类算法检测肺炎,流量工程网络结果显示胸部肺部呈黑色或深灰色,而肺炎因水肿和渗出导致病变区域密度增加,此方法有助于简便准确地判断感染程度。KUMAR 等[20]使用机器学习算法对胸部X 线片进行纹理分析,利用函数滤波器和支持向量机(support vector machine,SVM)区分X 线胸片中正常结构与肺水肿,获得了0.96 的AUC,但并未验证其他肺部疾病的诊断准确性。ISLAM 等[18]使用CNN 检测和定位肺水肿,效果较好。
2.2 人工智能在肺结节和肺癌CT 筛查及诊断中的价值 近年来,肺癌发病率逐渐上升,已成为世界范围内致死率最高的癌症之一。CT 对肺部疾病的诊断具有较高的敏感性,图像处理、模式识别等技术与CT 的深度融合,促进了影像组学的迅速发展。CT 容积扫描覆盖全肺且无间隔,大量薄层图像为获取全部的特征提供了基础,也显著提高了小结节的检出率。
肺结节筛查的主要步骤是使用图像分割算法对肺部扫描序列进行处理,生成肺部区域图,然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像和结节标准信息生成结节区域图像,对基于CNN 的肺结节分割器进行训练,然后对图像进行肺结节分割,得到疑似肺结节区域。找到疑似肺结节后,使用3D CNN 对肺结节进行分类,得到真正肺结节的位置和置信度。
肺结节检测系统主要流程:①读入CT 源图像;②图像预处理;③肺实质分割;④ROI 分割;⑤ROI特征提取;⑥机器学习;⑦模型训练;⑧分类器;⑨诊断结果等。其中基于图像处理的肺结节实质ROI 自动分割过程最重要,主要步骤:①通过最佳阈值分割算法分割;②中心连通区域分割;③背景滤噪;④躯干模板与OTSU 算法分割掩膜;⑤初步肺部区域分割;⑥肺实质背景轮廓;⑦肺部实质分割;⑧提取ROI。在获取单幅肺实质数据后,可发现大部分区域灰度值较低,而其他高灰度区域可能同时包含结节、血管、脏器边缘等。因此,在ROI 提取时,应尽可能将ROI 全面分割,计算实质区域的局部最后阈值,从而得到二值图像。之后对每个ROI 进行特征提取,从而进行模型训练,最后得出诊断结果。
人工智能提取出的影像组学特征对预测肺癌的组织学分型、基因表达和预后评价均有很高价值。在鉴别肺原位癌和浸润性肺腺癌中,LEE 等[21]证明,纹理分析结合临床和CT 特征,相比仅依靠临床和CT 特征,区分能力显著提高,AUC 从79.0%升至92.9%。另一项86 例实性与磨玻璃结节的研究[22]成功鉴别了非浸润肺腺癌和浸润性肺腺癌。WU 等[23]利用440 个影像组学特征对350 例肺肿瘤患者的CT 图像进行预处理,观察到53 个影像组学特征明显与肿瘤组织学有关,结合使用基于小波特征分析的肿瘤组织学亚型,可进行预测(AUC 为72%)。MALDONADO 等[24]研究出一种聚类分析软件(金丝雀),利用无创的肺腺癌影像组学特征推测病理表征,发现肺结节有基因组异质性,表现为结节物质内的细微差别,肉眼不易察觉,然而这种异质性可利用影像组学提取的特征对其CT 图像进行统计评估,提炼出相关特征建立数据模型,从而对肺腺癌进行诊断、预测。LIU 等[25]回顾性分析299 例外周肺腺癌,基于CT 的影像组学特征评估预测表皮生长因子受体(EGFR)突变情况;统计出11 个影像组学特征在EGFR 突变群和广泛基因群之间有显著差异;发现5 个影像组学特征可预测突变的EGFR(AUC 为0.647);当影像组学特征与临床特征结合,其预测能力AUC 从0.667 提升至0.709(P>0.000 1)。有研究[26-27]分别对接受手术、放疗或靶向治疗的非小细胞肺癌患者建立了预测模型,每个模型都用来预测治疗后反应和存活率。COROLLER等[28]研究表明,影像组学数据可预测晚期非小细胞肺癌患者治疗后的病理反应;从肺癌CT 图像中提取的影像组学特征可区分肿瘤治疗后是放射性纤维化还是局部复发,从而评估发生远处转移的风险。
3 应用前景
肺部疾病复杂多样,但人工智能具有图像识别的优势,基于人工智能的各种准确模型和训练将显著提高其获取和凝练信息的能力,可明显提升肺部疾病的诊断准确性。其发展前景:①显著提升医师的工作效率和诊断水平,促进临床治疗的发展;②从海量数据中提取信息,发现更多的规律;③打破医师的经验壁垒,促进低级别医师水平的提高;④在肺部其他疾病的诊断及鉴别等方面将获得突破;⑤有助于影像组学的发展和进步。
4 存在的问题及解决方案
人工智能在肺部疾病的影像诊断中虽具有良好的前景和发展潜力,但也面临一些问题:①各医院的扫描参数不同,导致影像数据存在差异;②特征值的提取及模型的建立存在区域化,数据量有限,有待进一步加强;③多个机构之间尝试不同的算法进行更新,缺乏完善的理论支持,对其结果缺乏解释;④在复杂图像的识别上还存在缺陷;⑤大多数研究为影像图像处理,对于影像科医师临床思维的模拟研究较少;⑥对于多发、多变和多部位的炎性病变,人工智能总体分析能力有限,靶区勾画困难。应规范影像数据,完善法律制度,保证信息安全,明确责任归属,提高技术水平,并逐步与病历系统融合。对于多征象性疾病可勾画分析每个征象并建立数据模型,训练后汇总提取出该疾病的总特征;也可收集该病足够量的影像数据,利用深度学习处理海量数据,从而直接提取所有特征。
总之,影像医学在推动医学进入数字化时代方面发挥着积极作用。随着人工智能技术的深入发展,人工智能在医学影像中的价值将更突出,在肺部疾病影像诊断中的应用也将越来越广泛。