人工智能在心血管CT 成像中的新进展
2021-12-01郭邦俊张龙江卢光明
郭邦俊 张龙江 卢光明*
《中国心血管健康与疾病报告2020 概要》报告指出,中国心血管病(cardiovascular diseases, CVD)现患病人数约3.3 亿,其中冠心病(coronary artery disease,CAD)病人约 1 139 万[1]。心血管 CT 是一种无创检测CVD 的方法,能够为疾病诊断、疗效监测以及预后评估等方面提供影像学证据。然而,在心血管疾病诊疗过程中会产生海量数据,包括病史记录以及实验室检查、病理学、基因检测的结果,影像学检查的影像数据及报告等。由于临床医生的经验水平及时间所限,对病人的这些信息很难分析透彻,因此误诊的情况随时有发生的可能[2]。
目前适用的诊断或者预测模型通常建立于某一人群,然而随着精准医学时代的到来,需要对每例病人的情况做出推断,而不能满足于总体上正确[3]。与常用的统计学模型不同的是,人工智能(artificial intelligence,AI)模型可以利用不同的算法从海量的数据中完成学习,并且不断优化自身的性能,突破了传统统计学模型的局限。最近,有多篇文献[4]报道AI 运用于疾病的监测、诊断、分类乃至结局预测的研究成果。本文通过复习文献对心血管CT影像学中常用的AI 术语予以介绍,并总结AI 相关技术在该领域研究与应用,最后讨论AI 在心血管影像中的应用局限和对未来的展望。
1 与心血管CT 影像学相关的AI 术语及其应用
1.1 AI AI 是一个定义广泛的术语。当前许多研究中使用的深度学习(deep learning,DL)、机器学习(machine learning,ML)等方法都属于AI 技术。根据是否有手动标注的标签(例如疾病的活检结果)输入模型内,ML 方法可以分为无监督学习与监督学习[5]。无监督学习不需手动标注,但模型得出结果可能缺乏直观。相较于无监督学习,监督学习需要专业人员根据已知结果对数据进行标注,根据已有数据集训练优化模型,但需消耗大量的时间与精力。
1.2 ML ML 是AI 的一个分支,常见的ML 模型包括回归模型、随机森林(random forests,RF)和支持向量机(support vector machines,SVM)模型等。在心血管领域,回归模型被广泛用于疾病的分类或确定心血管病相关的风险因素。然而,心血管疾病的诊断或预后常涉及许多因素,这可能导致过度拟合。目前已经建立了正则化回归模型,通过缩小系数来避免从复杂的模型中学习,避免逻辑回归的过度拟合问题。RF 本质是一系列决策树的组合。在临床研究中,建立一个完美的决策树是比较困难的,因为一些与结果相关的因素尚不知晓,故不能输入模型进行训练。因此,RF 模型会利用许多的决策树对结果进行推断。尽管给定的决策树不可能完全准确,但大多数的决策树都会围绕正确的结果进行判断。另一方面,RF 将输入的数据置于更高维度的空间中,使区分差异更加简单化。作为监督学习的方法,研究人员可以根据经验对图像或者其他类型的数据进行标记,然后建立模型,进而来预测一组新的数据集的结果。若没有明确的结果标签,可以采用无监督学习(如聚类分析)来寻找数据内部本身的联系。
1.3 DL DL 是ML 的一种,源自于人工神经网络。与人类大脑神经元的构成类似,深度神经网络(deep neural networks,DNN)由许多神经元或节点组成,节点间根据不同的权重在多层网络之间互相连接。在不同的卷积层之间,模型以不同方式来处理输入的特征,探究节点间的内在规律,直到输出层输出最后的判断结果[5]。DL 模型可根据反向传播误差的反馈,自动改变每个节点的权重,来实现输出结果,在一定程度上模型有了更多“自主权”,内部的特征以及想要得到的输出结果留给模型本身来处理,所以内部学习过程是一种“黑匣子”。目前,文献中大多使用的DL 方法都属于监督学习(有标签的),无监督的模型较少,且主要用于提高影像质量或生成影像。总的来说,强大的运算能力与丰富的高质量数据是构建成功AI 模型的基石。
2 AI 在心血管CT 成像中的应用
2.1 优化冠状动脉CTA(CCTA)影像质量 心血管成像质量与病人体质量指数(BMI)相关。在保证客观影像质量不变的条件下,随着BMI 增加,辐射剂量也会逐渐增加。降低辐射剂量的措施包括优化管电压(kV)、管电流(mA)与改进重建算法等。几乎所有的CT 生产商都提供迭代重建算法来降低CCTA过程中的伪影与噪声[6]。随着AI 算法的不断优化,在减低辐射的同时也能保证影像质量,而且能大幅缩短影像重建等待时间,现已达到几乎可以实时重建的水平。Green 等[7]研究发现,使用全卷积神经网络可以有效降低低剂量采集影像中的噪声。Wolterink 等[8]提出将卷积神经网络(convolutional neural network,CNN)与对抗CNN 结合,从低剂量心脏CT 上模拟出类似常规剂量所得到的影像,以此来降低辐射剂量;此实验共纳入28 例同时经过20%标准剂量及标准剂量的2 次心脏CT 扫描病人,结果表明上述方法可以将低剂量心脏CT 影像模拟成类似标准剂量CT 影像。
目前已有多种DL 技术可用于改善影像质量[9-12],有的还可用于减少运动伪影,由此可知AI 技术具有在心血管影像领域运用的潜力。
2.2 心血管组织自动分割 心血管病在发病前就可能会有心脏结构或者功能的改变。准确识别心脏结构及功能变化有助于早期诊断和掌握疾病的进展。但是,医师在利用一些半自动软件勾画组织结构轮廓时,通常会存在一些主观差异,并且手动勾画耗时、费力。目前有许多AI 技术已用于心血管组织的识别与自动分割,并且取得了不错的效果。例如,Baskaran 等[13]设计了一种端对端的 DL 模型,可自动分割心腔容积和左心室的心肌质量,结果表明模型分割结果与医师手动勾画轮廓有很好的一致性,且仅需要13 s 左右就可以自动完成分割,极大减轻了工作负荷。AI 除了能够分割心腔与心肌,还在分割心外膜脂肪方面也取得了较好的效果[14-15]。Commandeur 等[16]利用多中心包含850 例病人冠状动脉钙化积分的数据集,采用DL 方法分割心外膜脂肪组织,结果表明DL 方法可以自动且快速准确地分割心外膜脂肪,其结果与有经验的阅片者结论相似。相信未来许多需要医师手动操作的工作可以由AI 替代完成。
2.3 计算冠状动脉钙化积分(coronary artery calcium scoring,CACS) 冠状动脉钙化是 CAD 的一个标志,量化CACS 有助于预测CAD 病人未来心脏不良事件[17]。临床上,CACS 通常由放射科医生手动测量。由于医生主观经验的差异,CACS 测量存在观察者间的差异,且测量工作也会消耗大量时间。目前AI 技术可以克服上述缺点,快速且精确计算CACS。例如,Isgum 等[18]提出在非门控低剂量胸部CT 平扫影像上,首先利用multi-atlas 技术构建冠状动脉钙化概率图,然后使用模式识别系统识别钙化的特征,最后自动计算钙化积分,该方法检测敏感度为79.2%。除了上述基于传统的ML 算法外,近年来一些基于DL 的算法也被用于自动计算CACS,并且结果与医师手动测量的结果有着较好的一致性。例如,Martin 等[19]评估了一种基于 CNN 的模型,用于平扫心脏CT 影像上自动进行冠状动脉钙化评分,结果表明该模型与参考标准之间有着很高的一致性。另有研究者使用DL 方法在自动计算钙化积分方面也取得了良好的效果[20-23]。尽管上述方法在单中心数据集上表现良好,但针对不同CT 机型中的钙化检测性能尚未得到充分评估。最近,van Velzen 等[24]使用2 个连续的CNN 自动计算各种CT机型的CACS,同时以手动计算得到的CACS 作为参考标准,DL 模型的组内相关系数为0.79~0.97,表明DL 方法在计算不同CT 机型的CACS 方面有稳定表现。这些用于计算CACS 的自动化方法可显著减少医师的时间成本并减少临床医生之间的主观差异。
2.4 冠状动脉狭窄的自动化识别与检测 CCTA可以直观显示冠状动脉狭窄程度与斑块特征,已被推荐作为稳定性胸痛病人的一线检查方法。但是,由于钙化性病变的部分容积效应,会造成狭窄程度的高估。此外,阅片时间及不同医师间主观差异也是目前需要解决的问题。如今,AI 不但可以快速识别冠状动脉狭窄,有助于医生对冠状动脉狭窄进行评估,同时也解决了阅片时间和主观差异的难题。近期Liu 等[25]评估了一种基于DL 的冠状动脉后处理及狭窄的自动识别模型,结果表明,对于经验不足的放射科医生,该DL 模型可以显著提高其识别冠状动脉狭窄的准确性,并大幅缩短影像后处理及医师阅片的时间。Arnoldi 等[26]利用一种计算机辅助算法来检测CCTA 上的冠状动脉狭窄,结果显示以有创冠状动脉造影(invasive coronary angiography,ICA)为参考标准,该算法识别狭窄程度>50%的准确度为74%。随后,有研究[27-28]陆续开发了自动检测冠状动脉狭窄的算法,但特异性相对较低。Kang等[29]利用ML 方法同时检测阻塞性病变(≥50%)与非阻塞性病变(25%~50%),以3 位医生评估的结果作为参考标准,该算法的曲线下面积(AUC)为0.94。目前,国内已有获得国家药品监督管理局批准的血管狭窄辅助诊断软件,表明AI 可在辅助诊断中发挥作用,相信AI 将会在该领域有更多的突破。
2.5 基于AI 的CT 血流储备分数(CT- derived fractional flow reserve,FFRCT)技术 冠状动脉血流储备分数(fractional flow reserve,FFR)指的是冠状动脉存在狭窄时最大心肌血流量与其理论正常最大血流量之比,被认为是评估心肌缺血的“金标准”。与ICA 相比,CCTA 在诊断冠状动脉狭窄等方面具有较高的敏感性与阴性预测值,但CCTA 提供解剖学特征,缺乏血流动力学信息[30]。基于CCTA 的FFRCT技术可以一站式提供狭窄的解剖学及功能学信息。该技术运用高级的计算流体力学(computational fluid dynamics,CFD)方法通过模拟计算最大充血状态下的压力值。但是,基于CFD 的FFRCT计算模型与基于AI 的FFRCT模型相比,运算量大且计算时间较长,数据需要远程传输到中心实验室完成。基于AI 的FFRCT模型通过对12 000 个具有不同狭窄程度的冠状动脉树进行学习,进而得到不同形态的样本。在生成每个冠状动脉树之后,随机将狭窄的冠状动脉放置在不同的血管分支之间。随后,降维的CFD 模型被用来评估每根冠状动脉的流量和压力分布,训练ML 模型了解狭窄的特征,最后使用CFD模型模拟计算得到任意处冠状动脉的FFR 值。一项多中心注册研究[31]评估了基于AI 的FFRCT模型和基于CFD 的FFRCT的诊断效能,结果表明这2 种方法的诊断水平类似;以有创FFR 为参考标准,两者AUC 值均为0.84。后续的实验研究[32]表明了基于AI的FFRCT模型在诊断病变特异性心肌缺血方面的价值。此外,也有研究[33]显示基于AI 的FFRCT对于心肌桥病人有预测价值。FFRCT可以改变一部分基于传统的依据狭窄程度所做出的临床决策,提高ICA 的有效率,但其在临床中的潜在价值需要进一步探讨[34]。
2.6 心肌缺血的识别 人眼无法直接从影像上评估心肌是否有缺血性改变,而AI 可以通过挖掘更多隐藏在影像里的信息来帮助医生改变这一现状。Hae 等[35]探究了使用ML 算法在静息态CT 心肌灌注影像上能否改善仅基于狭窄程度所判定的心肌缺血的效能,研究纳入了252 例行静息态CT 心肌灌注检查与有创FFR 测量的病人,结果表明,与肉眼评估CCTA 上的狭窄程度相比,ML 模型可以改善传统的依据狭窄程度确定的心肌缺血诊断,净分类改善指数为0.52。Xiong 等[36]使用AdaBoost 分类器开发了一个新框架,从静息态CT 心肌灌注影像中获取3 个心肌特征(标准化心肌灌注密度、透壁灌注比及室壁厚度)对于预测阻塞CAD 的敏感度、特异度及准确度分别为0.79、0.64、0.70。AI 除了可在静息态CCTA 影像上预测心肌缺血外,在核医学成像上也显示出与医生相当的水平[37]。由此可见,尽管医师肉眼识别心肌缺血改变的能力有限,但AI技术帮助其对心肌缺血进行预测,弥补传统方法学上的不足。
2.7 心血管事件的预测 现阶段有多种传统模型用于预测CAD 病人的心血管不良事件,但这些模型通常仅纳入了有限的临床与影像变量,对于变量之间的关联及其他未能纳入模型的变量未能充分评估。AI 可以弥补传统统计模型的缺陷,综合临床、影像、病理、基因、影像组学等参数,构建更加精准的预测模型。例如,Ambale-Venkatesh 等[38]使用ML方法(随机生存森林)对MESA 研究中的6 814 例无心血管病的参与者构建心血管病的预测模型,结果表明,在预测心血管不良事件方面,ML 算法优于传统的风险预测模型。Motwani 等[39]利用ML 模型纳入了CCTA 影像学参数及临床参数预测可疑CAD 病人的5 年全因死亡率,结果表明,与单独使用Framingham 风险评分或CCTA 严重程度评分相比,ML 模型预测全因死亡有更好的表现。van Rosendael等[40]使用基于CCTA 的狭窄程度与斑块成分等参数,利用ML 方法可以更好地预测主要心脏不良事件。总之,相比传统统计学所建立的预测模型,ML算法已表现出更好地预测病人未来事件的潜能。
3 AI 应用的局限
由于心血管病病人数量庞大,AI 在心血管影像应用方面具有重要的潜在价值。AI 模型的成功构建需要高质量的数据及强大的运算力。缺乏上述2 个要素可能会使AI 在实际临床应用中出现下列问题:①AI 模型的“黑匣子”问题。这是影响临床医师解释结果的一大难题。当临床医生因不了解模型内部结构而做出有关病人生命的决策时,可能会造成一系列伦理问题。②样本量的问题。在样本量优先的情况下,AI 识别罕见病的能力可能不足。③过度拟合问题。虽然模型针对纳入研究的数据集有良好表现,但由于过度拟合,在用于不同医院或不同设备以及不同扫描参数获取的影像时,可能需要进一步修改模型以适应新的应用环境。④AI 的鲁棒性问题。当新的AI 模型建立后,需要严谨的实验(例如内外部评估、多中心前瞻性临床实验等)来评估其在真实世界中的表现,以避免发生严重不良事件。
4 展望
AI 将会进一步促进精准医学的发展。未来AI可将影像数据与病人的各类数据相结合,构建更精准的诊断或预测模型,以改善病人的预后。AI 相关的方法也应该在临床中进行全面测试,以验证其性能,而不是仅限于开发阶段的测试。迄今为止,包括影像、血液样本、电子健康记录在内的数据已经广泛可用,但是高质量有精确标记的数据却很难获得。与监督学习方法相反,无监督学习方法很少用于心脏影像领域。尽管AI 已广泛应用于医疗领域并有创新突破,但仍面临着发展障碍。例如,法律法规对病人隐私数据的保护限制了数据的自由交换,这可能会限制AI 在全球范围内的应用;各机构之间缺乏标准化的医疗数据格式,可能会限制数据的有效利用。因此,未来需要一种安全、隐私保护的AI相关技术。更重要的是,在临床使用过程中需要关注AI 实施的质量控制。应用AI 相关软件时可能会出现误诊或漏诊,以及系统错误和不可重复的结果。因此,临床医生不能完全依赖AI 得到的结果,需要结合病人的具体情况和自身的经验来考虑。实现AI 在心血管影像的自动化应用尚需要临床医生、病人及家属、放射科医生与计算机专家的共同努力。AI 是辅助医生的诊断,而不是替代。
随着AI 技术的发展,临床医生可以更好地利用这些数据,从而提高疾病诊断、风险分层和预后预测的准确性,以实现精准医疗这一目标。但是,AI技术并非没有局限,因此医生和科学家应该共同努力以最大限度地发挥其有效性。