人工智能在心血管疾病诊断及风险预测中的研究进展*
2020-04-06司春婴刘小明关怀敏
魏 珂,司春婴,王 贺,刘小明,关怀敏**
(1. 河南中医药大学第一临床医学院 郑州 450000;2. 河南中医药大学第一附属医院心脏中心郑州 450000;3. 中原工学院计算机学院 郑州 450000)
人工智能(artificial intelligence,AI)的概念最早于1956 年在达特茅斯会议提出,旨在模仿人类的思维过程、学习能力并赋予计算机执行认知功能的能力[1]。近年来,获益于医学大数据的爆炸式增长以及计算机的运算速度提升,基于机器学习算法的人工智能技术渗透到医学的各个领域。在心血管病方面,传统的诊疗过程依赖于临床医师对患者的临床症状,心电图(electrocardiogram,ECG)、影像学以及血液检验结果的分析。而心脏血管影像精细,心电图图形复杂,利用人工智能技术辅助医学影像自动化解释,能够减少主观因素带来的误判,提高临床诊疗效率。同时,在心血管病风险评估领域,人工智能可以通过深度整合心血管疾病大数据,构建疾病的风险预测模型,预测病情的演变,有助于医生提供个性化的精准诊疗[2]。在当前新冠肺炎疫情下,通过手术机器人对患者进行经皮冠状动脉介入治疗(percutaneous coronary intervention,PCI),可以减少与新冠肺炎患者近距离接触,降低暴露风险[3,4]。目前,人工智能在心血管病领域中的应用成为了交叉学科中的研究热点。本文旨在综合国内外学者在心血管病领域开展的人工智能研究,以期为人工智能在心血管病领域中的进一步研究提供参考。
1 机器学习的基本概念及分类
机器学习是AI的核心,是使计算机智能化的根本途径。机器学习是指计算机在没有先验知识的情况下,通过对样本数据进行学习,从原始数据中提取特征构建模型,然后利用模型对新的数据进行预测分类[5]。在训练模型的过程中,数据是机器学习算法的第一要素,也是AI 的基石。目前,医院储存有海量电子病历、影像学资料和实验室检查数据,从而加速了机器学习在医学领域的发展。在心血管病领域应用中,机器学习根据所处理数据以及训练方法的不同,可以分为监督学习和无监督学习[6]。
监督学习是指算法通过学习带有标注的数据集和相应的输出结果,找到输入的数据与输出数据间所存在的某种映射关系[7]。因此,常应用于构建疾病风险预测模型,如对急性冠脉综合征患者PCI 术后发生主要心血管不良事件(major adverse cardiovascular events,MACE)进行预测[8]。常见的监督学习算法有logistic 回归,支持向量机、朴素贝叶斯和随机森林(表1)。无监督学习寻求发现数据集中变量间的底层结构,无需提前对样本数据进行标注,以揭示数据间潜在的内在联系。包括从丰富的组学大数据中自动提取分子特征,发现新的发病机制、基因型或表型[9,10]。Chung[11]等利用无监督算法在小鼠心脏重塑过程中对小鼠的基因组学,蛋白质组学和代谢组学进行了分类,以寻找心脏疾病遗传模式背后的逻辑。无监督学习常见的算法有聚类和降维。
在过去的五年里,AI的巨大进步主要是由深度学习算法推动的[12]。2016年Google公司开发的一款名为AlphaGo 的深度学习算法击败了人类顶尖围棋选手,由此掀起了近5年来的AI热潮[13]。深度学习是机器学习的子领域,其本身不是一种独立的学习方法,以传统神经网络算法为基础,一种多层叠加的神经网络模型(通常5-25 层)[14]。由于深度学习模型在处理大样本量数据以及计算机视觉领域中的优异表现,这也使深度学习算法在医学影像自动化解读方面战胜了很多经典的机器学习算法[15]。如Gharaibeh[16]等构建深度学习模型通过学习冠脉光学相干断层成像(optical coherence tomography,OCT),可以自动识别钙化斑块、精准分割血管轮廓以及量化管腔面积狭窄率,进而辅助医生优化手术方案。常见的深度学习算法模型有卷积神经网络(convolutional neural networks,CNN)和循环神经网络。
2 人工智能在心血管病风险预测中的应用
心血管病的发生是由遗传、环境和行为学等多因素造成。现阶段临床常用的危险分层工具都是基于回归模型来分析心血管的危险因素,例如在临床和科研中广泛应用Framingham 心血管风险评分和Grace危险评分。但是传统的回归模型无法分析临床变量间交互作用产生的潜在影响,而心血管病各危险因素间的关系又非相互独立,部分心血管病危险因素间存在着明显正相关[17]。与传统的回归模型相比,机器学习算法可以分析危险因素之间的交互作用,对于非线性的临床数据的处理有着先天优势,可以构建更为精准的心血管风险评估模型[18]。
2.1 治未病思想与心血管病危险因素管理
对心血管病进行风险评估和危险因素管理是预防心血管病的重要措施。随着国民生活方式的转变以及我国人口老龄化进程的加速,中国心血管病危险因素流行趋势明显,导致以心血管疾病为代表的慢性病发病人数持续增加,发病年龄不断前移[19]。面对心血管病的负担不断加重,提高防治水平仍是我们努力的方向。自古以来,我国医学家对疾病预防的研究从未止步,在西医尚未被引进我国的时候,医者们就用中医理论对疾病预防的理念进行了阐述。“治未病”的思想从《黄帝内经》中“圣人不治已病治未病,不治已乱治未乱”到《伤寒杂病论》中“上工治未病”[20]。后经历长期实践,历代医学家对其有所发挥,逐步构成了大医学家孙思邈的“未病先防、既病防变、瘥后防复。”的理论体系[21]。通过掌握潜在的发病因素,在疾病还未发生之时,对危险因素主动干预,防患于未然,这些理念也奠定了我国预防医学理论基础[22]。将中医治未病的思想与机器学习算法相结合,对心血管疾病进行早期风险预测,是检出高风险个体的必要手段,有助于医务人员对高危个体制定近远期的治疗方案。同时,根据不同的病症类型进行辨证施治,以患者取得最大受益为宗旨,也体现了现代精准医疗的思想。辨证论治是将非线性、高维性和异构性的复杂数据系统化的过程[23]。冠心病心绞痛证候要素主要包括气虚、血瘀、痰浊、热蕴、气滞、阳虚、寒凝、阴虚。其发生由“心主血脉”的功能失调引起,而血瘀和气虚作为主要病因贯穿于冠心病PCI 术后始终[24]。传统中医对于症候的辨识往往取决于医师的主观意识和经验累积,症候辨识的精确性和重复性较差。而机器学习模型可以通过学习大样本症候数据,提高对于症候的辨识。许朝霞[25]等基于支持向量机和人工神经网络模型对心血管疾病的6 种中医证候进行分类识别。研究纳入2218 例心血管病患者的症候信息,采用随机样本多次训练预测取平均值的方法,计算预测准确率。结果表明基于人工神经网络对于症候辨识的准确率最高,对于气虚、痰浊、血瘀识别的准确率分别为92.4%、77.8%和63.1%,为心血管病证候的机器学习分类模型相关研究提供了参考。
表1 机器学习算法介绍
医疗大数据驱动下的疾病风险预测模型,可以对心血管等慢性病的早期识别和预防,以减轻医疗卫生系统的负担[26],与此同时,通过心血管病风险预测模型,能让患者本人更清楚自己身体状况,增强患者健康管理意识,改变不良的生活习惯,这与中医理论“治未病”的预防理念也相契合。
2.2 机器学习在血运重建风险评估中的应用
在心血管病介入治疗过程中,风险-获益评估是对患者进行血运重建治疗决策的基础。运用危险评分可在血运重建前用于预测患者结果,为患者选择PCI 或是冠状动脉旁路移植术治疗,也可以预测心肌血运重建术后MACE 事件的发生率[27]。目前在临床血运重建常用的危险评分主要有SYNTAX Ⅱ评分、EuroSCOREⅡ评分。评分系统整合了临床和冠状动脉病变解剖学因素,如靶血管分布、严重程度、分叉病变等解剖特点,根据积分的高低为血运重建患者进行风险评估。但是基于传统回归模型的危险评分只能分析少量的心血管危险因素,而机器学习模型可以通过全面整合患者心血管病危险因素和靶病变血管影像资料,预测冠心病患者将来是否需要进行血运重建,以及 PCI 术后 MACE 事件风险预测[28]。Baskaran[29]等基于1503 名疑似冠心病患者的91 个临床变量组成的数据集(包括靶病变血管数量、位置、狭窄程度、性别、年龄、BMI、糖尿病和高血压病史等记录),利用XGBoost 模型构建冠心病患者1 年内血运重建的预测模型。并采用五折交叉验证,通过受试者工作特征曲线下面积(area under curve,AUC)评估模型效果。研究将患者分为侵入性冠状动脉造影(invasive coronary angiography,ICA)组和冠状动脉CT 血管造影(coronary CT angiography,CCTA)组,分别基于两组的各自冠脉参数和临床指标构建预测模型。结果表明,无论模型的冠脉影像参数是来自于ICA 还是来自CCTA,对于患者1 年内是否进行血运重建的预测无明显差异,但是当去除冠脉影像变量时会大大降低模型性能,风险预测模型的AUC 从0.95 下降至0.63。该研究为进一步构建血运重建预测模型提供了基础。血运重建对于冠心病患者的治疗并不是一劳永逸,如PCI 术后发生支架内再狭窄(in-stent restenosis,ISR)依然是PCI术后面临的考验。ISR是指支架全程和/或支架两端5 mm节段内管腔丢失,导致管腔狭窄程度≥50%,表现为再次发生心绞痛或急性心肌梗死等。Sampedro[30]基于机器学习算法开发了ISR 风险预测模型,研究纳入263名急性心梗患者PCI 治疗后的68 个临床变量作为数据集,主要包括冠脉造影参数和临床指标。其中23名患者在12 个月的随访中发生ISR。但是由于ISR 事件数量相对较少,所以模型采用十折交叉验证限制模型过拟合。结果表明糖尿病、多支病变、植入支架数量、最小管腔直径以及PCI 术后血小板异常升高是发生ISR 的主要预测因子。此外,一些团队基于机器学习模型开发了用于预测院内心脏骤停[31]、院外心脏骤停患者预后评估模型[32]。如Johnsson[33]等基于人工神经网络构建了院外心脏骤停后缺血性脑损伤患者的神经系统预后预测模型。研究通过纳入932名心脏骤停患者复苏后的54个临床变量,根据脑功能分类量表对心脏骤停患者的神经功能预后进行分类(1-2 级为神经功能预后良好,3-5级为神经功能预后不良)。结果表明,与临床现有基于Logistic 回归的TTM 风险评分相比,人工神经网络模型对于心脏骤停后缺血性脑损伤患者的神经系统预后有着更精准的预测性能(AUC:0.904vs0.839)。该研究可能会改善院外心脏骤停患者复苏后缺血性脑损伤患者的神经功能预后。
较传统临床评分,基于机器学习构建的疾病风险预测模型可以分析大型复杂数据集中自变量之间的相关性,并且通过整合术前、术中、术后的靶病变血管影像参数和心血管危险因素,优化风险预测模型,提高了对冠心病危险分层的准确性和血运重建后MACE事件的预测能力,为早期识别高风险患者,改善医生的临床决策提供了帮助。
3 人工智能在心血管影像诊断中的应用
医学影像是心血管检查的重要组成部分,在临床心血管疾病诊疗中不可缺少。目前,一些心脏指标参数仍依赖于半自动软件的测量,操作比较费时费力。其次,一些检查依赖于医生主观视觉判断,而主观判断缺乏标准化。通过医学影像大数据来驱动机器学习模型完成自动化分析心脏的结构和功能等任务[34],进而辅助医生快速完成心血管影像学分析。这里对AI辅助心脏相关影像学检查做简单介绍。
3.1 人工智能在基于CCTA的血流储备分数中的应用
冠状动脉血流储备分数(fractional flow reserve,FFR)是诊断冠状动脉血管生理功能的金标准[35],能特异地反映心外膜下冠状动脉狭窄的功能学严重程度,并且FFR 指导下的介入治疗被证实能改善患者的预后[36]。但是由于其相关成本和有创性,临床上仅有10%-20%血运重建在FFR指导下进行。近年来,基于CCTA 图像通过管腔分割重建冠状动脉树的三维模型,应用流体力学分析方法实现FFR 的计算,成为了新的临床研究热点。但是基于三维冠脉模型的FFR运算量大,计算时间往往长达几个小时,限制了其在临床上的应用。随着AI 技术在医学影像领域中的发展,通过深度学习模型分析冠脉树解剖结构和血流动力学间的复杂关系,可以在几分钟内迅速获得冠脉树每个节段的FFR[37]。Kurata[38]等通过回顾性分析74 例患者的91 支血管,评估了CT-FFR 诊断冠脉狭窄的准确性。结果表明,在以血管为单位分析时,CT-FFR 的诊断敏感度和特异度分别为89%和75%,AUC 为0.907。在以患者为单位分析时,CT-FFR 的诊断敏感度和特异度分别为90%和78%,AUC 为0.91,与侵入性FFR 检查的相关系数为0.786。表明基于深度学习的CT-FFR 系统与通过压力导丝测量的FFR 达到了较好一致性,并且进行CT-FFR 检查的患者平均分析时间为16.4±7.5 min,实现了对冠脉狭窄功能学的实时评价。据Kimura[39]的研究,CT-FFR 较原本基于ICA指导的治疗,可以降低32%的治疗成本。综上,CT-FFR结合了CCTA 与FFR 各自的优势,可以从解剖和功能两方面评估冠脉狭窄,避免了对患者进行侵入性冠状动脉造影以及腺苷的不良反应,减轻了患者负担[40]。
3.2 人工智能在心电图的应用
ECG 具有无创、价格低廉等优点,是临床上评价心脏功能最基本的工具之一。从识别各类型心律失常到急性冠脉综合征的诊断,ECG 都是重要的检查方式。目前,几种ECG 自动分类的算法高度依赖于训练的数据集,无法处理较大的类内差异,在处理新的ECG 时表现不佳[41]。随着深度学习算法在ECG 中的应用,减少了ECG 图像特征提取过程中计算的复杂度,使机器学习模型辅助ECG 解释的准确性得到了实质性提升[42]。Attia[43]等开发了1种深度学习模型,用于识别窦性心律期间房颤患者。由于房颤通常无症状,现有的筛选方法需要对患者进行连续监测,因此检测不足且低效。该研究利用CNN 算法探测正常窦性心律时心房颤动的ECG 特征,来鉴别心房颤动患者。模型AUC 为0.87,表明模型对心房颤动患者有良好的分辨力。在另1 项研究中,Huanun[44]等利用深度学习算法学习91232 份ECG 组成的训练集数据,开发了可以检测12 种心律失常的分类模型。使用测试数据集验证时,模型的AUC为0.97,敏感性超过了6位心脏病专家的平均值(0.83vs0.78)。这些研究表明,端到端的深度学习算法训练的心律失常分类模型,其诊断性能与心脏病专家有着较强的一致性,降低了计算机自动解释ECG的误诊率。目前,除了将AI技术应用在自动诊断ECG,一些可穿戴设备也用于心脏监测和ECG 记录,如一些手腕佩戴的自动节律分析设备通过获取单导联心电信号,捕捉实时心电数据,将数据反馈给用户和家人手机,对心脏电生理活动进行检测[45]。
3.3 人工智能在超声心动图中的应用
超声心动图检查临床应用广泛,可以帮助临床医生快速准确评估心脏结构和功能。目前,超声心动图的影像解读主要在操作者目测下完成,主观性较强。随着深度学习算法在计算机视觉领域中的应用,实现了对超声心动图影像的视点识别、图像分割、结构和功能的量化。有研究基于监督学习算法实现了心脏重构和功能障碍早期阶段的检测,进而对心脏疾病早期干预[46]。Zhang[47]等基于 CNN 算法学习了 14035 张超声心动图影像,通过对心脏结构的自动识别与分割,实现心腔结构的量化以及计算射血分数。与手动分割超声心动图的测量结果相比,前者的精准度优于传统的手工裸眼标记测量,且效率更高。除此之外,该研究团队通过深度学习模型学习8666 张超声心动图影像,完成自动检测肥大性心肌病,心脏淀粉样变性和肺动脉高压三种疾病。不仅实现了对超声心动图的自动解释,还实现了对疾病的自动诊断,提高了超声科医生的工作效率,并且有助于超声心动图结果的可重复性和标准化[48]。
3.4 人工智能在单光子发射计算机断层成像中的应用
单光子发射CT(single photon emission computed tomography,SPECT)利用心肌血流灌注显像剂的示踪特性,观察心肌血流灌注和存活情况,对早期冠心病的诊断敏感性较高。在SPECT 心肌灌注成像中,对左心室和二尖瓣平面分割仍然受限于操作者的视觉评估和手动调整,而瓣膜平面定位的精确与否将影响心肌灌注的量化[49]。Betancur[50]等利用支持向量机模型通过对瓣膜平面精确分割,提高了SPECT 心肌血流灌注自动分析的准确性。该团队在另一项研究中利用LogitBoost 算法回顾性分析了2619 名冠心病患者SPECT 图像特征和临床数据(年龄,性别,高血压,血脂异常,吸烟,糖尿病和冠心病家族史等),预测冠心病患者3年发生MACE 事件的风险。结果显示机器学习算法用于MACE 事件预测的brier 分数为0.07,表明基于机器学习算法的MACE 事件风险预测模型与观察到的患者3年间发生MACE事件高度符合[51]。
目前,AI在心血管影像领域的应用均以自动化影像分析为核心。与手动测量心脏影像相关参数相比,AI减轻了影像科医生手动分割图像的工作量,提升了诊断的准确性和效能。与此同时,机器学习通过将心血管影像学资料转化为可挖掘的数据,筛选出关键的影像特征,以构建疾病的诊断和预后风险评估模型。
4 问题与展望
目前,AI 技术在心血管病的医学影像分析,疾病风险预测和患者健康管理过程中取得了良好的表现。但是现阶段将AI 技术广泛转化到临床实践的工作中仍存在一些问题:影像自动分割模型和疾病危险评估模型的精准与否,与用来训练模型的数据质量密切相关。低质量的影像数据和数据标注不恰当会导致错误的分类和预测结果。虽然我国有丰富的临床电子医疗数据,但数据的标准化有待进一步提高。算法本身所存在的问题,例如深度学习网络在样本量较小的数据集上训练时,会有过拟合风险。过拟合则会导致其他数据集部署到该模型时通用性较差[52]。同时,目前对于一些算法内在逻辑认识还不够清楚,无法说服大多数心脏病学从业人员在临床工作中使用“黑匣子”诊断。
未来,随着机器学习算法的优化以及医疗数据标准化程度的提升,通过构建可靠的冠心病风险分层和结局预测模型,帮助医生筛查出高风险患者,从而制定个性化治疗和健康管理方案,降低心血管病的发病率,以缓解医疗卫生系统的负担。与此同时,传统基于患者自我健康管理往往效果不显著,通过算法模型进行结局预测分析,使患者更了解自己的健康状况,以增强患者本人的健康管理意识。综上,为了实现这种新技术的临床应用,后续仍需要优化机器学习算法以及提高医疗数据的标准化,以期我国AI技术在医疗领域的发展有望进一步提速。