基于心电图的机器学习在心血管疾病预测中的应用进展
2022-03-14王蕾党时鹏王如兴
王蕾 党时鹏 王如兴
作为21世纪尖端技术之一的人工智能,主要是以计算机为基础来模拟人的某些思维过程和智能行为,如学习、推理、规划和思考等。人工智能可对复杂模式和大量数据进行分析和分类,其表现出的潜力甚至超出了人类可直接解释的范围[1]。该领域的研究内容包括机器人、专家系统、机器学习、计算机视觉、自然语言处理等。目前,人工智能在医疗健康行业的应用已非常广泛,应用场景主要涉及智能诊疗、虚拟助理、医学影像、可穿戴设备、急救室/住院管理、电子健康病历管理等多个领域[2]。机器学习是当前实现人工智能的主要技术手段,任何通过数据训练的学习算法都可归于机器学习,其中最热门的一个分支——深度学习更是在医学图像分析预测方面展示了巨大的潜力。本文主要综述基于心电图的机器学习在预测心血管疾病方面的应用进展。
1 机器学习和深度学习
作为实现人工智能的主要方法之一,机器学习通常利用大量数据,通过算法来构建模型,随后对模型性能进行评估;如果评估指标达到要求,则采用该模型,否则需要调整算法并重新搭建模型,直至达到目标[3]。机器学习能够识别非线性关系和多个变量之间的高阶交互作用,主要围绕算法的使用展开,常见的算法包括C4.5算法、K均值聚类算法、决策树、聚类、贝叶斯分类和支持向量机等[4]。传统的机器学习算法主要通过人工提取特征来去除不相关数据和冗余数据,从而提高机器学习效率和增强结果的可解释性。对于一些较复杂的问题,需要对人工提取的特征建立有效的特征集合,这一过程往往需要反复摸索,花费很多的时间和精力。随着大数据时代的来临,各领域数据总量、数据维数和特征数显著增加,现有处理方法遇到很大挑战,这就需要搭建更复杂的模型以代替人工寻找特征。作为机器学习的一个重要分支,深度学习不需要人工提取特征,它使用深层神经网络作为模型,除了可以自动学习特征和任务之间的关联以外,还能从原始数据自动获得抽象特征,将简单的特征组合成更加复杂的特征,并利用这些组合特征解决问题,可减少人工提取特征造成的不完备性[2]。深度学习具有强大的运算能力,并能对复杂的原始大规模数据集进行学习,从而做出有效决策,可达到甚至超出人脑的决策效果[5]。常见的深度学习模型有卷积神经网络(convolutional neural network,CNN)、循环神经网络和深度信任网络等,其中CNN在医学图像处理方面的性能表现尤为突出[6]。
2 机器学习在心电图分类诊断中的应用
心电图是从体表记录心脏电活动的临床工具,是一种诊断心脏疾病的重要非侵入性技术[7-8]。早在20世纪70年代,机器学习便被用于心电图的自动分析。机器学习利用算法构建模型,从大量心电图像中学习并提取特征,从而进行自动诊断。近年来随着大型专家释义的心电图数据库、创新算法和拥有强大计算能力的计算机的应用,心电图的自动诊断越来越准确[2]。机器学习可识别缺血性和非缺血性ST段改变,诊断冠心病和急性心肌梗死;识别P波、QRS波的形态和振幅异常,从而诊断心房扩大和心室肥厚;还可通过识别异常和不规律心跳进行心律分类,从而实现各种心律失常的自动诊断[5,9]。多种机器学习算法可用于心电图的分类诊断,如线性和二次方程判别式、支持向量机、随机森林、贝叶斯网络和神经网络等。不同算法对心电图分类的准确性虽存在差异,但普遍可达95%~99%[1,9]。
3 机器学习用于常见心血管疾病的预测
有些心血管疾病在发病之前心电图可能正常或轻度异常,临床医师尚不能据此直接诊断。目前有研究表明,机器学习通过对大量正常或接近正常的心电图进行分析、学习并提取特征,能对人工不能直接诊断的或将要发生的心血管疾病进行预测,主要表现在以下几个方面。
3.1 冠心病
急性冠脉综合征(acute coronary syndrome,ACS)患者可从早期血运重建手术中获益,然而部分患者为急性非典型ST段抬高型心肌梗死(nontypical ST-segment elevation myocardial infarction,NSTEMI),难以通过心电图准确判断其是否需要行急诊血运重建术。GOTO等[10]采用一维卷积层和双向长短期记忆层构成的模型处理时间序列心电数据,能检测到医生无法识别却实际存在的特定心电图特征,从而筛选出需要行急诊血运重建的患者,预测准确率达到83%,敏感性和特异性分别为79%和87%。AL-ZAITI等[11]从12导联心电图中提取了554个时间-空间特征,利用Logistic回归、梯度增强机和人工神经网络(artificial neural network,ANN)训练模型,排除最不可能与急性心肌缺血发病机制有关联的心电图特征,最终获得65个有临床意义的心电图特征以预测ACS,最终融合模型识别急性心肌缺血心电图的能力得到显著提高:敏感性比商业软件提高52%,比经验丰富的临床医生提高37%,这是第一个仅使用院前12导联心电图数据搭建机器学习模型来预测ACS的研究。对于急性NSTEMI与非心源性胸痛的分层,目前尚无有效手段。WU等[12]采用ANN模型来预测急性NSTEMI患者,通过文献搜索排查出42条潜在的预后因素来区分ACS引起的胸痛和紧急情况下的非心源性胸痛,并通过Logistic回归对上述预后因素进行分析,确定了收缩压、校正QT间期、血红蛋白等9个与急性NSTEMI独立相关的预测因子作为ANN模型的输入层,输出层主要预测急性NSTEMI和心绞痛,准确率可达92.86%,敏感性为90.91%,特异性为93.33%,阳性预测值为76.92%,阴性预测值为97.67%。SONG等[13]针对心率变异性(heart rate variability,HRV)降低与急性心肌梗死(acute myocardial infarction,AMI)患者死亡风险相关却无法利用HRV准确预测死亡的问题,采用一种基于支持向量机算法的预测模型分析24 h动态心电图数据,研究自主神经功能障碍和AMI死亡率之间的关系,从而更准确地预测高危AMI患者,提升AMI后的生存风险分层准确性,曲线下面积可达0.89。由此可见,机器学习能准确预测和筛查冠心病高危患者,使之及时得到适当的临床处置,有助于改善患者预后。
3.2 心律失常
房颤是临床上常见的一种心律失常,与脑卒中、心力衰竭(简称心衰)和死亡相关。部分阵发性房颤难以发现或确诊,而长时间监测不仅筛选成本较高,而且阳性率较低。ERDENEBAYAR等[14]利用CNN算法,仅需分析正常心电图信号即可实现阵发性房颤的自动预测。该模型的准确率、敏感性和特异性均可达98%以上,有望成为阵发性房颤早期诊断的有力工具。ATTIA等[15]使用标准10 s的12导联心电图,将以往心电图诊断为房颤或心房扑动的患者列为房颤阳性对照组,评估模型在测试数据集上的诊断效能,得出人工智能使用单次心电图预测房颤的准确率、敏感性和特异性均达79%以上;而采用患者发生房颤前一个月内的窦性心律心电图预测房颤的准确率升至83.3%,敏感性和特异性上升至82.3%和83.4%。JALALI等[16]利用CNNResNet模型和Wide-ResNet模型分析房颤发作前的长时程心电信号,发现通过识别心电图中的房性早搏可以预测房颤;如果样本数量较少、数据高度不平衡,则该方法仍能获得较好的房颤预测效果。EBRAHIMZADEH等[17]使用机器学习对HRV进行线性、时频和非线性分析并提取特征组合,利用局部特征子集选择进行特征简化,再使用K最近邻、支持向量机、多层感知器和混合专家4种分类器分别对阵发性房颤发病前后的心电信号进行分类,以实现对阵发性房颤的预测;结果表明,采用混合专家分类方法能够对不同过程的输出进行准确决策,分类精度更高,预测敏感性和特异性分别为100%和95.5%。HAYN等[18]为更好地了解心电图正常的患者未来是否会出现房颤,以及房颤是否会自动终止,提出了一种根据正常心电图预测房颤发生和终止的软件系统。该系统通过检测早搏并分析其P波形态来预测房颤的发生,以计算主要心房频率为基础来预测房颤的终止,准确率可达75%。此外,CHESNOKOV等[19]通过提取心电图中的HRV数据,利用ANN和支持向量机算法分析阵发性房颤事件发生前30 min非房颤节律的HRV的动态变化,并据此预测阵发性房颤;与支持向量机算法相比,ANN预测阵发性房颤的敏感性、特异性和阳性预测值更高。
阵发性室上性心动过速(简称室上速)是临床上一种常见的心律失常,可引起患者心悸、胸闷等不适症状,造成生活质量下降。当患者在无症状时的窦性心律状态下,医生无法通过常规心电图诊断。WANG等[20]使用阵发性室上速手术患者术前窦性心律心电图和正常对照人群的标准12导联窦性心律心电图训练CNN模型;结果显示该CNN算法可以通过正常窦性心律心电图进行阵发性室上速的检测,总体准确率为95.5%,敏感性为90.2%,特异性为96.6%。
作为引起心搏骤停的最主要心律失常,心室颤动的除颤成功率通常并不高。SHANDILYA等[21]针对该问题开发了一种基于信号处理和机器学习的模型,可用于预测心室颤动的除颤成功率,其主要方法如下:提取电除颤前的心电图信号,采用时间序列和二元树复小波变换方法,提取心电数据和呼气末二氧化碳数据特征,训练参数优化的支持向量机模型,其预测除颤成功率的准确性较高。
3.3 心力衰竭
针对医疗机构还不具备廉价且无创的无症状左心室功能不全筛查工具的现状,ATTIA等[22]将12导联心电图和超声心动图测得的左心室射血分数(LVEF)≤35%的患者数据进行配对,然后训练一个CNN模型,从而在无症状个体中仅基于心电图数据就可准确预测左心室功能障碍患者,敏感性可达86.3%,特异性和准确率均为85.7%。同样地,为了识别更多潜在的左心室功能障碍患者并使其得到及时干预,SUN等[23]将12导联心电图和超声心动图测得LVEF≤50%的患者数据进行配对,使用CNN LeNet-5框架来提取原始心电数据特征,亦可从看似正常的心电图中筛选出左心室功能障碍患者。ATTIA等[24]利用深度学习算法对近期经超声心动图评估存在左心室功能障碍和无左心室功能障碍患者的常规12导联心电图进行分析,可以识别出无症状的左心室功能障碍患者。此外,KWON等[25]将人口学特征和心电图特征作为预测变量,设定主要的终点事件是LVEF≤40%的心衰,次要终点事件是40% 虽然左心室舒张功能障碍在心衰发展过程中会起到重要作用,但患者可能没有任何临床症状,而且目前也缺乏在超声心动图检测前精准诊断舒张功能障碍的临床工具。KAGIYAMA等[27]在北美的4家医疗机构中开展了一项前瞻性研究,共招募1202例受试者,在特征提取阶段,把传统心电图信号与10个基础临床特征相结合作为机器学习回归模型的输入,并参考超声心动图测量的左心室舒张早期速度数值来评估心肌舒张功能。该方法能够较好地预测左心室舒张功能障碍,有望成为早期检测左心室舒张功能障碍的一种经济有效的筛查工具。SENGUPTA等[28]考虑到在所有左心室舒张功能障碍的病例中几乎都会存在心肌舒张受损,利用连续小波变换对心电信号进行预处理,选用随机森林分类器和蒙特卡罗交叉验证对心电信号进行分类预测,实现了基于体表心电图信号对心肌舒张异常的预测,从而识别出有左心室舒张功能障碍风险的患者。因此,机器学习算法可以通过心电图预测射血分数下降或保留的心衰患者。 为有效识别无症状期的主动脉狭窄患者,KWON等[29]以患者基本信息和12导联心电图原始数据作为预测变量,开发了一种结合多层感知器和CNN的深度学习算法模型,可有效识别和预测显著性主动脉狭窄;同时采用灵敏度图确定模型在心电图中识别主动脉狭窄的心电区域,发现胸导联T波区域对于模型决策影响最大。KWON等[30]还使用CNN模型对12导联心电图进行学习,以识别和预测二尖瓣反流的进展,并利用灵敏度图确定了二尖瓣反流患者心电图的P波和T波是CNN算法识别二尖瓣反流进展的重要决策区域。 心电图是预测左心室肥厚最常用的工具,但精确度不高,de la GARZA-SALAZAR等[31]使用机器学习C5.0算法,使心电图预测左心室肥厚的效能得到优化。该算法使用高度相关的心电图特征并提供适当的截止值,使得整个模型的内在特征具有高度可解释性,并包含了具有预后预测价值的变量,也为肥厚心肌的电发生机制提供了合理解释。左心房增大本身无症状和体征,但能独立预测多种心血管疾病的发展。为更好地预测患者是否存在左心房增大,JIANG等[32]选取已同时进行10 s的12导联心电图和超声心动图检查的65岁以上老年人为研究对象,搭建并训练CNN模型在心电图正常患者中识别存在左心房增大的患者;该CNN模型能根据窦性心律心电图识别出极有可能存在左心房增大的个体,其预测表现良好,敏感性为84.0%、特异性为92.0%、准确率为88.0%。针对心肌瘢痕对心电图有影响却不易被发现的问题,GUMPFER等[33]利用CNN与全连接前馈网络模型开发了一种心肌瘢痕预测模型,基于12导联心电图时间序列数据集和临床参数,采用6倍交叉验证进行模型训练和评估。该模型直接利用心电图数据和临床参数,无须预提取任何特征即可进行心肌瘢痕的有效预测,临床应用简单灵活;如能补充临床参数信息,还能进一步提高其预测性能。 心电图信号可用于血压的估计和预测。SIMJANOSKA等[34]通过对原始心电数据进行滤波与分割以提取特征,采用机器学习方法,结合基于堆叠的分类模块和回归模块,建立了关于收缩压、舒张压和平均动脉压的预测模型,以便有心电传感器的用户不使用额外设备即可测量血压。LANDRY等[35]利用ANN构建了带外源性输入的非线性自回归模型,不仅可基于心电图信号预测血压波形,准确估计患者的收缩压和舒张压,而且还可连续监测血压,并估算其他生理测量值。 全球每年有数百万人死于心脏性猝死(sudden cardiac death,SCD)。SCD具有发病急、存活率低和预测难等特点;如果能及时识别或预测,并使用除颤器等医疗设备,则能减少由SCD引起的死亡。SCD患者HRV信号在其SCD发生前后具有明显特征,可据此区分SCD易发患者和正常人群。EBRAHIMZADEH等[36]从HRV信号中提取线性、时频和非线性特征,分别利用K最近邻和多层感知器神经网络对健康人群和SCD风险人群进行分类。该研究发现,提取特征的类型和时间点不同,其对应的SCD预测准确率也不同,而将时频特征和非线性特征相结合可以获得更高的精度。距SCD发生的时间间隔越短,组合特征对SCD的预测准确率就越高;在SCD发生前第4 min往后,SCD的预测准确率将急剧上升。此外,与K最近邻算法相比,多层感知器神经网络识别SCD性能更高,可协助医生在SCD发生前4 min就识别它,从而可预防SCD事件发生,及时挽救生命。心搏骤停的预测对避免SCD的发生具有重要意义,HOUSHYARIFAR等[37]从心脏骤停发生前6 min的心电图信号中提取HRV信号的双谱特征和时域特征,并采用线性判别分析技术将HRV信号中提取的特征简化为一个特征,分别基于K最近邻和支持向量机算法进行分类,实现在心搏骤停发生前4、5、6 min预测SCD,准确率均超过91%。SHEN等[8]成功利用单导联心电图数据预测SCD,使家庭护理系统和可佩戴设备准确预测SCD事件成为可能。其中,个人心脏家庭护理系统主要由心电识别模块、SCD检测模块和SCD预测模块构成。该系统采用数字滤波器、模板匹配和均方误差方法对单导联(Ⅰ导联)心电信号进行处理,分别通过传统机器学习算法,如小波分析法、ANN、最小均方差、基于决策的神经网络、反向传播神经网络识别HRV特征以预测SCD事件,结果显示小波分析法的预测准确率最高。KWON等[38]分别将12导联、6导联和单导联心电图数据作为模型数据集,利用CNN对其进行学习,发现模型基于单导联(Ⅰ或Ⅱ导联)心电图同样可预测心搏骤停,这使采集单导联心电图的可穿戴设备也可能被用于心搏骤停的筛查和预测。同时,利用灵敏度图研究发现,用于支持决策的关键心电信号区域主要集中在QRS波段,部分分布于T波。 RAGHUNATH等[39]通过训练深度神经网络提取患者12导联心电图特征,不仅可预测患者一年内的死亡率,而且可对胸痛患者以及存在心脏缺血的非典型胸痛患者进行危险分层;对于预期生存时间在一年以内的患者,还能辅助治疗决策,即实施保守治疗还是采取侵入性的和(或)高风险的治疗措施。LIU等[40]采用随机森林方法从胸痛患者的8个临床体征和5 min HRV数据中筛选出与主要不良心脏事件最相关的3个变量,分别是收缩压、平均RR间期和平均瞬时心率,而以这些变量为输入的基于几何距离的机器学习评分系统会根据心电图对胸痛患者给出0~100分的风险评分。该研究发现,选择上述3个最相关预测变量的评分系统与采用全部23个变量的评分系统相比,前者在72 h内预测主要不良心脏事件的效果优于后者,提示预测因子并不是越多越好。COSTANTINO等[41]选取病史、心电图、晕厥情况等10个变量作为ANN模型对晕厥患者短期危险的预测因子,表明ANN模型有望成为晕厥患者危险分层工具而在急诊科推广应用。 使用机器学习进行心电图自动分类诊断的技术已经较为成熟,并在临床得到广泛应用。然而基于心电图的机器学习用于疾病预测,尤其是在心血管疾病预测方面仍处在研究阶段,尚未在临床大范围推广。同时,机器学习可以对患者的临床特征、检验结果、心电图、CT或MRI等多种数据进行综合学习,从而提高预测结果的准确性。而作为机器学习分支的深度学习,其性能往往随着训练数据集规模的增大而不断提升。深度学习能够自动获取特征,只需直接输入原始数据进行运算,就能得到输出结果。但深度学习过程中自动提取的特征可能跟临床特征无关,存在可解释性差的问题,而这种无法解释的特征往往难以让医生信服并据此做出诊断,即“黑匣子”效应。灵敏度图的应用在一定程度上打破了深度学习算法在学习与决策过程中的“黑匣子”限制,但其应用仍需进一步研究。3.4 结构性心脏病
3.5 高血压
3.6 心脏性猝死
3.7 心血管事件
4 小结