APP下载

心房颤动预测:从传统回归模型分析到人工智能模型

2024-01-28朱晓庆陈韬沈娟郭军

中国循环杂志 2023年12期
关键词:组学心房房颤

朱晓庆 陈韬 沈娟 郭军

心房颤动(房颤)是最常见的心律失常之一[1]。中国45岁及以上的成年人中约790万人患房颤,随着人口老龄化进程,房颤患病率持续增加[2]。既往研究发现房颤与心原性脑卒中风险增加、生活质量降低及心力衰竭风险增加密切相关,与其他病因的脑卒中相比,房颤相关脑卒中的致残率及死亡风险明显增加[3-4]。由于房颤往往是阵发性且部分患者发作时无症状[5],因此早期诊断及预防干预具有一定挑战性。据估计,15%的房颤患者未被检出,且其中超过半数的患者处于缺血性脑卒中的中高风险分层[6],因此早期检出房颤具有重要临床意义。疾病风险预测模型是目前的研究热点,通过构建预测模型,能够筛选出房颤高风险人群,针对该人群的密集监测可以提高房颤检出率,随后的预防干预能够为患者带来临床获益[7]。

已有许多研究使用经典的回归方法分析房颤相关的临床危险因素,并构建风险评分模型,便于计算且可解释性强,但在分析临床、实验室及影像学等大数据时仍存在一定的局限性。近些年,人工智能发展迅猛并广泛应用于医疗卫生领域。目前,基于机器学习算法,使用多维临床数据进行心血管疾病诊断及预测的研究日益增多[8-10]。机器学习算法具有分析和组合不同变量以预测房颤的潜力,其效能远超过传统方法[11]。本文将对房颤预测的传统回归方法和机器学习方法作如下综述。

1 回归分析与机器学习

回归分析是一种基于统计学原理的分析方法,通过建立数学模型,以描述自变量和因变量之间的关系,通常使用参数估计及假设检验等方法来确定模型的参数,最终使用这些参数预测未知数据的结果。常用的方法包括线性回归、Logistic回归、Cox比例风险回归等。基于特定函数所建立的回归模型直观性强且便于计算。但其仅适合处理低维度的特征变量,模型性能存在多方面的限制。

机器学习和深度学习是实现人工智能的技术手段,通常通过监督式学习、无监督式学习和强化学习等方式,使用多维数据训练模型,实现预测、聚类等任务。在临床研究中常用的传统机器学习算法包括人工神经网络(ANN)、支持向量机(SVM)、随机生存森林(RSF)等。

深度学习是一种基于神经网络的机器学习方法,通过多层次的非线性变换和特征自动提取,实现对大规模数据的高效整合分析。常用的深度学习算法包括卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等。目前,深度学习在医学影像自动分割、疾病诊断和预测等研究中广泛应用。

2 基于临床数据预测房颤

2.1 临床危险因素评分模型

既往许多研究使用易获取的临床变量,构建房颤风险评分模型。Framingham心脏研究(FHS)中,基于美国白人人群构建了房颤风险评分模型,AUC为0.78[12],但对非白人的房颤预测的适用性仍不明确,因此,Chamberlain等[13]基于社区动脉粥样硬化风险(ARIC)研究的双种族队列开发了一个全新的评分模型(AUC=0.78)。心脏与老龄化基因流行病队列(CHARGE-AF)研究进一步综合了心血管健康研究(CHS)、FHS及ARIC研究三大队列,构建的模型在美国整体人群中更具代表性,模型表现(AUC=0.77)不劣于以往的单人种模型[14]。近些年,陆续有团队在亚洲人群中开展相关研究。基于中国台湾人群构建的CHASE-LESS模型以及基于中国云南人群构建的C2HEST模型均仅包含6个临床变量,计算方便且便于应用,AUC分别达到0.73和0.75[15-16]。

此外,实验室检查、影像学数据及心电图数据中可能蕴藏着新发房颤相关的标志物。常见的血清心脏生物标志物,如利钠肽和C反应蛋白被证明可增强临床风险评分的预测能力[17]。胱抑素C以及内皮功能障碍也被证明与新发房颤相关[18]。患者检查及检验数据中包含庞大数量的参数,采用传统回归建模已变得不切实际。随着临床记录的数字化,研究人员开始探索使用机器学习算法筛选重要预测因子,构建房颤预测模型。

2.2 使用临床变量的机器学习模型

Tiwari等[19]的研究纳入了近200万例患者,使用电子健康记录中提取的200多个变量,训练了一种机器学习模型以预测未来6个月房颤风险,AUC为0.80,比基于危险因素的Logistic回归模型略好。英国一项大型研究中,采用机器学习方法构建的模型表现优异(AUC=0.83)[20],显著优于传统的CHARGE - AF评分模型(AUC=0.73),并且该机器学习模型在外部队列测试中表现出极强的稳健性(AUC=0.87)[21]。

许多因素会影响模型性能,不能仅凭AUC评价模型优劣。研究随访时间的差异显著影响了研究终止时的房颤发病率。Tiwari等[19]的研究仅有6个月的随访时间,若随访时间延长,其中的“假阳性”患者将变为“真阳性”,一定程度上会提高测试性能。总体对比来看,机器学习模型比传统回归模型表现出更强的稳健性。

3 基于心电图数据预测房颤

PREDICT-AF研究表明,在房颤发作前两年就已存在心外膜纤维化面积、波形蛋白阳性的间质细胞面积增大等左心房亚临床重构的特征性改变[22]。因此,患者未发生房颤时可能已存在与纤维化相关的亚临床心脏电生理改变,使得利用窦性心律期间的心电图预测房颤风险成为可能。

3.1 房颤预测的相关心电图特征参数

研究显示,心电图的心房和心室参数可以作为房颤的预测因子。心房参数包括P波时限、高度房内传导阻滞、P波起始至波峰时间、PR间期、P波离散度、P波面积、P波电轴、P波终末电势、P波振幅等[23-30]。心室参数包括左心室肥厚、QT间期、QRS时限、束支传导阻滞、R波递增不良、ST-T波异常等[31-35]。此外,心房早搏复合征(APC)的形态和频率可作为阵发性房颤的预测因子[36]。一项韩国研究分析了进行24 h动态心电图监测的患者,结果显示APC负担与新发房颤相关,其AUC为0.58[37]。鉴于心电参数在房颤中的预测价值,Sanz-García等[38]基于窦性心电图参数构建了一个Logistic回归模型,其AUC达到0.776。

3.2 使用心率变异信号的机器学习模型

Ebrahimzadeh等[39]开展的自身对照研究中,截取了房颤发作前30 min与终止后45 min的5 min心电图片段,提取了时域、频域和非线性特征,基于多种机器学习方法预测阵发性房颤,灵敏度、特异度及准确度分别达到了100%、95.5%及98.2%。结果表明组合的机器学习比单一机器学习方法,如多层感知器、K近邻、支持向量机的表现更佳。

3.3 使用窦性心电图的深度学习模型

算法的创新助推了深度学习在房颤预测中的应用。妙佑医疗国际的一项研究使用了超过60万份的窦性心电图,基于CNN训练了人工智能(AIECG)模型。该模型能够通过患者的一份窦性心电图预测未来30天新发房颤风险,AUC达到0.87[40]。Raghunath等[41]使用160多万份窦性心电图开发了一个基于深度神经网络的人工智能模型,预测未来一年新发房颤风险,AUC达到0.85。Khurshid等[42]的研究在训练基于CNN的心电图模型以外,还结合了CHARGE-AF评分模型以预测患者5年房颤风险,AUC达到0.84。

传统方法处理心电数据的过程繁琐耗时,机器学习方法能够提取并分析大量的心电特征。越来越多的研究正不断拓展机器学习在基于心脏电生理数据预测房颤中的应用价值。此外,基于心电图的疾病风险预测的一个未研究的方向是心电参数的时间演变。目前尚不清楚是心电参数的变化还是参数的绝对值在房颤进展中更加重要,心电图参数的变化模式可能成为更好的房颤预测指标,有待进一步研究。

4 基于影像学数据预测房颤

4.1 房颤预测的相关影像学特征

房颤患者常伴有心脏影像学上的结构异常,包括超声心动图、心脏CT及心脏磁共振成像(CMR)。既往基于超声心动图的研究表明,左心房容积、舒张功能障碍、心室壁厚度及心房总传导时间与新发房颤相关[43-46]。心脏CT显示的左心房厚度是心房病变的标志物,与阵发性房颤向持续性房颤转变相关[47-48]。

CMR在评估心脏组织特征方面具有独特的能力,CMR测得的左心房钆延迟增强(LGE)与左心房纤维化程度相关。一项研究证明,左心房LGE绝对面积及其占左心房壁面积百分比与新发房颤相关,在包含危险因素及左心房和心室功能的模型中加入该指数可显著提高预测效能(AUC:67.7% vs.78.9%)[49]。一项队列研究纳入了7 639例无房颤病史且进行CMR检查的患者,从CMR 的疾病表型、健康问卷、电子病历中提取了115个变量,基于随机生存森林构建模型,预测新发房颤的1年、2年、3年的AUC分别为0.80、0.79和0.70[50]。这些研究仅使用了影像学的常规参数,模型仍缺乏一定准确性,有待深度挖掘医学影像数据完善现有的房颤预测研究。

4.2 影像组学与机器学习

4.2.1 基本概念与研究流程

近些年,机器学习在图像分析领域发展迅猛,继影像组学概念提出后,机器学习与影像组学的结合极大促进了医学影像分析的迭代。影像组学通过高通量地提取医学影像的定量特征,提供更加多元的信息特征,并在疾病诊断及预测研究中广泛应用[51]。

与来自电子健康记录的分类或连续变量的输入不同,影像组学在应用机器学习时需要更复杂的方法,但基本理论类似[52]。区别于传统人工判读图像时主观定性的解释,影像组学能够量化提取感兴趣区(ROI)内的图像灰度、形状、纹理等信息,通过机器学习筛选所提取的海量特征,建立模型以改进疾病诊断、预测及预后评估[53]。

4.2.2 房颤消融术后复发的预测

较多研究关注于房颤消融术后的复发风险。一项研究分析了接受房颤消融术患者的术前心脏CT,在左心房、肺静脉、心肌壁的ROI中提取了28个影像组学特征,基于随机森林算法预测术后房颤复发,结合临床危险因素后的模型AUC达到0.87[54]。另一项研究分析了患者术前心脏CT的左心房形态,结合临床因素与影像学特征的模型AUC为0.78[55]。Yang等[56]提取了心脏CT图像下左心房周围心外膜脂肪组织的影像组学特征并结合容量信息构建了预测模型,AUC达到0.86。

4.2.3 影像组学与新发房颤预测

目前基于影像组学预测新发房颤的研究仍然较少。一项使用英国生物银行数据库的研究分析了患者基线CMR图像,在收缩末期和舒张末期的右心室腔、左心室腔和左心室心肌的ROI中提取影像组学特征,基于支持向量机算法构建预测模型。基于CMR影像组学的模型AUC为0.73,结合临床危险因素后提升至0.76[57]。未来研究需要进一步发展影像组学在房颤等非影像学诊断的疾病的检测及预测中的应用。考虑到筛查无症状患者的高成本问题以及接受心脏影像学检查的患者存在选择偏倚的问题,开展基于人群的大型研究仍存在一定困难。

5 问题与局限性

尽管基于人工智能的模型在预测性能上表现出比传统方法更大的优势,但在部署应用人工智能模型时仍存在相关伦理及法律问题。目前,人工智能应用仍处于早期阶段,深度学习算法固有的“黑匣子”特性使得研究人员无法明确人工智能算法提取、组合和选择了哪些预测变量。此外,在影像组学中,复杂算法提取的影像特征很难被影像学专家识别出来。当人工智能工具输出结果时,其可靠性需要审慎地判断,假阳性和假阴性的问题可能会导致干预及治疗上的严重医疗事故,随后的责任归属将产生分歧。

回归模型由于结构简单,具有事前解释能力。但复杂的机器学习算法本身不具备可解释性,因此模型构建后必须提供输出结果的事后解释,以便医生理解、信任并安全地使用人工智能辅助工具。可解释人工智能(XAI)的出现增强了对机器学习输出的解释,常用方法包括类激活映射、Grad-CAM、Smooth Grad、显著性图,可以标记图像中哪些部位对预测具有更高价值。在结构化数据预测中,SHAP(Shapley Additive Explanations)的应用最为广泛,能够度量每个特征对模型输出的贡献[58]。可解释人工智能仍是新兴的研究领域,如何更加明确地窥视“黑箱”中的信息,是未来研究的方向。

基于机器学习开展的房颤预测研究日益增多,但大多数研究仅基于单个数据库开展模型训练,在外部数据库的测试效能往往不及内部测试集,针对不同地区、种族的泛化性较差。进一步研究基于本国人群的风险预测模型是必要的。

6 总结

虽然目前人工智能在医学研究领域的应用仍处于早期阶段,并且人工智能模型存在其固有的难以解释性,但机器学习在提高房颤预测能力方面仍表现出巨大优势。毫无疑问,随着人工智能技术的不断进步以及对人工智能理解的不断深入,人工智能将在医学领域发挥更为突出的作用。未来临床、影像学、心脏电生理数据的整合必将提高机器学习模型的预测性能,并最终改善全球患者的诊疗及护理。

利益冲突:所有作者均声明不存在利益冲突

猜你喜欢

组学心房房颤
老年房颤患者,日常有哪些注意事项
心房颤动与心房代谢重构的研究进展
心房破冰师
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
左心房
预防房颤有九“招”
阵发性房颤应怎样治疗
花开在心房
代谢组学在多囊卵巢综合征中的应用