机器学习在急性缺血性卒中并发症中的应用进展

2022-12-07雷曼郭志伟母其文

中国脑血管病杂志 2022年1期

雷曼郭志伟母其文

脑血管疾病是我国第三大死亡原因，仅次于恶性肿瘤和心脏病，我国正面临世界上最大的卒中风险挑战[1]。急性缺血性卒中(acute ischemic stroke,AIS)占所有卒中的80%[2]。卒中的病死率严重受并发症的影响[3]，对卒中并发症进行早期预测并及时做出相应的处理对改善患者预后具有重要意义。

机器学习作为统计学和计算机科学的交叉领域，将高效的计算算法与数据结合，实现分类、预测及隐藏特征的挖掘，目前已经应用于包括医疗卫生在内的多个领域。其学习类型主要分为监督学习和无监督学习。监督学习旨在预测一个已知的输出，侧重于分类、预测及评估风险，常见的模型包括随机森林、决策树、支持向量机等；相反，无监督学习无输出可预测，试图从无标签的训练数据中挖掘有效的特征或表现，常见的模型包括聚类分析和主成分分析。此外，深度学习作为机器学习的一种特殊类型，其与传统的机器学习最大的区别在于如何从原始数据中学习表征，深度学习允许基于神经网络的多个处理层组成的计算模型去学习具有多个抽象级别的数据表征[4]，常用的模型为卷积神经网络。近年来，随着科学技术的发展，机器学习在医疗卫生领域中的应用越来越多，协助临床医师实现智能诊断、精准定位、疾病预测等，本文就机器学习在AIS并发症中的应用现状进行综述。

1 机器学习在AIS并发症中的应用

1.1 脑水肿

脑水肿可导致卒中后神经功能恶化甚至死亡，但是目前尚无有效预防或准确预测脑水肿发生的方法。基于此，Dhar等[5]开发了一种随机森林模型，对153例AIS患者进行总计397次CT扫描并测量脑脊液体积，以量化缺血性卒中后脑水肿的进展。在此基础上，该团队又开发了卷积神经网络模型来量化大脑半球脑脊液在每个成像时间点的体积，证明脑脊液可以定量评估早期脑水肿形成，从基线期到CT扫描后24 h的脑脊液位移是脑水肿的早期生物标志物[6]。Foroushani等[7]首先基于598例大脑半球卒中患者的基线数据建立Logistic回归机器学习模型，然后添加包括脑脊液位移在内的CT扫描后24 h数据，经10倍交叉验证，最终模型的受试者工作特征曲线下面积高达0.96。该研究结果表明，结合基线期和CT扫描后24 h的影像特征可帮助识别需要去骨瓣减压术的恶性脑水肿患者。但是，这种基于图像的机器学习模型需要进一步细化和外部验证。Martha等[8]评估28例行机械取栓术的急性大血管闭塞患者的颅内血栓远端及近端动脉血液中84个炎性因子基因表达的相对浓度，并建立随机森林模型来确定可预测梗死和水肿体积的炎性因子基因和患者人口统计学指标。此研究结果显示，CC趋化因子受体4、干扰素A2、白细胞介素(IL)9、CXC趋化因子配体3、年龄、2型糖尿病、IL-7、CC趋化因子配体4、体质量指数、IL-5、CC趋化因子受体3、肿瘤坏死因子 α 和IL-27可预测梗死体积(平均差异倍数：2.56～35.06)，而干扰素A2、IL-5、CC趋化因子配体11、IL-17C、CC趋化因子受体4、IL-9、IL-7、CC趋化因子受体3、IL-27、2型糖尿病、集落刺激因子2可预测水肿体积(平均差异倍数：3.98～42.61)，CC趋化因子受体4、干扰素A2、IL-9、IL-7、IL-5、CC趋化因子受体3和IL-27与2型糖尿病的重叠可预测梗死和水肿体积(平均差异倍数：3.98～35.06)。利用机器学习确定缺血性卒中患者血液中的分子预测因子，可以为卒中领域的药物研发开辟新途径。综上，机器学习可用于脑水肿的定量分析及恶性脑水肿的预测，但尚缺乏多中心外部验证，未来研究需要更多样化、更大的样本量支持。

1.2 梗死后出血转化

AIS的治疗主要包括静脉溶栓及血管内介入治疗，目的是恢复缺血区域的血流灌注，改善脑血液循环，但这可能导致严重的并发症，如脑出血[9]。因此，在再灌注治疗之前预测出血转化的发生对临床决策十分重要。2013年，Scalzo等[10]纳入多中心的263例在重症监护室治疗的AIS患者，基于磁共振灌注加权成像渗透率直方图，创建了多个机器学习模型来预测出血转化的发生，结果表明，非线性回归(谱回归核判别分析)表现最佳，平均预测准确率达85%以上。Yu等[11]结合155例发病时间小于6 h的AIS患者的源磁共振灌注加权成像与扩散加权成像来预测患者经再灌注治疗后24 h随访时出血转化的空间位置及范围，并对支持向量机、线性回归、决策树、神经网络、核谱回归这几个机器学习模型的预测性能进行比较，结果显示，核谱回归表现最好，预测准确率为(83.7±2.6)%。可视化预测大脑不同区域出血转化的空间位置可为神经介入医师行血管内治疗前提供新的思路。Feng等[12]基于90例前循环大动脉闭塞所致AIS患者的临床特征及Willis环变异情况，建立决策树模型和多元Logistic回归模型，预测患者经机械取栓后发生出血转化的危险因素，两个模型均证实，较差的侧支循环及较高的血小板淋巴细胞比值与出血转化显著相关(受试者工作特征曲线下面积分别为0.817、0.855)。结合临床实验室数据及医学影像数据能为机器学习模型提供更多的预测信息。尽管基于机器学习的成像模式还不是常规影像学研究的一部分，但是机器学习的预测作用有益于AIS的临床决策。

1.3 卒中相关性肺炎(stroke-associated pneumonia,SAP)

据中国国家卒中登记中心的资料统计，国内缺血性卒中患者中SAP发病率为11.4%[13]。SAP导致卒中患者的住院病死率(OR=5.87，95%CI：4.97～6.93)、0～90 d病死率(OR=2.17，95%CI：1.97～2.40)增加，91 d～365 d病死率相对风险增加31%[14]。因此，建立SAP发生的预测模型并对高风险患者做出有针对性的干预至关重要。Li等[15]收集了3 160例AIS患者的病历资料，建立了5种机器学习模型(正则化Logistic回归、支持向量机、随机森林、极端梯度提升、全连接深度神经网络)预测SAP，结果表明，极端梯度提升表现最佳，受试者工作特征曲线下面积为0.841。Ge等[16]也基于13 930例AIS患者电子病历系统的时间序列数据，建立了经典机器学习(Logistic回归、支持向量机、极端梯度提升)以及深度学习模型(多层感知机、基于注意力机制的门控循环单元)，比较上述模型对卒中后7 d及14 d内肺炎发生的预测性能，结果显示，基于注意力机制的门控循环单元表现最佳，其7 d及14 d内肺炎发病预测的受试者工作特征曲线下面积分别为0.928、0.905。尽管目前机器学习模型在SAP的预测中应用相对较少，且均为基于中国卒中人群的数据，但仍能说明机器学习模型较传统的SAP风险评估量表略胜一筹，未来有待进一步优化。

1.4 卒中后抑郁(poststroke depression,PSD)

近年来，PSD患者的总数随着卒中幸存者人数的增加而上升，大约1/3的卒中幸存者患有PSD，卒中后2年内PSD的发病率为11%～41%[17]。PSD的典型症状表现为情绪低落、兴趣缺失、乏力、注意力下降以及精神发育迟缓，不利于患者积极参与康复治疗[18]。因此，早期诊断并治疗PSD能改善卒中患者的预后。2016年，Hirata等[19]对546例卒中幸存者进行抑郁症筛查，并建立随机森林模型来确定与PSD相关并可预测的因素，其总体预测准确率为69%，年轻、贫困以及患有多种合并症是独立预测因素，有必要对上述患者进行抑郁症筛查。Hama等[20]建立基于对数线性高斯混合神经网络的机器学习模型，将卒中幸存者分为对照组(80例)、情绪障碍组(抑郁组40例、冷漠组80例、焦虑组40例)，并将对照组分别与情绪障碍组的每一组组合进行机器学习分析，结果表明，此种机器学习模型预测每一种情绪障碍的受试者工作特征曲线下面积都达到了0.85以上，优于传统的线性分类模型。Hong等[21]基于56例首次皮质下卒中患者(PSD组33例，非PSD组23例)的脑灰质体积建立支持向量机模型，由于样本量相对较小，研究者采用5倍交叉验证来检验模型的预测性能，结果显示，此预测模型受试者工作特征曲线下面积为0.80，添加患者的临床及人口学参数后，受试者工作特征曲线下面积提高至0.85。该研究表明，与非PSD组相比，PSD组左侧额中回灰质体积显著减少(P<0.01，Cohen′s d =-1.25)，额部边缘网络的变化表明，PSD可能是系统神经变化的结果，与病变的位置无关。上述研究说明，机器学习模型可以运用于PSD的预测因素分析，甚至是发病机制的探讨，但需要大的样本量支持。

1.5 卒中后认知障碍(post-stroke cognitive impairment,PSCI)

每年全球1/3卒中患者存在发展为认知障碍和痴呆症的风险[22]。识别认知障碍的预测标志物，实施早期治疗策略和对临床试验高危患者进行分层仍面临严峻的挑战。Betrouni等[22]基于160例卒中患者(PSCI组75例，非PSCI组85例)卒中后72 h的大脑海马和内嗅皮质磁共振T1加权成像的纹理特征，建立支持向量机模型，运用主成分分析筛选显著特征并结合患者年龄和性别，其预测PSCI的准确率达(88±3)%，说明机器学习可以处理多模态数据，磁共振图像的纹理特征可以代表神经变化成为早期预测PSCI的筛选策略的一部分。Lopes等[23]基于首次缺血性卒中患者(72例)卒中后6个月的PSCI磁共振功能连接网络，开发岭回归机器学习模型，预测患者卒中后36个月的认知领域评分，结果表明，平均预测准确率语言领域最低(48%)，注意/执行功能领域最高(73%)，记忆领域及视觉空间功能领域分别为67%、57%。此外，研究者在卒中患者(40例)组成的独立数据集中进行验证，结果表明，除注意/执行功能(平均预测准确率50%)之外，基于PSCI磁共振功能连接网络的模型对卒中后36个月认知领域评分的预测在首次缺血性卒中患者组和卒中患者组中同样准确(语言、记忆、视觉空间功能的平均预测准确率分别为48%、65%、52%，P>0.05)，说明PSCI磁共振功能连接网络模型预测具有普遍性。但是，此研究队列纳入患者的卒中程度整体较轻，不同卒中程度对预测准确性的影响可以在未来研究中开展。

2 不足及展望

机器学习作为一种统计模型拟合方法，其结果受样本量影响[24]。与在其他疾病中的应用相似，机器学习在AIS并发症中的应用大多为回顾性研究，并且样本量相对较小。为了避免因样本量较小而出现的过度拟合、特征选择偏倚、泛化不足等问题，研究者们采取了特征降维、交叉验证等方法，根据数据特点建立合适的机器学习模型。大数据支持、多中心验证、多学科合作对提高机器学习模型的预测准确率十分重要。随着国家对精准医疗的重视、计算机技术的快速发展以及现代数据共享模型的建立，相信机器学习在医疗领域的应用会越来越广泛。