APP下载

基于机器学习的急性穿支动脉闭塞性脑梗死预后预测模型研究

2024-03-27刘妍贾龙斌许丽娜刘伟

新医学 2024年3期
关键词:预测模型机器学习脑梗死

刘妍?贾龙斌?许丽娜?刘伟

【摘要】目的 基于機器学习算法评估急性穿支动脉闭塞性脑梗死预测模型并筛选优势模型,为临床管理急性穿支动脉梗死患者提供依据。方法 选取441例急性穿支动脉闭塞性脑梗死患者为研究对象,排除临床信息不完整10例,多次脑梗死患者28例,共纳入403例。将结果变量分为预后良好组[改良Rankin量表(mRS)评分0~2分]和预后不良组(mRS评分>2分)。采用单、多因素Logistic回归(LR)以逐步回归法分析筛选预测变量。使用LR、随机森林(RF)、支持向量机(SVM)3种机器学习算法构建功能预后预测模型,在测试集中通过受试者操作特征(ROC)曲线的曲线下面积(AUC)、准确度、灵敏度、特异度等指标比较预测模型对患者发病90 d功能预后的预测价值。结果 403例患者中男性占68.73%,年龄(60.4±11.4)岁。从44个变量中选出7个变量作为预测变量,分别为白细胞计数、血小板计数、就诊时血糖、胆固醇、既往糖尿病病史、既往服用降糖药物史、既往吸烟史(P均< 0.05)。LR、RF、SVM预测预后的AUC分别为0.610、0.690、0.780。结论 机器学习算法在预测急性穿支动脉闭塞性脑梗死中有一定的预判能力。RF、SVM(非线性模型)在预测模型中的表现优于传统LR模型(线性模型)。

【关键词】脑梗死;预后;穿支动脉粥样硬化性疾病;穿支动脉;机器学习;预测模型

Study of a prediction model for acute penetrating artery territory infarction based on machine learning Liu Yan△, Jia Longbin, Xu Lina, Liu Wei.△Changzhi Medical College, Changzhi 046000, China

Corresponding author, Jia Longbin, E-mail: sxjcjlb@163.com

【Abstract】Objective To evaluate the performance of prediction models for  acute penetrating artery territory occlusive cerebral infarction based on machine learning algorithms and select the optimal model, aiming to provide evidence for clinical management of acute penetrating artery territory infarction. Methods A total of 441 patients diagnosed with acute perforator artery territory infarction were enrolled in this study. Patients with incomplete clinical information (n = 10) and multiple cerebral infarctions (n = 28) were excluded, resulting in a final sample size of 403 patients. The outcome variables were divided into two groups: good prognosis (mRS scores of 0-2) and poor prognosis (mRS scores>2). Univariate and multi-variate Logistic regression (LR) using the stepwise regression method were employed to identify prediction variables. LR, random forest (RF)  and support vector machine (SVM) models were utilized to develop a prognostic prediction model. The dataset was further divided randomly into a training set and a test set in a 7:3 ratio. In the test set, the predictive performance of the model for 90-day functional prognosis in patients with BAD (with poor prognosis defined as mRS scores > 2) was evaluated using metric such as the area under the receiver operating characteristic (ROC) curve (AUC), accuracy, sensitivity and specificity, etc. Results Among 403 patients with BAD, 68.73% of them were male, with an average age of (60.4±11.4) years. Using the stepwise regression method, 7 prediction variables were selected from a pool of 44 variables: white blood cell count, platelet count, blood glucose, cholesterol, history of diabetes mellitus, history of taking hypoglycemic drugs, and history of smoking (all P < 0.05). The AUC of LR, RF and SVN for predicting clinical prognosis was 0.610, 0.690, and 0.780, respectively. Conclusions Machine learning algorithms have demonstrated certain predictive ability for acute penetrating artery territory infarction. The performance of RF and SVM models (nonlinear models) is superior to traditional logistic regression model (linear model).

【Key words】Cerebral infarction;Prognosis;Branch atheromatous disease;Penetrating artery;Machine learning;

Predictive model

脑卒中已经成为全球致残和致死的第二大原因,具有高患病率、高复发率、高病死率的特点,而且患病率逐年上升,给低收入和中等收入国家带来了巨大负担[1-2]。研究显示,90 d脑梗死复发率为2.81%,病死率也处于较高水平[3]。脑卒中除了会导致常见的感觉、运动、自主功能障碍及认知功能障碍以外,还会引发脑心综合征[4-5]。随之而来的康复需求及残疾适应周期等经济负担是沉重的[6-7]。超过80%的脑卒中患者为缺血性脑卒中,14.9%为脑出血卒中,3.1%为蛛网膜下隙出血卒中[1, 9]。穿支动脉粥样硬化性疾病(BAD)以动脉闭塞为特征,微动脉粥样硬化使得血栓堵塞在母动脉孔附近相对较大的穿支(直径700~

800 ?m),是引起急性孤立性皮层下梗死最常见且重要的病因,尤以亚洲人群多见,在发病急性期内,BAD引发的脑卒中更易出现症状波动或神经功能恶化[10-11]。在急性缺血性脑血管病住院患者中,约10.3%~10.8%为BAD患者,其中17%~75%运动系统受累患者的症状呈进行性加重[12]。到目前为止,还没有针对BAD的最佳治疗方法,因此预测BAD相关脑卒中的预后尤为重要[10-11, 13]。

机器学习是人工智能(AI)的一个重要分支,监督学习、无监督学习和深度学习是目前机器学习的重点类型。精准医疗是未来医疗的发展趋势,而AI是实现精准医疗的重要手段[14]。目前已有将机器学习应用于脑卒中的相关研究,包括影像学、生物信息学、基因研究等方面[15-17]。准确的预后预测一直是脑卒中研究的中心目标,有助于制定最适合的短期和长期治疗目标。

预测模型的建立可以帮助临床医师根据预测结果选择更有针对性的治疗方案。目前基于机器学习的预测研究虽然很多,但针对BAD相关脑卒中的预测研究甚少。本研究旨在采用机器学习对急性穿支动脉闭塞性脑梗死构建神经功能预测模型,并通过相关指标对其进行评估,选择优势模型,为BAD相关脑卒中的治疗提供参考依据。

对象与方法

一、研究对象

研究对象来源于山西省医学重点学科、首批省级临床重点专科、国家卫健委脑卒中筛查与防治基地——长治医学院附属晋城市人民医院神经内科。收集2020年1月至2021年12月连续入院的急性穿支动脉闭塞性脑梗死患者441例的临床资料,按以下纳入与排除标准进行筛选,纳入标准:①年龄>18岁;②根据BAD的定义,经头颅CT或MRI确诊脑梗死;头部MRI扩散加权成像(DWI)显示存在穿支动脉供血区(基底节区、内囊、丘脑、脑桥等)孤立梗死病灶(直径< 30 mm),梗死病灶在水平位至少累及不少于2个DWI 影像层面,或DWI显示梗死病灶最大层面直径≥ 15 mm,或DWI显示梗死病灶与脑桥腹侧的脑表面相连,梗死病灶靠近中线、位于一侧且不超过中线;③发病在3 d内;④住院接受治疗。排除标准:①临床信息不完整;②发病90 d内死亡;③多发性、皮质性梗死。最终纳入研究对象403例。本研究属于回顾性研究,由晋城市人民医院医学伦理委员会审核通过(批件号:JCPH.NO20221201006)。

二、基线数据

1.纳入变量

通过住院系统收集患者的人口学信息(年龄、身高 、体质量、BMI)、入院时实验室检查结果[血红蛋白、红细胞、白细胞、血小板、中性粒细胞、淋巴细胞、中性粒细胞/淋巴细胞、血小板/

淋巴细胞、胆红素、尿素、肌酐、尿素/肌酐、C反应蛋白(CRP)、LDL-C、甘油三酯、胆固醇、血糖、D-二聚体、同型半胱氨酸(HCY)]、既往病史[高血压、糖尿病、冠状动脉粥样硬化性心脏病(冠心病)、心房颤动、脑出血、脑梗死]、个人史(吸烟史、饮酒史)、既往服药史(降压药、调脂药、降糖药、抗凝药、抗血小板药等)、评分[入院时美国国立卫生研究院卒中量表(NIHSS)评分、加重后NIHSS评分、出院時NIHSS评分、入院时改良Rankin量表(mRS)评分、出院时mRS评分]、神经功能恶化情况。由数据监察员独立审核数据的完整性、准确性。

2.结局变量

采用电话随访的形式,使用mRS评估发病90 d时患者的预后。将患者按照预后良好(mRS评分0~2分)和预后不良(mRS评分>2分)分为2组。

三、统计学处理

采用SPSS 25.0和Python 3.7进行数据分析。二分类变量采用例(%)表示,比较采用χ 2检验。符合正态分布的计量资料用表示,比较采用t检验;不符合正态分布的计量资料用M(P25,P75)表示,比较采用秩和检验。双侧P < 0.05为差异有统计学意义。

四、预测模型建立方法

将单因素Logistic回归(LR)中P < 0.25的预测因素纳入多因素分析,多因素LR以逐步回归法进行特征筛选,最终将P < 0.05的变量纳入预测模型中。使用EM插补法对缺失值进行填充。将纳入的研究对象按 7∶3随机分为训练集和测试集,采用LR、随机森林(RF)、支持向量机(SVM)3种机器学习的方法分别建立预测模型。在测试集内对各个预测模型的预测性能进行内部验证。模型评价指标包括受试者操作特征(ROC)曲线的曲线下面积(AUC)、准确度、灵敏度、特异度。AUC 为0.5~0.7 时表示预测模型的准确度较低,为0.7~0.9 时表示预测模型具有一定准确度,AUC>0.9 时则表示预测模型具有较高的准确度。根据AUC评估模型价值,并选出优势模型。

结果

一、2组急性穿支动脉闭塞性脑梗死患者基线资料比较

本研究纳入符合条件的急性穿支动脉闭塞性脑梗死患者共403例,其中预后良好组353例、预后不良组50例。2组患者的白细胞、血小板、D-二聚体、入院时NHISS评分、加重后NHISS评分、出院时NHISS评分、出院时mRS评分、既往糖尿病病史、个人吸烟史比较差异有统计学意义(P均<0.05)。见表1。

二、預测变量筛选结果

多因素LR逐步回归结果显示,白细胞、血小板、就诊时血糖、胆固醇、既往糖尿病病史、既往服用降糖药、个人吸烟史可作为3种机器学习模型的变量(P均< 0.05)。见表2。

三、预测模型评价

LR、RF、SVM预测模型预测急性穿支动脉闭塞性脑梗死患者神经功能预后的AUC分别为0.610、0.690、0.780。准确度、特异度、灵敏度见表3、图1。

讨论

本研究从基线变量中筛选出7个变量作为预测变量。对于预测变量选择的方法很重要,因为在模型构建的过程中,数据集的数量庞大,但大多数的预测变量与目标变量无关,可能会降低机器学习的准确性。因此,本文采用LR逐步回归法进行预测变量的筛选,具有自动化选择、灵活性强、节约成本及时间、避免模型欠拟合等优势。

本研究基于机器学习的方法建立了急性穿支动脉闭塞性脑梗死患者90 d神经功能预后的预测模型,结果显示非线性模型RF(AUC=0.690)、SVM(AUC=0.780)算法构建的机器学习模型预测能力比传统的非线性模型LR(AUC=0.610)的表现更优秀,表明机器学习对预测急性穿支动脉闭塞性脑梗死患者的神经功能预后具有可行性,且非线性模型的效果优于线性模型。有研究显示,包括RF、分类和回归树、C5.0决策树、SVM、自适应提升、最小绝对收缩和选择算子、LR在内的模型可以预测发病90 d缺血性脑卒中患者的神经功能预后,具有一定的准确性(AUC 0.66~0.71)[18-19]。

对于影响BAD患者治疗效果的具体因素目前尚无确切定论,且BAD 相关脑卒中患者的症状更易出现波动及进展,导致预后不佳[20]。本研究将急性穿支动脉闭塞性脑梗死与机器学习相联系,通过机器学习找到预测患者神经功能预后的可靠方法,对BAD患者早期采取更有针对性的临床干预提供了依据。

本研究存在一些局限性:①由于BAD相关脑梗死患者的分布广泛,其预后容易受到医疗水平等特定因素的影响,本文仅选取了单一机构的急性穿支动脉闭塞性脑梗死患者数据集,存在一定的局限性。②本研究未进行影像学指标预测,可能会影响预测模型的特异度。

综上所述,新的科技变革会促使更多的AI技术服务于医学。机器学习被用于医学领域是发展趋势,对医学的进步将产生巨大的影响。

参 考 文 献

[1] Saini V, Guada L, Yavagal D R. Global epidemiology of stroke and access to acute ischemic stroke interventions[J]. Neurology, 2021, 97(20 Suppl 2): S6-S16.

[2] Tu W J, Zhao Z, Yin P,et al. Estimated burden of stroke in China in 2020[J]. JAMA Netw Open, 2023, 6(3): e231455.

[3] 王陇德, 彭斌, 张鸿祺, 等. 《中国脑卒中防治报告2020》概要[J]. 中国脑血管病杂志, 2022, 19(2): 136-144.

Wang L D, Peng B, Zhang H Q, et al.Brief report on stroke prevention and treatment in China[J]. Chin J Cerebrovasc Dis,2022, 19(2): 136-144.

[4] Rost N S, Brodtmann A, Pase M P, et al. Post-stroke cognitive impairment and dementia[J]. Circ Res, 2022, 130(8): 1252-1271.

[5] 龚家俊, 王文敏. 急性脑卒中后脑心综合征的临床特点及其对患者预后的影响[J]. 新医学, 2021, 52(5): 371-375.

Gong J J, Wang W M. Clinical characteristics of cerebro-cardiac syndrome and its effect on clinical prognosis of patients with acute stroke[J]. J New Med, 2021, 52(5): 371-375.

[6] Luengo-Fernandez R, Violato M, Candio P, et al. Economic burden of stroke across Europe: a population-based cost analysis[J]. Eur Stroke J, 2020, 5(1): 17-25.

[7] Cieza A, Causey K, Kamenov K, et al. Global estimates of the need for rehabilitation based on the Global Burden of Disease study 2019: a systematic analysis for the Global Burden of Disease Study 2019[J]. Lancet Lond Engl, 2020, 396: 2006-2017.

[8] GBD 2015 Neurological Disorders Collaborator Group. Global, regional, and national burden of neurological disorders during 1990-2015: a systematic analysis for the Global Burden of Disease Study 2015[J]. Lancet Neurol. 2017, 16(11): 877-897.

[9] Tu W J, Wang L D, Special Writing Group of China Stroke Surveillance Report. China stroke surveillance report 2021[J]. Mil Med Res, 2023, 10(1): 33.

[10] Takahashi S, Kokudai Y, Kurokawa S, et al. Prognostic evaluation of branch atheromatous disease in the pons using carotid artery ultrasonography[J]. J Stroke Cerebrovasc Dis, 2020, 29(7): 104852.

[11] Deguchi I, Takahashi S. Pathophysiology and optimal treatment of intracranial branch atheromatous disease[J]. J Atheroscler Thromb, 2023, 30(7): 701-709.

[12] Nagasawa J, Suzuki K, Hanashiro S, et al. Association between middle cerebral artery morphology and branch atheromatous disease[J]. J Med Invest, 2023, 70(3.4): 411-414.

[13] Senda J, Ito K, Kotake T, et al. Investigation of inpatient convalescent rehabilitation outcomes in branch atheromatous disease[J]. J Stroke Cerebrovasc Dis, 2023, 32(3): 106937.

[14] Bonkhoff A K, Grefkes C. Precision medicine in stroke: towards personalized outcome predictions using artificial intelligence[J]. Brain, 2022, 145(2): 457-475.

[15] Sheth S A, Giancardo L, Colasurdo M, et al. Machine learning and acute stroke imaging[J]. J Neurointerv Surg, 2023, 15(2): 195-199.

[16] Bao H, Li J, Zhang B, et al. Integrated bioinformatics and machine-learning screening for immune-related genes in diagnosing non-alcoholic fatty liver disease with ischemic stroke and RRS1 pan-cancer analysis[J]. Front Immunol, 2023, 14: 1113634.

[17] Sirsat M S, Fermé E, C?mara J. Machine learning for brain stroke: a review[J]. J Stroke Cerebrovasc Dis, 2020, 29(10): 105162.

[18] Campagnini S, Arienti C, Patrini M, et al. Machine learning methods for functional recovery prediction and prognosis in post-stroke rehabilitation: a systematic review[J]. J Neuroeng Rehabil, 2022, 19(1): 54.

[19] Alaka S A, Menon B K, Brobbey A, et al. Functional outcome prediction in ischemic stroke: a comparison of machine learning algorithms and regression models[J]. Front Neurol, 2020, 11: 889.

[20] 陈娜, 杨海华, 吴海威, 等. 静脉溶栓治疗急性穿支动脉闭塞脑梗死的影响因素[J]. 河北医药, 2023, 45(14): 2100-2105.

Chen N, Yang H H, Wu H W, et al. Analysis of influencing factors for the therapeutic efficacy of intravenous thrombolysis on acute cerebral infarction caused by perforating artery occlusion and the prognosis[J]. Hebei Med J, 2023, 45(14): 2100-2105.

(收稿日期:2023-12-03)

(本文編辑:洪悦民)

猜你喜欢

预测模型机器学习脑梗死
64排CT在脑梗死早期诊断中的应用及影像学特征分析
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
基于IOWHA法的物流需求组合改善与预测模型构建
基于预测模型加扰动控制的最大功率点跟踪研究
脉血康胶囊治疗老年恢复期脑梗死30例
中西医结合治疗脑梗死43例