APP下载

3种机器学习算法评估脑梗死患者颈动脉斑块稳定性的效能比较

2023-12-19湛先发余小亚王洪军熊坤林

实用临床医药杂志 2023年22期
关键词:内出血脂质颈动脉

湛先发, 余小亚, 王洪军, 熊坤林

(重庆市丰都县人民医院, 1. 放射科, 2. 神经内科, 重庆, 408200;3. 陆军特色医学中心 放射科, 重庆, 400042)

脑梗死又称缺血性脑卒中,是脑组织缺血、缺氧所致坏死或软化的脑血管疾病。近年来,流行病学研究[1]表明脑梗死发病率、致残率和再发生率持续升高,极大影响了患者的生活质量。颈动脉是向脑组织供血的主干血管,其分叉处极易形成动脉斑块,而颈部不稳定的斑块脱落可增加脑梗死事件的发生风险[2]。因此,分析研究颈动脉斑块的性质对于预测脑梗死的发生具有重要意义。随着医疗卫生信息化建设的迅猛发展,机器学习算法在医疗领取中得到了广泛应用。既往有学者使用机器学习算法辅助脑梗死的诊断[3], 预测脑梗死发病的风险[4], 以及评估脑梗死的预后[5]。但应用机器学习算法评估脑梗死患者颈动脉斑块稳定性的研究仍较少。鉴于此,本研究基于列线图、决策树和随机森林共3种机器学习算法,建立脑梗死患者颈动脉斑块稳定性的判别模型,以期为临床识别高风险人群、改善脑梗死患者预后提供依据。

1 资料与方法

1.1 一般资料

回顾性收集2017年1月—2023年6月在神经内科住院的脑梗死患者临床资料。纳入标准: ① 符合《中国急性缺血性脑卒中诊治指南2018》[6]相关诊断标准,且经头颅CT或磁共振检查确诊前循环系统脑梗死,同时急性卒中治疗低分子肝素试验(TOAST)分型为大动脉粥样硬化型者; ② 年龄18~90周岁者; ③ 住院期间完善颈动脉多层螺旋CT血管成像(MSCTA)检查者。排除标准: ① 合并有恶性肿瘤者; ② 合并免疫系统疾病者; ③ 合并严重肝、肾疾病者; ④ 相关资料缺失超过20%者。本研究已通过医院伦理审核。

1.2 方法

1.2.1 数据采集: 从电子病例系统提取研究对象的首页个人信息和诊断信息、颈动脉血管成像检查结果及住院期间相关实验室检查资料。提取患者的个人信息,包括性别、年龄、基础病(糖尿病、高血压、冠心病)、吸烟史、饮酒史等; 相关实验室检查资料包括血小板与淋巴细胞比值(PLR)、中性粒细胞与淋巴细胞比值(NLR)、白细胞计数(WBC)、红细胞分布宽度(RDW)、肌酐(CREA)、尿酸(UA)、总胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白胆固醇与高密度脂蛋白胆固醇比值(LDL-C/HDL-C)、同型半胱氨酸(Hcy)、D-二聚体(D-D); 影像学检查资料(MSCTA检查结果)包括斑块总面积、钙化面积、斑块内出血面积、脂质坏死核面积等。

1.2.2 MSCTA检查: 采用Siemens Healthineers, Magnetom Amira. 128层螺旋CT检查,扫描前固定患者头部。扫描参数: 管电压120 kV, 序列4 mm×0.75 mm, 管电流200 mA, 螺距1.15, 重组间隔0.7 mm, 矩阵512×512; 肘静脉注射75~90 mL碘帕醇(370 mgI/mL)造影剂,速率3.5~4.5 mL/s, 范围为主动脉弓部到颅底交通动脉环。采用示踪技术,智能触发,主动脉弓部为阈值监测点, 120 HU, 延迟5 s启动。使用CT工作站上的斑块分析软件(syngo.via)自动测量斑块的总面积、钙化面积、斑块内出血面积、脂质坏死核面积,单位以mm2表示。

1.2.3 相关变量界定: 糖尿病诊断参照《中国2型糖尿病防治指南(2020年版)》[7]; 高血压诊断参照《中国高血压防治指南(2018年修订版)》[8]; 冠心病诊断参照《稳定性冠心病诊断与治疗指南》[9]; 吸烟史指过去有持续或累计长达半年以上的吸烟行为; 饮酒史指过去持续或累计长达半年及以上每周有饮用酒精类饮料1次的行为; MSCTA斑块稳定性判断[10]: 对斑块密度的CT值进行测量,根据斑块的稳定性,将其分为稳定斑块(钙化斑块)和不稳定斑块(软斑块、混合斑块)。软斑块: 以脂质为主要成分, CT值<50 HU; 混合斑块: 同时存在多种成分, CT值50~120 HU; 钙化斑块: 以钙化为主, CT值>120 HU。

1.3 统计学分析

采用SPSS 23.0统计学软件进行数据处理。符合正态分布的计量资料以均值±标准差描述,采用独立样本t检验; 计数资料以[n(%)]描述,采用χ2检验进行分析。使用单因素分析对可能与颈动脉斑块稳定性相关的因素进行筛选,对筛选后的变量进行多因素Logistic回归分析,确定影响颈动脉斑块稳定性的危险因素。用R 4.1.3软件将数据按照7∶3的比例随机分成训练集和测试集,并使用不同的程序包构建3种不同的预测模型,其中列线图用“rms”包,决策树用“rpart”包,随机森林用“random Forest”包[11]。最后通过计算灵敏度、特异度、精确率、召回率、正确率以及受试者工作特征(ROC)曲线的曲线下面积(AUC)等指标比较3种模型的预测效果,以评选出预测效果最优的模型。AUC的比较采用Delong检验。P<0.05为差异具有统计学意义。

2 结 果

2.1 基线信息

本研究共纳入500例脑梗死患者,其中男294例,女206例; 颈动脉斑块稳定206例(稳定组),平均年龄(65.2±7.1)岁; 不稳定294例(不稳定组),平均年龄(66.7±8.4)岁。单因素分析结果显示,稳定组和不稳定组的年龄、糖尿病、Hcy、LDL-C/HDL-C、钙化面积、斑块内出血面积、脂质坏死核面积比较,差异均有统计学意义(P<0.05), 见表1。

2.2 特征选取结果

以单因素分析差异有统计学意义的指标,包括年龄、糖尿病、Hcy、LDL-C/HDL-C、钙化面积、斑块内出血面积、脂质坏死核面积为自变量,以颈动脉斑块的性质为因变量(稳定=0, 不稳定=1), 分类变量赋值[糖尿病(无=0, 有=1)], 连续变量原值录入,进行二分类Logistic回归分析。结果显示,糖尿病、LDL-C/HDL-C、钙化面积、斑块内出血面积、脂质坏死核面积是脑梗死患者颈动脉斑块稳定性的影响因素(P<0.05), 见表2。

表2 颈动脉斑块稳定性的多因素Logistic回归分析

2.3 列线图模型

基于多因素Logistic回归分析结果,本研究纳入糖尿病、LDL-C/HDL-C、钙化面积、斑块内出血面积和脂质坏死核面积共5个特征变量作为预测因子,构建预测脑梗死患者颈动脉斑块稳定性的列线图模型,见图1。

2.4 决策树模型

本研究构建出一个包含3个特征、9个节点、深度为4的预测脑梗死患者颈动脉斑块稳定性的决策树模型。“3个特征”分别为斑块内出血面积、脂质坏死核面积、糖尿病。其中,斑块内出血面积是脑梗死患者颈动脉斑块稳定性的首层影响因素,当斑块内出血面积≥2.3 mm2时,脑梗死患者发生非稳定性动脉斑块的风险为43%。深度为4表明预测脑梗死患者颈动脉斑块稳定性至多需要4个步骤,见图2。

2.5 随机森林模型

将糖尿病、LDL-C/HDL-C、钙化面积、斑块内出血面积和脂质坏死核面积指标全部纳入随机森林模型,当ntree=500, mtry=4时,模型误差率的变动幅度开始减小且趋于平稳,模型达到最优。变量输出重要性测度结果显示,变量重要性评分从高到低的影响因素依次为斑块内出血面积、脂质坏死核面积、钙化面积、LDL-C/HDL-C、糖尿病,见图3。

2.6 3种模型性能评价和比较

3种模型效能评价结果显示,在训练集数据中,随机森林评估脑梗死患者颈动脉斑块稳定性的整体效能均优于列线图模型、决策树,其灵敏度为0.972, 特异度为0.995, 精确率为0.993, 召回率为0.972, 正确率为0.986,AUC为0.984。其中训练集中随机森林模型AUC大于决策树,差异有统计学意义(Z=-3.141,P=0.002), 见表3和图4。在测试集中,列线图模型AUC大于决策树模型(Z=2.017,P=0.045), 而随机森林模型与列线图的AUC大小相当,见表4、图5和表5。

表3 3种模型预测训练集脑梗死患者颈动脉斑块稳定性的效能

表4 3种模型预测测试集脑梗死患者颈动脉斑块稳定性的效能

表5 3种模型预测脑梗死患者颈动脉斑块稳定性的AUC比较

3 讨 论

脑卒中具有较高的发病率、病死率和致残率,是全世界成人死亡和致残的主要原因[12]。脑梗死占中国脑卒中患者总数的80%[13], 是最常见的卒中类型,其中颈动脉狭窄和颈动脉粥样硬化斑块是脑卒中发展的重要病理基础。脑梗死的发生与颈动脉斑块稳定性密切相关。动脉粥样硬化斑块可分为稳定斑块和不稳定斑块(易损斑块),不稳定斑块破裂容易诱发血栓栓塞,导致脑梗死[13]。因此,准确判断颈动脉斑块稳定性,并实施针对性的干预,是预防脑梗死事件发生的关键。

本研究数据分析提示,脂质坏死核面积、斑块内出血面积、钙化面积是脑梗死患者颈动脉斑块稳定性的影响因素。随着现代医学影像技术的蓬勃发展及诊断水平的提高,脑卒中早期诊断率显著上升, MSCTA是目前临床上颈动脉影像学检查的重要手段之一。MSCTA的空间分辨率高,成像速度快,适用患者范围更广,检查费用低,选择其来评估颈动脉斑块的性质有明显优势[14]。研究[15-16]表明, MSCTA不仅可以评估颈动脉狭窄,还可识别易损斑块的高危征象,如富含脂质的坏死核心、斑块内出血和纤维帽等。脂质核坏死面积对斑块的稳定性有较大的影响,文献[17]报道,脂质核面积占斑块比例>40%时,易引起斑块破裂。斑块内出血被公认为是易损斑块的重要特征,与斑块的稳定性密切相关,斑块内出血可促进脂质核心的形成,进一步增加斑块的不稳定性[18]。在病理形态上,易损斑块除了形成较大的脂质核和斑块内出血外,还有纤维帽的破裂和钙化灶的形成[19]。斑块内的钙化对于斑块易损性的贡献目前还存在争议。学者[20]指出,斑块表面钙化容易导致斑块的破损和出血,是不稳定斑块形成的重要因素。也有学者[21]认为,斑块内相比于大片状钙化灶,小钙化灶周围更容易发生炎症和血栓,不利于斑块稳定。本研究结果表明,斑块内小钙化面积与不稳定斑块形成风险显著相关。研究[22]显示,CT发现的非钙化斑与美国心脏协会(AHA)基于MRI定义的Ⅵ型斑块(复杂高危斑块)存在高度一致性,即MRI定义的高风险成分在CT中则大多以非钙化斑块的形式呈现。斑块内钙化区有大量的钙盐沉积及纤维成分增加,可以促进斑块的机械稳定性增加,防止斑块破裂,是稳定性斑块的重要标志[23]。

此外,本研究还发现, LDL-C/HDL-C、糖尿病也是影响颈动脉斑块稳定性的重要因素。血浆中LDL-C水平升高是预测脑梗死发病的重要传统危险因素之一[24]。LDL-C氧化后形成的氧化型低密度脂蛋白(ox-LDL)是斑块形成并趋于不稳定的关键成分,其可通过抑制内皮一氧化氮合酶的表达,加重细胞内皮功能障碍,促进动脉粥样硬化稳定性斑块的形成[25]。研究[26]指出,相对于单纯的LDL-C,评估LDL-C/HDL-C更能有效预测颈动脉不稳定性斑块的风险,以上研究均与本研究结果相近。脂质代谢异常引起的血管内皮炎症是能降低斑块稳定性的重要机制, LDL-C可以促进动脉血管壁胆固醇的内流及沉积,并增加血管内膜的氧化敏感性,进而促进动脉不稳定斑块形成[27], HDL-C则通过保护内皮血管和逆转胆固醇转运,发挥抗动脉粥样硬化的作用[28]。本研究证实,糖尿病是评估脑梗死患者颈动脉斑块稳定性的影响因素,其既是颈动脉斑块形成的危险因素,也是影响其稳定性的重要因素。炎症反应是促使斑块发生发展和破裂的重要机制,在糖尿病患者群体中,颈动脉斑块的检出率可高达90%[29]。在长期的高血糖刺激下,患者斑块内的炎性反应增加,并使斑块的表面张力增加,导致斑块表面稳定性下降而趋于破裂[30]。临床上可以考虑通过评估斑块脂质坏死核面积、斑块内出血面积、钙化面积、LDL-C/HDL-C、糖尿病等因素对脑梗死患者颈动脉斑块的稳定性进行判断,以指导医护人员对患者进行提前干预治疗。

颈动脉不稳定斑块的形成与发展是由多种因素共同作用的结果。随着大数据时代的到来和算法的更新,海量数据和机器学习算法的发展可为颈动脉不稳定斑块的评估提供新技术[31-32]。机器学习算法擅长探索多维数据中的复杂关系,可从大量数据中提取隐藏的有效信息,为疾病的预测和诊断提供准确的参考[33]。本研究基于上述5项危险因素,运用机器学习算法建立了评估急性脑梗死患者颈动脉斑块稳定性的3种预测模型。随机森林具有随机化特征,对线性和非线性数据均能进行分类,并且不限制预测变量的数量,适用性较广,但在处理噪声较大的数据集时容易出现过拟合的情况[34]。本研究中通过适当增加数据集的大小来减少随机森林模型过拟合的情况。经验证,在训练集数据中随机森林评估颈动脉斑块稳定性的效能(AUC为0.984, 灵敏度为0.972, 特异度为0.995, 精确率为0.993, 召回率为0.972和正确率为0.986)优于列线图和决策树。目前,列线图预测疾病的使用频率很高,但预测能力不如随机森林,且无法对5项因子的重要特征进行排序,存在无法过滤特征、对多个协方差数据更敏感、难以处理不平衡数据的缺点[35]。随机森林是一种基于多个决策树的集成模型,通过投票或平均的方式得出更准确的预测结果。相比之下,单个决策树的预测受到噪声和异常值的影响,因此预测能力略低于随机森林。

综上所述,基于随机森林算法建立的模型在评估脑梗死患者颈动脉斑块稳定性中具有较好的预测效果和稳定性,其预测效能优于列线图和决策树,本研究结果有利于颈动脉不稳定斑块的风险评估。本研究处于初次探索阶段,仍存在许多不足: 本研究为回顾性研究,部分临床资料不全的患者被排除,可能存在选择偏倚和信息偏倚; 本研究为单中心研究,缺乏外部验证,尚需在不同人群中加以验证。

猜你喜欢

内出血脂质颈动脉
颅脑超声在诊断新生儿脑室周围-脑室内出血的临床应用价值
复方一枝蒿提取物固体脂质纳米粒的制备
白杨素固体脂质纳米粒的制备及其药动学行为
马钱子碱固体脂质纳米粒在小鼠体内的组织分布
新生儿脑室内出血的声像图特征分析
扭伤后赶紧这样处理
三维超声在颈动脉内膜剥脱术前的应用价值
脑微出血与颈动脉狭窄的相关性分析
3D MRI可检测糖尿病患者脑卒中风险
颈动脉内膜剥脱术治疗颈动脉狭窄的临床研究