基于机器学习的前交通动脉瘤破裂预测模型的构建
2021-05-20孙成建张照龙谢宜兴刘国平赵晓龙邵黎明王振光
张 岩, 孙成建, 张照龙, 谢宜兴, 徐 锐, 刘国平, 赵晓龙, 邵黎明, 王振光
颅内动脉瘤的发病率为1%~2%,破裂后引起的蛛网膜下腔出血(SAH)占非创伤性SAH 的80%~85%[1]、破裂后所致死亡占了脑血管病死亡的22%~25%[2]。在颅内动脉瘤中,前交通动脉瘤占到了30%~35%[3]。 随着影像技术的发展与人们对健康的愈益关注,颅内动脉瘤临床检出率也越来越高。当发现未破裂颅内动脉瘤时, 往往需要权衡动脉瘤短期和长期破裂的风险以及手术自身相关的风险。PHASES 评分作为目前常用的判断颅内动脉瘤破裂风险的工具[4],提出了将年龄、高血压、SAH 病史、动脉瘤大小、动脉瘤位置以及地理区域作为判断动脉瘤破裂风险的指标。 而具体到前交通动脉瘤,据文献报道,其破裂的危险因素包括动脉瘤的大小、形态、A1 优势、患者的年龄、病史等[5]。 机器学习作为近些年兴起的前交通动脉瘤破裂风险的预测模型建立方法,受到越来越多的关注。其中分类树及随机森林作为有监督机器学习中的一部分,是非常强大的方法,特别是在分类问题中。
1 材料与方法
1.1 材料
研究对象为经青岛大学附属医院临床科研大数据平台检索出的于2012 年12 月至2020 年4 月期间住院的前交通动脉瘤患者,共检索出452 例患者。 患者因SAH、脑血管疾病、健康查体等原因在我院行脑血管CT 血管造影(CTA)检查,并诊断为前交通动脉瘤。 381 例前交通动脉瘤患者符合纳入标准。 其中破裂引起SAH 患者244 例,未破裂前交通动脉瘤患者137 例。患者中男209 例,女172 例。破裂组平均年龄为(57.1±10.2)岁,未破裂组为(60.4±10.0)岁。
纳入标准:①因各种原因于我院行脑血管CTA检查,并诊断为前交通动脉瘤。 ②有详细的临床资料与影像学资料。 排除标准:①梭形动脉瘤、夹层动脉瘤、血管畸形患者。 ②患者及家属不能配合完成研究。 ③患者因外伤或其他因素导致的前交通动脉瘤。 ④患者临床资料或影像学资料不全。
1.2 方法
1.2.1 资料收集 有关患者的年龄、性别、病史及头颈部CTA 图像均从医渡云配合病历系统检索及测量。根据既往文献研究[6],收集患者的年龄、性别、吸烟史、 高血压病史、SAH 病史, 并分别测量患者CTA 图像中前交通动脉瘤的高度、瘤颈宽度、是否有A1 优势、动脉瘤是否规则、动脉瘤朝向,将以上特征纳入预测模型。 A1 优势定义为一侧A1 段明显增粗, 对侧A1 段未显影或直径小于优势侧二分之一。 动脉瘤朝向为从CTA 矢状位,以枕骨粗隆上缘与眉弓上缘连线为标准,根据动脉瘤瘤顶朝向分为前上、前下、后上及后下。 动脉瘤不规则定义为动脉瘤表面不光滑,有子囊、分叶或凸起。
1.2.2 数据处理及分析 采用R 软件(3.6.3 版本)对数据进行处理及分析。 正态分布的计量资料组间比较采用独立样本t检验, 计数资料的组间比较采用χ2检验;后选用机器学习中的决策树及随机森林方法建立预测模型, 预测指标为动脉瘤的破裂与否,模型样本量符合每个变量的事件数(EPV)原则。得出模型后在测试集中计算预测模型的准确度、灵敏度及特异度,并绘制受试者工作特征(ROC)曲线。以P<0.05 为具有统计学意义。
破裂组与未破裂组的年龄、动脉瘤高度、瘤颈宽度、动脉瘤不规则及A1 优势这些特征,差异有统计学意义(P<0.05),而性别、吸烟史、高血压史、动脉瘤朝向、SAH 病史这些特征之间的差异并无统计学意义。 表1。
2 结果
2.1 决策树预测模型建立及评价
将数据集以有放回的随机抽样方法即自助法,按照7∶3 比例分为训练集及测试集。 训练集273 例患者,其中动脉瘤破裂患者179 例;测试集108 例患者,其中动脉瘤破裂患者65 例。 在训练集中,用分类回归树(CART)的方法进行模型建立。 生成分类树后, 继续在训练集中利用10 折交叉验证的方法,得到标准差最小的树的分裂次数,从而对决策树模型进行剪枝,最终得到分裂次数为7 的决策树模型。如图1 所示可以看到,在训练集得出的决策树模型中,动脉瘤不规则、动脉瘤高度、瘤颈宽度及年龄是参与决策树分裂的较早的节点特征,其中动脉瘤高度以5.54 mm 作为最佳切分点, 动脉瘤颈宽度以3.59 mm 作为最佳切分点。 将该模型应用于测试集后,ROC 中曲线下面积(AUC)为0.737(95%CI: 0.637~0.837);最佳截断值为0.500(图2)。在该截断值下,模型的预测准确率为73.15%,灵敏度为0.831,特异度为0.581,一致性检验(kappa)值为0.424。
表1 破裂动脉瘤与未破裂动脉瘤特征对比
图1 决策树预测模型
图2 预测模型ROC 曲线
图3 特征重要性排序
2.2 随机森林预测模型建立及评价
随机森林是指多次随机抽取数据, 生成许多决策树,之后将这些树得出的结果结合起来,理论上可以防止模型过度拟合。 训练集及测试集分类方法同上。 将基尼指数的改善作为特征重要程度的评价标准, 对随机森林中变量重要性进行排序,如图3 所示,前3 位分别是动脉瘤的高度、动脉瘤颈宽度以及年龄,较单个分类树模型有所区别。 在树的规模为219 时,整体误差率最小,模型达到最优。 将该模型应用于测试集,ROC 中AUC 为0.675(95%CI:0.569~0.7806);最佳截断值为0.521(图2)。在该截断值下,模型的预测准确率为68.52%,灵敏度为0.800,特异度为0.512,kappa 值为0.322。准确率及ROC AUC 较决策树无明显改善。
2.3 Xgboost 梯度提升
由于分类树及随机森林模型效果不甚理想,故选用Xgboost()方法改善模型效果。 Xgboost 同随机森林类似,亦是一种集成树模型,但是由于其算法的优势,往往经过参数的调优后得到更为理想的模型,广泛应用于模型的优化提升。 利用网格搜索的方法,建立了一个具有36 个模型的网格,参数范围如下:最大迭代次数为75、219;学习率为0.01、0.1、0.3;gamma 值为0.5、0.25;单个树的最大深度为2、3、4。 利用5 折交叉验证方法调优各个超参数,得出最优模型,其参数如下:最大迭代次数为为219;学习率为0.1;gamma 值为0.5;单个树的最大深度为4。 最终ROC 中Auc 为0.758(95%CI:0.6569~0.8587);最佳截断值为0.545(图2)。 在该截断值下,模型的预测准确率为77.78%,灵敏度为0.893,特异度为0.605,kappa 值为0.518,均较前改善。
考虑到本研究仍为一个相对较小样本研究,当数据量较小时,训练集与测试集的划分对模型效能的影响较大, 故采用3 折交叉验证训练的方法,利用Xgboost 梯度提升训练模型,并分别在不同的测试集中进行验证。 如图4 所示,在测试集1 中,ROC 中AUC 为0.848(95%CI:0.7759~0.9197);在测试集2中,ROC 中AUC 为0.797(95%CI:0.7171~0.8768;在测试集3 中,ROC 中AUC 为0.858(95%CI:0.7847~0.9306),均表现出了较好的模型效能。
图4 不同测试集ROC 曲线
3 讨论
Greving 等[4]前瞻性队列研究的结果中发现,颅内动脉瘤5 年的破裂风险随PHASES 评分分值的增高而增加。 其中PHASES 评分主要包括以下6 个因素:年龄、高血压、SAH 史、动脉瘤大小、动脉瘤位置和地理区域。 前交通动脉瘤作为颅内动脉瘤中发生率最高的动脉瘤,专注于其破裂风险预测模型的研究相对较少。 本研究中,按照预测模型判断动脉瘤破裂与否的特征重要性进行排序, 动脉瘤深度,动脉瘤宽度,年龄,动脉瘤不规则,A1 优势征以及是较为重要的分类特征,而性别、吸烟史、动脉瘤朝向对结果影响相对较小。 这也与一些国内外的既往研究相符。
3.1 动脉瘤高度及动脉瘤瘤颈宽度的影响
有研究表明, 动脉瘤的破裂风险随着动脉瘤大小的增加而增加[7]。 本模型中,动脉瘤深度达到5.54 mm 时, 是预测前交通动脉瘤破裂与否的一个重要切分点。 在随机森林中根据基尼指数改善而得到的特征重要性排序中,动脉瘤高度亦是最重要的分类特征。 国外的一项基于ISUIA 数据库进行的研究中,在进行多因素回归分析后,动脉瘤的高度是唯一的独立危险因素[8]。 此外,在本模型中,动脉瘤瘤颈宽度的切分点为3.585 mm,而破裂组的瘤颈宽度要小于未破裂组,差异有统计学意义。 有研究认为,较小的瘤颈宽度会导致动脉瘤内的壁切应力改变,引起动脉瘤壁重建,从而增加破裂的风险[9]。
3.2 动脉瘤不规则的作用
有多个叶、子囊或其他类型的壁突的动脉瘤定义为不规则动脉瘤[10]。 本研究中的决策树模型中,动脉瘤不规则是最早参与决策树分裂的预测特征。瘤腔不规则增加破裂风险的机制可能与不规则瘤腔附近出现的高剪切应力值有关[11]。 一项关于前交通动脉瘤破裂的形态学特征的研究指出,不规则的动脉瘤是动脉瘤破裂的独立危险因素[10]。 日本一项大型的关于动脉瘤自然病程的研究中表明,有子囊的动脉瘤更容易破裂(危险比1.63)[7]。 国外的另一项研究也表明,前交通动脉瘤出现瘤泡与前交通动脉瘤破裂显著相关(OR∶22)[12]。 本研究与其得出的结论相符。
3.3 A1 优势征
A1 优势定义为一侧A1 段明显增粗, 对侧A1段未显影或直径小于优势侧二分之一。 一项关于前交通小动脉瘤的研究中指出,A1 优势征与动脉瘤破裂相关[13]。 有研究对A1 段的发育异常与前交通动脉瘤的形成及破裂的关系进行了血流动力学的三维数值模拟。 A1 段的发育异常会导致壁切应力的变化及湍流形成, 从而影响动脉瘤的形成与破裂[14]。本研究中, 破裂组与未破裂组的A1 优势征有显著差异,但依照基尼指数改善对特征排序,其重要性相对前述特征略低。
3.4 血流动力学参数
随着血流动力学的研究深入,许多血流动力学参数也被证明与前交通动脉瘤的破裂相关。 采用计算流体力学(CFD)对动脉瘤血流动力学参数进行计算是目前应用较多的一种研究方法。 壁应切力(WSS)是研究比较多的一种参数。 但是研究结果存在一定争议。Detmer 等[15]对大量的动脉瘤患者的血流动力学进行了研究, 结果表明, 破裂动脉瘤的WSS 明显较低,这与以前的研究一致。 有研究表明,较低的WSS 可能会引起内皮细胞的凋亡,从而导致血管壁变化,这可能是低WSS 与动脉瘤破裂相关的机制[16]。 但Zhang 等[17]的研究表明,WSS 幅值高于12.3 达因/ cm2时, 载瘤动脉中的WSS 可能是预测动脉瘤破裂状态的可靠血流动力学参数之一。 分析表明,每增加一单位WSS,前交通动脉瘤破裂的风险也会增加6.2 倍。 本研究受限于纳入的病例影像资料为CTA,显示动脉瘤形态欠佳,采用CFD计算动脉瘤的血流动力学参数误差较大。 根据相关研究[14],本文纳入了动脉瘤朝向和大脑前动脉A1优势征这两种与血流动力学表现密切相关的因素进行了分析。
3.5 年龄因素
年龄对动脉瘤破裂的影响目前尚有争议。 既往有研究表明,高龄(尤其是超过60 岁)是颅内动脉瘤破裂的重要的危险因素[18]。 但也有对前交通动脉瘤研究得出的结果中, 动脉瘤破裂的患者更加年轻[12]。 此外,国外的一项研究认为,随着年龄的增长,前交通动脉瘤的大小可能保持稳定,年轻患者和老年患者的破裂风险相似的。 在本研究中,破裂组的患者明显要比未破裂组更加年轻(P=0.003)。参考本研究的结果,当我们面对年轻的未破裂前交通动脉瘤患者时,可能需要更加积极的干预[16]。
机器学习正在越来越多被人们应用到预测模型的建立。 有学者应用两层的前馈人工神经网络对前交通动脉瘤的破裂风险进行预测,结果较为理想[19]。 在近期的另一项研究中,支持向量机、随机森林以及多层感知器亦应用在动脉瘤的破裂风险预测中[20]。 作为机器学习中的一员,分类树较为简洁易懂,而且对分类问题上有其独到的优势。 目前国内外的研究中,最常用的是logistic 回归[21]。 logistic 回归在线性关系的数据处理中有优势,而面对非线性问题时, 机器学习的方法可能更加适合; 而且logistic 容易多重共线性,通常需要正则化,这些恰恰是决策树的强项;此外,决策树还能更加便捷的得出预测因子的最佳切分点,这也是相对于logistic回归的一项优势。在本研究中,选用了决策树、随机森林来建立预测模型, 并应用xgboost 梯度提升建立了更加优化的模型,得到了较为理想的结果。
本研究存在一定的局限性。 首先,本研究是一项回顾性研究,而不是一项前瞻性的关于前交通动脉瘤自然病程的研究,所以可能不能完全代表前交通动脉瘤破裂的真实风险。 其次,使用该模型评估未来动脉瘤破裂的风险是基于这样的假设,即具有高破裂风险的动脉瘤与那些已经破裂的动脉瘤相似。 当输入数据后,该数据进入预测模型并被分类为破裂组,便可认为其破裂可能性大。 该模型主要用于预测动脉瘤短期破裂可能性,从而帮助临床医师制订治疗方案。 另外,本研究是单中心研究,缺乏外部验证,这可能会提高模型的置信水平,因此模型的泛化能力有待进一步论证。
应用机器学习中的决策树、随机森林、梯度提升方法建立模型,能较好地进行前交通动脉瘤的破裂预测, 其中梯度提升方法所建立的模型效能更优。 本研究在进行未破裂前交通动脉瘤的治疗决策方面,具有一定的临床应用价值。