人工智能在脑卒中患者心房颤动预测中的应用
2019-11-05朱千里ZHUQianli
□ 朱千里 ZHU Qian-li
我国人口基数较大且结构不平衡,造成了社会医疗负担较重。如何运用有限的医疗资源满足庞大的患者群需求是现今医改的重点和难点。脑卒中是一种常见并具有较高致残率的疾病[1],主要病因分为脑血管源性和心源性[2],其中心源性多见于心房颤动患者[3]。针对不同病因脑卒中患者的治疗原则不同,脑血管源性脑卒中的病理生理机制为动脉粥样硬化,治疗以抗血小板为主[4];房颤致脑卒中的病理生理机制为左房血栓脱落致脑动脉栓塞,故治疗以抗凝为主[5]。如不加以区分地对患者进行随机治疗:对仅存在动脉粥样硬化的脑卒中患者进行联合抗凝治疗会增加出血等高危并发症;对房颤导致脑卒中的患者进行单纯抗血小板治疗则为无效治疗。因此,寻找一种有效、简易的方法来筛查、甄别伴发房颤的脑卒中患者至关重要。既往的研究对于脑卒中患者伴发房颤的筛查方法主要从提高敏感性出发,通过延长心电监测的时程来实现[6-8],但这些研究涉及的连续长达3 周至3 个月的心电监护在我国这种医疗资源稀缺的特殊环境下,临床实际应用价值较低,无法普及推广。本研究希望通过使用人工智能的手段,以心电监测结果为依据,观察人工神经网络在预测脑卒中患者合并房颤方面的效能。
资料与方法
1.一般资料。纳入标准:2013 年1 月至2018 年1 月期间于我院诊断为急性脑卒中并住院治疗患者,共669 例。排除标准:(1)脑卒中出现出血转化;(2)精神或意识障碍,无法配合;(3)因检查需要或其他原因导致心电监护暂停或取消;(4)死亡或自动出院病例;(5)已知既往房颤病史。最终收录651 例患者。
2.变量采集及临床事件定义
2.1 变量采集。通过检索文献归纳并收集11 个已证实与房颤发作相关的影响因素作为构建预测模型的变量[9-13],包括:他汀用药史、血管紧张素转换酶抑制剂(angiotensin converting enzyme inhibitors,ACEI)或血管紧张素受体抑制剂(angiotensin converting enzyme inhibitorstors,ARB)用药史、身体质量指数(Body mess index,BMI)、糖尿病病史(Diabetic melitous,DM)、高血压病史(Hypertension,HT)、年龄、性别、心脏射血分数(Ejection fraction,EF)、心脏左房内径(Left atrial diameter,LAD)、尿酸、脑钠肽(B-type Natriuretic Peptide,BNP)水平。
2.2 临床事件定义。急性缺血性梗死性脑卒中:突发的>24小时的局部神经功能缺失症状,与相应的大脑动脉堵塞相匹配和/或对应影像学上的脑梗死病灶。房颤事件:心电监护记录发作时间持续≥30 秒房颤心律。
3.构建Logistic 回归(Logistic Regression,LR)和人工神经网络(Artificial Neural Network,ANN)模型。
将入选患者根据公式RV.BERNOULLI (0.7) 随机分为训练集(70%)和验证集 (30%)。比较两个模型在验证集患者中并发房颤的预测作用。
3.1 构建Logistic回归模型。使用SPSS22 (SPSS Inc, Chicago,IL,USA) 构建Logistic 回归预测模型,设定脑卒中患者是否存在房颤心律为结局(无房颤事件编码为0;存在房颤事件编码为1),将收集的所有预测变量纳入模型,以“逐步前向法”进行推演运算。
3.2 构建人工神经网络模型。使用MATLAB(R2012b,64bit)软件进行人工神经网络模型建设,将所有的预测变量纳入模型输入层。对于为定量资料的预测变量,在输入层时进行标准化校正,转化为0 ~1,以增加模型的稳定性。模型采用反向误差回归算法,隐藏层神经节点设置由模型进行优化拟定(隐层节点范围1 ~50),输出层根据脑卒中患者是否存在房颤心律分为2 个结局(无房颤事件编码为0;存在房颤事件编码为1)。
3.3 两组模型对于预测效能的比较。分别绘制两组模型ROC曲线并比较AUC 面积,根据最优化原则判断约登指数,计算模型敏感性、特异性、似然比和一致率。人工神经网络模型生成预测变量对应的权重列表。
4.数据的处理与分析。数据统计运用SPSS22.0 软件处理,连续变量用均值±标准差表示,组间比较进行t 检验或Mann Whitney 非参数检验。分类变量使用频数和百分率描述,组间比较进行χ2检验。两组模型AUC 比较使用Z 检验。p<0.05 认为差异具有统计学意义。
结果
1.预测变量赋值。变量X1 ~X6 为连续变量,纳入模型时进行标准化校正,X7 ~X11 为分类变量,以“0”编码无变量事件,“1”编码存在变量事件(见表1)。
表1 训练集与验证集组间比较
2.训练集与验证集比较。本研究入选患者共651 名,随机分入训练集(n=455,69.9%)和验证集(n=196,30.1%),交叉熵错误0.031,两组患者变量间差异无统计学意义p>0.05。(见表2)。
表2 人工神经网络与Logistic 回归模型
3.人工神经网络构建。本研究人工神经网络预测模型分3层,包括1 个输入层、1 个隐藏层、1 个输出层。其中输入层包含11 个变量,隐藏层5 个神经节点,输出层2 个结局。敏感性为79%,特异性为93% (见表2),变量权重列表前四位为射血分数、尿酸、脑钠肽、左房内径(见图2)。
图1 两种预测模型ROC 曲线下面积
图2 ANN 模型输入层变量权重
4. Logistic 回归构建。Logistic 回归预测模型敏感性为65%,特异性为55%(见表2),Hosmer-Lemeshow 检验值为0.681。
5.模型间预测效能的比较。两种模型对脑卒中患者是否存在房颤心律的预测效能的比较(见表2),与LR 模型的AUC[0.612(95% CI0.594-0.706)]相比(见图1),人工神经网络模型AUC 较大[0.844(95%CI 0.768-0.921)],且差异有统计学意义(Z=3.863,p<0.05)。
讨论
人工神经网络是人工智能的一种常见算法,通过模拟人脑神经元的运行方式,使用多层前馈网络系统,以达到准确预测临床事件的目的[14]。由于人工神经网络可以将运算结果与设定的结局进行比对,将存在的差异反向导入运算层进行再次演算调整权重,故优势在于能够对临床上受大量复杂因素影响的事件进行精确预测,提高临床工作的效能[15]。
通过检索房颤相关的研究文献显示,有大量因素能够直接或间接引起或加重房颤的发生,包括:年龄、血压、心脏结构和功能、尿酸水平等[9-11]。这些因素在不同的患者个体上会有不同的组合方式[12-13],随着预测因素和患者群体数量的增加,这些组合方式将呈指数级上升,所以很难通过临床经验、简单公式或评分系统对结局进行有效的分类预测。这也是本研究选择人工神经网络来构建这类复杂多变的预测模型的原因。其中考虑到脑卒中急性期甲状腺功能会产生相应变化无法反映其与房颤的真实联系[16];脑卒中头颅CT 梗死灶的位点与房颤相关性仍存在较大争议且急性期头颅CT 往往采集于24 小时内无法充分反映病程等的客观现状[17-18],本研究未将甲功和CT 检查等纳入做预测变量。
本研究对脑卒中患者是否合并房颤的预测模型效能通过构建两种不同模型进行比较。Logistic 回归模型的Hosmer-Lemeshow 检验值为0.681,提示LR 模型已充分应用了本研究所涵盖的变量资料进行演算。研究结果显示,LR 模型的预测一致率为59.4%,敏感性、特异性分别为65%和55%,提示模型对于房颤事件的预测效果不佳。如使用LR 模型对脑卒中患者进行房颤的预测将会造成部分患者的漏诊,从而引起严重的临床后果。相对而言,人工神经网络的预测模型的敏感性较高(79%),而特异性更是达到了93%。高特异性可以让医务人员在对脑卒中患者进行抗凝治疗时最大限度地做到有的放矢。86.7%的一致率也提示人工神经网络可以对近9 成的脑卒中合并房颤患者进行预测。因此,在针对急性梗死性脑卒中患者的诊治环节中,通过应用本研究模型可以对不同病因进行鉴别诊断。急性梗死性脑卒中患者的抗血小板治疗无法预防合并房颤患者的脑卒中再发。通过本研究模型预测的合并房颤的脑卒中患者进行相应的抗凝治疗可以改善预后。
在模型构建过程中,预测变量将会被赋予不同的权重,本研究构建的人工网络模型显示,在对脑卒中患者合并房颤事件的预测上,权重较大的前4 项变量为射血分数、尿酸、脑钠肽水平和左房内径。故医务人员在脑卒中患者的临床诊治过程中,需要更加关注这些类别的指标参数,在不同的患者个体上,当无法进行全面评估时,可以优先以这几类参数为依据进行临床决策和资源配置。
本研究采用临床中常见的指标和参数,作为预测变量进行模型构建,具有良好的可操作性和推广价值。研究结果显示,人工神经网络可以有效地预测脑卒中患者合并房颤事件的发生。通过对合并房颤的预测,可以指导临床相应治疗的进行,改善患者的预后。