体育锻炼与缺血性卒中复发风险存在因果关系:基于潜在结果理论
2021-09-10林奕蝶张柏杨胡美婧徐铭涵秦成洁朱彩蓉
林奕蝶,张柏杨,胡美婧,徐铭涵,秦成洁,朱彩蓉
四川大学华西公共卫生学院//四川大学华西第四医院流行病与卫生统计学系,四川 成都610041
《中国脑卒中防治报告2018》[1]显示,我国现存40岁及以上脑卒中患者约1242万,其中缺血性脑卒中患者约占70%。美国一项调查[2]显示近25%卒中幸存者经历过复发,且卒中复发患者的死亡率与残疾率均更高[2,3]。研究提示我国首发缺血性卒中患者出院后1年的复发率约15%[4,5]。随着我国卒中发病趋势的不断上升和死亡趋势的减缓[1],预防卒中复发已成为减轻卒中疾病负担的关键。除了药物治疗外,脑卒中二级预防指南[6]中指出改变行为生活方式也是预防卒中复发的重要途径。
已有较多研究证实体育锻炼可以改善卒中患者的心肺适应性、运动功能和肌肉力量[7,8]。基于体育锻炼与卒中患者生理功能的关联,大部分研究者提出体育锻炼可能是预防卒中复发的良好手段[8-11]。Saunders等[12]综合评价了75项卒中后体育锻炼相关的临床试验研究,没有发现体育锻炼对预防卒中幸存者死亡和复发的直接效应。由于该研究中纳入的临床试验对体育锻炼的定义有差别,而且随访时间不一,可能会产生一定的偏倚。
以上研究结论均基于体育锻炼对卒中风险替代指标的作用而提出,且以回顾性研究为主,这类研究常采用患者卒中前的体育锻炼指标,没有考虑卒中后体育锻炼对卒中复发的影响。相关的前瞻性研究随访时间较短[13]或者卒中复发事件较少[14],因此较难观察到体育锻炼的长期作用。
现有研究从研究设计和混杂控制的角度,难以得出体育锻炼对卒中复发的因果效应。关联性研究的结果本身是不完全确定与归纳法的产物,相关或危险因素可能是疾病的病因,也可能是无关变量。随着因果推断方法学的发展,越来越多的流行病学问题更关注暴露因素与结局之间的因果关系。因此,本研究将基于以脑卒中复发为临床终点的前瞻性研究数据,采用因果推断中的潜在结果理论和多重插补法探索体育锻炼与卒中复发的因果关系。
1 资料和方法
1.1 研究对象
本研究以2010年7月~2018年12月期间入住四川大学华西医院的首发缺血性脑卒中患者为研究对象。纳入标准[15]:首次确诊为缺血性脑卒中;病情稳定;患者愿意参加,依从性好;随访时间满1年且具有独立行动能力。排除标准:未取得患者的知情同意或拒绝参加;因外科手术或心脑血管手术如颈动脉内膜切除术、血管造影术或心脏手术而诱发卒中的患者;严重的疾病状态;随访时间不满1年或1年内死亡;因残疾或疾病无法独立行走。本研究共纳入636例随访时间满1年且具有行动能力的首发缺血性脑卒中幸存者。
资料收集分为基线调查和随访调查两部分。基线调查采用现场问卷调查与患者病历查阅的方式,调查内容包括患者的人口学特征信息、行为生活方式、临床检验指标、合并疾病及用药史等;随访调查采用1次/3月的电话随访,调查内容包括患者行为生活方式、健康状况、用药情况、并发症及生命质量情况等。
1.2 研究变量及测量方法
1.2.1 体育锻炼有效数据筛选 与体育锻炼相关的条目主要包括:是否进行体育锻炼;体育锻炼名称;每次锻炼持续时间;每周锻炼的频率。本研究中认定的体育锻炼,包括步行、慢跑、做操等,将错误记录在体育锻炼中的家务活动或农活等编码为0。另外,体育锻炼每次持续时间应超过10 min,如果患者记录的某项锻炼时间少于10 min,则其对应时间及频率都编码为0。
1.2.2 体育锻炼强度指标 代谢当量(MET,译称梅脱)指相对于安静休息时身体活动的能量代谢水平,是目前国际上反映身体活动绝对强度的常用单位[16]。一般以大于等于6梅脱为高强度,3~5.9梅脱为中等强度,1.1~2.9梅脱为低强度[16]。
1.2.3 体育锻炼水平分组 根据《中国成人身体活动指南》[17]进行分组,每位患者每周总体育锻炼活动量为:相应项目MET值×时间(min/次)×频率(次/周);若患者每周从事了不同类型的体育锻炼,则按照上述方法进行累加。考虑总体育锻炼活动量、锻炼时间和频率,将患者分为了低水平组(LPE)与中高水平组(MHPE)。MHPE组标准:每天不少于20 min的各类高强度体育锻炼,共计≥3次;或者每天不少于30 min的各类中等强度和/或步行活动,共计≥5次;或者各种强度体育锻炼共计≥5次,并且每周总体育锻炼水平≥600 MET-min。LPE组标准:无任何体育锻炼或者报告的体育锻炼未达到MHPE组标准。
1.3 统计学方法
1.3.1 潜在结果理论 潜在结果模型又称为Rubin因果模型[18,19],假设存在观测对象i,xi表示观测对象是否接受干预,如果i接受干预,则有xi=1;如果i不接受干预,则有xi=0。令Yi表示i的结局,则有Yi=即为潜在结果。此时,个体i接受干预的因果效应τi被定义为关于的表达式,如=0 或者τi=等。潜在结果模型有2个前提假设[23]:
Ⅰ可忽视性/可交换性假设
即干预措施的分配是随机的,或者Z包含处理前影响x和潜在结果()的所有混杂因素。此时,由于处理分配是随机的,潜在结果与处理分配的过程无关,即E(Y1|xi=1,Z)=E(Y1|xi=0,Z),同理E(Y0|xi=1,Z)=E(Y0|xi=0,Z);该假设使得基于比较潜在结果边际分布的因果推断成立。在基于多重插补法得到的10个插补后数据集中,除研究因素外的其余因素在暴露组与非暴露组中的分布将一致,因此本研究满足可交换性。
Ⅱ稳定单元治疗假设(SUTVA),SUTVA包含了两个原则:①无干扰原则,指任何个体的潜在结果不受其他个体所接受处理的影响;②每个个体所接受的处理水平是唯一的,指个体是否接受干预是已知且明确的。本研究中某一患者的脑卒中复发情况与其他患者无关,并且根据体育锻炼水平分类,可以明确每个患者的体育锻炼暴露水平,因此本研究满足SUTVA假设。
潜在结果模型的核心是比较同一个研究对象在接受干预和不接受干预时结果差异[21];但是对于同一研究对象,其潜在结果不能够都被研究者观察到,因此,必然存在缺失的潜在结果。此时,基于潜在结果模型的因果推断被转换为缺失数据的问题[20,21]。
1.3.2 多重插补法(MI)多重插补法[22-24]是一种高效地处理缺失数据的方法,涉及到模拟缺失值的分布,并基于Gibbs抽样随机抽取m个插补值的程序(m≥2),最终可得到m个完全数据集;对每个完整数据集分别使用相同的统计学方法处理,得到m个结果,最后合并这m个处理结果,得到对参数的估计值。采用多重插补法填补缺失的潜在结果时还需建立假设,即数据缺失机制为随机缺失(MAR);与潜在结果理论中的可忽视性类似,MAR假设没有其他未被观测到的影响因素,缺失值的分布只取决于观测数据,并且认为数据缺失信息均已包含在观测到的数据中。
1.4 统计学处理
1.4.1 填补缺失的潜在结果 本研究采用基于链式方程的多重插补方法[25];通过查阅文献资料,纳入可能与卒中复发相关的影响因素(吸烟、饮酒、BMI、高血压、糖尿病等)并构建预测矩阵,设定插补次数10次,利用R软件中的mice包的mice函数对缺失的潜在结果进行插补,并用lattice包绘制插补数据集与原观测数据集的分类散点图和核密度估计图,评估多重插补的效果并比较插补数据集与原观测数据集中潜在结果变量的边际分布。
1.4.2 体育锻炼与卒中复发的因果效应估计 平均因果效应(ACE)通常定义为个体因果效应的期望;基于潜在结果理论,个体因果效应可以表示为,那么平均因果效应为由于本研究的数据类型为生存数据,结局包括是否复发以及复发时间,因此采用Cox比例风险模型构建平均因果效应的估计公式,如下:
上述方法均用R软件3.6.4分析,计量资料中符合正态分布的以均数±标准差进行统计描述(不符合正态分布的以中位数和四分位数间距描述);计数资料以相对数进行统计描述,ACE采用潜在结果模型进行估计,检验水准α=0.05。
2 结果
2.1 研究对象的一般特征
636例脑卒中幸存者的平均年龄为68.23岁,其中男性401例,女性235例。随访期间共有148例患者卒中复发,累积复发率为23.3%,复发患者的中位复发时间(月)为24.0。观察对象被分为两组:低体育锻炼水平(LPE)组244人,中高体育锻炼水平(MHPE)组392人。卒中后LPE组与MHPE组的基线特征如表1所示。对LPE组和MHPE组患者进行比较分析,两组患者在年龄、Rankin评分、高血压患病率、高血脂患病率以及服药依从性5个方面的差异均具有统计学意义(表1)。
表1 LPE组与MHPE组研究对象的一般特征比较Tab.1 Baseline characteristics of LPE group and MHPE group
2.2 潜在结果的多重插补
在多重插补过程中,年龄、性别、体育锻炼、Rankin评分、婚姻状况、家族史、病灶部位、既往心血管疾病史、饮酒、高血压、糖尿病等变量均纳入缺失数据预测矩阵。运用分类散点图与核密度估计图评价多重插补前后潜在结果(生存时间与生存结局)的分布(图1、2)。
分类散点图展示了原数据集的观测值和插补后得到的10个数据集的结果,蓝点为已知的个体观测值,红点为插补值(图1);利用核密度估计展示了观测数据集和10次插补数据集中潜在结果的边际分布,红色曲线代表插补数据,蓝色曲线代表观测数据;基于多重插补法的假设,期望得到插补数据的分布与观测数据相近的结果(图2);多重插补的结果并没有出现异常点,且潜在结果变量的边际分布相似,插补效果稳定。10组插补后的完整数据集略有不同,这是由于插补具有随机成分,正是多重插补考虑了数据缺失不确定性的体现。
图1 原数据集与10个插补数据集中潜在结果变量的分类散点图Fig.1 Stripplot of potential-outcome variables in the original data and in the 10 imputed datasets.For Yaxis,"0"represents the observed dataset,and the other numbers(1-10)represent 10 imputed datasets.
图2 观测数据集(蓝色)与10个插补数据集中潜在结果变量的核密度估计图Fig.2 Kernel density estimates for potential-outcome variables from the observed dataset(blue)and 10 imputed datasets(red).
2.2 体育锻炼与缺血性卒中复发风险的因果关系
由于前述ACE=exp(β·X),故运用Cox回归模型对填补了缺失潜在结果的完全数据集进行分析,将得到对于回归系数β的10个估计值,根据Rubin等[27]对于多重插补法原理的推导,可以利用R语言pool()函数将10次结果合并,所得体育锻炼对卒中复发风险的回归系数估计值,结果有统计学意义,体育锻炼对首发脑卒中幸存者卒中复发的平均因果效应ACE=0.578(95%CI:0.186,0.970),说明中高体育锻炼水平组的卒中复发风险是低体育锻炼水平组的0.578倍,风险约降低42%。
3 讨论
本研究结果提示体育锻炼水平与卒中复发风险存在因果关系,中高体育锻炼水平组的卒中复发风险是低
体育锻炼水平组的0.578倍(95%CI:0.186~0.970),即与低体育锻炼组相比,中高体育锻炼水平组卒中复发风险约降低42%。
本研究结论与现有多数相关研究的结果一致,认为卒中后参与中高强度的体育锻炼可以降低卒中复发的风险。日本一项病例回顾性研究[28]发现,与体育锻炼强度<10梅脱/周的缺血性脑卒中患者相比,中高体育锻炼强度≥10梅脱/周的患者卒中复发风险的优势比(OR)为0.01(95%CI:0.001~0.999),虽然该研究采用了运动传感器技术来评估患者的体育锻炼水平,但是样本量仅50例,标准误较大。新西兰的一项临床试验[29]也表明参与体育锻炼项目可以显著降低短暂性脑缺血发作或轻型卒中患者卒中复发的风险(RR=0.23,95%CI:0.07-0.72),该研究的平均随访时间达到了3.5年,不过研究者并没有在随访期间持续观测受试者的体育锻炼情况,且样本量只有60例。美国的一项临床试验发现,基于专业评估后得分超过4分(适度体育锻炼每周不到4次,剧烈运动每周少于3次)的体育锻炼可以使首发卒中患者卒中复发、心肌梗死和血管性死亡风险降低40%(OR=0.60,95%CI:0.4~0.8),且体育锻炼比控制血压和胆固醇具有更好的预防卒中患者发生不良血管事件的效果[30]。该研究得到的效应值与本研究结果较为接近,但该研究随访时间较短,且未能将卒中复发作为独立的结局事件。现有研究在获得关联性的结果后,均没有继续探究体育锻炼与卒中复发的因果关系。
本研究能够进行因果推断的关键在于合理控制了混杂因素:①从研究设计的角度,本研究为前瞻性队列研究,纳入的研究对象为随访时间超过1年的首发缺血性脑卒中幸存者。既往研究[31]提示脑卒中患者的身体活动能力与恢复时间相关,由于恢复初期身体机能的限制,有些患者无法进行体育锻炼。卒中幸存者的心肺适应性水平也有类似的特点,在卒中发病1年后,患者的心肺适应性才能基本恢复到发病前的水平[35]。因此,纳入随访时间超过1年的脑卒中幸存者较为合理,可以获得卒中患者稳定可靠的体育锻炼数据;②从统计方法学的角度,本研究采用基于链式方程的多重插补法和潜在结果理论进行因果推断。潜在结果理论的核心是将个体的反事实结果作为缺失的潜在结果,比较个体暴露于研究因素和不暴露于研究因素时结局的差异,同时获得每一个个体在MHPE和LPE两种水平下发生或不发生卒中复发的结果,因此除研究因素以外的其余因素在MHPE和LPE组患者的分布是一致的,从理论上控制了混杂偏倚,获得更加可靠的因果关系[18];③2004 年,Rubin等[21]在潜在结果理论的基础上,提出因果推断的本质是缺失数据的问题。Westreich等[33]在其2015年发表的文章中也表示流行病病因研究可以从缺失数据的角度来探索,并且在模拟示例中显示数据插补法和潜在结果理论结合的因果推断方法具有较好的表现。为了填补个体的反事实结果,即缺失的潜在结果。本研究选取基于链式方程的多重插补法(又称FCS)[34],有学者通过模拟研究认为FCS比其他策略的多重插补法更灵活,且FCS策略在很多实际应用中也表现良好[24,25]。从本研究得到的结果来看,分类散点图(图1)和核密度图(图2)均显示插补数据集的收敛情况较为稳定。同时为了减小模拟误差,本研究设定插补次数为10次,在一定程度上增大了插补结果的可靠性,从而能够估计体育锻炼与卒中复发的平均因果效应。
与既往研究相比,本研究的优势在于:①利用了随访年限较久的前瞻性队列数据,可以获得体育锻炼与卒中复发的时间先后顺序,并且了运用潜在结果模型初步探索体育锻炼与卒中复发的因果关系;②对纳入对象进行了限制,只获取随访超过1年的患者数据,使得研究结果更为稳定可靠;③在全面收集卒中幸存者体育锻炼数据的基础上,本研究根据《中国成人身体活动指南》对体育锻炼的水平进行划分,尽可能减小自报数据对结果可能产生的影响。本研究也存在一些不足:①观察对象均来自同一家医院,基线特征可能与就诊于其他医院的患者不一致,因此可能存在选择性偏倚的问题;②未进行亚组分析,如果对性别等因素进行亚组因果分析,可以获得更加具体的效应关系;③本研究在分析体育锻炼与多次卒中复发事件的因果关系方面存在局限性。
研究表明长期参与体育锻炼会使卒中患者的血管内皮生长因子(VEGF)[36]和脑源性神经营养因子(BDNF)[37]表达上调,同时使血浆纤维蛋白原水平降低,从而起到保护卒中患者神经元修复、促进血管再生、降低缺血性卒中风险等作用[38,39]。这些机制研究的结果也在一定程度上提示了体育锻炼与卒中复发风险的因果关系。体育锻炼水平与降低卒中复发风险的剂量反应关系、老年卒中患者参与体育锻炼的方式和程度等仍不明确,因此本研究结论需要进一步验证和补充。