China-PAR脑卒中模型在北方农村人群中预测脑卒中发病风险的应用
2020-06-23张杜丹刘晓非刘秋萍黄少平窦会东胡永华
唐 迅,张杜丹,刘晓非,刘秋萍,曹 洋,李 娜,黄少平,窦会东,高 培△,胡永华△
(1. 北京大学公共卫生学院流行病与卫生统计学系,北京 100191; 2. Cardiovascular Epidemiology Unit, Department of Public Health and Primary Care, University of Cambridge, Cambridge CB1 8RN, United Kingdom; 3. 北京市房山区疾病预防控制中心,北京 102446; 4. 北京市房山区第一医院,北京 102400)
脑卒中目前在全球范围内位列第三位死因,也是中国人群的首位死因,并且随着我国人口老龄化进程的加速发展,有效预防脑卒中等心血管病已成为重要的公共卫生问题之一[1-2]。心血管病预防实践的进展很大程度上得益于对多种危险因素的综合风险评估,采用准确的预测工具可以更好地开展风险分层,进而针对不同风险水平的对象,制订相应的综合干预或危险因素管理方案,这对于降低心血管病在人群中的总体风险具有重要的公共卫生学意义。基于该策略开发的各类风险预测模型用于风险评估和分层干预已被多个西方发达国家的心血管病一级预防指南广泛接受和应用[3]。2017年美国弗明汉研究更新了改良的弗明汉脑卒中风险评分(Framingham stroke risk profile, FSRP), 用于预测5年和10年脑卒中发病风险[4];2019年中国动脉粥样硬化性心血管疾病风险预测研究(prediction for atherosclerotic cardiovascular disease risk in China, China-PAR)也新开发了适用于中国人群的China-PAR脑卒中模型[5]。对上述最新发表的预测模型进行外部验证,将会直接影响到风险评估工具的推广和应用,因此本研究在中国北方农村人群的前瞻性队列中,独立验证并比较FSRP和China-PAR脑卒中模型的预测准确性,为预测模型在一级预防中实际应用的评价提供证据。
1 资料与方法
1.1 研究对象
本研究是一项以人群为基础的前瞻性队列研究,采用整群抽样的方法选取了北京房山农村社区32个行政村登记的40岁及以上常住户籍居民,2010年6月至8月开展的基线调查中共计7 577人完成了心血管疾病及其相关危险因素的收集,包括完整的问卷调查、体格检查和生化检测[6]。后期随访工作包括每年的电话随访和每3年1次的现场随访,结合该地区的监测系统(包括健康档案和死因监测等常规监测以及村医提供的随访事件线索的定向监测),对冠心病、脑卒中、糖尿病、高血压及恶性肿瘤等主要慢性疾病的发病和死亡事件进行追踪调查,并通过连接医疗保险数据库和该地区主要二级医院的电子病历档案中的住院及死亡数据进行诊断核实。最近一次现场随访时间为2016年8月,电话随访时间为2017年1月,医疗保险和电子病历数据库记录核查时间为2017年1月[7]。由于目前队列人群的随访周期未到10年,依照国际惯例[4-5]本研究将对基线无冠心病、脑卒中及心力衰竭病史的40~79岁人群进行5年脑卒中发病风险预测模型的评估。根据纳入、排除标准,本研究的研究对象选择流程如图1所示,共有6 483名研究对象进入最终的统计分析。本研究已通过北京大学生物医学伦理委员会的批准(IRB00001052-16013), 所有研究对象调查前均书面签署知情同意书。
1.2 研究指标及定义
参照FSRP[4]及China-PAR研究[5]的预测模型中纳入的变量及定义,本研究中脑卒中事件的定义主要包括脑卒中(ICD-10编码为I60~I64, I67, I69)的发病和死亡。脑卒中定义为急性进行性的血管源性的中枢神经系统局灶性或大范围的功能障碍(包括出血性、缺血性脑卒中)超过24 h,且必须经过二级及以上医院CT或磁共振成像确诊。问卷调查中,父母脑卒中家族史定义为研究对象的亲生父母中至少一人有脑卒中病史;吸烟定义为平均每天吸纸烟1支(或采用其他吸烟方式消耗相当于1支纸烟的烟草量)及以上,并已持续1年及以上;糖尿病定义为空腹血糖水平≥7.0 mmol/L,或2 h口服葡萄糖耐量试验≥11.1 mmol/L,或有明确的糖尿病病史并在接受降糖药物治疗;高血压治疗定义为调查前两周内规律服用降压药物进行治疗;心房颤动定义为既往心电图或24 h动态心电图记录到的P波消失代之以小而不规则的f波(频率350~600次/min),且心室率绝对不规则。体格检查过程中,血压、身高、体质量、腰围、心电图等指标采用标准、规范的方法进行测量。空腹抽取静脉血,血脂生化指标使用7060型全自动生化分析仪(日本HITACHI公司)进行血清学检测。
1.3 质量控制
调查前对所有调查员集中进行统一培训;现场调查过程中由质控员核查全部问卷和体检表的完整性,并抽取1%复核其完整性、有效性;在结局事件的随访和确认方面,通过监测系统、电话和现场随访以及已覆盖99%以上人群的医疗保险系统可以有效减少低估或遗漏结局事件的发生,并且通过医院数据库的核查确诊可以降低高估结局事件的风险。生化检测符合北京市临床检验中心临床检验室间质量评价标准,具有严格的实验室内和实验室间的质量控制措施;数据录入过程中使用Epidata 3.0软件进行平行双录入,并设置逻辑核查。
1.4 统计学分析
基线数据中连续变量用均数±标准差表示,分类变量用百分比(%)表示,对非正态分布资料用对数转换后进行统计学检验,均为双侧检验,显著水平为α=0.05,连续变量和分类变量分别采用t检验和卡方检验比较不同性别之间各模型预测变量的基线差异。5年脑卒中发病风险评分的预测值分别采用China-PAR脑卒中模型[5]和美国FSRP[4]中各自的公式和参数分性别进行计算,保持预测变量的系数不变,采用本队列人群基线时危险因素水平以及脑卒中发病风险的均值进行再校准(recalibration),便于模型比较。脑卒中发病风险预测模型的验证包括区分度(discrimination)和校准度(calibration)的评估[8],区分度是反映预测模型的风险评分能够正确区分早发病者为高风险,通常采用C统计量(Harrell’sCstatistics)评估受试者特征曲线的曲线下面积,一般认为0.7以上较好;校准度是衡量预测模型估计的绝对风险的预测值与观察到的实际情况之间拟合的一致程度,通常采用Hosmer-Lemeshow检验评价预测模型的校准度,按照风险评分的预测值分为10组进行比较并作图表示,总体χ2<20表示校准度好。观察到的5年脑卒中事件实际发生数通过Kaplan-Meier分析获得,根据每个研究对象生存时间的顺序从小到大排列,直接采用条件概率及概率乘法原理估计研究对象5年后仍然未出现结局事件的累积概率,用(1-累积概率)×总人数即可得到结局事件的实际发生数,该方法调整了删失数据对结局事件发生数的影响。计算预测风险与实际发病率的比值(expected-observed ratio, EOR),比值为1表示预测准确,EOR>1表示高估风险,EOR<1表示低估风险[9]。采用Stata 16软件进行统计分析。
2 结果
2.1 验证队列的基本情况和基线特征
本研究队列中40~79岁基线无心血管病史的研究对象共6 483人,平均随访时间为(5.83±1.14)年,共计37 778.91人年,研究人群的平均年龄(55.4±8.8)岁,34.2%为男性(2 215/6 483),基线特征如表1所示。总体而言,男性比女性具有更高的吸烟率和血压水平,但高血压治疗率以及血脂水平低于女性(P<0.05)。在平均(5.83±1.14)年的随访周期内,共发生438例脑卒中结局事件(其中男性202例,女性236例),经过Kaplan-Meier方法调整后的5年脑卒中事件发生率也是男性高于女性,提示各类主要的心血管病危险因素以及结局事件均存在明显的性别差异,风险预测模型需分性别进行评估。
SBP, indicates systolic blood pressure; DBP, diastolic blood pressure; HDL-C, high-density lipoprotein cholesterol; a, to convert total cholesterol and HDL-C to mmol/L, multiply by 0.025 9.
2.2 男性中China-PAR和FSRP模型的验证和比较
与Kaplan-Meier方法调整后的5年脑卒中实际发生数(136.1)相比,在男性中再校准后的China-PAR(130.3)和FSRP(125.6)模型均显示预测准确性较好,且China-PAR脑卒中模型更好(表2);进一步计算EOR发现各模型在男性中均提示稍有低估,相比于FSRP模型风险低估的 7.7%,China-PAR仅低估了4.3%。在男性中,China-PAR和FSRP模型区分度的C统计量均高于 0.7,提示两个模型的区分度均较好,并且两个模型的校准度也均显示总体预测准确性较好(P>0.05)。
表2 研究人群中China-PAR和FSRP模型分别用于5年脑卒中风险预测的外部验证及比较
a, actual number of stroke events through follow-up; b, observed number of stroke events after Kaplan-Meier adjustment through follow-up; c, expected number of events based on the five-year stroke prediction models through follow-up. China-PAR, prediction for atherosclerotic cardiovascular disease risk in China; FSRP, Framingham stroke risk profile;CI, confidence interval.
如图2所示,根据十等分的风险分组,在预测风险最高的第10组,在男性中China-PAR模型仅低估了 4.4%,但FSRP模型反而高估了14.9%。校准图(图3)也发现在男性中FSRP模型偏离45°的校准线,而且预测风险越大偏离越远;而China-PAR模型校准度较好。因此,在男性中China-PAR比FSRP模型外部验证的预测准确性更好。
2.3 女性中China-PAR和FSRP模型的验证和比较
在女性中再校准后的China-PAR和FSRP模型的验证均显示了预测风险的高估(表2), China-PAR模型在预测女性风险方面高估了11.6%,而FSRP模型高估了30.0%。在女性中,China-PAR和FSRP模型的C统计量均高于0.7,提示两个模型的区分度均较好,但China-PAR模型(P=0.188)在女性中的校准度优于FSRP模型(P=0.004)。
十等分的风险分组图(图2)显示,在女性中预测风险最高的第10组,China-PAR和FSRP模型的预测风险分别高估了20.5%和90.0%。校准图(图3)也提示女性中FSRP模型在最高风险组偏离45°的校准线较远,因此,在女性中China-PAR模型外部验证的预测准确性也优于FSRP模型。
3 讨论
对风险预测模型的校准和对人群绝对风险的准确评估将直接影响到心血管病一级预防的风险分层及后续干预[3]。2019年最新发布的《中国心血管病风险评估和管理指南》正式推荐采用China-PAR模型对35岁及以上存在心血管病危险因素的个体进行风险评估(Ⅰ类推荐,C级证据)[10]。本研究组前期在中国北方农村人群的前瞻性队列中验证了China-PAR模型的预测准确性,发现China-PAR模型对于中国人群5年心血管病发病风险的预测优于美国的汇总队列公式,特别是在男性中更准确[7]。值得注意的是,虽然该结果与已报道的多数验证研究一致[9],再校准后的China-PAR模型和汇总队列公式都出现了不同程度的风险高估,考虑到中国人群脑卒中高发的特点,以及本研究人群属于中国北方“脑卒中带(stroke belt)”的高危人群的情况,在高危人群中仍然出现高估风险提示需要进一步建立针对中国人群脑卒中的风险预测模型。2019年最新发表的China-PAR脑卒中模型[5]是特别针对中国人群脑卒中风险预测而开发的,但目前尚未有研究进行独立外部验证的报道。本研究进一步在上述人群中同时比较了China-PAR脑卒中模型和国外经典的FSRP模型的预测准确性,发现China-PAR对于中国人群5年脑卒中发病风险的预测优于FSRP模型,特别是在男性中更准确。
国外广泛使用的FSRP模型最初建立于1991年,考虑到原有模型的陈旧数据不能反映当前高血压、糖尿病和吸烟等脑卒中危险因素流行情况的变化,2017年美国弗明汉心脏病研究(Framingham Heart Study)发布了更新的FSRP模型[4],并分别在法国三城市研究(3 cities study)和美国脑卒中地理和种族差异原因研究(reasons for geographic and racial differences in stroke, REGARDS)的两个队列中进行了验证。三城市研究在1999—2001年选取了2 949名年龄在65岁及以上的基线无心血管病史的法国人群,FSRP在该研究的低风险欧洲人群中预测脑卒中10年风险的准确性一般,在男性和女性中的区分度C统计量分别为0.70和0.72,校准度卡方值分别为12.5和6.5,与本研究结果基本一致。但考虑到三城市研究的样本量较小且入选人群年龄偏大,美国“脑卒中带”高风险人群的REGARDS研究更具有借鉴意义。REGARDS前瞻性队列在2003—2007年共纳入10 808例年龄在55岁及以上的基线无心血管病史的美国白人和黑人,验证结果显示FSRP高估了脑卒中的5年发病风险,特别是在脑卒中发病风险更高的黑人中。FSRP在男性和女性中的区分度C统计量分别为0.66和0.71,校准度卡方值分别为30.6和90.3,提示FSRP在“脑卒中带”人群中的验证效果还有待改善。
目前有关FSRP模型在其他人群中验证的报道较少,美国多种族动脉粥样硬化研究(multi-ethnic study of atherosclerosis, MESA)[11]对6 712名基线无心血管病史的多种族人群平均随访10.7年发现,FSRP模型对脑卒中10年风险预测具有较好的准确性,C统计量为0.716,校准度卡方值为6.55(P=0.59)。来自欧洲人群的鹿特丹研究(Rotterdam study)[12]也验证了脑卒中10年发病风险的FSRP模型,该研究从2002—2006年共纳入7 966例55岁及以上的基线无心血管病的荷兰人,研究对象平均年龄69.5岁,58.9%为女性,结果显示校准度男性(χ2=22.2)优于女性(χ2=36.4),而区分度相反,C统计量在男性和女性分别为0.68和0.74。由于疾病谱、危险因素流行情况等差异,FSRP模型在不同人群中的验证结果并不一致,本研究结果也提示国外队列开发的预测工具可能并不适用于中国人群。
作为China-PAR脑卒中模型的原始验证队列之一,中国代谢综合征社区干预研究(community intervention of metabolic syndrome in China, CIMIC)[5]同时比较了China-PAR脑卒中模型和FSRP模型预测5年脑卒中发病风险的准确性,结果也显示在区分度和校准度方面China-PAR优于FSRP模型,CIMIC研究队列中China-PAR模型预测风险(男性高估12.9%,女性高估26.7%)优于FSRP模型(男性低估43.1%,女性低估 50.7%)。与本研究前期结果[7]类似,后续研究仍需要重点考虑在女性人群的风险预测模型中加入相关预测因素。本研究的局限性包括由于随访时间有限仅验证了5年发病风险,但脑卒中结局事件发生随时间的变化并非简单的线性关系,5年和10年发病风险预测模型验证结果的差异仍需要通过进一步随访并在后续研究中继续验证。另外,由于本研究人群仅是中国北方“脑卒中带”的农村人群,结论的外推性受限,China-PAR原始模型在南方或城市人群中的预测准确性仍需要在其他研究中进一步独立验证。
综上所述,本研究提示China-PAR脑卒中模型对于中国北方农村人群5年脑卒中发病风险的预测优于FSRP模型,特别是在男性中更准确。采用准确适合的风险预测工具进行人群脑卒中的风险评估,将对进一步完善心血管病一级预防策略具有重要的公共卫生学意义。