APP下载

糖尿病心血管并发症预测模型的构建

2024-02-20李冰潇温馥源李盼弟杨晓俊屈艾彬

医学新知 2024年1期
关键词:心血管病心血管血脂

孙 源,刘 括,李冰潇,温馥源,李盼弟,杨晓俊,屈艾彬,张 玲

1.首都医科大学公共卫生学院(北京 100069)

2.临床流行病学北京市重点实验室(北京 100069)

2型糖尿病是由组织胰岛素抵抗和相对胰岛素缺乏引起的高血糖[1]。2019 年全球男性年龄标准化患病率为6.0%,女性为5.0%[2],2021年全球约有5.37亿人患有2型糖尿病,预计到2045年将达到7.83亿[3]。长期罹患糖尿病可能发生多器官或系统长期受损的慢性并发症,其中心血管病是最常见的大血管并发症之一,糖尿病患者发生心血管并发症的风险是非糖尿病患者的2~4倍[4],糖尿病死亡患者中约三分之二是因心血管并发症导致[5]。因此,通过构建预测模型探索糖尿病患者发生心血管并发症的危险因素具有重要意义,可帮助医生更准确地评估患者心血管并发症发生风险,有效识别出高危个体,对其尽早采取有针对性的干预措施,提供更紧密的监测管理,同时有利于患者了解自身状况,增强自身管理,提高患者生活质量。

既往三大经典临床试验ADVANCE[6]、ACCORD[7]和VADT[8]探讨了2型糖尿病患者在强化/标准降糖治疗后对心血管疾病结局的影响,发现强化控制血糖并不能减少2型糖尿病患者心血管疾病的发生,提示血糖水平并非唯一影响心血管并发症的因素。英国前瞻性糖尿病研究(UKPDS)[9-10]以及日本和中国香港人群的相关研究[11-12]指出,年龄、吸烟、体力活动、糖尿病病程、心血管病史、体质量指数(body mass index, BMI)、收缩压、糖化血红蛋白、非高密度脂蛋白胆固醇和白蛋白与肌酐比值等是糖尿病心血管并发症的危险因素。目前,国内仅针对糖尿病心血管并发症构建预测模型的研究较少,如基于上海4 335例糖尿病患者构建了糖尿病并发卒中的风险预测模型,发现年龄、糖尿病病程、血压、BMI、低密度脂蛋白胆固醇等是发生卒中的危险因素[13],其主要在中国2型糖尿病人群中利用既往的心血管病风险预测模型进行验证,发现美国弗明汉(Framingham)模型和新西兰糖尿病队列研究(diabetes cohort study,DCS)模型不适用于我国2型糖尿病人群心血管病风险预测[14]。同时,2型糖尿病的代谢环境,包括高血糖、胰岛素抵抗和过量的游离脂肪酸的释放,通过内皮功能障碍、氧化应激和低度炎症等机制影响血管壁,促进血栓形成,最终导致动脉粥样硬化,从而罹患心血管疾病和脑卒中[15]。因此,本研究将冠心病和卒中共同作为糖尿病心血管并发症事件,基于京津冀社区自然人群慢性病队列研究的调查数据,利用Lasso回归筛选糖尿病心血管并发症的危险因素并构建预测模型,将为社区糖尿病患者早期预测预警提供有效工具,并为早期干预筛选高危人群提供科学依据。

1 资料与方法

1.1 研究对象

选取京津冀社区自然人群慢性病队列研究(CHCN-BTH,注册号:ChiCTR1900024725)基线(2017—2019年)调查数据进行横断面研究。纳入标准:①年龄18岁以上2型糖尿病患者;② 心血管疾病确诊时间在2型糖尿病确诊时间之后。排除标准:①脑出血及卒中类型不确定;② 急性感染或炎症患者;③相关生化指标,如血脂四项(甘油三酯、胆固醇、低密度脂蛋白、极低密度脂蛋白)和脂蛋白a等数据缺失。CHCNBTH研究主要覆盖北京、天津和河北三个省市18岁以上3.7万社区自然人群,2017—2019年通过问卷调查、体格检查和实验室检查等方法收集健康和慢性病相关的基线数据,建立社区自然人群健康数据库,旨在明确其病因和危险因素,从而建立疾病风险预测模型,用于社区慢性病的精准预防和干预。CHCN-BTH研究已获得首都医科大学伦理委员会的审核批准[批号:2018SY81],所有研究对象均签署了知情同意书。

1.2 资料收集

使用标准化问卷收集一般人口学特征(年龄、性别、婚姻状况、教育水平)、生活行为方式(吸烟、饮酒、体力劳动、体育锻炼频率)、个人健康情况(高血压、血脂异常、糖尿病病程、心理症状)和疾病家族史(高血压、糖尿病、冠心病和脑卒中)。通过体格检查获得血压、身高、体重等数据;收集的血液样本均在北京某三甲医院使用贝克曼库尔特化学分析仪AU5800进行统一临床实验室检测,空腹血糖使用己糖激酶法、糖化血红蛋白使用离子交换高压液相色谱法、尿酸使用脲酶比色法、尿素使用脲酶紫外速率法、超敏C反应蛋白使用免疫比浊法、血清胆红素使用重氮试剂法进行检测。

1.3 指标定义

一般人口学特征中婚姻状况分为未婚、已婚、离异和丧偶,教育水平分为小学及以下、初中、高中和大学及以上,将曾经和现在正在吸烟或饮酒的情况判定为有吸烟或饮酒情况。BMI为体重(kg)与身高(m)平方的比值。血压(使用欧姆龙HEM-907电子血压计)由医生在研究对象静坐休息后间隔测量三次取平均值,高血压诊断依据《中国老年高血压管理指南2019》,将收缩压≥140 mmHg(1 mmHg=0.133 kPa)和(或)舒张压≥90 mmHg,或自我报告曾在二级及以上医院明确诊断高血压且接受降压药物治疗的研究对象定义为患有高血压。血脂异常是由研究对象自我报告曾在二级及以上医院明确诊断,或根据《中国血脂管理指南(2023年)》中胆固醇和(或)甘油三酯水平升高或高密度脂蛋白胆固醇水平降低进行定义。心理症状使用抑郁、焦虑和压力量表-21(Depression, Anxiety and Stress Scale-21,DASS-21)进行收集[16-17],该量表包括三个子量表,每个子量表包含七个问题,抑郁量表>9分判定为有抑郁症状,焦虑量表>7分判定为有焦虑症状,压力量表>14分判定为有压力症状,存在任一状态则判定为有心理症状。

根据《中国2型糖尿病防治指南(2020年版)》[18],2型糖尿病患者定义为糖化血红蛋白在6.5%及以上,或自我报告曾在二级及以上医院诊断过,或正在进行规律的降糖治疗。糖尿病心血管并发症定义为糖尿病患者在确诊为糖尿病之后发生心血管病,其确诊时间在糖尿病确诊时间之后。心血管病是由研究对象在2017—2019年基线数据收集时自我报告曾在二级及以上医院明确诊断,按照《国际疾病分类第10版》(International Classification of Disease,10th Edition,ICD-10)标准,本研究主要包括冠心病(I21~I25)和缺血性脑卒中(I64)。

1.4 统计学分析

符合正态分布的连续性变量用±s表示,两组间比较采用t检验;非正态分布的连续性变量以中位数(M)和四分位数(P25,P75)表示,两组间比较采用Mann-Whitney U检验;分类变量分布用例数(n)和百分比(%)表示,两组间比较采用χ2检验。将研究对象按7 ∶ 3比例随机分为训练集和测试集,分别进行模型的构建与验证。采用最小绝对值收敛和选择算子算法(least absolute shrinkage and selection operator, Lasso)回归方法,根据既往报道的糖尿病心血管并发症模型的危险因素以及本研究数据库包含的其他未探讨的因素,分析筛选训练集的30个自变量,采取十折交叉验证法确定参数λ,选取模型误差在一个标准差时的λ,将此时β不为0的变量纳入并拟合多因素Logistic回归模型。根据多因素Logistic回归的结果,选取P≤0.05的变量构建糖尿病心血管并发症的预测模型并绘制列线图进行可视化,列线图中每个预测因素对应的线段上都标注了刻度,代表该因素的可取值范围,线段的长度反应该因素对结局事件的贡献大小。图中顶部的分数表示预测因素在不同取值下所对应的得分,所有预测因素分数相加,进而通过总分对应图中底部线得到糖尿病心血管并发症发生的概率预测值。基于测试集对构建的预测模型进行验证。绘制受试者工作特征曲线(receiver operating characteristic curve,ROC)并计算曲线下面积(area under curve,AUC)作为区分度评价指标,校准度通过Hosmer-Lemeshow 拟合优度检验和绘制校准曲线来评估,以确保模型的预测能力。所有统计分析使用R语言软件4.2.0版本完成,采用的软件包为“rms”“glmnet”“pROC”“ResourceSelection”。双侧检验,P≤0.05认为差异具有统计学意义。

2 结果

2.1 一般情况

共纳入813例2型糖尿病患者,其中训练集569例(62.6±10.3岁),测试集244例(62.8±10.6岁),分别有85(14.9%)例和27(11.1%)例2型糖尿病患者发生心血管并发症,两组间除超敏C反应蛋白水平具有差异(P=0.028)外,其余基本特征差异无统计学意义(表1)。

表1 患者基线资料 (n, %)Table 1.Basic characteristics of patients (n, %)

2.2 模型构建

根据训练集数据将问卷信息和临床生化指标的30个潜在危险因素进行Lasso-Logistic回归分析和十折交叉验证(图1),根据距离模型均方误差最小值一个标准误的λ值(lambda.1se=0.032)时结果,确定了10个非零特征变量,包括年龄、吸烟、高血压、血脂异常、糖尿病病程、心血管病家族史、空腹血糖、尿素、肌酐和血清胆红素水平。

图1 基于十折交叉验证的Lasso回归特征变量选择Figure 1.Lasso regression feature variable selection based on ten-fold cross-validation

将10个非零特征变量纳入多因素Logistic回归模型,结果显示年龄[OR=1.040,95%CI(1.010,1.073),P=0.010]、高血压[OR=2.211,95%CI(1.263,3.975),P=0.006]、糖尿病病程[OR=1.063,95%CI(1.028,1.099),P<0.001]、空腹血糖水平[OR=1.186,95%CI(1.075,1.309),P=0.001]、血脂异常[OR=2.051,95%CI(1.167,3.583),P=0.012]、心血管病家族史[OR=2.794,95%CI(1.650,4.774),P<0.001]和吸烟[OR=1.975,95%CI(1.133,3.462),P=0.017]是糖尿病心血管并发症的危险因素,而血清胆红素水平[OR=0.940,95%CI(0.889,0.991),P=0.027]是其保护因素(表2)。最终预测模型表达式为:

表2 Lasso-Logistic回归模型中糖尿病心血管并发症的预测因素Table 2.Predictors of cardiovascular complications in diabetes mellitus in Lasso-Logistic regression models

发生概率P=1/[1+e^(-(-7.758+0.040年龄+0.793高血压+0.061糖尿病病程+0.171空腹血糖+0.718血脂异常+1.028心血管病家族史+0.681吸烟-0.062血清胆红素))]。

根据Lasso回归联合多因素Logistic回归筛选出8个最佳预测因素绘制列线图(图2)。通过各个预测因素相加得到的总分对应糖尿病心血管疾病并发症的发生风险,例如,某罹患2型糖尿病5.5年的患者,年龄73岁、不吸烟、患有高血压和血脂异常、有心脑血管疾病家族史、空腹血糖为7.5 mmol·L-1、血清胆红素为18.08 μmol·L-1,由列线图计算该患者总分为205.8,发生糖尿病心血管疾病并发症的概率为21.4%。

图2 2型糖尿病心血管并发症预测模型的列线图Figure 2.A nomogram of a predictive model for cardiovascular complications of type 2 diabetes

2.3 模型验证

对训练集构建的糖尿病心血管并发症的预测模型进行评估,同时利用测试集对预测模型进行内部验证。训练集和测试集分别绘制ROC曲线,AUC值分别为0.803[95%CI(0.753, 0.852)]和0.820[95%CI(0.736,0.903)],提示模型 区分度较好(图3);对训练集和测试集进行Hosmer-Lemeshow拟合优度检验,P值分别为0.776 4和0.554 2,提示模型预测值与实际观测值之间并无统计学差异,再经500次重抽样校正后的校准曲线与理想曲线的平均绝对误差为0.013,提示曲线之间一致性较好,模型校准度良好(图4)。

图3 2型糖尿病心血管并发症预测模型的受试者工作曲线Figure 3.AUC of a predictive model for cardiovascular complications of type 2 diabetes

图4 糖尿病心血管并发症预测模型的校准曲线Figure 4.Calibration curve of prediction model for cardiovascular complications of diabetes mellitus

3 讨论

本研究利用京津冀社区自然人群慢性病队列基线调查数据,采用Lasso-Logistic回归的分析方法构建糖尿病心血管并发症风险预测模型,纳入的预测因子包括年龄、吸烟、高血压、血脂异常、糖尿病病程、心血管病家族史、空腹血糖和血清胆红素,经内部验证表明该预测模型有较好的区分度和校准度。

本研究显示2型糖尿病患者的年龄和糖尿病病程是心血管并发症的危险因素,Wan等[19]、Morton等[20]和De Jong等[21]分别针对中国、澳大利亚和英国的糖尿病患者心血管并发症发生风险的研究表明,随着年龄和病程时间的增加心血管病风险逐渐提高,与本研究的结果一致。Al-Rubeaan等[22]发现2型糖尿病患者中缺血性卒中的患病率在糖尿病病程时间长且老年人组最高。同时现在糖尿病确诊年龄越来越趋于年轻化也意味着病程时间的延长,确诊年龄每提前10年发生心血管并发症的风险逐渐增加[23]。

本研究发现患有高血压和血脂异常以及空腹血糖升高是糖尿病患者发生心血管并发症的重要危险因素。Kaze等[24]发现与血脂代谢正常的2型糖尿病患者相比,血脂异常的患者发生心血管并发症的风险更高,其中冠心病发生风险增加1.48倍。血脂异常也是高血压和糖尿病两者共同的危险因素[25]。既往研究证实,高血糖和高血压会共同加剧血管损伤和内皮功能障碍[26-27],促进动脉粥样硬化的发生发展,糖尿病合并高血压患者可使大血管并发症的风险显著增加。Sibarani等[28]证明在血糖异常患者中合并高血压导致心血管并发症的发生风险增加2.58倍;Elley等[29]开展新西兰糖尿病队列研究发现收缩压每升高10 mmHg,心血管并发症的风险增加1.03倍,与本研究结果一致。

本研究构建的糖尿病心血管并发症的预测模型与其他研究相比还包括危险因素心血管病家族史和保护因素血清胆红素。Tian等[30]利用中国慢性病前瞻性研究项目数据发现有卒中家族史的研究对象发生脑卒中的风险增加1.5倍,且患有家族史的人数与脑卒中发生风险有剂量反应关系。Lloyd-Jones等[31]基于Framingham原始队列的子代人群发现其父母有心血管病史的男性子代发生心血管病风险提高2.6倍,女性子代提高2.3倍。血清胆红素是天然的内源性抗氧化剂,抑制氧化修饰低密度脂蛋白胆固醇生成,清除自由基,具有抗脂质过氧化、抗动脉粥样斑块等作用,因此对心血管病有保护作用[32-33]。Kunutsor等[34]对12篇研究进行Meta分析,调整传统心血管病危险因素后,发现血清胆红素基线水平增加2倍,心血管病发生风险可降低10%。然而血清胆红素与心血管病发病风险方面因果关系仍不明确,仍需进一步探讨。

本研究通过探究糖尿病心血管并发症的多种危险因素,初步构建了针对糖尿病心血管并发症的预测模型。既往研究构建或验证预测模型的研究人群大多来源于欧美国家[35],由于种族和生活行为等差异,模型外推到亚洲地区时预测能力可能存在差异。与2型糖尿病患者10年心血管风险预测评分SCORE2-Diabetes相比[36],两个研究所纳入的预测因素信息获取均较为便捷,同时本研究纳入的预测因素所反映信息与之基本相似,且进一步考虑了心血管疾病家族史的影响。另一方面,本研究构建的糖尿病心血管并发症预测模型的区分度与SCORE2-Diabetes相比更好,但SCORE2-Diabetes研究最终可计算出风险评分,可更为直观地为临床医生和糖尿病患者自身进行快速甄别心血管并发症高风险人群,进而提供预警信息和及时干预。

本研究仍存在一些局限性。首先,本研究利用基线调查时患者自报疾病史的信息判定先发生糖尿病后发生心血管病的时间先后顺序,可能存在回忆偏倚和信息偏倚,未来将对糖尿病患者进行长期随访获得心血管并发症发生情况,以提高预测模型的准确性;其次,因未能获取到其他糖尿病患者心血管并发症发生情况的研究数据,该预测模型没有开展外部验证,模型的外推效果尚有待进一步验证;此外,本研究为横断面调查,并限于研究设计,收集的有关实验室检查指标可能会受到基线糖尿病患病的影响,导致预测结果的精确性下降;且纳入样本量相对较少,结果可能不够稳定,可重复性有待验证,同时未包括患者的饮食和药物使用情况等信息,且研究对象仅集中在京津冀地区,未来对中国其他地区的糖尿病心血管并发症的危险因素预测需要设计更加严谨的前瞻性多中心队列研究来完善预测模型。

综上所述,本研究构建了一个简便的糖尿病心血管并发症风险预测模型,模型内部验证区分度和校准度较好,能够直观地反映不同糖尿病患者的心血管并发症发生风险,在一定程度上能够为临床开展早期预防和干预提供科学的依据。

猜你喜欢

心血管病心血管血脂
“心血管权威发布”公众号简介
《心血管病防治知识》征稿启事
《心血管病防治知识》征稿启事
《心血管病防治知识》征稿启事
COVID-19心血管并发症的研究进展
血脂常见问题解读
《心血管病防治知识》征稿启事
你了解“血脂”吗
lncRNA与心血管疾病
胱抑素C与心血管疾病的相关性