糖尿病肾病风险预测模型研究现状
2022-11-23潘琼妮胡雯勤李雪萍许刚柱
潘琼妮,胡雯勤,李雪萍,宋 梅,李 亚,许刚柱
(1.西安医学院临床医学院,陕西 西安 710021;2.西安医学院第一附属医院内分泌科,陕西 西安 710003;3.西安医学院第一附属医院神经外科,陕西 西安 710003)
根据国际糖尿病联盟估计,全球糖尿病患病率到2030 年将上升至10.2%(约5.78 亿人),到2045年将上升至10.9%(约7 亿人)[1]。目前我国的糖尿病患病率已上升至11.2%,糖尿病知晓率、控制率和治疗率虽有所改善,但仍处于较低水平[2]。糖尿病肾病(diabetic kidney disease,DKD)是糖尿病的微血管并发症之一,约30%的糖尿病患者可发展为DKD,进而出现终末期肾病,其与较高的心脏病发病率和死亡率密切相关,故及早发现和筛查DKD的高危患者是防治的关键[3]。临床预测模型是使用数学模型来评估受试者当前患有某种疾病或将来发生某种结局的可能性[4]。因此,了解DKD的风险预测模型,有利于医护人员早期识别危险人群,以便及时采取预防和治疗措施,从而降低DKD的发生率。本文主要对DKD 相关风险预测模型进行综述,以期为今后构建及使用DKD 风险预测模型提供参考。
1 糖尿病肾病及其预测模型概述
1.1 糖尿病肾病 糖尿病肾病是由糖尿病所致的慢性肾脏疾病,是根据尿蛋白升高程度和(或)估算肾小球滤过率(estimated glomerular fifiltration rate,eGFR)的下降程度,同时排除其他原因所致的慢性肾脏疾病(chronic kidney disease,CKD)而作出的诊断,是许多终末期肾病(end stage kidney disease,ESKD)患病人群中的最常见原因[5,6]。2020 年《亚太肾脏病学会糖尿病肾病临床实践指南》发布,其中建议在1 型糖尿病(type 1 diabetes mellitus,T1DM)患病后的第5 年和2 型糖尿病(type 2 diabetes mellitus,T2DM)患病后每年分别利用尿蛋白肌酐比值(urine albumin to creatinine ratio,UACR)进行DKD的筛查[7]。2021 年版的《基层糖尿病微血管病变筛查与防治专家共识》建议将尿常规、eGFR、UACR 作为DKD 筛查的首选方法[8]。
1.2 疾病风险预测模型 疾病风险预测模型最早被应用在美国氟莱明翰的心脏病研究中,其使用分类变量开发出一种简单的冠状动脉粥样硬化性心脏病(coronary heart disease,CHD)的预测算法,可预测未发生CHD 患者的CHD 患病风险[9]。近年来研究者在糖尿病[10]、肿瘤[11]和脑血管疾病[12]等领域逐渐应用疾病风险预测模型来预测疾病。
2 糖尿病肾病的危险因素
DKD 发病机制复杂,有多种危险因素共同参与,国内外研究[13-15]中关于糖尿病肾病的危险因素主要包括:①人口学资料及生活方式:性别、年龄、血压、体重指数、吸烟;②代谢相关指标:血糖、糖化血红蛋白、血脂、尿酸等;③糖尿病病程;④体重方面:超重和肥胖是其危险因素,随着体重指数的增加,DKD的检出率呈上升趋势,体重指数与DKD 呈正相关[16];⑤其他:睡眠时间等。有研究发现长睡眠时间(≥8.5 h)与DKD 相关,而我国研究发现只有短睡眠时间(<6 h)与DKD 相关。Tan NYQ 等[17]研究了新加坡成年糖尿病患者睡眠时间与DKD的关系,发现睡眠过长或过短均与DKD 有关。
3 糖尿病肾病风险预测模型
3.1 列线图模型 列线图[18]又称诺莫图,是一种在多因素回归分析基础上同时将多个预测指标整合后使用带有刻度的线段绘制在同一平面上的图形,常被用于表达预测模型中各变量之间的关系。目前列线图已被应用于胃癌、浸润性导管癌、前列腺癌和骨肉瘤等肿瘤性疾病的研究中[19],也有学者将其应用在糖尿病及其并发症的研究中。Jiang S 等[20]的研究纳入中日友好医院连续行肾活检的T2DM 患者302例,病例的相关数据被随机分成包含70%患者的训练集和剩余30%患者的验证集,分别用于模型构建和外部验证。纳入包括性别、糖尿病病程、糖尿病视网膜病(diabetic retinopathy,DR)、血尿、糖化血红蛋白(HbA1c)、血红蛋白、血压、尿蛋白排泄和eGFR在内的9 个变量构建列线图。模型c 指数为0.934,内外部验证c 指数值为0.91、0.875。Xi C 等[21]的研究对桂林市1095 例T2DM 患者进行问卷调查、体格检查、血常规和生化指标评价,筛选出的危险因素为性别、年龄、高血压、药物使用、糖尿病持续时间、体重指数、血尿素氮水平、血清肌酐水平、中性粒细胞与淋巴细胞的比率和红细胞分布宽度,结合筛选出的危险因素进行逻辑回归分析并建立预测列线图模型,模型c 指数为0.819,ROC 曲线下面积(AUC)为0.813,内部验证c 指数为0.796;决策曲线分析显示,当风险阈值在1%~83%时,糖尿病肾病风险列线图在临床上是适用的。这两项研究结果均表明列线图模型对DKD的风险评估有一定作用,但这两项研究的样本量均较小,且第2 项研究未进行外部验证。当然,也有基于社区的样本量较大的研究。Shi R 等[22]的研究纳入4219 例T2DM 患者,分为单纯T2DM组、DKD 组、DR 组和DR+DKD 组,预测模型中的预测因子包括病程、体重指数、甘油三酯、收缩压、餐后血糖、HbA1c 和尿素氮,模型c 指数为0.807,AUC为0.807,内部验证c 指数达到0.804,决策曲线的分析风险阈值为16%~75%,说明此模型可预测DKD风险。此外,Wang G 等[23]的研究选取糖尿病住院患者2163 例,基于诺谟图建立4 种不同的筛选方程(全模型、基于实验室的模型1、基于实验室的模型2和简化模型),4 种模型纳入的因素有所差异,全模型纳入10 个因素:饮酒状况、高血压、糖尿病持续时间、冠心病史、SBP、总胆固醇、空腹血浆C 肽、尿酸和糖尿病视网膜病变;模型1 纳入7 个因素:性别、SBP、TC、饮酒、高血压、冠心病和糖尿病持续时间;模型2 在模型1的基础上加入HbA1c;简化模型有6 个因素:性别、SBP、饮酒、高血压、冠心病和糖尿病持续时间;4 种模型的c 指数分别为0.8450、0.8149、0.8171、0.8083,根据Hosmer-Lemeshow 拟合优度检验,分别为3.2756、7.749、10.023、12.294,结果表明模型1、模型2 模型均具有良好的预测性能和有效性,可用于中国DKD 病例的筛查。需要说明的是,这两项研究虽然纳入的样本量大,但均未进行外部验证,故其适用性需要进一步考量。
3.2 基于机器学习的不同算法 机器学习是一门涉及到概率论、统计学等多门学科的交叉学科。机器学习从当前现有的数据中发现相应的规律,并利用这些规律对未来作出预测,已在当前各个领域中得到广泛应用。在医学领域中应用机器学习算法可有效地降低财力、物力,提高当前医疗系统的运作效率,缓解当前人民群众就医难的问题[24]。乔高星[25]研究基于机器学习适用不同算法构建预测模型,纳入2197 例T2DM 患者,将整体数据随机分组,训练集和验证集的比例约为7∶3,在训练集中,采用单因素Logistic 回归筛选糖尿病肾病的预测因素,建立Logistic 回归、人工神经网络(ANN)、朴素贝叶斯分类器(NBC)和分类回归树(CART)糖尿病肾病诊断预测模型,结果发现CART 模型的准确度和区分度最好,AUC 为0.7454,校准度χ2为4.2899,对糖尿病肾病发病的绝对诊断预测与糖尿病肾病实际发生情况一致性较好。林鑫等[26]的研究选择894 条T2DM 住院数据,利用单因素Logistic 回归筛选出24 个有效检查指标作为特征,并基于随机森林、BP神经网络、支持向量机分别构建模型,结果发现随机森林预测模型的总体性能最优。上述两项研究比较了不同算法构建模型的性能,得出的结论不同,故需要进一步研究探讨不同算法在糖尿病肾病预测方面的价值。在危险因素筛选方面,这两项研究均采用Logistic 回归,对于危险因素的筛选还有其他方法,如分类树模型。两者在研究因子间的交互作用和混杂因素方面均有应用,Logistic 回归分析作为应用频率较高的模型,其变量共线性较差,而分类树模型因其因变量为分类变量,作为一种非参数回归分析方法,能很好的解决变量间的共线性问题[27]。有研究者比较了两种方法在筛选糖尿病危险因素方面的性能,Lou J 等[28]分别采用Logistic 回归和分类树模型分析T2DM 患者肾病的危险因素,发现两种模型的结果相似。但廖志波等[29]的研究显示,分类树模型在预测糖尿病肾病进展方面效果较好,能较好地分析因素间的交互作用。因此,Logistic 回归和分类树模型的差别可能是前者侧重于糖尿病肾病危险因素的分析,而后者侧重糖尿病肾病进展因素的研究。
3.3 Logistic 回归模型 Logistic 回归是流行病学和医学中最广泛使用的二元结果建模方法,该模型是一个具有典型连接函数的广义线性模型,通过使用解释变量的值的线性函数来计算事件的概率。当因变量为分类变量时,可使用此模型。此外,对解释变量没有限制被认为是该模型的一个优点[30]。
有研究为筛选DKD的高危因素[31],利用优化后的Logistic 回归模型构建DN的发病风险预测模型,共纳入7 项危险因素:LDL-C、SBP、FPG、HbAc1、高血压、糖尿病病程和吸烟,建立的模型为:0.44x1+0.06x2+0.34x3+0.36x4+0.53x5+0.18x6+0.66x7,并通过内分泌科的糖尿病患者住院数据进行外部验证,结果显示该模型的AUC及95%CI分别为0.662、0.591~0.773,其结果更为可靠,但该模型中的有关系数是根据当地疾病发生率估算的,故而应用于其他地区时应进行适当的调整。此外,也有基于临床资料和超声资料的模型。李楠等[32]研究结合三维超声获得的肾脏体积参数和临床资料参数(收缩压、尿蛋白、肾小球滤过率、血浆尿素氮、血肌酐、糖尿病病史、是否有DR、是否有血尿),使用Logistic 回归建立预测模型,结果显示该模型的AUC 为0.9217,阳性预测值为0.8824,阴性预测值为0.8214,但因为此模型需要考虑肾脏超声检查的结果,故在基层医疗卫生机构开展存在一定程度的限制。
3.4 评分表 评分表[33]以结局作为因变量,筛选出的危险因素作为自变量,根据回归系数β 确定不同变量的积分值,以累计积分值的大小判断个体患病的危险性。各变量10 倍的回归系数作为各变量记分的分值,即风险评分表中各变量的具体分值。
Jiang W 等[34]纳入了41271 例T2DM 患者,筛选出包括年龄、BMI、吸烟、DR、HbA1c、收缩压、HDL-c、TG 和UACR 在内的9 个危险因素,对所有危险因素按权重进行评分。根据Sullivan LM 等[35]建议的方法开发出评分表,对所有风险因素进行分类,为每个类别分配权重,然后计算预测模型中所有风险因素的总得分,最后将该模型代入验证组,选择16 分作为最佳截断值,结果显示该模型的AUC 为0.762,灵敏度为0.847,特异度为0.667。该研究在回顾性队列中进行了外部验证,并且纳入的危险因素亦属于常用检查指标,故可用于DKD的预测和诊断,适用性强,使用方便,非常适合基层医生使用,值得推广。
3.5 其他 除了上述的列线图模型、Logistic 回归模型及积分表等,疾病风险计算器亦是一种模型展示形式。如Heikes KE 等[36]使用国内健康和营养检查调查数据开发的糖尿病风险计算器,可计算一个人患未确诊的糖尿病或糖尿病前期的概率。Choi Y 等[37]开发的无症状糖尿病患者心血管风险计算器,可预测无症状T2DM 患者中阻塞性冠状动脉疾病的存在和主要不良心脑血管事件的风险。上述两项研究开发出的疾病风险计算器可预测糖尿病、糖尿病前期及糖尿病患者心血管风险,但目前尚无针对DKD的风险计算器,相信今后会有针对DKD的风险计算器。
4 总结
目前,国内外研究者已经构建出多种适用于DKD 患者的风险预测模型,可用于糖尿病患者的筛查、评估等,但大部分预测模型未进行外部验证,且一些模型纳入的危险因素可能不适用于社区卫生服务中心等基层医疗机构。今后可对部分风险预测模型进行外部验证,进一步评估模型的效能,也可研发出针对不同级别医疗机构的模型,优化筛查措施,必要时进行早期干预,在降低医疗成本的同时也为患者、家庭和社会减轻负担。