2型糖尿病周围神经病变风险的列线图预测模型研究
2022-02-17李永生张学良李丞封志炜王凯
李永生,张学良,李丞,封志炜,王凯*
2型糖尿病(T2DM)是世界范围内公认的重大的公共卫生问题,2019年国际糖尿病联盟(IDF)的糖尿病地图(IDF Diabetes Atlas)(第9版)表明,全球约有4.63亿糖尿病患者,估计2045年糖尿病患者将升至7.002亿[1]。随着糖尿病发生率的增加,并发症的发生率也相应增加[2]。据报道,作为糖尿病最常见的慢性并发症,糖尿病周围神经病变(DPN)的患病率在中国为 35.34%[3],缅甸为 33.7%[4],印度为 29.2%[5],也门为 56.2%[6],约旦为 39.5%[7],伊朗为 53%[8]。DPN是一种由长期高血糖引起的神经病变[9-10],可导致足部溃疡,严重时需截肢,其致残率、病死率极高,死亡风险甚至超过部分癌症,如乳腺癌和前列腺癌[11]。又因DPN发病机制复杂,目前尚无有效的治疗方法。而DPN发病早期临床症状缺乏特异性,多数患者一旦出现肢体麻木、疼痛等症状,周围神经已经发生不可逆转的病理变化[12]。如能早期发现和治疗,可以延缓或预防DPN的不良后果,从而提高患者的生活质量。因此,迫切需要及早发现并适当控制可改变的DPN危险因素,以便早期预防和治疗DPN。现有关于预测DPN的国内外研究多基于社区型小样本人群[13-16],代表性方面有待商榷。本研究拟通过对新疆15 020例T2DM患者的临床指标进行分析,探讨DPN的危险因素,并以DPN作为结局变量,利用经济、有效且易于获取的参数,在中国新疆地区建立一个精确的个性化DPN风险预测模型,为临床工作者在DPN的早期筛查和诊断治疗方面提供参考。
1 资料与方法
1.1 研究对象 回顾性收集2010—2019年在新疆医科大学第一附属医院就诊的15 020例T2DM患者的住院资料,T2DM和DPN的诊断均依据《中国2型糖尿病防治指南(2010年版)》[17]中的诊断标准,本研究已获新疆医科大学第一附属医院伦理委员会批准(批号:K202108-24)。纳入标准:(1)年龄≥18岁;(2)确诊或新诊断为T2DM;(3)能够自主交流,无精神障碍。排除标准:(1)资料不全;(2)未签署知情同意书。
1.2 数据收集
1.2.1 一般资料 包括性别、年龄、糖尿病视网膜病变(DR)、糖尿病病程等。
1.2.2 生化资料 入院次日空腹状态下取静脉血3 ml,采用全自动生化分析仪(以3 000 r/min离心10 min,离心半径22 cm)检测白细胞计数(WBC)、嗜酸粒细胞分数、淋巴细胞计数、糖化血红蛋白(HbA1c)、糖化血清蛋白(GSP)、总胆固醇(TC)、三酰甘油(TG)、高密度脂蛋白(HDL)、低密度脂蛋白(LDL)、载脂蛋白A1(ApoA1)、载脂蛋白B(ApoB)。
1.3 统计学方法 采用R 4.0.4软件进行统计学分析,连续变量采用Kolmogorov-Smimovz正态检验,符合正态分布的计量资料采用(±s)描述,两组间比较采用t检验;计数资料的分析采用χ2检验;通过严格的数据过滤与预处理,将符合条件的患者(n=15 020)按3∶1的比例随机分为训练组(n=11 265)和验证组(n=3 755)。以训练组数据中DPN作为结局变量,采用最小绝对收缩与选择算子方法(Lasso回归)[18-19]筛选出独立预测因子,在此基础上利用多因素Logistic回归分析进一步探讨并建立列线图(Nomogram)预测模型,使用验证组数据验证构建的预测模型,为了评价预测模型的效能,本研究采用受试者工作特征(ROC)曲线下面积验证预测模型预测效果[20],并通过Hosmer-Lemeshow拟合优度检验判断模型的拟合优度,绘制校正曲线[21],同时采用决策曲线分析(DCA)[22-23]预测DPN发生的风险。以P<0.05为差异有统计学意义。
2 结果
2.1 一般资料 15 020例T2DM患者中包括8 887例无DPN患者和6 133例DPN患者。无DPN患者和DPN患者嗜酸粒细胞分数、TC、LDL比较,差异均无统计学意义(P>0.05)。无DPN患者和DPN患者性别、年龄、DR发生率、糖尿病病程、WBC、淋巴细胞计数、HbA1c、GSP、TG、HDL、ApoA1、ApoB比较,差异均有统计学意义(P<0.05),见表1。
2.2 DPN的危险因素 以训练组是否发生DPN(赋值:是=1,否=0)为因变量,以性别(赋值:男=1,女=2)、年龄、DR(赋值:是=1,否=0)、糖尿病病程、WBC、嗜酸粒细胞分数、淋巴细胞计数、HbA1c、GSP、TC、TG、HDL、LDL、ApoA1、ApoB作为自变量(其余自变量赋值为连续变量)进行Lasso回归分析(图1),随着惩罚系数λ的变化,模型纳入的变量也在逐渐减少,最终选择10倍交叉验证误差为最小λ+1(λ最小值的1 SE=0.023)作为模型的最优值,此时筛选的预测变量包括年龄、DR、糖尿病病程、HbA1c和HDL。将筛选后的预测变量纳入多因素Logistic回归分析,结果显示,年龄、DR、糖尿病病程、HbA1c和HDL是2型糖尿病患者发生DPN的影响因素(表2)。
表2 T2DM患者发生DPN影响因素的多因素Logistic回归分析Table 2 Multivariate Logistic regression analysis of influencing factors of diabetic peripheral neuropathy in type 2 diabetics
图1 采用Lasso回归进行临床特征的筛选Figure 1 Selection of potential predictors of diabetic peripheral neuropathy in type 2 diabetics by the least absolute shrinkage and selection operator(Lasso)regression
2.3 构建列线图预测模型 将上述多因素Logistic回归分析结果筛选出的变量纳入列线图预测模型,结局指标选取DPN的发病风险,绘制列线图(图2),根据每个风险因素所对应列线图上方的标尺,从而得到该因素的单项评分,所有风险因素评分相加得到总分,便可得到对应患者DPN发生率,总分越高,意味发生DPN风险的可能性越大。
图2 T2DM患者发生DPN风险预测列线图Figure 2 Nomogram predicting diabetic peripheral neuropathy in type 2 diabetics
2.4 训练组和验证组发生DPN的预测价值 绘制列线图预测精度的ROC曲线,训练组列线图预测模型的ROC曲线下面积为0.858〔95%CI(0.851,0.865)〕,诊断临界值为0.464,灵敏度为76.5%,特异度为83.7%;通过验证组数据集进行验证,预测列线图的ROC曲线下面积为0.852〔95%CI(0.840,0.865)〕(图3、4),诊断临界值为0.522,灵敏度为74.0%,特异度为87.4%。此外,验证组的ROC曲线下面积较建模人群仅降低0.006,说明预测模型在训练组和验证组人群均具有良好的预测区分度。
图3 列线图预测模型预测训练组T2DM患者发生DPN风险的ROC曲线Figure 3 ROC curve of the predictive nomogram for the risk of diabetic peripheral neuropathy in type 2 diabetics of training group
图4 列线图预测模型预测验证组T2DM患者发生DPN风险的ROC曲线Figure 4 ROC curve of the predictive nomogram for the risk of diabetic peripheral neuropathy in type 2 diabetics of verification group
2.5 训练组和验证组发生DPN的校正曲线 在训练数据集上,列线图的校正曲线显示预测结果与观察吻合较好(图5)。Hosmer-Lemeshow拟合优度检验表明模型不显著(P>0.05),表明模型与观察数据吻合较好。通过验证组数据集进行验证,同样显示预测与观察吻合较好,Hosmer-Lemeshow拟合优度检验表明模型不显著(P>0.05),表明模型与观察数据吻合较好。
图5 列线图预测模型预测T2DM患者发生DPN风险的校准曲线Figure 5 Calibration curve for predicting the risk of diabetic peripheral neuropathy in type 2 diabetics by the predictive nomogram
2.6 训练组和验证组发生DPN的决策性曲线(DCA)在列线图预测模型的基础上,将筛选出的变量进行DPN的DCA(图6),结果显示,当患者的阈值概率为0~0.9,使用列线图预测T2DM发生DPN风险的净收益更高,同样在验证组得到证实(图6),因此,广泛的备选阈值概率表明该模型是一个很好的评估工具。
图6 列线图预测模型预测T2DM患者发生DPN风险的决策性曲线分析Figure 6 Decision curve analysis for predicting the risk of diabetic peripheral neuropathy in type 2 diabetics by the predictive nomogram
3 讨论
本研究结果发现年龄、DR、糖尿病病程、HbA1c和HDL是T2DM发生DPN的影响因素,其中,DPN发生率与年龄、是否发生DR、糖尿病病程和HbA1c呈正相关,与HDL呈负相关。
本研究结果显示,DR是T2DM患者发生DPN的危险因素,其本身也是糖尿病微血管并发症之一,虽然DPN和DR的病理生理机制有些不同,但其病理基础均与糖代谢紊乱、微血管疾病及微循环障碍有关[24],因此,在T2DM患者中,随着DR的患病率增加,DPN的患病率也随之增加,二者成平行关系[25]。在国内外相关DPN风险预测模型研究中[14-16],少有文献提出将DR纳入DPN风险预测模型的相关报道,而本研究结果显示二者具有非常强的相关性,因而,在临床工作中,医务工作者对T2DM患者进行DPN筛查的过程中应仔细询问其是否患有DR。目前,DPN的发病机制尚不明晰,但已提出炎症、氧化应激和线粒体功能障碍主要参与DPN病理改变[26]。所有这些变化与衰老过程有关[27]。DPN已被证实与一些可改变和不可改变的危险因素有关[13,28-30]。在多数DPN的流行病学研究中,年龄和糖尿病病程是报道最多的不可改变的危险因素[2,31-32]。LI等[29]研究显示,20~34 岁、35~49 岁、50~64岁和≥65岁的患者DPN发生率分别为8.4%、22.7%、33.0%和42.4%,年龄与DPN发生率显著相关。POPESCU等[33]研究结果显示,根据密歇根神经病变筛查量表(MNSI)评分,DPN患病率为28.8%,与较高的年龄呈显著正相关,证明了年龄影响DPN的发生;而SHUN等[34]和ZHANG等[35]发现,糖尿病病程越长,DPN患病率越高,可能是DPN患者神经纤维病变导致纤维神经密度的减少,加深了皮肤去神经化的程度,进而增加了发生DPN患病风险,因此在临床工作中,需要提高对病程较长的T2DM患者的筛查力度,以减缓或减少DPN的发生,从而提升患者生活质量。
本研究结果显示,除年龄、DR和糖尿病病程外,血糖、血脂与DPN的发生同样密切相关。T2DM患者常伴有脂代谢紊乱,表现为HDL水平降低,LDL水平升高。杨辉等[36]研究显示HDL低水平是T2DM患者发生DPN的危险因素,其原因可能是HDL对逆向转运胆固醇起到了促进作用,加速了TG和胆固醇代谢,从而稳定血糖浓度。另有研究证明,HDL与神经传导速度呈正相关,DPN患者HDL水平明显降低,神经传导速度受限提示HDL可能是DPN的危险因素[37]。本研究结果显示,HDL与DPN呈负相关,起到了保护作用。HbA1c是葡萄糖与血红蛋白反应产物,能反映患者过去1~2个月血糖水平,李美[38]在研究中指出,DPN患者的HbA1c水平明显高于非DPN患者,HbA1c与DPN发病率有关。HbA1c水平越高,DPN患病率也越高[39],本研究结果与之一致,HbA1c水平与DPN呈显著正相关,HbA1c升高是DPN发生的独立危险因素之一,有研究发现长期高血糖可促使神经髓鞘上的蛋白非酶促糖基化,导致神经纤维信号传导功能障碍[40],而HbA1c水平的升高便表明T2DM患者处于高血糖状态[41],因此针对T2DM患者,需要严格控制其血糖,降低HbA1c水平,从而可以有效预防、延缓DPN的发生。
列线图是临床事件个体化预测分析的统计模型。与其他预测性统计学方法相比,列线图分析可以通过直观、可视化的方式提供更好的个体化预测风险评估[14,42]。本研究通过Lasso回归结合多因素Logistic回归分析确定筛选出的5个危险因素是临床医生容易获得的常规临床变量,从而使其易于在实践中采用。此外,使用随机抽样将符合条件的患者分为训练组和验证组,以评价预测模型的效能。在训练组中,预测列线图的ROC曲线下面积为0.858,相比SANTOS等[14]建立的模型(ROC曲线下面积=0.73)及宁改君等[16]建立的模型(ROC曲线下面积=0.789)具有更高的效能。将建立的预测模型在外部验证时,不论是预测精度,还是校正曲线和DCA均具有良好的效能,由此说明该预测模型是一个很好的评估工具。本研究的局限性在于本研究为单中心研究,并非多中心大样本流行病学调查结果,数据来自同一医疗中心,亦存在病例选择偏倚,在后续的研究工作中,本课题组计划与其他中心进行合作,利用其临床数据资料进一步完善并提高模型的预测价值。
作者贡献:李永生、张学良、李丞、封志炜和王凯进行文章的构思与设计;张学良、李丞进行研究的实施与可行性分析;李丞、封志炜进行数据收集;李永生、封志炜进行数据整理;李永生、王凯进行统计学处理;李永生、张学良进行结果的分析与解释;李永生撰写论文;张学良进行论文的修订;王凯负责文章的质量控制及审校;张学良、王凯对文章整体负责,监督管理。
本文无利益冲突。