APP下载

空腹血糖受损危险因素的Logistic回归及分类树分析

2018-09-05谢梦婷邹迪莎马小珺江仁美

安徽医科大学学报 2018年9期
关键词:高龄危险血糖

姚 爽,谢梦婷,邹迪莎,黄 芳,马小珺,江仁美,于 健

空腹血糖受损(impaired fasting glucose,IFG)最早是在1997年由美国糖尿病协会(ADA)引入概念,IFG和糖耐量异常(impaired glucose tolerance,IGT)都是一种处于正常和糖尿病血糖水平之间的状态,IFG患者虽然仅是空腹血糖(fasting plasma glucose,FPG)轻度增高,但却具有同IGT人群一样向糖尿病发展的高危倾向,同时也存在发生大血管并发症的危险[1]。因此,及早识别发现IFG患者,控制IFG的危险因素,并积极进行早期干预,对减少糖尿病以及其并发症,降低死亡率具有重要意义。Logistic回归是常被应用于预测结果为二分类变量的传统方法,其对单独危险因素的分析较为明确,但当多因素之间存在复杂相互关系时,会使分析误差增加。而分类树模型作为一种新的统计方法,弥补了传统统计方法的不足,对数据的类型没有严格的限制,目前被广泛应用于疾病发病风险的预测[2-3],但其在对IFG危险因素的分析,目前国内研究并不多见。该研究对5 952例体检者的临床资料进行分析,并构建Logistic回归模型及分类树模型,并比较分析两模型的准确性,为IFG的预防和治疗提供科学依据。

1 材料与方法

1.1研究对象选择2012年7~11月在桂林医学院附属医院体检中心体检的5 952例汉族人群为研究对象,进行横断面调查,研究对象均来自桂林市七星区、叠彩区、秀峰区、雁山区及象山区等,并获得知情同意,该研究由桂林医学院伦理委员会批准。其中,排除年龄小于20岁、孕妇、以及已确诊的糖尿病患者、患有恶性肿瘤等重大疾病以及严重肝肾功能不全者,共5 952例资料完整者纳入研究。研究对象年龄20~70(45.82±11.69)岁。其中男3 074例(51.65%),平均年龄(46.22±12.04)岁;女2 878例(48.35%),平均年龄(45.39±11.29)岁。本研究共检出IFG患者404例,平均年龄(53.04±9.55)岁,其中男244例(60.4%),女160例(39.6%)。成人IFG的粗患病率为6.79%(男:7.94%;女:5.56%)。

1.2问卷调查在研究对象进行体检时,采用问卷调查和体检的方法,并通过专业人员进行记录,获取其基本资料,包括个人基本情况(姓名、性别、年龄、民族、婚姻状况、职业、文化程度);既往史:高血压、非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)、糖尿病等;生活习惯(饮食、吸烟史、饮酒等)、家族史及运动情况等。

1.3体格测量及测量方法经过专业培训和考核的体检中心专业人员,采用统一标准,使用经校准的SK-CK超声波人体秤,时间为早晨7:30~9:00,被测量者免冠、赤脚、空腹、排空膀胱、着轻单衣、以“立正”姿势站立,身高测量精确至0.1 cm,体质量测量精确至0.1 kg。计算体重指数(body mass index,BMI),BMI=体重(kg) /身高(m2)。研究者要避免饮酒、吸烟、喝茶和咖啡,避免剧烈运动,安静休息5~10 min,呈坐位,使用水银血压计测量右臂肱动脉血压,手臂与心脏在同一水平,测量3次,每次间隔30 s,取3次测量的平均值进行分析,数值精确到1 mmHg。

1.4实验室检查及测量方法所有受检者至少禁食10 h,清晨空腹采集肘静脉血(5 ml),在口服75 g葡萄糖负荷后120 min再次采集血液样本。生化指标:使用罗氏Cobas C501 全自动生化分析仪检测: FPG、口服葡萄糖耐量实验(oral glucose tolerance test,OGTT)、2 h血糖(2-h plasma glucose,2 hPG)、尿酸(uric acid,UA)、三酰甘油(triacylglycerol,TG)、总胆固醇(total cholesterol,TC)、低密度脂蛋白胆固醇(low-density lipoprotein cholesterol,LDL-C)及高密度脂蛋白胆固醇(high-density lipoprotein cholesterol,HDL-C)。所有研究对象由固定的超声专科医师行肝胆B超检查。

1.5诊断标准NAFLD 的诊断参照中华医学会肝病分会脂肪肝及酒精性肝病学会组制定的非酒精性脂肪性肝病诊断标准[4]。高血压的诊断标准按《中国高血压防治指南2010》定义[5]:3次测量平均值收缩压(SBP)≥140 mmHg(1 mmHg=0.133 kPa)和(或)舒张压(DBP)≥90 mmHg为高血压或近2周内服降压药血压正常者,排除继发性高血压者。血脂异常诊断标准:参照2007年中国成人血脂异常防治指南的标准[6]:TC≥6.22 mmol/L;TG≥2.26 mmol/L;LDL-C≥4.14 mmol/L;HDL-C<1.04 mmol/L,出现以上任何一项即诊断为血脂异常。参照中国2型糖尿病防治指南[7],IFG组诊断标准为6.1 mmol/L≤FPG<7.0 mmol/L且OGTT 2 h血糖<7.8 mmol/L。将24.0 kg/m2≤BMI<28 kg/m2诊断为超重,BMI≥28 kg/m2诊断为肥胖[8]。高尿酸血症诊断标准[9]:男性血尿酸≥420 μmol/L或女性血尿酸≥360 μmol/L者为高尿酸血症者。

1.6统计学处理采用SPSS 20.0软件和Medcalc(版本15.2.2)软件进行分析,分别建立Logistic回归模型和分类树模型,比较分析两种方法结果的差异,以P<0.05为差异有统计学意义。

2 结果

2.1Logistic回归分析IFG影响因素中,年龄取平均值45.8为分界点,其余因素结合专业知识进行赋值,见表1。以IFG有无作为因变量,各影响因素作为自变量进行单因素Logistic回归,结果显示:高龄、男性、高TG、高TC、高LDL-C、高BMI、高尿酸血症、NAFLD、高血压是IFG的危险因素,高HDL-C是IFG患者的保护因素(P<0.05),见表2。将单因素Logistic分析中有意义的因素作为自变量,进行多因素Logistic回归分析,控制混杂因素后,结果显示:高龄、NAFLD、高血压、高TG、高BMI是IFG患者的危险因素,高HDL-C是IFG患者的保护因素(P<0.05),见表3。

表1 IFG患者影响因素主要变量及赋值

表2 IFG影响因素的单因素Logistic回归分析结果

OR:比值比

表3 IFG影响因素的多因素Logistic回归分析结果

图1 IFG患者的分类树模型

2.2构建分类树模型利用分类树模型分析IFG的危险因素,将IFG患者赋值为1,将正常组赋值为0。将性别、年龄、TG、TC、HDL-C、LDL-C、BMI、UA、NAFLD、高血压作为IFG患者的影响因素构建分类树模型。基于根节点和子节点的最小样本大小的限制后的增长和修剪后,得出分类树模型包括4层,19个节点,以及10个终末节点。树模型提示NAFLD、高龄、高血压、高TG和高LDL-C 5个变量是IFG的危险因素。见图1。

2.3Logistic回归与分类树模型的受试者工作特征曲线(receiveroperatorcharacteristiccurve,ROC)比较根据Logistic回归和分类树模型所得的预测变量作为测试变量,IFG组作为状态变量进行绘制ROC曲线。Logistic回归模型的ROC曲线Youden指数为41.90%,敏感性为75.00%,特异性为66.90%,曲线下面积(area under curve,AUC)值为0.775。分类树模型的ROC曲线的Youden指数为43.96%,敏感性为73.27%,特异性为70.69%,AUC值为0.775,两种模型均具有中等准确性,两种模型AUC比较差异无统计学意义(P=0.9610),说明两模型没有明显差异性,见图2、表4。

图2 Logistic回归模型与分类树模型的ROC曲线比较

表4 Logistic回归模型与分类树模型的ROC曲线参数比较

3 讨论

糖尿病的发展是一个缓慢的过程,从血糖升高到出现一系列的临床症状,需要数年时间。IFG是正常糖代谢与糖尿病之间的中间状态,是糖尿病和心血管疾病的危险因子之一[10]。探讨IFG危险因素,加强预防和保健工作,对于避免和减少糖尿病的发生具有重要意义。

控制混杂因素后,多因素Logistic回归结果显示:高龄、NAFLD、高血压、高TG、高BMI是IFG患者的危险因素,高HDL-C是IFG患者的保护因素,与之前研究[11-12]结果一致。高龄人群IFG发病率高,有以下两点原因:第一,随着年龄的增长,肌肉组织逐渐老化、减少,机体储存和利用葡萄糖的能力下降;第二,随着年龄增长,β细胞对内源性胰岛素刺激因子的反应性降低,胰岛素分泌减少,引起血糖升高[13]。我国已进入老龄化社会,据有关统计,2012年我国60岁及以上老年人口数量为1.94亿,老龄化水平已达到14.3%。因此,加强对高龄人群血糖的筛查,对改善其生活质量有着不可忽视的作用。NAFLD是一种无过量饮酒史肝实质细胞脂肪变性和脂肪贮积为特征的临床病理综合征。NAFLD的细胞脂肪堆积,会引发并加剧胰岛素抵抗,同时NAFLD患者的血液和肝脏中的游离脂肪酸(FFA)、肿瘤坏死因子-α(TNF-α)、纤溶酶原激活物抑制物-1(PAI-1)、瘦素[14-15]等表达增加,都可促进胰岛分泌胰岛素,形成高胰岛素血症和胰岛素抵抗,继而导致血糖升高。

近年来,诸多针对IFG研究主要集中在危险因素的调查上,通常采用的是Logistic 回归模型对影响因素进行筛选。本文中应用Logistic 回归计算出各危险因素的OR值:高龄人群发病风险是低龄人群的2.796倍,NAFLD患者发病风险是无NAFLD者的2.297倍,高TG患者发病风险是TG正常者的2.222倍,高血压患者发病风险是血压正常者的1.983倍,高BMI人群发病风险是BMI正常人群的1.343倍。这些结果可帮助研究者更直观地了解各影响因素的作用及大小,但是,此方法易受到共线性的影响,无法估计各个自变量间可能存在的相互作用。

分类树分析是一种非参数回归模型,利用递归分型将人群分为不同的亚群,近年来在国外大量应用。分类树模型在处理变量之间的相互作用中,可有效的处理数据中自变量缺失的问题,不仅能把缺失值归到众数的范畴,还可以将其设置为单独的一个分类,使结果可以不受变量的共线性的影响,并以树形图的形式显示结果,模型直观、明确、清晰、有层次。本研究应用分类树模型对IFG患者影响因素的信息进行深入挖掘,共筛选出5个IFG危险因素,包括NAFLD、高龄、高血压、TG和 LDL-C,与Logistic回归模型分析的结果基本相符,另外,树形图还可显示各因素之间的交互作用,本模型提示,高龄和有NAFLD人群患病率为25.5%,高于低龄和有NAFLD人群的患病率(11.6%)。但是,与其他统计分析方法一样,分类树自身也存在缺点:第一,分类树对各因素的单独效应的定量解释不如Logistic模型明确,在本研究中使用Logistic模型得出OR值,可明确的判断出影响IFG患者的危险因素和保护因素。第二,在样本容量小的情况下模型稳定性差,因本研究数据量大,因此分类树模型稳定性良好。

最后,应用ROC曲线来评估两模型的准确度,结果显示:两模型曲线均位于参考线上方,分类树模型的ROC曲线更为平滑,说明分类树模型在稳健性上更有优势,两者曲线下面积差异无统计学意义(P>0.05)。但因两种分类方法各有利弊,具体结论要因实际情况和具体的数据情况来表现与判定。提示在临床研究上,可结合实际应用情况,进行优势互补,综合比较。

然而,目前本研究也有一些局限性:首先,所有包括成人受试者来自一个体检中心,因此并不能代表所有桂北地区人群。其次,需要进一步的前瞻性研究来调查危险因素和IFG患者的因果关系。

猜你喜欢

高龄危险血糖
细嚼慢咽,对减肥和控血糖有用么
一吃饺子血糖就飙升,怎么办?
居家监测血糖需要“4注意”
高龄孕妇妊娠中期产前诊断中唐氏筛查的应用
二胎政策以来高龄孕产妇的高危因素分析和临床干预
喝水也会有危险
拥挤的危险(三)
话“危险”
14省份建立高龄补贴制