APP下载

基于决策树与Logistic回归模型的2型糖尿病患者生存质量的影响因素分析*

2022-08-31张文慧王艳梅韦锡娟杨沛

现代临床护理 2022年5期
关键词:决策树条目年龄

张文慧,王艳梅,韦锡娟,杨沛

(1 宁夏医科大学护理学院,宁夏银川,750000;2 上海市浦东新区公利医院护理部,上海,200135)

糖尿病目前已成为全球性的严重公共卫生问题。截止至2019年全球约有4.6 亿的成年人患有糖尿病,我国糖尿患者数为1.164 亿,位居全球第一,并以2 型糖尿病为主[1]。糖尿病患病率高、病程长、易引起多种并发症,一旦患病需要终身治疗,严重影响着个人、社会和经济的健康[2]。糖尿病患者生存质量水平是评价治疗效果的重要指标,在疾病持续治疗阶段不仅需要帮助患者控制血糖,还应帮助患者改善生存质量[3]。2 型糖尿病患者的生存质量受到多种因素的作用和影响,只有了解患者生存质量现状及其影响因素,才能有效改善其生存质量。目前,对生存质量影响因素的分析通常采用多元线性回归或Logistic 回归分析,未能深入挖掘数据信息。决策树方法作为分类规则学习方法之一,能够充分挖掘数据信息,实现对数据的分类和预测[4]。已有研究证明[5],决策树和Logistic 回归共同运用能够优势互补,提高分析效能,有助于高危人群的筛选,现已被广泛应用于医疗卫生领域。然而,国内尚缺乏将决策树和Logistic 回归联合运用分析2 型糖尿病患者生存质量的影响因素。因此,本研究运用Logistic回归模型和决策树CHAID 模型共同分析2 型糖尿病患者生存质量的影响因素,旨在为2 型糖尿病患者制定干预措施和管理策略提供参考依据。

1 对象与方法

1.1 研究对象

2020年6月—12月, 采用便利抽样法选取上海市某三级乙等综合医院及以医联体为纽带的8家社区卫生服务中心就诊的500 例2 型糖尿病患者。根据估计总体均数所需样本量的计算公式[6]:n=(u1-α/2σ/δ)2,取α=0.05,u1-α/2=1.96;参考2018年北京市747 例2 型糖尿病患者生存质量调查结果[7],取标准差σ=13.32,预计允许误差δ=1.4,得出n=343,考虑流失率等原因将样本含量扩大20%,最终确定样本量至少为429 例。纳入标准:①符合2017年中国2 型糖尿病防治指南中糖尿病诊断标准[8];②年龄≥18 周岁;③意识清楚,认知水平正常,能进行正常语言沟通。排除标准:①伴有严重合并症或并发症,如肾功能衰竭、心力衰竭等。本研究经上海市浦东新区公利医院伦理委员会审批通过,审批号:[2019]临审第(030)号。患者均知情同意并签订知情同意书。

1.2 研究工具

1.2.1 一般情况调查表 由研究小组成员参考相关文献[9]自行设计,包括社会人口学资料:性别、年龄、文化程度、居住方式、工作状态、家庭人均月收入、医保种类;疾病相关资料:病程、糖尿病相关并发症、合并症、糖尿病治疗方式、接受过糖尿病教育(指是否参加过由医院或社区组织过的健康讲座,或住院期间接受过院内小课堂等形式的健康教育)、吸烟情况、饮酒情况等。

1.2.2 糖尿病患者生存质量特异性量表(diabetes specific quality of life scale,DSQL) 由我国学者方积乾等[10]研制,量表由生理功能(12 个条目)、心理功能(8 个条目)、社会关系(4 个条目)、治疗维持(3个条目)4 个维度共27 个条目组成,采用Likert 5 级评分法,每个条目从无至最严重得分对应1~5 分,总分135 分,得分越高,生存质量越低。参考文献[11],将患者生存质量得分中位数作为界值分为两组:>中位数者为较差组,≤中位数者为较好组,本研究参考此界值进行分组。量表Cronbach’s α 系数为0.95,分半信度为0.91。本研究该量表的Cronbach’s α 系数为0.829。

1.2.3 糖尿病自我管理行为量表(the summary of diabetes self-care activities measure,SDSCA) 由TOOBERT等[12]研制,我国学者华丽等[13]对其进行翻译。翻译后的量表包括饮食(4 个条目)、锻炼(2 个条目)、血糖监测(2 个条目)、足部护理(2 个条目)和用药管理(1 个条目)5 个维度共11 个条目,每个条目按0~7分8 级计分,总分77 分,得分越高说明自我管理行为越好。计算2 型糖尿病患者自我管理行为标准分:标准分=实际得分/此项可能的最高得分×100,标准分<60 分为较差,标准分≥60 分为较好。量表总体Cronbach’s α 为0.918,重测信度为0.425~0.774。本研究该量表的Cronbach’s α 系数为0.877。

1.3 资料收集方法

由课题组培训并通过考核的4 名调查员进行现场问卷调查,采用统一的调查表和指导语。问卷填写完毕后当场回收,检查并纠正错误。采用EpiData 3.1软件进行数据双人录入及一致性检验。本研究共发放500 份问卷,回收500 份,剔除信息不完整问卷14份,实际有效问卷486 份,有效回收率为97.2%。

1.4 统计学方法

数据采用SPSS 23.0 软件包进行统计分析。计量资料采用(±s)描述,计数资料采用频数、百分率描述,单因素分析采用χ2检验或独立样本t检验。Logistic 回归分析采用多因素Logistic 逐步向前筛选法。决策树分析采用决策树CHAID 算法[14],生长枝条拆分及合并显著性检验水准α=0.05。父节点最小样本量设置为100,子节点最小样本量设置为50,若结点上的样本量达不到设置要求,该结点即作为终结点。为了防止模型过度拟合,设定决策树最大生长层数为3 层。采用受试者工作特征曲线、Hosmer-Lemeshow 拟合优度检验、总体预测正确率、模型Risk统计量、灵敏度、特异度等指标评价两模型。P<0.05为差异有统计学意义。

2 结果

2.1 2 型糖尿病患者一般情况

本研究486 例2 型糖尿病患者完成研究,男283 例(58.2%),女203 例(41.8%);年龄26~98 岁,平均(63.4±10.6)岁,其余情况见表1。

2.2 2 型糖尿病患者生存质量得分情况

2 型糖尿病患者生存质量总分为(46.1±7.2)分,处于中上水平,较差者230 例(47.3%),较好者256例(52.7%)。其中生理功能得分为(19.6±4.9)分、心理功能(15.0±2.5)分、社会关系(7.0±1.3)分、治疗维持(4.6±1.0)分,各维度项目平均得分由低至高依次为治疗维持(1.5±0.3)分、生理功能(1.6±0.4)分、社会关系(1.8±0.3)分和心理功能(1.9±0.3)分。

2.3 2 型糖尿病患者生存质量的单因素分析

2 型糖尿病患者生存质量的单因素分析见表1。由表1 可见,两组患者在年龄、文化程度、工作状态、病程、有无糖尿病相关并发症、有无合并症、治疗方式和自我管理行为变量比较,差异有统计学意义(均P<0.05),其他变量比较,差异无统计学意义(均P>0.05)。

表1 2 型糖尿病患者生存质量的单因素分析(n=486;n/%;±S)

表1 2 型糖尿病患者生存质量的单因素分析(n=486;n/%;±S)

生存质量较差组(n=230)变量t/χ2P 生存质量较好组(n=256)性别男女年龄(岁)文化程度小学及以下初中高中/中专大专及以上工作状态不在岗在岗居住方式独居与配偶与子女家庭人均月收入(元)≤3000 3001~6000>6000医保类型自费公费132(57.4)98(42.6)65.4±9.6 151(59.0)105(41.0)61.6±11.1 0.126 4.064 0.782<0.001 23(10.0)107(46.5)81(35.2)19(8.3)19(7.4)98(38.3)100(39.1)39(15.2)8.300 0.040 189(82.2)41(17.8)179(69.9)77(30.1)9.892 0.002 23(10.0)143(62.2)64(27.8)23(9.0)175(68.3)58(22.7)2.130 0.345 11(4.8)155(67.4)64(27.8)5(2.0)175(68.3)76(29.7)3.109 0.211 142(61.7)88(38.3)159(62.1)97(37.9)0.007 1.000

(续表1)

2.4 2 型糖尿病患者生存质量的Logistic 回归分析

以2 型糖尿病患者生存质量作为因变量(生存质量较好赋值为0,生存质量较差赋值为1),将单因素分析中有统计学意义的变量作为自变量,进行Logistic 回归分析。年龄作为连续型变量直接带入模型,分类变量赋值后(赋值情况见表2)带入模型,由表3 可见,自我管理行为较差(OR=3.041)、合并糖尿病相关并发症(OR=2.797)、使用胰岛素治疗(OR=1.907)是2 型糖尿病患者生存质量的风险因素,年龄小(OR=0.969)是2 型糖尿病患者生存质量保护因素(均P<0.05)。

表2 Logistic 回归分析变量赋值

表3 2 型糖尿病患者生存质量影响因素的Logistic 回归分析(n=486)

2.5 2 型糖尿病患者生存质量的决策树CHAID 算法分析

以2 型糖尿病患者生存质量情况作为因变量,将单因素分析中有统计学意义的变量作为自变量进行决策树CHAID 算法分析。因变量与自变量赋值方式同Logistic 回归分析。根据本研究所设置的生长和修剪规则,最终建立的决策树包含3 层、11 个节点、5 个终末节点,共筛选出3 个解释变量:并发症、自我管理行为、年龄。模型的第1 层为“是否患有并发症”,显示糖尿病相关并发症与患者生存质量相关性最高,并发症是2 型糖尿病患者生存质量重要的影响因素,有并发症的患者生存质量不佳的概率(70.8%)明显高于无并发症的患者(38.1%)。模型第2 层筛选出的影响因素是“自我管理行为”,在有并发症的人群中,自我管理行为较差患者的生存质量不佳的概率(78.7%) 高于自我管理行为较好的患者(59.6%)。第3 层筛选出的影响因素是“年龄”,在无并发症且自我管理行为较好的人群中,年龄越小的患者其生存质量不佳的概率越低,≤59 岁的患者其生存质量不佳的概率为7.4%,见图1。

图1 2 型糖尿病患者生存质量影响因素的决策树CHAID 算法分析

2.6 Logistic 回归模型与决策树CHAID 模型评价

Logistic 回归模型ROC 曲线下面积AUC 为0.743(95%CI 0.701~0.787);模型系数检验χ2=6.536,DF=8,P=0.587,拟合效果较好;模型预测正确率为68.2%。决策树CHAID 模型ROC 曲线下面积AUC 为0.741(95%CI 0.697~0.784);构建风险0.282,标准误为0.022,拟合效果较好;模型预测正确率为64.2%。决策树模型灵敏度(76.171)高于Logistic 回归分析模型(73.054),特异度(59.133)低于Logistic 回归分析模型(65.651%)。两模型预测价值比较,差异无统计学意义(Z=-0.527,P=0.328),分类效果均为中等,见表4。

表4 Logistic 回归模型与决策树CHAID 模型分类效果比较

3 讨论

3.1 2 型糖尿病患者生存质量现况分析

本研究结果显示,2 型糖尿病患者生存质量总分为(46.1±7.2)分,患者生存质量处于中上水平,与樊理诗等[7]调查的北京市2 型糖尿病患者得分(44.92±13.32)较接近,低于四川2 型糖尿病患者(76.178±11.36)分[15]、安徽农村2 型糖尿病患者(54.99±11.88)分[16]及上海老年2 型糖尿病患者(54.13±14.08)分[17],提示患者生存质量可能与地区经济发展及年龄有关,在分析与评估患者生存质量时应充分考虑地域、经济和人口学因素。在各维度得分中心理功能平均分最高,提示2 型糖尿病患者的心理功能水平较差,与方燕龄等[18]的研究结果相似。造成该结果的原因可能有:2 型糖尿病是一种终身性疾病,患者需要长期的血糖监测和药物治疗,并且随着病程的发展,患者逐渐出现胰腺β 细胞功能障碍及胰岛素抵抗等问题,导致血糖控制难度增加,继而发生各种并发症,对患者及其家庭带来沉重的经济负担与生理、心理压力。此外,有研究显示[19],病程>5年的患者更易出现焦虑、抑郁症状,患病率约为20%~40%。而本研究糖尿病病程>5年的患者共445 例,占总人数的91.6%。该部分患者更可能存在烦躁、恐惧、焦虑、抑郁等负性情绪,导致心理精神状况较差。当患者出现负性情绪时,机体将处于应激状态,升糖激素分泌增加,血糖波动增加,患者易发生低血糖、皮肤瘙痒、麻木、疼痛等症状[20]。躯体上的不适又会加重患者负性情绪,最终导致“心理-生理”的恶性循环,严重影响患者生存质量。因此,建议在2 型糖尿病患者的管理中应重视患者心理健康状况的评估,加强对患者疾病认知和心理健康的宣教,鼓励患者积极参加社会活动、构建良好社会支持网络,改善其不良心理,最终提高患者生存质量。

3.2 决策树与Logistic 回归模型对2 型糖尿病患者生存质量影响因素的异同分析

本研究结果显示,决策树CHAID 模型与Logistic 回归模型的ROC 曲线下面积均>0.7,模型预测价值为中等。两模型均显示,患者自我管理能力、并发症发生情况与年龄是2 型糖尿病患者生存质量影响因素。与Logistic 回归分析结果相比,决策树CHAID模型未纳入治疗方式作为患者生存质量的主要影响因素,可能由于两种模型的检验方法不同,决策树在以糖尿病相关并发症作为第一层变量时,模型运行中治疗方式对生存质量的贡献程度不显著,故未能进入决策树模型。本研究中,Logistic 回归虽然能突出自我管理行为、糖尿病相关并发症、年龄、治疗方式的主效应,通过OR 值量化自变量对因变量的变化关系,但对各影响因素间交互作用的处理效果欠佳,且不能提供很好的决策建议[21]。决策树模型分析对所有纳入变量采用非线性及高度相关的分析,能根据纳入变量的重要性进行排序并以树型图的方式显示结果,但其无法输出OR 值,使结果解读受限[22]。故联合两种模型共同用于患者生存质量影响因素的分析可提高分析效能,充分解释各变量间关系[5,22]。如本研究中糖尿病并发症是影响患者生存质量的主要因素,发生并发症的患者其生存质量不佳的概率为70.8%,而无并发症的患者其生存质量不佳的概率较低,仅为38.1%。自我管理行为及年龄也是患者生存质量的影响因素,发生并发症同时伴自我管理行为较差的患者其生存质量较差的概率高达78.8%,而在无并发症且自我管理行为较好的患者中,生存质量不佳的概率为26.4%,且该类患者的年龄越小其生存质量不佳的概率越低,如年龄≤59 岁的患者生存质量不佳的概率可低至7.4%。本研究将两种模型结合,深入挖掘数据信息,从不同层面分析了2 型糖尿病患者生存质量的影响因素,帮助临床医护人员识别危险因素和筛选高危患者。

3.3 2 型糖尿病患者生存质量的影响因素分析

3.3.1 自我管理行为 本研究结果显示,自我管理行为是2 型糖尿病患者生存质量的影响因素,自我管理行为越好的患者其生存质量越高,与夏章等[23]的研究结果一致。分析原因可能是:自我管理是指患者通过管理自身疾病症状,包括调整生理、心理和社会状态,改变惯有生活方式从而控制病情发展的一个过程[24]。自我管理行为较差的患者更易导致血糖控制不佳,发生相关并发症及不良事件的风险也明显增加,对患者生理功能造成负面影响[25]。此外,有研究表明[26],自我管理能力可在患者生存质量与心理抑郁之间发挥中介作用,自我管理行为较差的患者其心理健康状况较差,易产生焦虑、抑郁等不良情绪,降低患者心理、精神健康质量。因此,医护人员应重视患者自我管理能力的提升,可通过加强相关知识宣教、促进患者健康行为养成、改善患者负性情绪等改善患者生存质量。

3.3.2 糖尿病相关并发症 本研究结果显示,是否患有糖尿病相关并发症对患者生存质量具有影响作用,发生并发症的患者其生存质量较低。随着糖尿病病程的进展,患者易发生大血管、微血管及神经系统的并发症[27],如糖尿病足、糖尿病眼病、糖尿病肾病,出现皮肤和足部感染、视力下降、蛋白尿、水肿等症状,对患者的日常生活及社会交往造成限制,直接降低患者生理功能和社会关系方面的生存质量。合并并发症的患者需要采取更复杂的治疗方案,如严格的饮食控制运动、多种药物联合治疗、定期指标筛查等[8],不仅加重糖尿病痛苦与自我感受负担,还会加重患者经济负担,导致其生存质量降低。

3.3.3 年龄 2 型糖尿病是一种与年龄相关的疾病,其患病率随着年龄的增长而增加[28]。本研究发现,高龄是2 型糖尿病患者生存质量的危险因素,分析原因可能是老年2 型糖尿病患者自理能力相对较差,多存在病程长、防治意识不足、治疗依从性差、健康教育实施困难、多病共存等特点[7,15,29],易导致病情控制不佳,引起生存质量下降。且随着年龄增长,患者机体功能逐渐衰退,代谢平衡更易破坏,易发生肢体活动障碍及相关并发症且预后相对较差,影响患者生存质量。

3.3.4 治疗方式 本研究中Logistic 回归分析显示,与未使用胰岛素治疗的患者相比,使用胰岛素治疗的患者生存质量较低,与ARDITI 等[30]研究结果一致。中国2 型糖尿病防治指南中明确规定[8],在生活方式干预和口服降糖药联合治疗下患者的血糖控制仍不佳,应开始胰岛素治疗。相比使用胰岛素治疗的患者,仅采取口服药物治疗或以接受生活方式干预为主的患者可能血糖控制情况较好,对生存质量影响较小。另一方面,虽然短期使用胰岛素使患者血糖水平有所改善,但长期使用带来的疼痛、低血糖、高额医疗费用等问题易影响患者生存质量。

4 结论

本研究结果显示,2 型糖尿病患者的生存质量处于中上水平,还有待改善,疾病对患者的心理功能影响较大。生存质量的影响因素分析中决策树模型与Logistic 回归模型显示,相同的影响因素有自我管理行为、并发症、年龄,不同的影响因素有治疗方式。未来医护人员应重点关注合并并发症、自我管理行为较差、高龄的2 型糖尿病患者,积极改善该类患者的疾病认知水平、治疗依从性和心理精神功能,提高患者自我管理能力和生存质量。本研究存在的局限性:采用便利抽样法,选取样本仅来自于上海市浦东新区,存在选择偏倚。未来研究应扩大样本量并采用分层抽样对多个城市、医院、社区进行2 型糖尿病患者生存质量的调查。本研究为横断面研究,无法得出因果结论,未来可通过实验性研究进行验证。

猜你喜欢

决策树条目年龄
变小的年龄
简述一种基于C4.5的随机决策树集成分类算法设计
《词诠》互见条目述略
11个自由贸易试验区将启用新版负面清单
年龄歧视
决策树学习的剪枝方法
算年龄
决策树在施工项目管理中的应用
不服不行的搜索记录
两本《醒世姻缘传》?