糖尿病患者住院期间降糖药调整的相关因素:基于美国130家医院数据的Logistic回归分析
2020-11-06施亚男施羽樊春笋姚红玉
施亚男,施羽,樊春笋,姚红玉
南通大学附属启东医院/启东市人民医院内分泌科1、科研科/病因室2,江苏 南通 226200
20 世纪70 年代末以后的历次大规模糖尿病流行病学调查显示,我国糖尿病患病率呈现持续上升趋势,从1980 年的0.67%上升到2013 年的10.9%[1]。目前、高血糖和糖尿病在我国构成了巨大的疾病负担,糖尿病防控工作任重而道远[2]。根据最新一版的中国2型糖尿病防治指南(2017版),在糖尿病患者的血糖监测指标中,糖化血红蛋白(hemoglobin A1c,HbA1c)是评估血糖长期控制状况的金标准,也是临床实践中决定是否需要调整降糖药的重要依据[3]。在实际临床工作中,糖尿病作为主诊断或其他诊断的患者群体分布在综合性医院的各个科室,这个庞大而混杂的糖尿患者群在住院期间无疑有可能发生降糖药治疗方案的调整,调整必然伴随着住院日的增加和住院费用的上涨。目前对于因任何疾病住院的糖尿患者群降糖药调整关联因素的研究较少,本研究利用既往用作研究糖尿病患者30 d 内再入院相关因素的住院病案大数据,采用Logistic 回归分析评估住院期间降糖药调整的相关因素,报道如下:
1 资料与方法
1.1 一般资料 自UCI的机器学习资源库(https://archive.ics.uci.edu/ml/datasets.php)下载美国130 家医院糖尿病患者的1999—2008年数据集,该数据集记录的均是住院患者,住院第一诊断可为任何疾病,但均明确诊断患有糖尿病,住院时间为1~14 d,住院期间均进行了临床检验、药物治疗和(或)手术治疗。该数据集共101 766 条记录,剔除HbA1c 为“None”即HbA1c未检测的对象共84 748例,剩余具备HbA1c结果记录的患者共17 018例。针对研究对象的重复住院记录,仅保留第一次记录,剔除后续住院记录,剩余研究对象15 388 例。进一步剔除出院状态(discharge disposition id)显示为死亡、临终关怀或无记录的研究对象,最终共有14 339例研究对象进入本次分析。本研究采用的是公共开放数据,所有研究对象已行去识别化处理,已向启东市人民医院伦理委员会申请伦理豁免并审核通过。
1.2 研究结局 研究结局为患者住院期间是否发生降糖药治疗的调整改变,对应的研究结局变量名为“change”,该变量无缺失。在“change”变量基础上新建结局变量“outcome”,赋值=0 表示未发生研究结局即住院期间降糖药无调整,赋值=1表示发生研究结局即住院期间降糖药有调整,由此形成一个二分类的研究结局。
1.3 临床指标 纳入分析的临床指标共14 项,其中属于离散型数值变量的有八个,变量中文含义及原始英文名如下:入院诊断数为number diagnoses,入院化验项目数为num lab procedures,入院药物治疗数为num medication,入院手术治疗数为num procedure,一年内急诊就诊数为number emergency,一年内门诊就诊数为number outpatient,一年内住院次数为number patient,本次住院天数为time in hospital;属于连续型数值变量或分类变量的有6 个,变量中文含义及原始英文名如下:性别为gender,年龄为age,种族为race,入院来源为admission type id,入院诊断为diag 1、diag 2、diag 3,糖化血红蛋白为A1Cresult。
1.4 统计学方法 数据清理和统计分析全部在SAS 软件(版本9.4)进行,研究结局和临床指标通过Proc Logistic 进入Logistic 回归模型进行分析。首先是8 个离散型数值形式的临床指标单个和一并进入Logistic回归模型,随后将8个离散型数值临床指标变换成两分类变量,14个两分类临床指标分别单个和一并进入Logistic回归模型,一并进入Logistic回归模型时,分别采用向前、向后和逐步法筛选变量并比较结果。数值变量用均数±标准差(±s)和中位数(四分位数间距)表示,分类变量用频数(构成比)表示,用比值比(odds ratio,OR)评估关联强度并计算OR 值点估计的95%置信区间(confidence interval,CI),P 值=0.05 设为关联是否有统计学意义的界值。
2 结果
2.1 离散型数值临床特征与降糖药调整关联的Logistic 回归分析 14 339 例住院患者中,共8 067 例(56.26%)在该次住院过程中经历了降糖药调整,6 272例(43.74%)则未发生降糖药调整。全部14 个临床指标中,属于离散型数值变量的指标有8个。8个离散型数值变量指标逐个进入单因素Logistic 回归模型,除住院次数外,其余7个指标的OR(95%CI)均大于1,且P值均<0.05,差异有统计学意义;住院次数的OR点估计大于1,但95%CI经过1,P值=0.7516,差异无统计学意义。8 个离散型数值变量指标一起进入多因素Logistic 回归模型,向前、向后和逐步筛选模式的结果相同,其中3 个指标是降糖药调整的危险因素,即化验项目数、治疗药物数和急诊就诊数,2 个指标是降糖药调整的保护因素,即手术治疗数和住院次数;其余3 项指标(入院诊断数、门诊就诊数和住院天数)在进入多因素Logistic 回归模型后,OR 的95%CI 经过1,P 值>0.05,差异无统计学意义。具体OR 值及95%CI 见表1。
表1 临床特征为离散型数值变量的住院糖尿病患者控制血糖药物调整相关因素的Logistic回归分析(n=14 339)
2.2 两分类临床变量特征与降糖药调整相关的Logistic回归分析 将表1中的八个离散型数值变量转换成两分类变量后,共有14个两分类临床特征进入第二阶段的Logistic回归分析。男性、年龄<60岁、非急诊入院、主诊断非心血管疾病、入院诊断数>6项、入院化验指标数>49项、入院药物使用>14种、既往曾急诊就诊、住院天数>7 d、糖化血红蛋白>7%,在单因素和多因素Logistic回归中,相对于各自的参考组均为危险因素,即OR值点估计>1,95%CI不经过1,P值均<0.05。其中OR值点估计>2 的有入院药物试用数和HbA1c。入院药物使用数>14 的OR (95%CI)为2.245 (2.075~2.428),HbA1c>7%的OR (95%CI)为2.118 (1.965~2.283)。单因素Logistic回归中,非白人发生降糖药调整的OR值的95%CI 经过1,差异无统计学意义,而在多因素Logistic回归中,OR值>1,95%CI不经过1,差异有统计学意义。而既往有住院史在单因素Logistic回归中,OR值点估计为危险因素,但差异无统计学意义;而在多因素Logistic回归中,既往有住院的OR值点估计为保护因素,并差异有统计学意义。有手术治疗史,在单因素Logistic回归为危险因素,而在多因素Logistic回归为保护因素,差异均有统计学意义。既往有门诊就诊史,在单因素Logistic回归为危险因素,差异有统计学意义,而在多因素Logistic回归中作为危险因素则差异无统计学意义。上述结果的具体OR值及95%CI见表2。
表2 临床特征为两分类变量的住院糖尿病患者控制血糖药物调整相关因素的Logistic回归分析(n=14 339)
3 讨论
本研究利用基于医院常规收集病案大数据对糖尿患者群因任何疾病住院期间发生降糖药调整的相关因素进行分析,结果发现患者的人口学信息如性别、年龄、种族,入院时及入院期间特征如是否急诊入院、主诊断类别、入院诊断数、化验数、药物数、手术数、住院天数、入院HbA1c水平以及既往史信息如一年内急诊就诊次数、住院次数均与研究结局即住院期间发生降糖药调整相关。本研究使用的大数据为机器学习领域常用的开放数据库,既往主要用来研究糖尿患者群因任何疾病住院后30 d内再入院的相关因素,因该数据集具备完整无缺失的降糖药调整信息,故适合用作本次降糖药调整相关因素的分析[4]。
住院糖尿病患者因任何原因住院后,血糖控制不佳无疑是平均住院日增加的一大原因。如能明确糖尿患者群住院期间发生降糖药调整的相关因素,有利于针对相应的危险因素或保护因素采取个性化的住院前预防或干预措施,进而能够降低平均住院日及总费用。在本研究确定的降糖药调整危险因素中,OR值>2的有药物使用数和HbA1c,两者中更有临床应用价值的无疑是HbA1c。根据中国2型糖尿病防治指南(2017 年版)[3],已经写明将HbA1c≥7%作为治疗方案调整的判定标准,并将HbA1c作为评价长期血糖控制情况的金标准。而HbA1c 的检测往往在非内分泌科室被忽视,并且在科室间存在差异[5-6]。在本次分析中主诊断为非心血管疾病是降糖药调整的危险因素,或说明入住心血管科的患者有更好的血糖控制方案[7]。本次分析还确认了两个降糖药调整的保护因素,即手术和既往住院,提示糖尿患者群中的择期手术患者和既往住院患者有更好的血糖控制。
原始数据集中包含了其他和糖尿病及降糖药调整相关的临床指标,例如研究对象体质量,但体质量指标的缺失值过多,故未能纳入Logistic回归模型。在17 018条记录的数据集中,高达97.97%的体质量指标缺失,提示笔者在未来的前瞻研究中,需要特别重视身体测量指标的获得,身高、体质量、腰围、臀围等指标均需按标准测量。本次分析的一个优势是数据集样本量较大,因此Logistic 回归结果受样本量的影响很小。笔者计算了离散型数值变量的回归结果,后续全部转换为两分类变量,主要是出于方便结果进行临床解释的需要,而离散型数值变量如何兼顾统计学指标和实际临床应用转换成两分类变量,值得进行进一步的探索和验证[8]。
尽管HbA1c的检测精度、控制标准等方面还存在不足和争议[9-11],本次分析得出的高HbA1c 是住院期间降糖药调整的独立危险因素,提示入院前患者的HbA1c检测率需进一步提高,以确保糖尿病患者的入院前确诊,并利用已建成的基于门诊的糖尿病标准化管理中心等平台,将糖尿患者群的血糖在入院前便控制到较为理想的状态,减少住院期间降糖药调整,利于患者主要疾病的诊治和康复,并有望降低平均住院日,提升医疗机构的运行效率。