基于决策树的结直肠癌术后患者非计划性再入院风险预测模型研究*
2020-02-03陈静文徐林霞吴秀丽李显蓉
陈静文,徐林霞,吴秀丽,李显蓉
(1 西南医科大学护理学院,四川泸州,646000;2 西南医科大学附属医院普通外科(胃肠),四川泸州,646000)
非计划性再入院是指前次住院诊疗结束,患者在首次出院后无法预测的再入院,且患者再入院的原因是相同或相关疾病[1]。非计划性再入院率是评价医院诊疗和护理质量的重要参考指标,较高的非计划性再入院率不仅增加了患者的身心痛苦、住院时间及治疗费用,也在一定程度上导致了医疗资源的浪费[2]。近年来,结直肠癌术后患者非计划性再入院的发生率呈逐渐上升趋势[3],但目前对于患者非计划性再入院的统计分析方法,常规使用Logistic 回归模型。但由于影响结直肠癌术后患者非计划性再入院的因素较多,且相互之间关系错综复杂,传统的Logistic 回归分析方法在处理存在多重共线性数据资料时存在偏倚[4]。目前,相关研究主要集中于影响因素的鉴别及再入院原因的探索分析,少有相关风险预测的研究报道。决策树是数据挖掘中用于分类预测的方法,决策树模型在护理管理、临床护理领域已有应用[5]。文天才等[4]应用决策树对缺血性脑卒中患者31 d 内非计划性再入院风险因素进行预测,证实了决策树用于非计划性再入院风险预测的适用性。目前关于运用决策树构建结直肠癌术后患者非计划性再入院的风险预测模型研究较少。本研究在查阅了国内外关于结直肠癌术后患者非计划性再入院危险因素的研究[3,6-18]基础上,通过决策树进一步构建结直肠癌术后患者非计划性再入院预测模型,对指标进行验证,为今后制定降低患者非计划性再入院的措施提供依据。现将方法和结果报道如下。
1 资料与方法
1.1 一般资料
抽取2018年6月至2019年12月在本院胃肠外科住院治疗的结直肠癌患者为研究对象。纳入标准:①年龄≥18 岁;②内镜或病理检查确诊为结肠癌或直肠癌; ③常规行术前各项检查,资料完整;④接受手术治疗。排除标准:①原发疾病非结直肠癌而由其他恶性肿瘤转移至结直肠; ②结直肠癌早期复发二次手术; ③在其他医院接受结直肠癌手术治疗;④首次治疗非正常出院。
1.2 方法
1.2.1 资料收集方法 课题组前期查阅了国内外关于结直肠癌术后患者非计划性再入院危险因素的研究,包括原始研究[6-17]和系统评价[3,18]。由2 名研究员依据文献类型选择相应工具进行文献的质量评价,然后提取相关危险因素。使用医院HIS 系统,查阅所有研究对象首次入院及再入院的完整病历,提取患者资料包括性别、年龄、体质量指数(body mass index,BMI)、文化程度、居住地、疾病诊断、肿瘤TNM 分期、入院方式、术前合并症、术前新辅助化疗、手术方式、手术时间、术中出血量、是否肠造瘘、术后并发症、术后住院时间;再入院资料 (再入院时间、再入院原因、治疗方式和转归)。
1.2.2 结局指标 31d 内非计划性再入院[1]:①患者出院当天开始至再入院当天为止31d 内的再入院;②再入院ICD-10 疾病代码与前次入院疾病相同;③因前次入院疾病的并发症或者疾病的复发、恶化而无法预测的再入院; ④若患者再入院的原因与上一次住院的原因无关,或再入院是预先计划好的,如结直肠癌术后定期住院化疗、复查等再入院,不列入非计划性再入院。
1.2.3 统计学方法 数据使用SPSS24.0 软件进行统计学分析。按31 d 内有无非计划性再入院分为两组,有非计划性再入院设为再入院组,无计划性再入院设为对照组,两组间的计量资料比较采用t检验;计数资料比较采用卡方检验,计数资料不满足卡方检验条件时采用Fisher 确切概率法;等级资料比较采用秩和检验。采用卡方自动交互检验(chi-square automatic interaction detection,CHAID)算法构建决策树模型。决策树模型构建过程:将数据录入SPSS24.0 软件,在分析中选择:分类-决策树,决策树的生长方法选择:卡方自动交互检验,并设置决策树的父节点和子节点中最小样本含量分别为100 和50,最大树深度为3。采用ROC 曲线下面积(AUC)、灵敏度和特异度对决策树模型的预测效果进行评价。
2 结果
2.1 两组患者一般资料的比较
符合纳入标准1195 例患者,其中非计划性再入院63 例(5.27%)为再入院组,未发生非计划性再入院的1132 例(94.73%)为对照组。两组间一般资料比较见表1。从表1可见,两组患者在疾病诊断、性别、年龄、体质量指数、文化程度和居住地方面的比较,差异无统计学意义(均P>0.05)。
表1 患者一般资料两组间的比较 (n/%,±s)
变量性别分类统计量P χ2=0.008 >0.05年龄(岁)体质量指数(kg/m2)文化程度男女 文盲t=0.054 t=-1.789>0.05>0.05小学初中高中大学农村城镇直肠癌结肠癌再入院组(n=63)38(60.32)25(39.68)59.98±13.19 21.87±2.78 3(4.76)27(42.86)27(42.86)5(7.94)1(1.59)38(60.32)25(39.68)41(65.08)22(34.92)对照组(n=1132)689(60.87)443(39.13)60.07±11.83 22.59±3.10 69(6.09)401(35.42)508(44.88)128(11.31)26(22.97)764(67.58)368(32.51)632(55.83)500(44.17)χ2=0.970>0.05居住地χ2=1.391 >0.05疾病诊断χ2=2.075 >0.05
2.2 两组患者临床相关资料的比较
两组患者临床相关资料的比较见表2。从表2可见,两组患者在肿瘤TNM 分期、术前合并症项数、是否肠造瘘、术后并发症方面的比较,差异有统计学意义(P<0.05)。在入院方式、新辅助化疗、手术方式、手术时间、手术出血量、术后住院时间方面的比较,差异无统计学意义(P>0.05)。
表2 患者临床相关资料两组间的比较 (n/%)
2.3 结直肠癌术后患者非计划性再入院现状
1195 例结直肠癌术后患者中63 例患者非计划性再入院,非计划性再入院率为5.27%,再入院总费用为113 万。其中不完全性肠梗阻(22 例),腹腔残余感染(9 例),切口感染(7 例),吻合口瘘(5例),为非计划性再入院的主要原因。其中50 例患者保守治疗,13 例患者接受二次手术治疗,61 例患者好转出院,2 例患者病情恶化自动出院。
2.4 结直肠癌术后患者非计划性再入院风险预测树形图
根据决策树构建的结直肠癌术后患者非计划性再入院风险预测树形图,见图1,该树形图包含3 层,共11 个节点,6 个终端节点,提取6 条分类规则,见表3。以非计划性再入院的患者所占节点构成比例代表该类人群发生非计划性再入院的风险,筛选出3 类高危人群:①有术后并发症,术前合并症≥2 项,占该节点构成的28.1%; ②有术后并发症,术前合并症<2 项,占该节点构成的10.6%;③无术后并发症,TNM 分期≥III 期,有肠造口,占该节点构成的8.3%。
图1 结直肠癌术后患者非计划性再入院风险预测树形图
表3 结直肠癌术后患者非计划性再入院风险预测决策树模型分类规则
2.5 决策树模型的预测效果
使用SPSS24.0 软件绘制ROC 曲线,见图2,计算决策树模型的ROC 曲线下面积、灵敏度和特异度。结果显示,决策树模型的ROC 曲线下面积为0.823,95%CI(0.775,0.870),灵敏度为0.762,特异度为0.745。
图2 决策树模型ROC 曲线图
3 讨论
3.1 结直肠癌术后患者非计划性再入院现状分析
相关研究结果显示,不同时间跨度、不同国家的结直肠癌术后患者非计划性再入院率有所差异。以30d 内非计划性再入院为例,意大利[6]再入院率为6.0%,丹麦[7]为13.7%,美国[8-9]为10.0%~11.4%,英国[10-11]为12.6%~16.0%。国内学者何小东[12]和杨婕[13]研究显示,结直肠癌术后患者非计划性再入院率分别为5.2%和6.1%。目前,各个国家或地区关于非计划性再入院的时间间隔尚无统一标准,2011年,中华人民共和国原卫生部发布了《三级综合医院医疗质量管理与控制指标(2011版)》,该文件明确了我国非计划性再入院的间隔时间为≤31d[19]。故本研究以31 d 内非计划性再入院为结局测量指标,调查了结直肠癌术后患者非计划性再入院现状,结果显示,结直肠癌术后患者非计划性再入院率为5.27%,与国内学者[12-13]调查30d 内非计划性再入院结果相近。本研究中63 例非计划性再入院患者中,不完全性肠梗阻、腹腔残余感染、切口感染和吻合口瘘是患者非计划性再入院的主要原因。
3.2 基于决策树构建结直肠癌术后患者非计划性再入院风险预测模型的合理性
随着计算机技术的发展,基于决策树的分类方法是数据挖掘中较为典型的分类预测的方法。与传统统计方法相比,决策树的优势为:属于非参数统计,对资料基本无要求,克服了传统统计方法应用时存在严格条件限制的问题;结果可视化,易于理解和解释;能处理自变量之间共线性的问题,展现自变量间的交互作用[20]。本研究以结直肠癌术后患者为研究对象,研究该类患者非计划性再入院的风险预测因素,模型的因变量为二分类变量,自变量既有分类变量也有连续型变量,满足决策树模型算法的要求。通过CHAID 算法构建决策树模型,从树形图可明显看出各子节点中非计划性再入院的占比构成情况,通过节点的路径来表示非计划性再入院患者的分类规则,共提取6 条分类规则,筛选出3 类高危人群,其中术后并发症对非计划性再入院影响最大,有术后并发症,术前合并症≥2 项时,发生非计划性再入院的患者占该节点构成的28.1%,为第一类高危人群;有术后并发症,术前合并症<2 项时,发生非计划性再入院的患者占该节点构成的10.6%,为第二类高危人群;无术后并发症,TNM 分期≥III 期,有肠造口时,发生非计划性再入院的患者占该节点构成的8.3%,为第三类高危人群。以往的研究多基于Logistic 回归分析,侧重于对单个因素的独立作用,决策树得到的树模型展示了多个因素交互作用,更侧重于模型整体的预测效果[21]。本院结合相关文献,采用综合性的指标构建决策树模型,结果显示,决策树模型的ROC 曲线下面积为0.823,通常ROC 曲线下面积为0.9 左右表示诊断价值较高[22]。本研究还发现,构建的结直肠癌术后患者非计划性再入院的决策树模型,其灵敏度为0.762,特异度为0.745。说明,决策树模型可以较为准确地预测结直肠癌的发生和区分无风险的患者。
3.3 结直肠癌术后患者非计划性再入院的影响因素分析
根据决策树模型中影响因素距离根节点的位置和卡方检验统计量,将影响因素进行排序,结果显示,术后并发症是最主要的影响因素,其后依次为术前合并症≥2 项、肿瘤TNM 分期≥III 期、肠造口、居住地。相关研究[23-25]结果表明,术后并发症是结直肠癌术后患者非计划性再入院的独立危险因素。LAWSON 等[23]研究表明,结直肠癌患者首次住院期间出现术后并发症与30d 内的非计划性再入院密切相关,术后伴有并发症的患者非计划性再入院率是正常康复患者的3.3 倍。ORCUTT 等[24]研究显示,首次住院期间发生术后并发症的患者非计划性再入院的风险是无术后并发症患者的4.36倍。因此,早期预防术后并发症的发生,重点关注有术后并发症的患者,具有重要的临床意义。杨婕等[13]研究显示,加速康复外科模式下有术前合并症的结直肠癌患者术后非计划性再入院的风险是无合并症患者的2.91 倍,且合并呼吸系统疾病和心血管疾病是导致结直肠癌患者术后非计划性再入院发生率高的主要因素。国外学者的研究结果也显示,术前合并症增加了结直肠癌患者非计划性再入院的风险[10]。提示,临床护士在做好结直肠疾病专科护理的同时,也要关注患者的基础疾病,做好术前合并症的护理。本研究结果显示,肿瘤TNM 分期≥III 期,也是结直肠癌术后患者非计划性再入院的影响因素,这与QUINTANA 等[17]的研究结果一致,TNM 分期≥III 期的患者,肿瘤浸润较深、邻近器官受累、手术预后较差,与早期肿瘤患者相比非计划性再入院风险更高。行肠造口术的患者非计划性再入院风险更高,可能与造口护理的专业性较强,患者居家照护的难度大,护理不当易出现多种造口并发症有关[26]。此次决策树分析还显示,居住地为非计划性再入院的影响因素,但距离根节点的位置最远,卡方检验统计量也最小,且单因素分析结果显示,两组患者的居住地情况差异无统计学意义(P>0.05),因此尚需增加样本量进行进一步研究分析。
4 结论
非计划性再入院率是评价医院诊疗和护理质量的重要参考指标,结直肠癌术后患者非计划性再入院的发生率呈逐渐上升趋势,有效预测非计划性再入院的风险,筛选出高危人群,是预防非计划性再入院发生的首要步骤。本研究应用数据挖掘技术,构建结直肠癌术后患者非计划性再入院的决策树模型,提取6 条分类规则,筛选出3 类高危人群,为临床护理工作者预测非计划性再入院高危人群,采取针对性预防措施提供依据。未来可进行前瞻性研究,并扩大样本量,使研究数据更具代表性。