Logistic 回归模型与决策树模型在早期肝癌切除术后感染危险因素分析中的效果比较
2022-10-10胡鹏蕴赵宏峰史保宾杨小伟
胡鹏蕴 赵宏峰 史保宾 杨小伟
(1. 新乡市中心医院肿瘤外科(普瘤三)肿瘤特需科,河南 新乡 453000;2. 新乡医学院第四临床学院,河南 新乡 453000)
肝癌是发生于肝脏或肝内胆管的恶性肿瘤,发病率居恶性肿瘤第三位[1]。肝癌发病隐匿,进展快,多数确诊时已为晚期,预后差[2]。感染为肝癌术后常见并发症,包括肺部、腹腔、手术切口及泌尿系统等感染,尤其是肺部感染,其发病率处于高水平[3]。
我国拥有最大肝脏疾病人口及最多肝切除病例,肝癌切除术后患者5 y、3 y 生存率在70%、30%,改善其肝切除术后预后为临床研究重点。肝癌切除术后感染导致患者术后创口愈合不良,增加患者痛苦,不利于病情康复,严重者并发呼吸衰竭症状,增加患者死亡与预后不良风险[3]。故确定肝癌术后感染危险因素并早期干预对提高预后具有重要意义。
目前临床多用Logistic 模型分析感染因素,能有效占线因变量与自变量间数量依存关系,但无法处理一些非线性、高度交互作用与大量缺失值资料[4]。决策树法是数据挖掘的重要方式,广泛用于医药生物方面,极大程度弥补传统Logistic 回归模型的不足与劣势[5]。本研究通过比较决策树与Logistic 回归模型分析肝癌术后感染危险因素效果,旨在降低术后感染发生率。
1 资料与方法
1.1 一般资料
选取2018 年10 月-2020 年12 月于我院行肝癌切除术的76 例早期肝癌患者作为研究对象。纳入标准:符合《原发性肝癌诊疗规范(2019 年版)》标准[6];肝功能分级为A、B 级;患者知情同意。排除标准:凝血障碍患者;临床数据缺失患者;术前存在感染患者。所有患者均签署知情同意书,并经伦理委员会论证通过。
1.2 方法
1.2.1 资料收集
记录患者基本资料(性别、年龄、吸烟饮酒史),病史(糖尿病、高血压、腹部手术),生化指标(白蛋白水平),手术指标术中出血量、ASA 分级、肝切除范围),术后指标(引流管留置时间、有无输血与肝漏)信息。
1.2.2 决策树模型
CHAID 算法分析发生感染患者感染危险因素,分离规则:生长“枝条”分割检验α=0.05;防止过度拟合,决策树生长层设为3 层,停止规则为α=0.05,母节点样本量为50,子节点最小为10。
1.2.3 Logistic 回归模型
逐步向前筛选法分析术后发生感染的影响因素。
1.2.4 术后感染的诊断
感染的诊断标准[7]。肺部感染:咳嗽咳痰,听诊有湿啰音,呼吸音减弱,痰细菌培养呈阳性,胸片与CT 显示肺部炎症;切口感染:切口出现明显红肿、发热症状,渗出的分泌物伴脓性,细菌培养呈阳性;腹腔感染:明显腹痛,B 超见腹腔脓肿,穿刺或引流渗出脓性分泌物,细菌培养呈阳性;泌尿道感染:出现尿频尿急等症,细菌培养呈阳性。
1.3 观察指标
(1)肝癌切除术后的感染情况;(2)Logistic回归模型的单因素分析;(3)术后感染危险因素的多因素分析;(4)决策树模型分析术后感染因素。
1.4 统计学方法
2 结果
2.1 肝癌切除术后感染发生情况
肝癌切除术后13 例患者发生感染,发生率为17.11%,肺部、切口、腹腔、泌尿道感染分别为5 例、3 例、2 例、3 例。
2.2 Logistic 回归模型的单因素分析结果
感染与未感染患者在性别、吸烟饮酒史、高血压史、手术方式、ASA 分级方面,差异无统计学意义(P>0.05);两组的年龄、糖尿病史、肝功能分级、白蛋白水平、出血量、肝切除范围、引流管留置时间、输血、胆漏,具有统计学差异(P<0.05)。见表1。
2.3 术后感染的多因素分析
经Logistic 分析显示,糖尿病史、白蛋白水平、出血量、引流管留置时间、胆漏为术后感染危险因素(P<0.05)。见表2。
2.4 术后感染影响因素的决策树模型分析结果
决策树图显示,糖尿病史、术中出血量、白蛋白水平、胆漏为影响患者术后感染的因素,其中糖尿病史的影响最显著。见图1。模型估计风险为0.465,标准误为0.008。
表1 单因素分析
表2 多因素分析
图1 CHAID 法对肝癌术后感染发生影响因素的决策树图
3 讨论
我国拥有最大肝脏疾病人口及最多肝切除病例,改善其肝切除术后预后为临床研究重点。肝脏部位具有丰富的血供,手术的创伤较大、风险较高,术后并发症尤其是感染不仅增加治疗难度,也是影响术后恢复的重要因素[1-2]。研究显示,肝癌术后感染率在5~21%,感染表现多样,不同感染部位有不同感染表现[2-3]。本研究中76 例患者术后13 例感染,感染率为17.11%。
通过Logistic 回归模型与决策树模型筛选出术后感染的危险因素,包括年龄、糖尿病史、肝功能分级、白蛋白水平、出血量、肝切除范围、引流管留置时间、输血、胆漏,与既往研究基本类似。Logistic 回归分析中的引流管留置时间为术后感染的影响因素,而决策树中被剔除,与既往研究结果不同。决策树模型的优势不受共线性影响,各因素相互独立,可提高模型准确度。
Logistic 回归分析显示,糖尿病史、白蛋白水平、出血量、引流管留置时间及术后胆漏为感染危险因素;而决策树图显示,糖尿病史、术中出血量、白蛋白水平、胆漏为决影响患者术后感染的因素,其中糖尿病史的影响最显著。本研究结果的糖尿病史、白蛋白水平的因素与刘清[8]研究结果一致,胆漏因素与其不同。该结果原因为肝癌患者术后应激而激活肝糖原,引起胰岛素抵抗,高血糖状态促进细菌增殖而感染。白蛋白水平能反映机体肝功能与营养状态,肝功能B 级患者有更高的感染率,肝功能与营养状态相互影响,白蛋白下降更易感染。术中大量出血可导致机体缺血,对肝功能有损伤,降低患者免疫功能,术后短时间输血增加循环负荷发生免疫应激,增加感染风险[9]。肝切除范围也影响术后感染,但肝切除范围较大且操作过程更复杂,肝切断面大,术中失血量更大,且肝IV 段与VIII 段切除术中暴露较多Glisson 鞘,增加术后胆漏风险,滋养细菌以发生腹腔感染。术后留置引流管能排出体内坏死组织,但留置时间越长,细菌经其进入体内的风险也逐渐增加[8]。决策树在统计学方面属于非参数统计,该方法不同于统线性处理,弥补了变量间共线性,避免评估复杂参数以分析变量间关系。Logistic 回归模型能将肝癌术后感染危险因素与自变量关系表达出来,变量变化信息相对于决策树更充分。但该模型未针对影响变量重要性不直观,对变量交互效应差。决策树可表现变量间相互作用,无法反应变量主效应与叠加效应[9]。相对于Logistic 模型,决策树图形有更直观的输出结构,具有良好的可视化效果,能展现出感染因素与占比。
综上所述,早期肝癌患者肝癌切除术后感染的影响因素较多,决策树与Logistic 回归模型能相互补充,从多方面描述感染发生影响因素,为制定防治术后感染的措施提供依据。