运用决策树算法构建天疱疮并发感染的风险预测模型
2023-10-30黄国惠李娇倪萍丁钰
黄国惠,李娇,倪萍,丁钰
天疱疮是临床较为常见的一种自身免疫性大疱病,多发于50~60岁的中老年群体,且以皮肤、黏膜上出现薄壁水疱或大面积糜烂为临床特点[1-2]。据相关文献[3]报道,全球范围内天疱疮年发病率约为(0.75~5)/10万,并呈逐年增高趋势。目前临床应用糖皮质激素联合其他治疗,虽然可将患者致死率降低至5%,但由于其机体表皮内棘层细胞松解,正常皮肤屏障功能受损,表皮剥落,促使体液过量渗出[4-5]。加之免疫抑制剂和糖皮质激素等药物长期大量使用,促使本身就已存在皮肤屏障受损的天疱疮患者极易并发感染。既往研究[6]表明,天疱疮未治疗者2年死亡率为50%,5年死亡率可达100%。虽然通过上述干预方式可将多数患者的5年致死率降低至51.6%,但近年研究报道,该类患者的致死率仍呈上升趋势,其中感染是患者死亡的主要原因。因此,探究影响天疱疮患者并发感染的相关因素并给予早期制定针对性的防控策略,对优化天疱疮患者的临床疗效,降低感染风险等方面尤为重要[7]。目前虽然已有部分学者对天疱疮并发感染的相关因素展开研究,但上述报道多采用传统的风险预测模型,虽然传统的风险预测模型具有良好的风险评估效能,但其在临床决策/建议等方面存在一定不足[8]。而决策树模型是通过树形结构建立的一种风险预测模型,其分类速度快且结果能显示各项风险因素的重要性排序,更利于医务人员识别分析风险因素的权重[9-10]。基于此,本研究通过分析天疱疮患者的临床资料,探究影响感染发生的相关因素,并建立预测天疱疮并发感染的预测决策树模型,以期为天疱疮高感染风险患者的临床防治工作提供参考。
1 对象与方法
1.1研究对象 病例来源于2019年3月—2022年8月在本院收治的127例天疱疮患者作为研究对象,本研究已通过本院伦理委员会批准。
1.2纳入标准 ①所有受试者均符合《2015EDE/EADV共识:大疱性天疱疮的管理[11]》中有关天疱疮相关诊断标准者;②通过直接免疫荧光、临床表现以及组织病理学诊断确诊者;③存在黏膜损害者,尼氏征阳性;④临床一般资料完整者。
1.3排除标准 ①复发性天疱疮者;②伴有其他感染性疾病者;③伴有恶性肿瘤疾病者;④伴有结核、肝炎等传染性疾病者;⑤伴有精神类疾病或重度失语者。
1.4观察指标及研究方法
1.4.1观察指标 ①基线信息:性别、年龄、居住地、抽烟、饮酒、病程;②基础疾病:糖尿病、高血压、高脂血症;③其他资料:皮损面积、临床分型、激素使用种类、住院时间、感染类别、病情程度、低蛋白血症、CD4+T淋巴细胞减少症。
1.4.2研究方法 回顾性分析127例天疱疮患者的临床一般资料,参考系统感染相关诊断[12]标准(白细胞计数>10.0×109/L,且中性粒细胞比例>70%),所有患者的基线治疗均为系统使用甲泼尼龙联合局部应用糖皮质激素。根据患者是否发生感染,将患者分为感染组和非感染组。采用单因素、多因素分析天疱疮患者并发感染的影响因素。
1.5相关定义 ①病情严重程度:根据天疱疮疾病面积指数对患者病情严重程度进行划分[13]:即分为轻度(0~8分),中度(9~25分),重度(>25分);②CD4+T淋巴细胞减少症:CD4+T淋巴细胞计数<300/μL;③低蛋白血症[14]:血清总蛋白<60 g/L或血清白蛋白<25 g/L。
1.6统计学处理 采用SPSS24.0软件分析数据,计数资料选择卡方检验分析,运用多因素Logistic回归分析筛选天疱疮并发感染的危险因素。当P<0.05为差异有统计学意义。运用SPSS Modeler软件构建预测天疱疮并发感染的决策树模型,并应用R(4.2.1)软件绘制多因素Logistic回归模型与决策树模型的受试者工作特征(ROC)曲线。
2 结果
2.1天疱疮患者感染发生现状 本研究共计纳入的127例天疱疮患者中有41例患者发生了感染,有86例患者未发生感染,感染发生率为32.28%(41/127)。
2.2天疱疮患者并发感染的单因素分析 感染组和非感染组患者性别、居住地、抽烟、饮酒、病程、皮损面积、临床分型、激素使用种类、住院时间、高血压、高血脂症、感染类别等临床资料对比,差异无统计学意义(P>0.05),而年龄、病情程度、糖尿病、低蛋白血症、CD4+T淋巴细胞减少症等资料对比,差异有统计学意义(P<0.05)。见表1。
表1 天疱疮患者并发感染的单因素分析 例(%)
2.3天疱疮患者并发感染的多因素Logistic回归分析 将感染组和非感染组患者单因素分析具有统计学意义的项目(年龄、病情程度、糖尿病、低蛋白血症、CD4+T淋巴细胞减少症)作为自变量,以天疱疮患者是否并发感染作为因变量(具体赋值方式见表2),进行多因素Logistic回归分析,结果显示:年龄>60岁(OR=4.503,95%CI:1.611~12.583)、病情程度为重度(OR=6.037,95%CI:2.074~17.575)、存在糖尿病(OR=2.960,95%CI:1.116~7.847)、存在低蛋白血症(OR=7.826,95%CI:2.133~28.717)、存在CD4+T淋巴细胞减少症(OR=24.181,95%CI:5.114~114.34)是天疱疮患者并发感染的危险因素(P<0.05),见表3。
表2 变量赋值表
表3 天疱疮患者并发感染的多因素分析
2.4天疱疮患者并发感染的决策树模型 将感染组和非感染组患者单因素分析(P<0.05)的自变量(年龄、病情程度、糖尿病、低蛋白血症、CD4+T淋巴细胞减少症)纳入决策树模型,生成模型见图1。本研究决策树生长5层,共计12个节点,其中终末节点7个,共筛选提取5个分类规则,即年龄、病情程度、糖尿病、低蛋白血症、CD4+T淋巴细胞减少症:①非低蛋白血症,非CD4+T淋巴细胞减少症,年龄≤60岁者占该节点构成比的7.55%;②非低蛋白血症,CD4+T淋巴细胞减少症者占该节点构成比的71.43%;③非低蛋白血症,非CD4+T淋巴细胞减少症,年龄>60岁者,病情严重程度为重度者占该节点构成比的57.14%;④非低蛋白血症,非CD4+T淋巴细胞减少症,年龄>60岁,病情严重程度为轻中度,无糖尿病者占该节点构成比的7.14%;⑤非低蛋白血症,非CD4+T淋巴细胞减少症,年龄>60岁,病情严重程度为轻中度,伴糖尿病者占该节点构成比的42.86%;⑥低蛋白血症,年龄≤60岁者该节点构成比的44.44%;⑦低蛋白血症,年龄>60岁者该节点构成比的88.89%,见图1。其中糖尿病对天疱疮患者并发感染的影响较小,而年龄则是天疱疮患者并发感染最为重要的影响因素,见图2。
图1 影响天疱疮患者并发感染的决策树模型
图2 影响天疱疮患者并发感染决策树模型的预测变量重要性排序
2.5两种模型的预测效能 预测天疱疮患者并发感染的决策树模型的AUC值稍高于多因素Logistic回归模型(0.814vs.0.798),但两个模型的AUC相比差异无统计学意义(Z=-0.451,P>0.05),见表4,图3~4。
图3 多因素Logistic回归模型的ROC曲线
图4 决策树模型的ROC曲线
表4 两种模型预测效能对比
3 讨论
天疱疮与感染之间的关系较为复杂,其发生与进展过程是由患者机体免疫功能、抗菌药物有效性等多种因素共同决定的。既往国内外研究[15-16]报道,天疱疮患者感染发生率从22%~56%不等。本研究127例天疱疮患者中,有86例患者未发生感染,感染发生率为32.28%,结果符合上述报道。分析原因可能为,天疱疮患者临床早期干预需给予大剂量糖皮质激素并适当给予免疫抑制剂等相关药物进行辅助治疗,而这种干预方案虽然具有较好的治疗效果,但极易诱发真菌感染。因而探究天疱疮并发感染的相关因素并构建天疱疮患者并发感染的风险预测模型,对天疱疮患者并发感染的临床防治工作尤为重要。
既往研究[17]表明,高龄是天疱疮患者并发感染的独立危险因素。随着年龄的不断增加,患者体内脏器及免疫系统均呈衰退状态,机体对外界病原菌的抵抗能力随之减弱,加以疾病本身对免疫系统的损害,促使天疱疮患者更易发生感染。天疱疮患者张力性水疱破溃风险相对较大,而伴有糖尿病的患者,其机体高血糖状态可经多种途径下诱导机体参与创面愈合的细胞逐渐凋亡,促使患者创面愈合时间延长,而创面长时间暴露外界,也会增加患者机会性感染风险[18];此外,由高糖状态所诱发的高凝状态、微血管病变、白细胞吞噬与黏附能力降低、局部微循环障碍等因素均可为病原菌的繁殖与成长提供有利条件,继而导致患者感染风险增加[19]。相关研究[17]表明,重度天疱疮患者并发感染的风险显著高于轻中度患者。本研究结果发现,感染组中病情严重程度为重度的患者占比显著高于非感染组,通过多因素Logistic回归进一步分析发现,重度天疱疮患者发生感染的风险较轻中度患者增加6.037倍,结果与上述研究相一致。
此外,本研究证实存在低蛋白血症和CD4+T淋巴细胞减少症的患者发生感染的风险较非低蛋白血症和非CD4+T淋巴细胞减少症患者增加7.826倍和24.181倍,结果与刘琼等[18]研究一致。血清白蛋白和CD4+T淋巴细胞表达均是能够有效反映机体免疫功能的可靠指标。白蛋白主要由体内肝脏合成,其具有极为重要的生理作用并可维持胶体渗透压。而天疱疮患者需长期行糖皮质激素干预,极易导致蛋白丢失,而低蛋白血症可导致降低患者血浆胶体渗透压,诱发组织水肿并加剧感染扩散;而感染又可加剧体内蛋白消耗形成恶性循环。目前有关CD4+T淋巴细胞减少症增加天疱疮患者并发感染的具体机制尚未完全明确,可能与疾病本身相关。而人体中存在的CD4+T淋巴细胞可介导细胞免疫和炎症反应,抵抗病原菌感染。此外,患者体内存在一种可针对桥粒芯蛋白3的抗体,一般情况下B细胞并不会产生该种抗体,但在患者机体免疫调节机制异常下,B细胞无法对桥粒芯蛋白3出现免疫耐受,而该种免疫耐受可接受Th2的调节,因而CD4+T淋巴细胞降低不仅极易导致患者受到病原菌侵袭,亦会促进病情加速进展[19]。
除上述外,本研究结果显示,决策树模型预测天疱疮患者并发感染的AUC值稍高于多因素Logistic回归模型,但两种模型预测天疱疮患者并发感染结果具有一致性。医务人员可通过上述模型用于辅助预测天疱疮患者感染发生风险,针对感染高危患者制定防治措施,继而有助于提高患者临床疗效,降低感染风险。
综上所述,年龄>60岁、病情程度为重度、存在糖尿病、存在低蛋白血症、存在CD4+T淋巴细胞减少症是天疱疮患者并发感染的危险因素,本研究构建的天疱疮患者并发感染的决策树预测模型预测效能良好,有助于医务人员筛选感染高风险人群。但本研究为回顾性、单中心样本研究,样本量纳入有限且可能存在遗漏有价值的相关指标,因此,研究结论仍需在今后的研究中加以验证。