基于数据挖掘模型分析CA125、NLR、PLR、hs-CRP联合检测对社区获得性肺炎伴胸腔积液的临床意义
2020-12-03曾瑞璜王小林陈智熙秦昌宏
曾瑞璜, 王小林, 曾 叶, 陈智熙, 袁 宁, 秦昌宏
(叙永县中医医院检验科,四川 叙永 646400)
社区获得性肺炎(community-acquired pneumonia,CAP)是发病率较高的疾病。由肺炎累及患者,尤其是年老体弱、低钠血症、低蛋白血症者胸膜易产生胸腔积液[1],CAP伴胸腔积液死亡率比单纯CAP高,因此胸腔积液的早期诊断对患者进行早期治疗具有重要意义。有研究结果显示,糖类抗原125(carbohydrate antigen 125,CA125)、中性粒细胞/淋巴细胞比值(neutrophil/lymphocyte ratio,NLR)、血小板/淋巴细胞比值(platelet/lymphocyte ratio,PLR)、高敏C反应蛋白(high-sensitivity C-reactive protein,hs-CRP)与CAP均存在相关性[2-3],但其在肺炎与肺炎伴胸腔积液之间的关系报道较少。本研究旨在探讨CA125、NLR、PLR、hs-CRP与CAP伴胸腔积液的相关性,并建模分析其联合检测的应用价值。
1 材料和方法
1.1 一般资料
选取2018年1月—2019年8月于叙永县中医医院就诊的284例CAP患者,所有患者均符合CAP诊断标准[4]。排除标准:(1)严重肝、肾、心功能不全;(2)脑血管疾病;(3)自身免疫性疾病;(4)其他系统性感染。按肺部影像学特征将患者分为肺炎不伴胸腔积液组(180例),其中男100例、女80例,年龄(68.4±10.1)岁;肺炎伴胸腔积液组(104例),其中男55例、女49例,年龄(70.1±12.8)岁。根据《医学影像诊断学》中的诊断标准[5]将胸腔积液分为:少量,液体上缘在第4肋前端以下;中量,积液上缘在第4肋前端平面以上,第2肋前端平面以下;大量,积液上缘达第2肋前端以上。其中肺炎伴胸腔积液患者少量积液74例,中量积液16例,大量积液14例。
1.2 方法
采用BC-6900全自动血液分析仪(深圳迈瑞公司)检测中性粒细胞、淋巴细胞、血小板,计算NLR、PLR;采用BC-5390全自动血液分析仪(深圳迈瑞公司)检测hs-CRP水平;采用e601自动电化学发光分析仪(瑞士罗氏公司)检测CA125水平。试剂盒及校准品分别购自深圳迈瑞公司和瑞士罗氏公司。
1.3 数据模型
将数据进行处理后录入统计软件,设置分类变量和连续变量,通过多层感知器(multilayer perceptron,MLP)神经网络、卡方自动交互检测(chi-square automatic interaction detection,CHAID)决策树和Logistic回归建立模型。MLP神经网络分区,培训样本和检验样本采用7∶3进行分组,隐藏层最小单位为1,最大单位为50,隐藏层激活函数为双曲正切,输出层激活函数为softmax;CHAID决策树采用交叉验证,水平最大数为3,父节点为100,子节点为50,分裂准则为χ2显著性;通过Logistic回归模型建立联合检测模型。3个模型分别通过受试者工作特征(receiver operating characteristic,ROC)曲线分析诊断效能。
1.4 统计学方法
采用SPSS 19.0软件进行统计分析。计数资料以例或率表示,比例采用χ2检验。正态分布数据采用±s表示,组间比较采用t检验;非正态分布数据采用中位数(M)[四分位数(P25,P75)]表示,2个组间比较采用Mann-WhitneyU检验,多组间比较采用Kruskal Wallis检验。采用Spearman进行相关性分析。以P<0.05为差异有统计学意义。
2 结果
2.1 284例CAP患者分析
284例CAP患者中,肺炎性胸腔积液患者104例,发生率为36.6%。肺炎不伴胸腔积液组和肺炎伴胸腔积液组CA125、NLR、PLR比较、hs-CRP,差异有统计学意义(P=0.00),见表1。CAP伴胸腔积液者,少量占71.2%,中量占15.4%,大量占13.4%。3个积液量之间指标差异有统计学意义(P=0.00),见表2。CA125、NLR、PLR、hs-CRP水平分别与积液量呈正相关(r=0.487,P<0.00;r=0.587,P<0.00;r=0.741,P<0.00;r=0.591,P<0.00)。
表1 肺炎不伴胸腔积液组和肺炎伴胸腔积液组各项指标比较
表2 不同积液量各项指标比较
图1 MLP神经网络模型
图2 标准化重要性分布图
2.2 建模结果分析
MLP神经网络纳入CA125、NLR、PLR、hs-CRP作为4个神经元,含有1个隐藏层。分类结果1为肺炎不伴胸腔积液组,2为肺炎伴胸腔积液组,模型见图1。通过标准化自变量重要性可得出CA125>PLR>NLR>hs-CRP,见图2。CHAID决策树模型显示,根节点肺炎不伴胸腔积液组患者180例,占63.4%;肺炎伴胸腔积液组患者104例,占36.6%。第1个子节点通过CA125分为≤19.53、19.53~59.86、>59.86 3个节点;节点1有85例,其中肺炎不伴胸腔积液75例(88.2%);节点3有85例,其中肺炎伴胸腔积液患者58例(68.2%);节点2继续通过PLR分为≤313.2、>313.2 2个节点;节点4有84例,包括肺炎不伴胸腔积液患者64例(76.2%);节点5有30例,包括肺炎伴胸腔积液患者16例(53.3%);见图3。模型仅纳入了CA125和PLR 2个变量,其中CA125为最重要变量,与MLP神经网络模型一致。
MLP神经网络、CHAID决策树、Logistic回归模型检测CAP伴胸腔积液的曲线下面积(area under curve,AUC)分别为0.803、0.775、0.785,均高于单项指标,其中CA125特异性为82.2%、敏感性为63.5%、AUC为0.77、95%可信区间(confidence interval,CI)为0.648~0.772;NLR特异性为67.2%、敏感性为64.4%、AUC为0.691、95%CI为0.626~0.756;PLR特异性为77.2%、敏感性为53.8%、AUC为0.674、95%CI为0.607~0.742;hs-CRP特异性为82.2%、敏感性为63.5%,AUC为0.691、95%CI为0.628~0.753。见表3和图4。
图3 CHAID决策树模型
表3 3个模型诊断效能比较
图4 MLP神经网络、CHAID决策树、Logistic回归模型ROC曲线
3 讨论
神经网络和决策树模型被广泛应用于疾病预测和诊断,大多数神经网络和决策树模型在肺癌、肝癌等癌症疾病中多次被应用,其性能都优于传统Logistic回归模型[5-7]。本研究纳入了284例数据,采用MLP神经网络、CHAID决策树、Logistic回归模型对结果进行分析,发现MLP神经网络模型的AUC、敏感性、阳性预测值、阴性预测值、准确率均优于CHAID决策树和Logistic回归模型。用Logistic回归模型初步分析单项检测指标的AUC、敏感性、特异性,诊断效能低于3个模型联合检测,提示CA125、NLR、PLR、hs-CRP联合检测可用于CAP伴胸腔积液检测。但本研究纳入数据量不足,导致MLP神经网络、CHAID决策树、Logistic回归构建3个模型阳性预测值分别仅为65.8%、64.3%、64.8%;但阴性预测值较高,分别为82.9%、82.2%、79.9%。通过增加纳入数据进行建模,能有效提高AUC、敏感性、特异性、阳性预测值、阴性预测值、准确率,如有条件可进一步通过测定其治疗后指标来分析预后,为临床进行辅助诊断提供帮助。
CA125是诊断卵巢癌及其复发的最敏感指标,但因为CA125也存在于由胎儿体腔上皮细胞分化而来的心包膜、腹膜和胸膜等组织中,所以,当肺炎累积胸膜时,CA125轻度上升,病情严重时可显著增加并出现胸水[8-9]。有研究结果显示,CA125在鉴别肺炎与肺结核中也起重要作用[10]。本研究通过MLP神经网络和CHAID决策树模型得出CA125在4个指标中重要性最强,与肺炎伴胸腔积液的产生有直接关系,但其单独检测的敏感性仅为63.5%,AUC为0.71,虽然在疾病诊断中也有作用,但联合检测可进一步提高诊断价值。
NLR、PLR是新型炎症标志物,其敏感性高于单独白细胞检测。当机体出现炎症时,外周血中性粒细胞增多,机体出现免疫应答,淋巴细胞减少,其比值更能反映机体炎症状态,尤其白细胞升高不明显时尤为重要。血小板参与炎症反应过程,其与淋巴细胞的比值也能反应机体炎症状态。C反应蛋白作为传统炎症标志物,参与机体炎症反应过程,有良好的辅助诊断作用。3个炎症标志物被广泛用于肿瘤、泌尿系统和各种炎性疾病的诊断。多项研究结果表明,NLR、PLR、hs-CRP在CAP、肺结核和肺癌中存在差异,并可运用于鉴别诊断中[11-12]。本文研究结果显示,在CAP伴胸腔积液中,3个炎症指标均有诊断价值,亦可以通过联合检测鉴别有、无胸腔积液。
通过MLP神经网络构建的CA125、NLR、PLR、hs-CRP联合检测模型对CAP伴胸腔积液具有良好的辅助诊断价值,能帮助临床及时调整治疗方案。