APP下载

logistic回归结合ROC曲线在乳腺癌中的诊断价值

2023-10-21刘香丽刘瑞东胡新菊

河南医学高等专科学校学报 2023年5期
关键词:诊断模型敏感度标志物

柴 婕, 刘香丽, 刘瑞东, 胡新菊

(河南中医药大学第一附属医院 a.病理科;b.乳腺外科,郑州 450000)

乳腺癌是女性常见恶性肿瘤之一,GLOBOCAN 2020数据库显示,全球新发癌症中,女性乳腺癌首次超过肺癌成为最常见的癌症,2020年新发乳腺癌2 261 419例,占癌症总发病的11.7%,女性乳腺癌成为新发病例数最高的肿瘤[1]。早发现及早治疗对提高乳腺癌患者生存率尤为重要,因此寻找乳腺癌特异性的血清肿瘤标志物刻不容缓。肿瘤异常蛋白(tumor abnormal protein,TAP)是多种细胞恶变时产生的几十种附着于细胞表面结构改变的糖链糖蛋白,可脱落释放入外周血,通过监测其凝聚物大小辅助肿瘤的诊断[2],TAP作为新兴肿瘤标志物,可实时反映肿瘤细胞增殖情况,具有高灵敏性;血清肿瘤特异性生长因子(tumor specific growth factor,TSGF)可促进肿瘤周围血管内皮细胞生长与血管浸润,在实体肿瘤中高表达;此外临床常用的传统乳腺癌检测指标有血清糖类抗原153(carbohydrate antigen153,CA153)及癌胚抗原(carcinoembryonic antigen,CEA),鉴于单一使用传统指标效果欠佳,本研究通过建立logistic回归模型探究以上肿瘤标志物联合使用的最佳乳腺癌诊断模型,并通过受试者操作特征(receiver operating characteristic,ROC)曲线评价各指标疗效,旨在为乳腺癌血液检测寻找最佳诊断标志物。

1 资料与方法

1.1 资料 回顾性分析2021年3月—2021年6月河南中医药大学第一附属医院诊治的乳腺疾病患者97例,其中经病理确诊为乳腺癌的患者50例,收集其临床资料,将其纳入观察组,年龄32~66岁(中位年龄51岁),均为女性;非特殊型浸润性癌41例,组织学分级:G1期6例,G2期27例,G3期8例;导管内癌9例,其中高级别4例,低级别5例;淋巴结转移29例,无转移21例。选取经病理确诊为乳腺良性疾病的患者47例纳入对照组,年龄27~60岁(中位年龄43岁),均为女性,乳腺腺病25例,肉芽肿性乳腺炎11例,乳腺纤维腺瘤9例,乳腺囊肿2例。2组患者年龄(t=2.671,P=0.072)差异无统计学意义,具有可比性。本研究经院伦理委员会审核通过。

观察组纳入标准:①经病理检查确诊为乳腺癌,未经放化疗。②治疗前均有TSGF、CA153、CEA肿瘤标志物的检测结果。③无可能影响检测结果准确性的重要脏器疾病。观察组排除标准:①其他部位转移性乳腺癌者。②存在其他相关造血系统等疾病者。对照组纳入标准:①经病理确诊为乳腺良性疾病者。②有TSGF、CA153、CEA肿瘤标志物的检测结果。对照组排除标准:①存在其他部位恶性肿瘤者。②有其他造血系统疾病者。

1.2 方法 用EDTA抗凝管采集患者空腹外周静脉血液5 mL,全血均匀涂在载玻片上,滴加刀豆凝集素、曼陀罗凝集素、小扁豆凝集素及E型红腰豆凝集素等试剂于载玻片上,自然放置,形成圆形斑圈,标本即制作完成,放入浙江瑞生医疗科技TAP检测集成阅片仪,显微镜下观察凝集物面积大小,正常值参考范围为0~121 μm2;>121~225 μm2为TAP异常,>225 μm2为凝集物较大。另收集患者全血5 mL,3 500 rpm 5 min离心,保留血清,采用化学发光法对TSGF、CA153及CEA指标进行检测,放入BECKMAN型号SHFa-03仪器扫描并得到各个指标数值,TSGF参考范围为0~64.0 U·mL-1,CA153为0~15.0 IU·mL-1,CEA为0~5.0 pg·L-1。

1.3 统计学处理 应用IBM SPSS 20.0统计学软件处理数据,TAP、TSGF、CA153及CEA计量资料均不满足正态分布,以M(P25,P75)表示,两两比较采用Wilcoxon (Mann-Whitney)检验,进行单因素logistic回归,P≤0.05的指标可进一步纳入共线性检验,得到容忍(Tolerance)>0.10或方差膨胀因子(VIF)<10.0即可认为不存在多重共线性,将有统计学意义的指标纳入多因素logistic回归模型,Hosmer-Lemesho拟合度卡方检验评价模型拟合优度,P>0.05表明模型构建良好,应用Graphpad绘制ROC曲线,计算单个指标及联合指标曲线下面积(area under curve,AUC)与cut off值,P<0.05为差异有统计学意义。

2 结果

2.1 2组受试者TAP、TSGF、CA153与CEA表达量比较 2组受试者TAP、TSGF、CA153、CEA表达量比较,差异有统计学意义(P<0.01)。见表1。

表1 2组受试者TAP、TSGF、CA153与CEA表达水平比较[M(P25,P75)]

2.2 将TAP、TSGF、CA153与CEA 指标纳入单因素logistic回归 单因素logistic回归试验显示,TAP、TSGF、CA153、CEA单变量均与乳腺癌有密切关系(P<0.05),回归系数β值均有统计学意义,模型无混杂因素,各个指标均可选入多因素logistic回归模型。见表2。

表2 各个指标进行单因素logistic回归分析

2.3 将TAP、TSGF、CA153、CEA纳入多因素logistic回归模型 对TAP、TSGF、CA153及CEA指标进行共线性诊断,均Tolerance>0.10,VIF<10.0,显示各个指标之间不存在共线性,表明上述指标可纳入回归模型,Hosmer-Lemesho检验P=0.63表明模型构建良好,TAP、TSGF及CA153表达量与乳腺癌有关(P<0.05),而CEA指标与乳腺癌联系较弱(P>0.05),故CEA被拒绝纳入多因素回归模型。TAP、TSGF及CA153的OR值分别为2.393、2.053、3.794,套入公式可得出三者联合预测方程Logit(P)=-0.429+0.873×TAP+0.719×TSGF+1.334×CA153,计算P值。见表3。

表3 多因素二分类logistic回归分析与共线性诊断

2.4 血清TAP、TSGF、CA153单个指标与联合预测模型诊断乳腺癌的ROC曲线分析 绘制TAP、TSGF、CA153单个指标ROC曲线(图1),结果显示TAP的AUC面积最大,敏感度为70%,特异度为80.9%,约登指数约为0.509,显著高于TSGF及CA153,单一效能比较得出TAP>CA153>TSGF。SPSS软件对TAP、TSGF、CA153进行两两联合logistic回归,可以得出TAP+TSGF风险概率值Logit(P)=-6.146+0.021×TAP+0.048×0.048;TAP+CA153风险方程Logit(P)=-4.724+0.021×TAP+0.132×CA153;TSGF+CA153组合风险得分Logit(P)=-6.635+0.154×CA153+0.068×TSGF,分别计算P值,将其纳入协变量绘制ROC曲线,图2结果显示,联合检测中TAP+TSGF+CA153的AUC最大(0.866),其诊断性能高于单一指标TAP,确立最佳诊断模型,当cut off值为0.559时,乳腺癌的最佳诊断模型的敏感度、特异度分别为76.0%、80.9%,约登指数为0.569。见表4。

图1 单一指标诊断乳腺癌的ROC曲线

图2 联合指标诊断乳腺癌的ROC曲线

表4 TAP、TSGF、CA153单个与联合检测在乳腺癌中诊断性能比较

2.5 TAP+TSGF+CA153模型三种组合模式特异度、敏感度及约登指数比较 上述实验得TAP+TSGF+CA153三者联合预测模型优于单指标或其两两联合指标的诊断模型,TAP+TSGF+CA153联合模型结合ROC曲线可得到其敏感度、特异度分别为76.0%、80.9%,约登指数为0.569,制作并联试验模型,另满足TAP≥121 μm2或TSGF≥64 U·mL-1或CA153≥15 IU·mL-1为阳性模型,其余为阴性模型,制作串联试验模型;另同时满足TAP≥121 μm2、TSGF≥64 U·mL-1、CA153≥15 IU·mL-1为阳性模型,分别计算并联及串联试验的敏感度、特异度及约登指数,虽TAP+TSGF+CA153联合预测模型敏感度小于并联试验,特异度小于串联试验,但综合考虑约登指数最佳,优于并联及串联试验模型。见表5。

表5 TAP+TSGF+CA153模型三种组合模式特异度、敏感度及约登指数比较

2.6 最佳诊断模型风险概率值与乳腺癌患者临床参数之间的关系 本研究结果显示,最佳模型风险概率值在淋巴结转移患者高于未转移患者,淋巴结转移患者敏感度可达到86.2%;在非特殊型浸润性乳腺癌中其随着组织学分级增加而增加,在导管内癌中,高级别导管内癌风险概率值大于低级别导管内癌风险概率值。见表6。

表6 最佳诊断模型风险概率值与乳腺癌患者临床参数之间的关系

3 讨论

乳腺癌是多因素疾病,年龄、遗传因素、生活方式等都可增加其发病风险,女性发病率逐年升高,公共卫生组织倡导加强乳腺癌二级预防[3],寻找早期灵敏性高且便利易取的诊断方法可使预防便捷化,针对此问题,探究有效的、高效的早期肿瘤风险筛查指标也显得尤为重要。本研究选取新兴的肿瘤标志物TAP与临床上传统乳腺癌标志物CEA、CA153与TSGF进行logistic回归分析,用联合指标的预测值PRE-1作为协变量,绘制ROC曲线评价各个变量及联合变量的诊断效能。

CEA为广谱肿瘤标志物,可高表达于胃癌[4]、胰腺癌[5]、结直肠癌[6]等,但特异性及敏感度并不高,本研究也证实了利用单因素logistic回归CEA单变量与乳腺癌关系较弱;CA153为乳腺癌较为特异性的指标[7],由于其在乳腺癌的不同亚型之间存在偏差而引起较多争议[8];TSGF为一种可促进恶性肿瘤细胞形成和增殖的生长因子,与肿瘤的浸润、转移密切相关[9],高劲松等[10]研究表明,在乳腺癌中TSGF敏感度可高达70%,可作为乳腺癌的标志物;TAP为几十种异常糖链蛋白的总称,可影响细胞分裂,加速DNA扩增,早于形态学改变之前便可反映细胞的恶变[11]。本研究通过凝集素与TAP特异性反应识别肿瘤异常糖链,对乳腺癌患者及良性乳腺疾病患者血清进行TAP检测,发现观察组TAP高于对照组(Z=-5.671,P<0.01),单一诊断时ROC曲线也显示出TAP效能最佳(AUC=0.834),高灵敏度(70.0%)及高特异度(80.9%)都证明TAP可作为优异的肿瘤早筛指标。此外,研究阐明在肿瘤发生的动态过程中,TAP呈现出不同的释放量与浓度,可用于肿瘤复发及转移的风险评估[12],这与本研究乳腺癌患者中淋巴结转移患者高于未转移患者的结论不谋而合。

临床上单一使用上述某个指标诊断乳腺癌时会产生很大偏差,为减少假阴、假阳,提高诊断精确性,本研究通过建立多因素logistic回归模型关注协变量对因变量的优势比,其中TAP、CA153、TSGF权重分别为2.393、3.794、2.053,而CEA被拒绝纳入模型,由此可见,单因素有意义变量未必能纳入模型,多因素分析更加与实际情况相符[13]。logistic回归得到联合预测模型风险值,利用ROC曲线对指标进行评价,发现TAP+CA153+TSGF三者诊断性能(AUC=0.866)最佳;此外,我们又构建TAP、CA153、TSGF联合并联试验与构建TAP+CA153+TSGF联合串联试验,进一步检验三种组合下的诊断效能比较,结果也显示logistic回归TAP+CA153+TSGF预测模型约登指数最佳。

综上,三者联合预测模型更加满足临床需求,同时,还发现最佳诊断模型风险值淋巴结转移患者高于未转移患者,随着乳腺癌组织学分级增加而增加,这也表明最佳诊断模型可协助早期发现乳腺癌复发及转移,为乳腺癌组织学分级及预后提供可靠依据,并为临床防治提供新思路。

猜你喜欢

诊断模型敏感度标志物
CD4细胞计数联合IGRA预测AIDS/Ⅲ型TB影像诊断模型分析
全体外预应力节段梁动力特性对于接缝的敏感度研究
电视台记者新闻敏感度培养策略
在京韩国留学生跨文化敏感度实证研究
脓毒症早期诊断标志物的回顾及研究进展
冠状动脉疾病的生物学标志物
Diodes高性能汽车霍尔效应闭锁提供多种敏感度选择
肿瘤标志物在消化系统肿瘤早期诊断中的应用
MR-proANP:一种新型心力衰竭诊断标志物
对于电站锅炉燃烧经济性诊断模型的研究