APP下载

乳腺癌患者组织多项组化标记物与血清CA153,CA125,CEA,25-OH-D3水平关联性分析模型建立及在预后判断的临床价值*

2019-06-21尹志辉周志伟刘继勇杨保昌王凌凌

现代检验医学杂志 2019年3期
关键词:置信度准确度规则

尹志辉,周志伟,刘继勇,杨保昌,王凌凌

(1.邢台市第三医院检验科,河北邢台 054000;2.中国石油天然气集团公司中心医院a.检验科;b.肿瘤科,河北廊坊 065000)

乳腺癌作为女性常见恶性肿瘤之一,发病率占女性恶性肿瘤的第一位,该疾病诊断主要依据患者临床表现、体格检查、影像学检查和组织病理学结果等。规范化的病理学诊断不仅是疾病确诊与治疗的依据,还在患者诊疗方案制定、疗效预测和预后判断方面起着重要的作用[1]。病理学诊断结论的得出除需要常规显微镜观察以外,更重要的是基于多种组化指标检测结果进行判断的。因此,如果能够将常规血清检验指标与患者组化结果之间关系加以研究分析,不仅能为乳腺癌的诊断及术后监测提供新的方法与途径,还能扩展检验指标的临床应用价值。本文就乳腺癌组化指标结果与血清糖类抗原153(CA153),糖类抗原125(CA125),癌胚抗原(CEA),25羟基维生素D3(25-OH-D3)水平间关系进行关联性分析建立数学模型并加以分析,取得一定效果,现报道如下。

1材料与方法

1.1 研究对象 选取2016年1~4月在中国石油天然气集团公司中心医院就诊由组织病理学确诊的新发乳腺癌患者60例作为乳腺癌组,病理组化指标包括 PF63,ER,PR,Calponin,CFerbBF2,KiF67,EGFR和EFCadherin,该组患者年龄31~66岁,平均年龄48.63±8.54岁,其中Ⅰ~Ⅱ期35例,Ⅲ期16例,Ⅳ期9例。选取同期就诊乳腺良性疾病患者60例作为乳腺良性疾病组,年龄30~69岁,平均年龄47.25±7.62岁。最后选取同期就诊新发乳腺肿瘤患者30例作为验证组,年龄32~65岁,平均年龄47.75±8.29岁。三组患者年龄比较差异无统计学意义(P>0.05),具有可比性。本研究获得研究单位伦理学委员批准。

乳腺癌纳入标准:①病理学确诊为乳腺癌;②新发病患者;③未进行手术、放疗或化疗治疗;④依从性高,积极配合治疗;⑤自愿参与研究,并签署知情同意书。

排除标准:①患有精神疾病;②严重肝、肾等脏器功能障碍;③曾进行手术、放疗或化疗治疗;④依从性差,妊娠及哺乳患者。

1.2 仪器与试剂 血清CA153,CA125,CEA检测采用美国贝克曼-库尔特公司DXI800化学发光分析仪进行,配套试剂由美国贝克曼-库尔特公司提供。25-OH-D3检测采用罗氏COBA2010化学发光分析仪,试剂由罗氏公司提供。PF63,ER,PR,Calponin,CFerbBF2,KiF67,EGFR和EFCadherin抗体检测采用罗氏ventana Benchmark GX全自动免疫组化染色系统进行,试剂由罗氏公司提供。仪器定期保养,性能验证符合要求,室内质控在控,室间质评成绩合格。

1.3 方法

1.3.1 血清指标检测方法:清晨空腹采集静脉血3 ml置于促凝管内,自然放置30 min后,以4 000 r/min,离心10 min取上清,每批测定仪器定标和质控均符合要求后进行下一步操作,血清CA153,CA125和CEA检测在美国贝克曼-库尔特公司DXI800化学发光分析仪进行,25-OH-D3在罗氏COBAS2010化学发光分析仪上进行。

1.3.2 病理组化染色方法:首先对标本进行固定包埋切片制片后,置于罗氏ventana Benchmark GX全自动免疫组化染色仪器内,仪器自动进行组化染色程序,仪器开始前各项准备工作均符合要求。

1.3.3 数据建模方法:将整理好乳腺癌患者组化结果、年龄、月经状态和肿瘤标记物检测数据以数据源节点方式接入数据挖掘软件内,纳入PF63,ER,PR,Calponin,CFerbBF2,KiF67,EGFR和EFCadherin等8个组化变量,变量类别为标记型,角色为任意,添加Apriori建模节点,最低条件支持度为50%,最小规则置信度为90%,最大前项数为5,建立Apriori模型;对阳性组化指标进行关联分析,组合间逻辑关系为AND,得到高关联度的组化指标组合,并计算组合的预测准确度。规则集条件设置为:交叉验证,折叠次数为10,修剪严重性为75,每个子分支中最小记录数为2,采用全局修剪。

1.4 统计学分析

1.4.2 数据变量的关联分析与规则集分析由SPSS modeler 18.0完成,关联规则采用标准为:置信度>90%,支持度>50%,其余关联规则舍弃。

2结果

2.1 一般情况 本次研究中,乳腺癌组和乳腺良性疾病患者平均年龄为48.63±8.54岁,47.25±7.62岁,年龄在两组之间差异无统计学意义(t=0.176,P=0.861)。

2.2 乳腺癌组与乳腺良性疾病组25-OH-D3,CA153,CA125,CEA比较 见表1。乳腺癌组的CEA和CA125水平均高于乳腺良性疾病组,而25-OH-D3水平则低于乳腺良性疾病组,差异均具有统计学意义(P<0.05);CA153水平在乳腺癌患者组和乳腺良性疾病组间进行比较,差异无统计学意义(P>0.05)。

表1 乳腺癌组与乳腺良性疾病组25-OH-D3,CA153,CA125,CEA水平比较

2.3 关联性分析 见表2。乳腺癌患者多项组化指标间关联性分析结果,按照置信度由高到低进行排列,其中预后较好指标组合分别为ER和PR,KiF67;PR和ER;ER和EFcadherin,KiF67,置信度分别为100%,97.509%,97.509%;预后较差指标组合为CFerbBF2,KiF67;Calponin,KiF67;PF63,KiF67,置信度分别为96.0%,95.833%,95.455%;其余指标组合由于置信度均低于90%或支持度低于50%而被剔除。

表2 乳腺癌阳性组化结果间关联性分析

注:*为指标取阴性结果。

2.4 预测变量重要度分析 对于组化指标ER和PR,KiF67,PR,ER的实验室指标预测变量及变量重要度结果一致,分别为是否绝经0.2,CA125水平 0.15,25-OH-D3水平0.11;ER和EFcadherin,KiF67的实验室指标预测变量及变量重要度结果为是否绝经0.14,CA125水平0.16,CEA水平0.14,见图1。组化指标CFerbBF2,KiF67;Calponin,KiF67,PF63,KiF67的实验室指标预测变量及变量重要度结果分别为CA153水平0.84,25-OH-D3水平0.16;CA153水平0.65,年龄0.35;是否绝经0.15,CA153水平0.14,年龄0.16,见图2。

2.5 特征规则集结果分析 见表3。预后良好的组化指标组合的规则集显示: 规则集“25-OH-D3≤15.10 ng/ml或绝经患者且CA125≤7.820 U/ml” 预测ER和PR,KiF67全阳准确度为86.17%;规则集“未绝经患者且CA125≤29.3 U/ml,25-OH-D3≤6.9ng/ml”预测PR,ER全阳准确度为95.00%,规则集“25-OH-D3≤15.10 ng/ml且CA125≤29.70U/ml” 预测ER和EFcadherin,KiF67全阳准确度为98.33%,规则集“CA153≤18.31 U/ml或CA153>18.31U/ml,25-OH-D3>13.70 ng/ml” 预测CFerbBF2,KiF67全阳准确度为86.67%,规则集 “年龄>47岁或年龄≤47岁且CA153≤16.70U/ml”预测Calponin,KiF67一阴一阳准确度为81.67%,规则集 “绝经患者且CA153>5.10 U/ml,25-OH-D3≤20.70 ng/ml” 预测PF63,KiF67一阴一阳准确度为95.00%。

表3 不同组化指标组合的特征集与预测准确度分析

注:*为组化指标取值为阴性。

2.6 模型验证 以验证组数据对所建模型进行诊断效能验证,结果见表4。不同组合ER和PR,KiF67;PR和ER;ER和EFcadherin,KiF67;CFerbBF2,KiF67;Calponin,KiF67;PF63,KiF67之间灵敏度分别为:85.00%,77.78%,94.74%,88.89%,100.00%和65.00%,经两两组合比较,差异无统计学意义(χ2=0.006~2.163,均P>0.05)。特异度分别为54.54%,76.92%,58.33%,50.00%,50.00%和72.73%,经两两组合比较,差异无统计学意义(χ2=0.059~3.259,均P>0.05)。阳性预测值分别为77.27%,82.35%,78.26%,92.31%,89.29%和81.25%,经两两比较,Calponin’KiF67与PF63,KiF67两组阳性预测值,经统计学分析,差异具有统计学意义(χ2=10.362,P=0.001),其余组合两两比较,差异无统计学意义(χ2=0.156~2.948,均P>0.05)。阴性预测值分别为66.67%,71.43%,87.50%,40.00%,100.00%和53.33%,经两两组合比较,差异无统计学意义(χ2=0.024~1.377,P均>0.05)。

3讨论乳腺癌作为激素依赖性肿瘤,其肿瘤细胞生长受控于体内雌激素与孕激素水平的变化,因此,ER和PR是公认的预后良好的最可靠的生物标志物[1-2];EF-Cadherin是钙黏蛋白分子家族中跨膜蛋白亚型之一,其大量表达在维持上皮细胞完整性、极性、形态和组织结构意义重大,是预后良好指标之一[3]。本文纳入预后不良组化指标,KiF-67反映细胞增殖抗原,与乳腺癌发生、发展有关,阳性越强预后越差,EGFR为表皮生长因子受体,阳性提示临床预后较差,CerbB-2是一种原癌基因过度表达指标,表明预后较差,Calponin与PF63是抑制肿瘤标志物,阴性表示临床预后差[4-5]。患者组化指标阳性表现各异,单独应用临床价值有限,同时检测具有滞后性,因为组化检测标本只能通过有创手段获得,如手术切除或穿刺。如何在术前实现影像学疑似乳腺癌患者的准确诊断与预后评估,是一个亟待解决的问题。一些肿瘤标记物联合应用可获得较高的敏感度和可靠性而被广泛采纳并应用于临床诊断和治疗,CA153,CA125和CEA是乳腺癌常用的肿瘤标志物[6],其中不同的肿瘤标志物对乳腺癌的诊治都有其独自的优势,而且不同的肿瘤标志物对不同分型的乳腺癌有着各自的敏感度,本研究结合CA153,CA125和CEA25-OH-D3水平、患者年龄、是否绝经,建立关联分析与特征描写模型,为预测肿瘤良恶程度提供了可能。

本研究通过统计学分析显示乳腺癌患者未绝经组25-OH-D3,CEA水平低于绝经组,CEA水平高于绝经组,差异具有统计学意义,CA153水平在乳腺癌患者未绝经组和绝经组间进行比较,差异无统计学意义,与文献报道基本一致[7],说明较低25-OH-D3和CEA水平的未绝经患者即可发生乳腺癌。与统计学分析结果相比,关联分析与特征规则集结果显示:预后较好组化指标各组合中置信度比较高而支持度均不足60%,纳入分析的单一指标预测重要性10%~20%,说明单一使用血清指标用于预测组化结果效果不佳,只有多指标组成规则集才能实现较高的准确度。预后较差组化指标组合中两个指标组合的置信度在95%以上,支持度两组在80%以上,一组在70%以上,预测重要性也表现为CA153最佳,分别为84%和65%,是预后不佳组化指标预测的重要因子。验证组数据显示所建立模型在预测组化指标结果方面灵敏度较高,特异度稍低,具有一定临床辅助指导意义。

综上,对于乳腺癌确诊患者其病理组化结果可通过25-OH-D3水平、患者状态和肿瘤标记物指标组合成规则集加以预测分析,测定影像学结果怀疑乳腺癌患者的25-OH-D3水平、肿瘤标志物,结合患者是否绝经和患者年龄可一定程度预测病理组化阳性结果,最终明显提高检测指标对乳腺癌类型预测的准确度、可靠性以及一致性,扩展指标应用,更进一步挖掘实验室指标的应用价值。

本研究不足之处,采集数据有限只进行了搜集到乳腺癌患者分析,没有按照癌症类型以及分期进行测试,因此还有待进一步完善。

猜你喜欢

置信度准确度规则
一种基于定位置信度预测的二阶段目标检测方法
撑竿跳规则的制定
硼铝复合材料硼含量置信度临界安全分析研究
数独的规则和演变
Phosphatidylinositol-3,4,5-trisphosphate dependent Rac exchange factor 1 is a diagnostic and prognostic biomarker for hepatocellular carcinoma
系统可靠性评估与更新方法
幕墙用挂件安装准确度控制技术
正负关联规则两级置信度阈值设置方法
让规则不规则
TPP反腐败规则对我国的启示