APP下载

乙型肝炎相关性肝癌血清标志物诊断价值及支持向量机鉴别诊断模型的建立*

2019-07-16刘海顺万鸿飞刘向祎

中国医学装备 2019年7期
关键词:预测值乙型肝炎灵敏度

白 晶 刘海顺 万鸿飞 刘向祎*

原发性肝细胞癌(hepatocellular carcinoma,HCC)是常见的恶性肿瘤之一,发病率和病死率均居世界恶性肿瘤的前列[1-2]。我国HCC病死率占恶性肿瘤的18.8%,其5年生存率仅为5%~9%[3-4]。乙型肝炎病毒(hepatitis B virus,HBV)和丙型肝炎病毒(hepatitis C virus,HCV)感染是HCC的主要因素,我国以HBV感染引起的HBV相关性肝癌最为常见,约有40%的HBV感染患者会发展成为肝硬化和HCC,原发性肝癌中乙型肝炎相关肝癌占90%[5-6]。临床中早发现、早诊断及早治疗是有效控制乙型肝炎相关HCC的关键,但影像和病理检查所需费用很高,不能对高危人群进行很好的监测,因此高灵敏度和特异度的肿瘤标志物对识别HCC非常必要,迫切需要更精确、更有效的生物标志物。

甲胎蛋白(alpha-fetoprotein,AFP)对HCC诊断的其灵敏度为40%~65%,当肝癌病灶很小,AFP检测的假阴性率较高[7]。脱-γ-羧基凝血酶原(des-γcarboxy-prothrombin,DCP)又称维生素K缺乏或拮抗诱导的异常蛋白(protein induced by vitamin K absence or antagonist-Ⅱ,PIVKA-Ⅱ), HCC合成的无凝血活性的异常凝血酶原,是判断HCC进展程度与预后的重要指标。AFP、DCP作为常规血清肿瘤标志物,经常出现假阳性,并且缺乏足够的敏感性及特异性[8]。高尔基体蛋白73(Golgi protein 73,GP73)是肝脏胆管上皮细胞表达的特异性膜蛋白,在HBV和HCV感染相关的HCC患者血清中浓度显著升高,但GP73诊断HCC的效能以及GP73在良、恶性肝病中的表达高低存在争议,GP73对HCC的诊断价值并不优于AFP[9]。基于此,本研究通过检测AFP、GP73及DCP在HBV相关性HCC患者血清中的表达水平,探讨联合检测上述指标在HBV相关性HCC中的诊断价值,为HBV相关性HCC的筛查与诊断提供参考依据。

本研究创新性在于通过运用支持向量机(support vector machine,SVM)数学模型,建立HBV相关性HCC筛查诊断模型,以提高分类的正确率,为HBV相关性HCC的早期诊断提供新的方法和依据。

1 资料与方法

1.1 一般资料

选择2016年3月至2018年1月就诊于首都医科大学附属北京同仁医院的177例HBV患者,其中男性93例,女性84例;年龄19~70岁,平均年龄(50.6±11.7)岁。根据患者疾病情况将其分为HBV相关性HCC组(57例)、HBV相关性肝硬化组(52例)及慢性乙型肝炎组(68例);同期选择74名健康体检者将其纳入健康对照组,其中男性35名,女性39名;年龄20~65岁,平均年龄(45.22±10.09)岁。分别检测4组受试者的血清DCP、AFP及GP73水平。4组基本资料的比较无差异,具有可比性。所有受试者签署知情同意书。

1.2 纳入与排除标准

1.2.1 纳入标准

(1)HBV相关性HCC组:①符合国家原卫生和计划生育委员会医改医管局《原发性肝癌诊疗规范》[10](2017年版),经临床表现、病理结果、影像学等其他相关检查综合诊断为原发性肝癌者;②存在慢性HBV感染者;③均未行手术、射频消融、介入、放化疗等抗肿瘤行为者。

(2)HBV相关性肝硬化组:符合中华医学会肝病学分会《慢性乙型肝炎防治指南》[11](2015年更新版),临床表现、生化、组织病理学检查或肝脏超声等影像学检查综合诊断为肝硬化者。

(3)慢性乙型肝炎组:符合中华医学会肝病学分会2015年更新版《慢性乙型肝炎防治指南》[11](2015年更新版),慢性乙型肝炎诊断标准,但肝组织病理学检查或症状、体征、化验及影像学检查无肝硬化证据者。

(4)健康对照组:年龄≥18周岁,体检未发现明显疾病者。

1.2.2 排除标准

排除标准:①曾服用维生素K制剂或维生素K拮抗剂如双香豆素、华法林等药物者;②合并其他脏器原发恶性肿瘤者或转移性肝癌者;③存在HCV等其他肝炎病毒感染、酒精性肝病、非酒精性脂肪肝、自身免疫性肝病、药物性肝损害、遗传代谢性疾病、肝血吸虫病等其他原因引起的肝脏损害者;④妊娠期或哺乳期妇女等情况。

1.3 样本采集

所有受试者于清晨空腹禁水状态下用一次性采血器抽取肘静脉血约3~5 m1,置入带分离胶的真空采血管,室温静止30 min,以3500 r/min离心15 min,分离血清用于肿瘤标志物检测;取上清至2 ml的Eppendorf管中,置入-80 ℃保存备用,样本注意避免污染和反复冻融。

1.4 仪器与试剂

采用Cobas e601型电化学发光分析仪(瑞士罗氏公司);肝癌血清学标志物AFP、DCP和GP73均采用电化学发光方法检测,AFP采用罗氏试剂,DCP、GP73采用北京热景生物技术有限公司试剂。

1.5 SVM模型的建立

鉴于ROC曲线对HBV相关性HCC组、乙型肝炎组和HBV相关性肝硬化组分类的正确率不是很高,本研究采用SVM数学模型进行有效的分类,选取较为常用的径向基核函数其计算为公式1:

式中γ为核参数,在寻求最优超平面时会用到惩罚参数C,2个参数均为待优化参数,决定了模型的效能及泛化能力[12]。

1.6 统计学方法

采用SPSS 22.0软件进行统计分析。符合正态分布的计量资料用均数±标准差(x-±s)表示,非正态分布的计量资料用中位数(M)和四分位数间距(Q25,Q75)表示,计数资料用率(%)表示。多个样本均数的比较先进行正态性及方差齐性检验,对于符合上述条件者,采用方差分析进行比较,反之采用多个独立样本的非参数检验(Kruskal-Wallis H test)比较,组间两两比较采用两独立样本非参数检验(Mann-Whitney U test);绘制受试者工作特征 (receiver operator characteristic,ROC)曲线,确定最佳临界值,采用Z检验比较各指标ROC曲线下面积(area under the curve,AUC)的差异,按α=0.05为检验水准,以P<0.05为差异有统计学意义。

2 结果

2.1 各组血清DCP、GP73和AFP水平的比较

将各指标数据取对数,通过Shapiro-Wilk正态检验,DCP与AFP不满足正态分布,故对于DCP、GP73及AFP的含量,各组间采用Kruskal-Wallis H检验(H=104.27,H=79.45,H=45.681;P<0.001),两两组间采用Mann-Whitney U检验;而GP73的检测数据满足正态分布,组间采用t检验,见表1。

(1)血清DCP水平:健康对照组与乙型肝炎组、HBV相关性肝硬化组及HBV相关性HCC组的DCP含量差异显著,具有统计学意义(U=174.5,U=245,U=304.5;P<0.05);乙型肝炎组与HBV相关性HCC组的DCP含量差异显著,具有统计学意义(U=210.5,P<0.05);HBV相关性肝硬化组与HBV相关性HCC组的DCP含量差异无统计学意义(U=255,P>0.399)。

(2)血清GP73水平:健康对照组与HBV相关性肝硬化组、HBV相关性组HCC的GP73比较,差异有统计学意义(t=-14.579,t=-12.007;P<0.05);乙型肝炎组与HBV相关性肝硬化组、HBV相关性HCC组GP73含量有显著性差异,具有统计学意义(t=-6.847,t=-6.524;P<0.001);HBV相关性肝硬化组与HBV相关性HCC组的GP73含量差异无统计学意义(t=0.776,P>0.05)。

(3)血清AFP水平;健康对照组与HBV相关性肝硬化组、HBV相关性HCC组的AFP含量有显著性差异,具有统计学意义(U=189.5,U=345;P<0.05);乙型肝炎组与HBV相关性肝硬化组、HBV相关性HCC组的AFP含量有显著性差异,具有统计学意义(U=163,U=177;P<0.05);HBV相关性肝硬化组与HBV相关性HCC组的AFP含量差异无统计学意义(U=273, P>0.629)。

2.2 血清DCP、GP73及AFP联合检测对HBV相关性HCC诊断价值

(1)HBV相关性HCC组与健康对照组组血清DCP、GP73及AFP含量的ROC曲线以及各项指标的曲线下面积(AUC)和95%置信区间见图1。

图1显示:①AUCDCP=0.848,95%CI(0.741~0.955),最佳临界值为6.705 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为77.8%、97.3%、91.3%和92.3%;②AUCGP73=0.984,95%CI(0.965~1.000),最佳临界值为92.6 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为92.6%、95.9%、89.3%和97.3%;③AUCAFP=0.827,95%CI(0.728~0.927),以20 ng/ml为标准时,其灵敏度、特异度、阳性预测值和阴性预测值分别为66.7%、89.2%、69.2%和88%。对3项指标进行Logistic回归分析获得联合预测因子,绘制3项指标联合诊断的ROC曲线,得出AUCDCP+GP73+AFP=0.997,95%CI(0.4930~1.000),其灵敏度、特异度、阳性预测值和阴性预测值分别为98.9%、98.6%、96.4%和98.6%。3项指标联合诊断要好于单独诊断,其差异有统计学意义(U=11.2,P<0.001)。

表1 血清DCP、AFP及GP73检测结果(M Q25,Q75)

图1 HBV相关性HCC组与健康对照组DCP、GP73及AFP含量的ROC曲线

(2)HBV相关性HCC组与HBV相关性肝硬化组血清DCP、GP73及AFP含量分别绘制3项指标诊断HBV相关性肝癌的ROC曲线,得出各项指标的AUC及95%置信区间,见图2。

图2 HBV相关性HCC组与HBV相关性肝硬化组DCP、GP73及AFP含量的ROC曲线

图2 显示:①AUCDCP=0.57,95%CI(0.403~0.739),最佳临界值为11.219 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为70.4%、59.1%、67.9%和61.9%;②AUCGP73=0.459,95%CI(0.294~0.623),最佳临界值为168.208 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为51.9%、59.1%、60.9%和50%;③AUCAFP=0.540,95%CI(0.374~0.707),以20 ng/ml为标准时,其灵敏度、特异度、阳性预测值和阴性预测值分别为48.1%、77.3%、72.2%和54.8%。对3项指标进行Logistic回归分析获得联合预测因子,绘制3项指标联合诊断的ROC曲线,得出AUCDCP+GP73+AFP=0.650,95%CI(0.493~0.807),其灵敏度、特异度、阳性预测值和阴性预测值分别为66.7%、68.2%、72%和62.5%,3项指标联合诊断要好于单独诊断,其差异有统计学意义(U=9.8,P<0.001)。但联合诊断仍不能很好地区分HBV相关性HCC与HBV相关性肝硬化。

(3)HBV相关性HCC组与乙型肝炎组血清DCP、GP73及AFP含量分别绘制3项指标诊断HBV相关性肝癌的ROC曲线,得出各项指标的AUC及95%置信区间,见图3。

图3 HBV相关性HCC 组与乙型肝炎组DCP、GP73及AFP含量的ROC曲线

图3 显示:①AUCDCP=0.711,95%CI(0.556~0.867),最佳临界值为13.952 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为66.7%、88.9%、68.1%和72.7%;②AUCGP73=0.919,95%CI(0.846~0.992),最佳临界值为84.792ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为92.6%、81.5%、83.3%和91.7%;③AUCAFP=0.757,95%CI(0.625~0.890),最佳临界值为0.575 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为88.9%、64.3%、68.6%和84.2%。对3项指标进行Logistic回归分析获得联合预测因子,绘制3项指标联合诊断的ROC曲线,得出AUCDCP+GP73+AFP=0.919,95%CI(0.846~0.992),其灵敏度、特异度、阳性预测值和阴性预测值分别为97.5%、74.1%、79.4%和98.6%,3项指标联合诊断要好于单独诊断,其差异有统计学意义(U=16.2,P<0.001)。

(4)HBV相关性HCC组与乙型肝炎组+HBV相关性肝硬化组患者血清DCP、GP73及AFP含量分别绘制3项指标诊断HBV相关性肝癌的ROC曲线,得出各项指标的AUC及95%置信区间,见图4。

表2 SVM模型建立及效果评价(%)

图4 HBV相关性HCC 组与乙型肝炎组+HBV相关性肝硬化组DCP、GP73及AFP含量的ROC曲线

图4 显示:①AUCDCP=0.648,95%CI(0.502~0.794),最佳临界值为13.951 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为66.7%、75.5%、60%和80.4%;②AUCGP73=0.712,95%CI(0.598~0.827),最佳临界值为84.792 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为92.6%、46.9%、49%和92%;③AUCAFP=0.660, 95%CI(0.535~0.785),最佳临界值为0.383 ng/ml,其灵敏度、特异度、阳性预测值和阴性预测值分别为98.5%、46.5%、42.9%和99.7%。对3项指标进行Logistic回归分析获得联合预测因子,绘制3项指标联合诊断的ROC曲线,得出AUCDCP+GP73+AFP=0.728,95%CI(0.615~0.814), 其灵敏度、特异度、阳性预测值和阴性预测值分别为98.2%、52.8%、47.4%和97.6%;3项指标联合诊断要好于单独诊断,其差异有统计学意义(U=17.2,P<0.001);但单独和联合诊断其特异性和阳性预测率均不高。

2.3 SVM模型效果评价

采用网格搜寻结合5折交叉验证的方法确定SVM数学模型γ和C的2个参数。SVM在对于HBV相关性HCC组与HBV相关性肝硬化组、乙型肝炎组和健康对照组具有较好的诊断效果,在诊断中HBV相关性HCC组与健康对照组的特异度和敏感度均达到了100%;诊断HBV相关性HCC与HBV相关性肝硬化时,特异度和灵敏度达到了90.91%和96.3%(见表2)。

3 讨论

HBV感染是我国肝癌发生发展的重要原因,肝癌的5年生存率为40%,早期行肝癌切除术可将生存率提升至60~70%[13]。病理学活检是诊断肝癌的金标准,但因其为侵入性检查,存在穿刺的难度及风险。影像学检查对小肝细胞癌的检出能力有限。血清学生物标志物具有无创性、简便性、客观性等特点,多用于肝癌的早期筛查与诊断以及肝癌的监测管理。

AFP是应用最为广泛的HCC血清学指标,每6个月进行血清AFP的检测和腹部超声的检查已普遍成为肝癌高危人群的筛查办法[14]。由于AFP在肝癌的筛查和诊断中存在灵敏度和特异度低的问题,近年欧洲肝脏研究学会和美国肝病研究学会在其更新的诊疗指南中不再将AFP作为肝癌的筛查与诊断标准[15-16]。本研究发现,HBV相关性HCC组患者血清AFP水平显著高于健康对照组,最佳临界值为6.705 ng/ml,此时的AUC=0.827,其灵敏度、特异度、阳性预测值和阴性预测值分别为66.7%、89.2%、69.2%和88%,与文献报道的研究结果相近[17]。本研究中AFP诊断灵敏度仅为66.7%,近40%的HCC患者可能被漏诊,因此仍需警惕AFP阴性的高危人群发生HCC的风险。HBV相关性肝硬化组患者血清AFP也可以升高,与HBV相关性HCC组之间的差异无统计学意义,可能与纳入样本病例疾病程度有关,AFP的血清水平在不同病因引起的HCC中是否存在差异还需进一步探讨。

DCP其对HCC的诊断价值已受到了国际上的肯定,日本已将血清DCP的检测纳入肝癌高危人群的筛查管理项目[18]。本研究发现,HBV相关性HCC组患者血清DCP水平高于健康对照组,且差异显著,当最佳临界值为6.705 nɡ/ml时,其灵敏度、特异度、阳性预测值和阴性预测值分别为77.8%、97.3%、91.3%和92.3%,血清DCP诊断HBV相关性HCC的特异度较高,有助于HBV相关性HCC的筛查。同时,血清DCP的阴性预测值较高,对HCC的排除具有一定的临床价值,与文献相关报道一致[19]。

GP73在正常肝组织中,且主要在胆管上皮细胞内表达,在HBV和HCV感染相关的HCC患者血清中浓度显著升高。本研究发现,HBV相关性HCC患者血清GP73水平高于健康对照组,且差异显著,当最佳临界值为84.310 ng/ml时,其灵敏度、特异度、阳性预测值和阴性预测值分别为92.6%、95.9%、89.3%和97.3%。而HBV相关性肝硬化组与HBV相关性HCC组相比灵敏度、特异度、阳性预测值和阴性预测值分别为51.%、59.1%、60.9%和50%,与Mao等[20]报道一致,提示血清GP73检测难以鉴别肝硬化和肝癌,但血清GP73可在一定程度上作为反映肝纤维化严重程度的有效血清学诊断指标。

本研究通过绘制ROC曲线,得出血清DCP、GP73及AFP的3项检测指标的AUC,发现HBV相关性HCC与健康对照组、慢性乙型肝炎组比较AUC均为0.7~0.9,表明3项指标对鉴别HBV相关性HCC组与健康对照组和慢性乙型肝炎组的诊断均有一定的准确性。但3项指标对鉴别HBV相关性HCC与肝硬化的诊断效能不高,考虑临床中HBV相关性HCC可同时伴有肝硬化的存在。

单项检测血清学指标仍存在敏感性低的缺陷,需要多项血清学指标联合检测来提高诊断率。本研究对3项指标进行联合检测发现,血清DCP、GP73及AFP联合检测的灵敏度、特异度、阳性预测值和阴性预测值分别为98.9%、98.6%、96.4%和98.6%,表明联合检测3项指标极大提高了HBV相关性HCC诊断的敏感性,可提高HBV相关性HCC患者的检出率,减少了漏诊率,有助于HCC的早期诊断。联合检测的阴性预测值高达98.6%,对HCC的排除诊断有很大的参考价值。然而,不可忽略的是3项指标联合检测灵敏度增高的同时,特异度也随之下降,误诊率可能随之增加,仍需结合患者一般情况、临床症状、实验室检查结果、病理或影像学资料进行综合判断,争取做到在提高检出率的同时,最大限度地降低误诊率。

由于DCP、GP73及AFP3项指标对鉴别HBV相关性HCC与肝硬化的诊断效能不高,本研究创新采用了SVM模型在对于HBV相关性HCC组与HBV相关性肝硬化组和乙型肝炎组均具有较好的诊断效果。SVM是一种基于统计学习理论和结构风险最小化原则的学习方法,是一种多元统计分析方法,在多变量分析与识别等方面有着广泛的应用[21-23]。其基本原理是将原始测试数据映射至更高维的空间,再通过寻找合适的超平面解决相应的分类问题[24]。在更多变量的空间,通过使用核函数将原有的数据映射到高维空间,需要使用相应的核函数完成。在建立该模型时,应当从原始数据集中选取适当的数据作为训练集训练该模型,而后对其余的数据(测试集)进行相关测试,得出相应的诊断与预测结果。常用的划分训练集与测试试集的方法有随机法[25]和Kennard-stone(K-S)法[26]。随机法选取的数据随机性较大,所选样品可能不具有代表性,模型预测结果不稳定。KS法主要是根据数据间的欧氏距离来选取,选取的训练比较具有代表性。SVM模型在HBV相关性HCC组与健康对照组应用时,特异度和敏感度均达到了98.6%;诊断HBV相关性HCC与HBV相关性肝硬化时,特异度和敏感度分别达到了90.91%和96.3%,这两次SVM的诊断效果均优于肿瘤标志物的诊断效果。因此,SVM模型可以考虑用于不同阶段肝病的诊断与识别。

本研究样本量偏少,未来可进行更大样本数量的前瞻性研究,进一步减少其他因素影响产生的偏倚。通过分析获得的结论尚需要大样本、多中心及长时间的随访研究进行证实。本研究建立的诊断模型为提高HCC早期诊断提供了思路和方法,但仅仅依靠上述模型对HCC进行早期诊断显然还不理想,结合相应的影像学指标或许可以进一步提高早期肝癌的检出率。

猜你喜欢

预测值乙型肝炎灵敏度
慢性乙型肝炎抗病毒治疗是关键
基于机电回路相关比灵敏度的机电振荡模式抑制方法
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
乙型肝炎病毒与肝细胞癌微血管侵犯的相关性
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure
AI讲座:ML的分类方法
基于灵敏度分析提升某重型牵引车车架刚度的研究
二至丸对慢性乙型肝炎作用机制的研究进展
慢性乙型肝炎的预防与治疗