碳酸酐酶9在肾细胞癌中的表达对预后评估的价值不足:一项基于TCGA生物信息学分析的Meta分析
2021-09-14张子宽陈勇全王东文
张子宽,邵 渊,陈勇全,吴 波,王东文
(山西医科大学第一医院泌尿外科,山西太原 030001)
肾肿瘤(renal cell carcinoma,RCC)是人类最常见的实体肿瘤之一,近年来发病率迅速上升[1]。2020年美国有73 750例新发肾肿瘤患者,同时有14 830人因肾肿瘤死亡[2]。肾肿瘤经常发生缺氧和坏死,肿瘤缺氧已被证明是患者预后不良的独立因素[3],其可削弱手术、化疗、放疗等治疗方式的疗效[4]。因此,许多研究试图量化肿瘤缺氧程度,并对其精确测量以预测治疗效果[5]。
基于组织的RCC生物标志物的检测可能有助于预测术后疾病的进展和对辅助治疗的反应[6]。碳酸酐酶9(carbonic anhydrase 9,CA9)也称MN蛋白,已被作为预测RCC术前或术后结局的生物标志物[7]。与正常肾组织相比,CA9在RCC中表达水平较高[8],而在正常肾脏中不表达,因此被认为是一种很好的潜在组织生物标志物。其主要功能是通过反应:CO2+H2O=HCO3-+H+来维持细胞内外pH之间的平衡,从而产生酸性的细胞外微环境[9]。CA9作为一种缺氧相关蛋白,其高表达与头颈部肿瘤[10]、卵巢肿瘤[11]的低氧状态和不良临床结果有关。围绕RCC,已有报道称高CA9表达与良好的预后相关[12-21]。但也有研究认为CA9的表达与RCC预后无相关性[22-23]。CA9的研究产生了矛盾的结果,因此我们进行Meta分析以确定CA9是否可以作为RCC的预后指标。
1 资料与方法
1.1 文献检索、纳入标准及数据提取在PubMed、Cochrane图书馆和Web of Science数据库中检索关键词:renal or kidney;cancer or carcinoma or tumor or neoplasm;“carbonic anhydraseⅨ” or “CAⅨ” or “CA9”,以及prognosis or survival,对CA9在RCC预后中的作用的文献进行初步文献检索。发表文章时间截至2020年12月。文献纳入标准:①经组织病理学证实的肾细胞癌诊断;②采用免疫组织化学染色法(immunohistochemistry,IHC)检测原发性肾癌组织CA9水平。本研究主要评价经手术治疗的肾肿瘤的预后与CA9表达的关系,未行手术者则排除。当同一患者队列被多篇论文报告时,患者数量最多的报告被纳入本研究。
由邵渊和吴波2位研究员提取的数据包括纳入文献的基本信息(第一作者、发表年份、作者国家和病例数)、肿瘤特征(肿瘤分期和分级)、CA9表达强弱分界值、生存结局(CA9表达相关生存)。
从PubMed、Web of Science和Cochrane数据库中,分别检索出493、318和97篇(共908篇)可能与本研究相关的文章。使用Endnote软件后,排除125篇重复论文。阅读标题和摘要,有71篇论文可用于评估RCC患者CA9表达水平与预后的相关性。我们的Meta分析共包括27项研究[12-21,24-40],其中包括12篇新的研究[25-35,40],是在最近5年(2014年之后)发表的。
我们的Meta分析共纳入了5 462例患者。这些研究中,有9项采用多变量分析进行评估,18项采用单变量分析进行评估。疾病特异性生存率(disease-specific survival,DSS)、总生存率(overall survival,OS)、无进展生存率(progression-free survival,PFS)和无复发生存(recurrence-free survival,RFS)分别有9、15、7、6项研究报道。纳入研究的评估质量和基本信息见表1。
1.2 数据分析采用危险比(hazard ratio,HR)及其95%置信区间(confidence interval,CI)的危险比描述CA9表达高低对患者生存的影响。当研究中提供HR和95%CI时,直接提取这些数据进行分析。如果文献没有提供数据,则使用EngaugeDigitizer软件(4.1版)从Kaplan-Meier生存曲线中估计HR值和95%CI,并从曲线中提取存活率,得到HR(SE)值[41]。数据分析采用Stata11.0软件。此外,Q检验和I2指数被用于评估研究的异质性。当被分析的数据具有明显的异质性时,采用随机效应模型[24],反之采用固定效应模型。所有统计检验均为双侧,当P<0.05时,差异具有统计学意义。
1.3 质量评价所有纳入分析的研究都是由2位独立的评审员进行质量评估,使用Newcastle-Ottawa质量评估量表进行评估(http:∥www.ohri.ca/programs/clinical_epidemiology/oxford.asp)。研究质量评估主要分为3部分:①队列的选择;②队列的可比性;③结果的准确性。评价表共有8个项目。当研究在第1和第3部分中具有较高质量时,得1分。在第2部分中,文献有较高质量得2分。然后将总分加在一起,得出总评分进而比较文献质量。
1.4 发表偏倚用Egger检验,Begg检验和漏斗图来评估发表偏倚的风险。
1.5 TCGA数据集RCC的临床信息来源于癌症基因组图谱(the cancer genome atlas,TCGA)数据门户。包括588例具有可用临床信息的病例和72例正常组织样本。
2 结 果
2.1Meta分析结果
2.1.1在RCC中CA9表达水平与DSS无关 首先,我们先进行了包括所有研究在内的分析,结果表明CA9的表达水平与DSS无关(HR=1.18,95%CI:0.82~1.70,I2=79.3%,P<0.05,图1A)。然而,异质性较为明显,因此我们通过排除低质量文献后再进行亚组分析,在只包括高质量文章的亚组分析中结果仍然和前述分析类似(HR=1.40,95%CI:0.89~2.18,I2=39.0%,P=0.161,图1B)。最后,我们又进行了一次只包含较新研究的亚组分析(HR=0.95,95%CI=0.51~1.78,I2=1.1%,P=0.364,图1C),结果也显示CA9的表达高低与DSS没有关系。
表1 纳入研究的27项研究的基本信息和质量评估
A:纳入所有研究;B:排除低质量研究后;C:只包含较新研究。
2.1.2CA9表达水平不能预测RCC患者的术后OS 按照前述的方法,我们对CA9表达与OS之间进行了几个亚组分析,共包括15项研究来评估CA9表达与OS之间的相关性。结果表明CA9表达与OS无关(HR=1.13,95%CI:0.82~1.56,I2=79.8%,P<0.05,图2A)。显著的异质性使我们也需要有像图1B这样的亚组分析。在排除低质量研究后,结果仍然没有变(HR=0.90,95%CI:0.75~1.07,I2=23.1%,P=0.246,图2B)。正如预期的那样,数据支持CA9表达与OS没有相关性。在只包括新研究的亚组分析中也有相同的结果(HR=0.94,95%CI:0.63~1.40,I2=80.9%,P<0.05,图3A),但结果存在显著的异质性,因此我们有一个额外的分析,低质量的研究(质量评分≤6)被删除,以减少异质性。得出了与之前相同的结果(HR=0.83,95%CI:0.68~1.01,I2=33.1%,P=0.201,图3B)。
A:包括所有研究;B:排除低质量研究后。
A:包括所有新研究;B:只包括高质量新研究。
2.1.3RCC中CA9表达水平与PFS无关 由于缺乏新研究(只有2项2015年后的研究),CA9和PFS之间的分析比以前的分析更简单,因此我们只进行了包括所有研究在内的分析,不包括低质量的研究。分析共包括7项研究(HR=1.73,95%CI:0.97~3.09,I2=82.4%,P<0.05,图4A),结果表明高CA9表达与PFS升高有关。这些结果可能与纳入较少的新文献有关。随后我们进行了亚组分析来减少异质性,在排除低质量研究后,发现结果仍然与前面几项分析的结果类似(HR=1.04,95%CI:0.79~1.36,I2=0.0%,P=0.465,图4B)。
2.1.4RCC中CA9表达水平与RFS无关 我们还比较了CA9和RFS之间的关系。与其他分析一样,我们也没有发现CA9和RFS之间的关系。因为只有较新的研究有相关的数据,所以只进行了包括新研究的分析(HR=0.99,95%CI:0.95~1.02,I2=57.8%,P=0.050,图5A)。该项分析的异质性也很显著,所有纳入研究质量评价均在6分以上,其中5项评为8分,只有1项研究评为7分。因此,进行了一个不包括最低质量研究的亚组分析(HR=1.01,95%CI:0.99~1.03,I2=0.00%,P=0.704,图5B)。无论是图6A还是图6B,CA9表达与RFS没有相关性的结果仍然是稳定的。
A:包括所有研究;B:只包含高质量研究。
2.1.5发表偏倚 本研究的发表偏倚使用漏斗图和Egger检验、Begg检验评价。对于OS的分析,漏斗图显示存在发布偏倚(图6A)。发表偏倚通过Egger检验和Begg检验进行测定(Egger’stest=0.040,Begg’stest=0.921),排除低质量研究后,发表偏倚明显减少(Egger’stest=0.160,Begg’stest=0.902,图6B)。其余各项分析结果均与前述结果相似,围绕CA9与OS,仅包括新研究(Egger’stest=0.328,Begg’stest=0.536,图6C),排除低质量文献后(Egger’stest=0.844,Begg’stest=1.000,图6D);围绕CA9与PFS的发表偏倚检验(Egger’stest=0.308,Begg’stest=0.764,图6E),排除低质量文献后(Egger’stest=0.183,Begg’stest=1.000,图6F);围绕CA9与RFS的发表偏倚检验(Egger’stest=0.225,Begg’stest=0.462,图6G),排除低质量文献后(Egger’stest=0.710,Begg’stest=1.000,图6H);围绕CA9与DSS的发表偏倚检验(Egger’stest=0.771,Begg’stest=0.466,图6I),排除低质量文献后(Egger’stest=0.262,Begg’stest=0.548,图6J);只包括新研究(Egger’stest=0.666,Begg’stest=1.000,图6K)。CA9与不同生存指标的分析结果均可接受。
2.2 TCGA生物信息学分析为了验证上述结果,我们对CA9与各种生存率相关性进行了生物信息学分析。其结果与前述的分析一致。图7A~C显示,所有生存率均有相似的结果,即低CA9表达与高CA9表达之间的生存率没有差异。对TCGA数据的分析表明,肾癌CA9的表达水平高于正常组织。在核分级和病理分期方面也未发现各组之间有显著差异。再进行生存分析,发现CA9的表达与无疾病生存率(disease-free survival,DFS)(P=0.3,图7A)、OS(P=0.073,图7B)、DSS(P=0.204,图7C)无关。
A:CA9的表达与患者DFS的生存曲线;B:CA9的表达与患者OS的生存曲线;C:CA9的表达与患者DSS的生存曲线。
3 讨 论
CA9的表达在肿瘤诊断、治疗和临床结果预测方面已有多种应用。有些疾病如乳腺癌,可以通过检查HER2在根治性手术后的表达来有效地预测预后[42]。因此很多研究者正在寻找类似的生物标志物来预测RCC患者的生存情况。
纳入的27篇论文中可供分析的数据包括CA9的表达与DSS、OS、PFS、RFS的相关性。我们的分析表明CA9的表达高低与不同的生存率均无相关性。CA9表达与患者预后的相关性在其他的肿瘤中已被证实:如CA9在头颈部[10]、乳腺[43]、食管[44]、胰腺[45]和软组织肿瘤[46]中表达,且这些肿瘤预后差均与CA9的高表达有关。肾肿瘤中CA9的表达则有所不同。除了癌细胞林岛综合征(von-hippel-lindau,VHL)基因及其所产生蛋白影响CA9的表达外,也有报道称PI3K和未折叠蛋白反应也有调节作用[47],这增加了CA9的表达和RCC预后的不确定性。除RCC外,在卵巢癌[48]、膀胱癌[49]和宫颈癌[50]的研究中也显示CA9水平与患者预后无相关性。除了上述肿瘤,还有一些存在争议的,如脑肿瘤,不同的研究中CA9与脑肿瘤的OS和PFS结果存在矛盾[51-52]。
在大多数RCC中,特别是肾透明细胞癌(clear cell RCC,ccRCC)有个独特的特征,即癌细胞VHL基因突变频繁发生[53]。有研究表明,在低氧条件下,CA9表达对HIF-1α有依赖性[54]。HIF-1反应元件HRE定位于CA9转录起始位点旁边[11],提示CA9是HIF-1下游靶基因。当肿瘤处于低氧条件时,缺氧诱导因子-1α(hypoxia-induced factor-1α,HIF-1α)(HIF有2个部分,一个固有型β-亚基和一个氧敏感的α亚基[55])不能被脯氨酸羟化酶结构域蛋白羟化,且由于VHL基因突变而被异常的VHL蛋白包围[56],HIF-1α不能被26S蛋白酶体降解而持续存在[57]。这一情况导致HIF-1α的持续积累和激活[58]。在低氧状态和酸性条件下,CA9的表达由HIF转录复合物介导[59]。在文献中,由于VHL基因突变导致HIF-1α非氧浓度依赖性积累导致CA9异常增加,使其不能反映真实的低氧状态,这可能使CA9表达与患者预后相关性出现偏差。CA9在RCC中的表达可归因于VHL蛋白阻止CA9在常氧时的蛋白酶体降解,并在无氧或缺氧[60]的情况下表达。综上所述,VHL基因突变导致VHL蛋白缺失,不能降解HIF-1α致使HIF-1α的异常积累。在正常或低氧条件下,HIF-1α可调节CA9过表达,通过检测CA9表达水平无法反映肿瘤缺氧,也无法预测患者预后。
目前还没有研究表明CA9表达在肾癌不同治疗方式中是否有显著差异。我们没有评估CA9表达与T、N、M和Furhman核分级之间的关联,因为2014年后没有新的研究报告关于它们的完整数据,并且在2014年的一项研究中CA9水平与T之间的关联已经被证明无关[7]。在我们的分析中,纳入所有研究的分析和只包括高质量研究的亚组分析均得出结论认为CA9不能作为预测RCC预后的生物标志物。
与几年前的Meta分析相比,我们纳入了更多的文献,得出了更科学的结论。除了DSS、OS和PFS之外,我们还评估了CA9与RFS的相关性。为了使结论更可靠,我们采用生物信息学分析来验证结论。
本研究也有局限性,例如观察性研究低于随机对照试验提供的证据水平。我们的Meta分析中包含的大多数研究都是回顾性研究。本研究中,27项纳入的研究之间存在显著的异质性。与以往的Meta分析[7]相比,我们没有限制文献语言,因此得到了更完整的文献检索[41]。异质性可能是由以下因素引起的,如来自不同国家的患者具有不同的肿瘤分期和组织学类型,对CA9表达高低的定义,使用的治疗方法,随访时间,不同来源和稀释的抗体等。为了尽量减少异质性,只选择用IHC测量CA9表达水平的研究。此外,我们需要注意发表偏倚。对于OS,结果存在发表偏差(图6A、C)。但当排除低质量的研究后,发表偏倚明显降低(图6B、D)。此外,RFS和DSS没有显著的发表偏倚(图6H、K),这表明分析结果是可信的。另一个限制是数据提取的过程,当文献中不直接提供HR和SE时,使用生存曲线计算所需数据。该过程不可避免的引入了潜在的异质性来源。估计的HR和SE可能不如研究直接提供的准确。当我们使用TCGA数据库进行生信分析时,由于数据库中缺乏患者RFS和CA9的相关数据,我们只能使用DFS。
我们的Meta分析表明,IHC检测到的低CA9和高CA9表达之间没有发现各种生存率的差异。