基于GEPIA2 和Oncomine 数据库分析ITGA6 基因在卵巢癌中的表达及意义
2021-05-06欧阳振波冯国开尹倩李群张敏李凤吴嘉雯万子贤张秋实
欧阳振波 冯国开 尹倩 李群 张敏 李凤 吴嘉雯 万子贤 张秋实
卵巢癌是妇科三大恶性肿瘤之一,由于其发病隐匿、症状不典型,患者就诊时已多为晚期,因此预后差[1-3]。盆腹腔种植性播散是卵巢癌的主要转移方式,也是影响其手术及治疗效果的重要原因[2-4]。对卵巢癌转移及种植机制的基因研究,可以用于卵巢癌的分子靶向成像及治疗,也是目前研究的热点[4-6]。整合素(integrin,ITG)是一种广泛存在于上皮细胞及内皮细胞等表面的跨膜糖蛋白,由一种α 和β 亚单位通过非共价键形式构成的异二聚体。作为人体的重要黏附分子,ITG 可介导细胞与细胞间、细胞与基质间的相互作用,并直接参与肿瘤的侵袭和转移过程[6-7]。ITGA6基因表达的整合素α6 是ITG 的一种α 亚单位,可以分别与β1 和β4亚单位结合形成α6β1 和α6β4,参与体内多种重要的生理及病理过程[8-9]。许多研究表明,ITGA6直接参与多种癌症的形成及转移等,在癌组织中的高表达与更差的预后存在显著相关性,如肝癌、胰腺癌、乳腺癌及结直肠癌等[7-11]。尽管也有一些研究探讨了ITGA6在卵巢癌中的表达及其与预后的关系,但是目前的结论尚存在一定的矛盾和争议[5-6]。
基因表达谱数据交互分析数据库2 (Gene Expression Profiling Interactive Analysis 2,GEPIA2)是基于肿瘤基因组计划(the Cancer Genome Atlas,TCGA) 与基因型-组织表达(Genotype-Tissue Expression,GTEx)两大著名转录组数据库建立的可视化癌症大数据分析平台[12]。Oncomine 数据库是当今世界上最大的肿瘤芯片数据库与整合平台[13]。本研究拟通过对GEPIA2 和Oncomine 两大数据库中相关信息的挖掘,分析ITGA6在卵巢癌中的表达及其与分期和预后的关系,为进一步研究ITGA6在卵巢癌发生发展中的作用机制及分子靶向成像和治疗等提供依据和参考。
资料和方法
一、Oncomine数据库的数据提取及分析
根据本研究的需求设定筛选条件:(1)Gene:
ITGA6; (2) Analysis type: cancervsnormal analysis;(3) Cancer type: ovarian cancer;(4)Data type:mRNA;(5) Datasets threshold by:Pvalue<0.05,fold change=2,gene rank=top 10%。将所有结果汇总后再进行综合比较分析。
二、GEPIA数据库的数据提取及患者预后分析
首先利用GEPIA2 数据库进一步验证Oncomine数据库中的ITGA6表达结果,再对ITGA6在卵巢癌不同分期中的差异表达及其与生存预后的关系进行分析。在Expression DIY 的“Stage Plot”模块中设置筛选条件:(1) Gene:ITGA6;(2) Use major stage:yes;(3)Datasets selection(cancer name):OV;(4)Log Scale:yes。在“Survival plots”模块中设置筛选条件:(1) Gene:ITGA6;(2)Methods:
Overall Survival (OS) or Disease Free Survival(RFS);(3) Group cutoff:median;(4) Hazards ratio(HR):yes;(5)95%confidence interval:yes;(6)Axis units:months;(7)Datasets selection:OV。
三、统计学方法
卵巢癌与正常组织之间的ITGA6表达差异采用配对t检验,不同分期之间ITGA6表达的比较采用单因素方差分析(one-way ANOVA),并对符合条件的研究进行在线Meta 分析。ITGA6表达与卵巢癌预后的关系采用GEPIA2 数据库的GBM 数据集进行在线生存分析(Kaplan-Meier 法),两组之间生存率的比较采用Log-Rank 检验。当P<0.05 时认为差异有统计学意义。
结 果
一、Oncomine 数据库中ITGA6 在所有肿瘤中的表达
按照设置的筛选条件,Oncomine 数据库中共收集了359 项关于ITGA6在20 种不同类型肿瘤和正常组织中表达的对比研究结果,表达差异有统计学意义的研究有81 项,其中呈显著高表达的研究有50 项,呈显著低表达的研究有31 项。在卵巢癌中呈显著高表达的研究有1 项,呈显著低表达的研究有2项,见图1。
图1 ITGA6在Oncomine数据库中所有肿瘤中的表达
二、GEPIA2数据库中ITGA6在所有类型肿瘤中的表达
GEPIA2 数据库共收录了33 种肿瘤及与其配对正常组织中ITGA6表达的比较。其中,13 种肿瘤的ITGA6呈显著高表达,3种肿瘤的ITGA6呈显著低表达。与配对的正常组织相比,卵巢癌中的ITGA6呈高表达,但差异无统计学意义,见图2。
三、基于Oncomine 数据库分析ITGA6 在卵巢癌和正常组织间的表达差异
图2 GEPIA2数据库中ITGA6在卵巢癌与正常组织中的表达比较(红色为卵巢癌组)
Oncomine 数据库中共有7项研究包含13个子数据集对比了ITGA6在卵巢癌与正常组织中的表达,共计1 043 个肿瘤样本。相关研究分别发表于Br J Cancer[14]、Cancer Res[15-16]、Clin Cancer Res[17]、Proc Natl Acad Sci USA[18]、Cancer Sci[19]等 专 业 杂志。对上述7 项研究进行Meta 分析发现,与正常组织相比,ITGA6在所有差异表达基因中的中位秩为1 777.0,P<0.001,差异有统计学意义,提示ITGA6在卵巢癌中呈显著高表达,见图3。有4项研究专门针对的是浆液性卵巢癌(含TCGA 数据库数据),有2项研究对上皮性卵巢癌的四种病理类型进行了分组分析[16-17]。对所有针对浆液性卵巢癌的研究进行Meta 分析,发现与正常组织相比,ITGA6在所有差异表达基因中的中位秩为3 066.5,P=0.013,差异有统计学意义,提示ITGA6在浆液性卵巢癌组织中呈显著高表达,见图4。有2 项研究分别比较了ITGA6在卵巢子宫内膜样癌、黏液性卵巢癌及卵巢透明细胞癌中的表达[16-17],Meta 分析显示差异均有统计学意义,提示ITGA6在以上三种上皮性卵巢癌亚型中也均呈显著高表达。
图3 Oncomine数据库中ITGA6在卵巢癌表达的Meta分析
图4 Oncomine数据库中ITGA6在浆液性卵巢癌表达的Meta分析
四、ITGA6表达水平与卵巢癌分期的关系
在GEPIA2 中分析ITGA6表达与卵巢癌分期的关系,发现在不同分期间ITGA6的表达差异有统计学意义(F=6.05,P=0.002 57),Ⅱ期卵巢癌中的ITGA6表达显著高于Ⅲ期和Ⅳ期,见图5。
图5 GEPIA2数据库中ITGA6在卵巢癌不同分期中的表达对比
五、ITGA6表达与卵巢癌预后的相关性
利用GEPIA2 数据库进行在线生存分析,可见ITGA6的表达与卵巢癌的总生存期(overall survival,OS)(HR=0.94,P=0.6)(图6)和无病生存期(disease free survival,RFS)(HR= 0.83,P=0.12)(图7)均无显著相关性。
图6 GEPIA2数据库中ITGA6表达与卵巢癌患者总生存期(OS)的关系
图7 GEPIA2数据库中ITGA6表达与卵巢癌患者无病生存期(RFS)的关系
讨 论
尽管手术及化疗技术均已得到了很大的提高,但是卵巢癌的五年生存率仍未得到明显改善[2]。究其原因主要是卵巢癌就诊时已多为晚期,且随着化疗次数的增加,癌细胞会逐渐出现耐药[4]。基因检测技术及精准医学的发展,促使越来越多的研究开始在基因层面探讨卵巢癌的发生、发展及预后等,以实现对卵巢癌的早期分子诊断及基因靶向治疗,从而改善卵巢癌的预后[3,5]。
不少研究表明,在肝癌、胰腺癌、乳腺癌及结直肠癌等中,ITGA6呈显著高表达,且与患者的预后差存在显著的相关性[7-11]。鉴于整合素α6 在癌组织中的显著高表达,有团队设计开发了靶向整合素α6 的多肽,并通过将其与PET、MRI及SPECT 等示踪剂结合,在小鼠及人体中实现了对相关癌症的早期分子成像,从而为癌症的早期诊断及治疗提供基础[7-11]。
目前关于ITGA6在卵巢癌中的表达及其对预后的预测价值仍存在争议。尽管有研究表明整合素α6在卵巢癌中呈显著高表达,且与患者预后差存在显著相关性,但是也有研究表明整合素α6 在卵巢癌中的表达并未显著升高,甚至呈低表达,对预后无预测价值[4-6]。考虑出现以上争议和矛盾的原因主要有以下几点:第一,大部分研究纳入的卵巢癌样本量较少。第二,上皮性卵巢癌主要可分为浆液性卵巢癌、黏液性卵巢癌、卵巢子宫内膜样癌及卵巢透明细胞癌四种。有研究表明整合素α6 在各种卵巢癌亚型中的表达是存在差异的[6],但少有研究对各种病理亚型进行考虑。第三,研究方法各异,有如流式细胞术、免疫组织化学、PCR及Western Blot等。第四,另有研究表明整合素α6 在卵巢癌中的表达与分期相关,分析时应考虑肿瘤分期的影响[5-6]。因此,有必要进一步探讨ITGA6在卵巢癌中的表达及价值。
肿瘤相关生物数据库使得高效分析海量基因测序数据成为了可能。GEPIA2 是一个新开发的用于癌症和正常组织基因表达谱分析和交互分析的网络服务器,其包含了来自TCGA 和GTEx 的9 736 个肿瘤和8 587 个正常样本的RNA 测序表达数据[12]。Oncomine 数据库是一个基于基因表达汇编(Gene Expression Ommibus,CEO)、TCGA 及文献来源的高通量测序数据综合分析平台,现共包含715 个数据集的86 733 个样本[13]。基于以上两个数据库的研究不仅可以弥补临床实验中样本量不足的短板,而且可以利用数据库的模块进行各种在线分析,是一种研究基因与肿瘤相关性的有效便捷方法[12-13]。
通过对Oncomine 数据库中所有7 项研究的在线Meta 分析发现,ITGA6在卵巢癌中呈显著高表达。但在GEPIA2中,ITGA6在卵巢癌的表达与其在正常对照组织中相比,差异无统计学意义。考虑主要是由于GEPIA2中的肿瘤数据均来自于TCGA,即所有患者均为浆液性卵巢癌。进一步在Oncomine数据库进行的基于病理学亚型的分层Meta 分析显示,ITGA6在浆液性卵巢癌、黏液性卵巢癌、卵巢子宫内膜样癌及卵巢透明细胞癌中呈均显著的高表达,且在后三种病理亚型中更为明显。基于GEPIA2 数据库进行的生存分析显示,ITGA6表达的高低与卵巢癌的OS 及RFS 均无显著相关性。但是需要注意的是,GEPIA2 数据库仅包含了浆液性卵巢癌患者。卵巢癌中ITGA6的表达与分期相关,Ⅲ期和Ⅳ期的表达显著低于Ⅱ期,故后续研究在探讨ITGA6与患者的预后关系时应考虑分期的影响。
综上所述,基于GEPIA2 和Oncomine 数据库的分析表明,与正常组织相比,ITGA6在卵巢癌中呈显著高表达。尽管ITGA6的表达与卵巢癌的预后无显著相关性,但是这种显著性的高表达使其可以作为一种卵巢癌分子成像及基因药物研制的靶标,从而为卵巢癌的早期诊断及精准治疗提供思路及参考。