APP下载

基于GEO数据库的肾上腺皮质腺癌关键基因筛选及预后分析

2022-03-24周乃春樊瑞新张少朋顾朝辉

现代泌尿外科杂志 2022年2期
关键词:差异基因信息学细胞周期

周乃春,樊瑞新,张少朋,顾朝辉,陆 伟

(1.信阳市中心医院泌尿外科,河南信阳 464000;2.郑州大学附属信阳医院泌尿外科,河南信阳 464000;3.郑州大学第一附属医院泌尿外科,河南郑州 450052)

肾上腺皮质癌(adrenocortical carcinoma,ACC)是罕见的恶性肿瘤,但又是肾上腺最常见的原发性恶性肿瘤[1],是仅次于甲状腺癌的内分泌器官第二常见恶性肿瘤[2]。ACC极大地威胁着患者生命健康,5年生存率仅10%~20%[3]。然而目前针对ACC尚缺乏有效的早期诊断及晚期治疗方法,因此,本研究利用生物信息学技术及多种在线工具对美国国立生物技术信息中心(National Center of Biotechnology Information,NCBI)、基因表达数据库(Gene Expression Omnibus,GEO)多个表达数据集行生物信息学分析以进行ACC关键基因的筛选,为其提供潜在的诊断标志物和治疗靶点。

1 资料与方法

1.1 GEO数据集的获取以“Adrenocortical carcinomas”为关键词,实验类型选择“Expression profiling by array”,物种选择“Homo sapiens”,在GEO数据库中检索ACC相关数据集,最终纳入GSE12368、GSE19750、GSE143383、GSE90713、GSE14922、GSE75415共6个数据集(表1)。

表1 各个GEO数据集的样本分布情况

1.2 差异表达基因分析运用R软件(4.0.3,https://www.r-project.org/)对GSE12368、GSE19750、GSE143383、GSE90713、GSE14922、GSE75415数据集进行差异表达分析;首先运用GEOquery包从GEO数据库获取以上6个数据集并导入R软件[4];其次运用Limma包对6个数据集行差异表达分析(ACC组织vs.正常肾上腺组织)[5]。以调节后P<0.05为差异存在统计学意义,变化倍数的对数(log2fold change,log2FC)>1或<-1为存在差异表达,在线Venn图绘制工具(http://www.bioinfor-matics.com.cn/static/others/jvenn/example.html)整合6个数据集的差异表达基因集,获取共同差异表达基因[6]。

1.3 共同差异基因的蛋白互作网络、关键基因的筛选运用STRING数据库的Multiple Proteins模块行蛋白互作网络分析,其中每个点代表1个基因、蛋白或分子,连线代表两点之间存在相互作用。将分析结果导入Cytoscape软件[7],运用cytoHubba插件获取关键基因(degree排序,排名前5基因)[8]。

1.4 关键基因的富集分析及预后分析运用在线富集分析工具WebGestalt采用过度表征分析(over-representation analysis,ORA)[9],错误发现率(false discovery rate,FDR)采用Benjamini and Hochberg矫正法,以FDR<0.05存在统计学差异,行GO富集分析;clusterProfiler包(3.16.1)行KEGG分析[10],P<0.05为差异存在统计学意义;运用在线生物信息学分析工具GEPIA2(Gene Expression Profiling Interactive Analysis)的“survival analysis”模块对关键基因行生存分析[11],以基因表达中位数将ACC分为高表达与低表达组,以总生存期(overall survival,OS)作为评估方法,基于Cox-PH模型计算风险比(hazards ratio,HR),以P<0.05为差异具有统计学意义。

2 结 果

2.1 ACC的差异基因分析研究从GEO数据库共整理得到6个数据集,包括正常肾上腺组织样本31个、ACC样本193个,行差异表达分析,GSE12368共得到差异表达基因722个(上调244个,下调478个)、GSE19750共得到差异表达基因591个(上调101个,下调490个)、GSE143383共得到差异表达基因443个(上调146个,下调297个)、GSE90713共得到差异表达基因307个(上调76个,下调231个)、GSE14922共得到差异表达基因436个(上调214个,下调222个)、GSE75415共得到差异表达基因650个(上调249个,下调401个)。差异基因取交集共得到差异表达基因16个,上调5个:TPX2、CCNB1、TOP2A、ZWINT、NCAPG;下调11个:HOXA5、PTH1R、IGFBP6、WFDC1、IGFB5、ADH1B、SERPING1、KCNQ1、FBLN1、EFEMP2、TAGLN。

2.2 共同差异基因的蛋白互作网络、关键基因的获取图1展示了16个差异基因经STRING数据库蛋白互作网络分析的结果,共得到2个主要相互关联的蛋白网络。导入Cytoscape软件以degree方法排序获取排名前5的关键基因(TPX2、CCNB1、TOP2A、ZWINT、NCAPG),均为上调基因。结合蛋白互作网络分析结果,这5个关键基因在ACC发生发展中可能发挥着重要的作用。

图1 16个差异基因的蛋白互作网络图

2.3 关键基因的富集分析及预后分析图2展示了关键基因的GO富集分析结果,关键基因主要组成或参与细胞周期检查点、染色体分离、DNA构象改变、有丝分裂细胞周期负调控、细胞器等形成过程。KEGG富集分析结果最终显示关键基因TPO2A主要参与顺铂类耐药(platinum drug resistance),CCNB1主要参与p53信号通路(p53 signaling pathway)调控、孕酮介导的卵母细胞成熟(progesterone-mediated oocyte maturation)、细胞周期(cell cycle)、卵母细胞成熟分裂(oocyte meiosis)、FoxO信号通路(FoxO signaling pathway)、细胞衰老(cellular senescence)等信号通路。GEPIA2工具行生存分析,结果显示关键基因与ACC总体生存期均存在高度相关性:TPX2(P=0.000 45,HR=4.1),CCNB1(P<0.000 1,HR=4.9),TOP2A(P=0.000 12,HR=4.8),ZWINT(P<0.000 1,HR=16),NCAPG(P<0.000 1,HR=6.1,图3)。

A:生物学进展;B:细胞成分;C:分子功能。

A:TPX2;B:CCNB1;C:TOP2A;D:ZWINT;E:NCAPG。

3 讨 论

ACC起源于肾上腺皮质,约占原发性肾上腺肿瘤的6.8%[12]。ACC可发生在任何年龄段,幼儿期和50~70岁之间为2个发病高峰,且以女性多见[13-15]。目前主要的治疗手段是手术切除,然而,即使完全切除,ACC复发率仍高达19%~34%[16-17]。辅助治疗旨在减少复发,包括化疗和放射疗法,但疗效有限[13,18]。而最广泛使用的肿瘤、淋巴结和转移分期系统(TNM分期)并不能很好地反映ACC复杂的异质临床特征及估计未来生存期[19-20]。且近期流行病学研究显示,过去40年ACC发病率逐年上升,而患者存活率未有任何改善[1]。因此,运用生物信息学技术从分子水平解开ACC基因组学特性对于寻找有效治疗方法、预测患者生存期和复发风险至关重要。本研究中通过差异分析、蛋白互作网络分析等过程最终筛选出5个与ACC密切相关的关键基因:TPX2、CCNB1、TOP2A、ZWINT、NCAPG。生存分析显示5个关键基因均与ACC存在高度相关性,且与ACC较差的预后相关。GO富集分析显示关键基因参与多种信号通路调整及细胞组成,KEGG富集分析仅筛选出TOP2A、CCNB1两个基因,提示TOP2A、CCNB1在ACC发生发展中发挥着重要作用。

TPX2参与纺锤体微管的形成,是有丝分裂纺锤体正常组装所需的纺锤体组装因子,参与细胞凋亡、细胞周期等多种过程。在多种恶性肿瘤中过度表达,已被确认是恶性肿瘤诊断和预后的标志物[21]。ZWINT在有丝分裂检查点信号传导中起重要作用。最近研究表明,ZWINT与多种细胞周期蛋白的表达存在显著相关性,可能成为肝细胞性肝癌的潜在治疗靶点[22]。NCAPG在细胞有丝分裂和减数分裂过程中组织了单个染色单体的卷曲拓扑结构,参与了肝癌的进展[23]。因此,推测它们可能在ACC的发生发展中起关键作用。尽管TPX2、ZWINT、NCAPG尚未被广泛报道参与ACC的进展,但它们被观察到与多种肿瘤相关,且多个生物信息学分析研究提示TPX2、ZWINT、NCAPG高表达与更差的ACC预后相关,是ACC潜在的诊断与治疗靶点[24-5],这与本研究结果一致。

TOP2A编码DNA拓扑异构酶,是一种控制和改变转录过程中DNA拓扑状态的酶,已被证明是蒽环类和拓扑异构酶抑制剂有效性的预测因子[26],与研究KEGG分析结果一致。TOP2A已被证明在几种癌症中发挥预后作用,例如结直肠、食管、乳腺癌、前列腺、肺等癌症[27-30]。近期研究显示TOP2A在ACC中与更差的预后相关,在晚期ACC患者辅助顺铂类药物治疗方面有较强的预测性[31]。另一项研究提示TOP2A在ACC中过表达,可调节ACC细胞的增殖和侵袭,是ACC治疗的潜在靶点,以TOP2A为治疗靶点的药物预测与应用有待进一步临床研究[32]。

CCNB1编码的细胞周期蛋白B1是细胞周期G2-M期转换的关键细胞周期蛋白,在多种恶性肿瘤中过表达[33]。细胞周期蛋白通过激活特定的细胞周期蛋白依赖激酶在细胞周期的各个阶段发挥重要作用。在调控细胞周期的各种细胞周期蛋白/细胞周期蛋白依赖激酶复合物中,细胞周期蛋白1/细胞周期蛋白依赖激酶2是一个被广泛研究的复合物,它控制着G2-M期检查点的监测,是启动有丝分裂的重要复合物[34]。SOON等[35]曾报道CCNB1可作为鉴别ACCs和腺瘤的潜在标志物。大量研究表明,细胞周期蛋白B1与肿瘤细胞的分化、生长、凋亡、转移和耐药有关[36-37]。本研究富集分析显示CCNB1参与多种信号通路,且与较差的ACC预后密切相关,因此在ACC方面针对CNNB1的靶向预防和治疗可能是有益的。

综上所述,本研究通过生物信息学技术对多个GEO数据集行数据挖掘最终确定5个与ACC密切相关的关键基因,一定程度上揭示了关键基因参与ACC发生发展的潜在机制与通路。CCNB1、TOP2A、TPX2、ZWINT、NCAPG是ACC潜在的诊断标志物及治疗靶点,部分基因的相关通路与机制虽有相关报道与研究,但其具体临床意义及重要程度有待进一步研究与验证。

猜你喜欢

差异基因信息学细胞周期
ICR鼠肝和肾毒性损伤生物标志物的筛选
鸡NRF1基因启动子区生物信息学分析
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
初论博物馆信息学的形成
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
SSH技术在丝状真菌功能基因筛选中的应用