乳腺癌中c-MYC调节的剪接基因鉴定及其临床意义分析△
2018-06-13张永明王一澎马飞
张永明,王一澎,马飞
国家癌症中心/中国医学科学院北京协和医学院肿瘤医院1教育处,2乳腺外科,3肿瘤内科,北京100021
RNA剪接是指从DNA模版链转录出的初级转录本中去除内含子,并将外显子拼接在一起,产生成熟的信使RNA的过程。对于具有多个外显子的基因而言,剪接过程产生了具有不同外显子组成方式的信使RNA,并被翻译成不同的蛋白产物,极大地丰富了基因组编码蛋白的多样性,对维持细胞的正常功能以及决定细胞和组织的特异性发挥着重要作用。RNA剪接过程调控紊乱与肿瘤及多种疾病有关。如在肿瘤的发生、发展过程中,肿瘤相关基因的调控序列在剪接位点常发生基因突变,从而影响基因的选择性剪接过程。剪接复合体核心组分的蛋白表达异常影响了剪接体的正常功能,与肿瘤的进展和转移有关[1]。MYC癌蛋白是大多数人类肿瘤的主要驱动因子,MYC可以结合到基因组中的活性调控元件上,广泛扩大基因表达,导致细胞不受限制地生长[2]。MYC开启一组与剪接体组成元件相关的基因表达,剪接相关基因对MYC驱动肿瘤形成起到至关重要的作用[3-4]。本研究通过分析乳腺癌多组学数据,鉴定MYC调控的剪接基因,并评价其潜在的预后价值,为深入研究MYC在乳腺癌中的作用机制,鉴定潜在的乳腺癌治疗靶点提供理论依据。
1 资料与方法
1.1 数据库分析
利用癌症和肿瘤基因图谱(cancer genome atlas,TCGA)数据库调取乳腺癌数据集BreastⅠnvasive Carcinoma(TCGA,Provisional)数据,分析乳腺癌中与c-MYC共表达的基因;采用DAVⅠD(functional annotation bioinformatics microarray analysis)数据库对c-MYC共表达的基因进行功能富集分析;采用String蛋白数据库分析剪接基因蛋白互作网络;利用TCGA数据库调取BreastⅠnvasive Carcinoma(TCGA,Provisional)数据,分析剪接基因在基因组水平上的突变、扩增和缺失情况;Kaplan-Meier plotter数据库分析乳腺癌中WDR77、GEMIN4、SNRPD1及其他剪接基因的表达与乳腺癌患者预后的关系。
1.2 热图绘制
采用Cluster 3.0和Java TreeView软件绘制基因表达热图。
2 结果
2.1 c-MYC共表达基因功能富集分析
调取并分析TCGA数据库中乳腺癌数据集Breast Ⅰnvasive Carcinoma(TCGA,Provisional)的1105例乳腺癌数据,结果显示:与c-MYC共表达相关的基因共有519个(Pearson相关系数≥0.3)。采用DAVⅠD数据库对519个基因进行功能聚类,结果显示:与c-MYC共表达相关的基因显著富集核糖体生物合成、细胞周期、染色体分离、RNA剪接、DNA结合调节等功能。(图1)
图1 c-MYC共表达基因的功能富集
2.2 c-MYC对可变剪接基因的影响
功能富集结果显示:与c-MYC共表达的基因中涉及RNA剪接的共有16个,其中PPP2CA基因的表达与c-MYC的表达在乳腺癌中呈负相关;其余15个基因的表达均与c-MYC的表达呈正相关,即c-MYC表达的升高伴随着15个剪接基因的表达升高的现象,提示在乳腺癌中c-MYC参与调节异常剪接基因的转录。(图2)
图2 c-MYC与共表达基因的相关性分析
2.3 c-MYC调节的剪接基因互作网络
应用String蛋白数据库分析c-MYC相关剪接基因互作网络,分析结果显示:16个基因中有12个基因与RNA剪接具有密切联系,主要是剪接体复合物、U12-型剪接体复合物和剪接体snSNP复合物,其中最主要的节点基因为SNRPD1,其他基因的节点数目详见图3。
图3 String蛋白数据库分析可变剪接基因之间的联系
2.4 剪接基因交集分析
在本研究分析的乳腺癌数据中,与c-MYC共表达的16个基因中有3个基因与已经发表的淋巴瘤中的基因一致,分别为WDR77、GEMIN4和SNRPD1。WDR77、GEMIN4和SNRPD1基因与c-MYC基因在乳腺癌数据集中的Pearson相关系数分别为0.32、0.47和0.30。(图4)
图4 淋巴瘤和乳腺癌c-MYC调节剪接基因交集分析
2.5 基因组水平检测基因变化
调取TCGA数据库中乳腺癌数据集BreastⅠnvasive Carcinoma(TCGA,Provisional),分析剪接基因在基因组水平上突变、扩增和缺失的情况,结果显示:16个剪接基因在乳腺癌中均有不同程度的扩增,其中CPSF1、PUF60、TGS1和RBM17基因在乳腺癌中的扩增比例较多,分别为16%、15%、9%和5%,详见图5。进一步分析结果显示:c-MYC调节的剪接基因在基因组水平的拷贝数改变与基因mRNA表达之间存在相关性,详见图6。
图5 剪接基因的突变、扩增和缺失比例分析
2.6 对乳腺癌患者预后的影响
图6 剪接基因拷贝数变异与基因表达的相关性分析
对WDR77、GEMIN4、SNRPD1基因及其他剪接基因的表达与乳腺癌患者预后的关系进行分析,结果显示:与WDR77低表达的乳腺癌患者相比,WDR77高表达的乳腺癌患者的总生存期较长,差异有统计学意义(log-rankP=0.046);WDR77高表达的乳腺癌患者的无复发生存期明显长于WDR77低表达的乳腺癌患者,差异有统计学意义(logrankP=1.1×10-11);GEMIN4高表达的乳腺癌患者的总生存期和无复发生存期均短于GEMIN4低表达的患者,差异均有统计学意义(log-rankP=0.031、4.2×10-6);SNRPD1高表达的乳腺癌患者的总生存期和无复发生存期均短于SNRPD1低表达的患者,差异均有统计学意义(log-rankP=0.036、5.9×10-12);另外,CPSF1、PPNA、SF1、LSM6、SRPK1、YBX1、RBM28和PUF60基因的表达也与乳腺癌患者的预后有关。(图7)
3 讨论
图7 WDR77、GEMIN 4和SNRPD 1基因高表达与低表达乳腺癌患者的生存曲线图
可变剪接是生物多样性的重要原因,属于表观遗传学范畴,其通过不同的作用方式从同一条基因序列产生不同的mRNA序列从而合成功能不同的蛋白质,使基因编码更有效率。可变剪接在发育、分化过程中发挥着重要作用。越来越多的证据表明:不同组织或细胞中往往存在异常的可变剪接事件与肿瘤的发生发展密切相关。剪接异构体通过调控细胞运动、细胞增殖、激素应答、细胞凋亡和化疗反应等过程中的基因参与肿瘤的发生发展。由于肿瘤中普遍存在选择性剪接异常,可变剪接异常逐渐被认为是肿瘤进展和治疗的重要标志。然而,其介导肿瘤发生发展的具体机制尚不明确[5-6]。
有研究表明,多种肿瘤中常见MYC的表达上调,并伴有肿瘤的恶性进展和不良预后,说明MYC是肿瘤发生的重要驱动基因[7-8]。虽然细胞通路基因的突变可为细胞的生长和增殖提供最初的信号,但转录的异常可以引起广泛的细胞生理学变化,从而促进细胞的生长和增殖;同时,基因表达程序组成部分的增加,使细胞能够适应多种突变,使肿瘤细胞变得活跃[9]。研究发现,一些促进细胞恶性转化的剪接调节蛋白是MYC的直接转录靶点,其中包括hnRNP A1和hnRNP A2,而MYC诱导上调的二者能调节丙酮酸激酶的选择性剪切,进而促进与肿瘤相关的丙酮酸激酶M2的表达[10]。靶向剪接体通路,剪接复合体蛋白以及肿瘤相关基因的选择性剪接过程的治疗方法,可以为肿瘤靶向治疗提供新的策略[1,11-12]。近些年,人们正尝试通过可变剪接进行肿瘤诊断和治疗,剪接体是MYC驱动的肿瘤中一个治疗新靶点,因为在MYC驱动的肿瘤中,肿瘤的发生和进展对剪接体蛋白表达的依赖性增强,但是目前仍没有阻断该基因发挥作用的有效方法,通过抑制肿瘤细胞中剪接体的功能或许可以有效抑制肿瘤的进展[1]。Hsu等[13]发现BUD31为乳腺上皮细胞中的MYC合成致死基因,并证明BUD31是核心剪接体组装和催化活性所需的组分,敲降BUD31表达能干扰剪接体活动并损害MYC依赖性乳腺肿瘤和转移。在MYC驱动的淋巴瘤中,使用相应的反义寡核苷酸能使Eμmyc B细胞出现增殖减缓和诱导凋亡的特征[4]。因此,较深入地研究并揭示剪接体在肿瘤发病与进展中的机制,同时针对不同剪接体设计靶向药物对于肿瘤的诊断和治疗具有重要意义。
Hsu等[13]在乳腺癌中直接对c-MYC调控的剪接因子进行了实验性分析,但缺少多样本剪接因子表达分析,为此本研究组进行了多肿瘤样本的c-MYC调控表达对剪接的影响。本研究分析发现,在乳腺癌中与c-MYC共表达的基因有519个,其中可变剪接基因有16个。剪接基因中有15个基因表达伴随c-MYC表达升高而升高。Cheryl M.Koh团队[4]研究发现,在淋巴瘤中c-MYC参与调控RNA剪接复合体核心组装基因的转录,其中c-MYC直接调节的核心SNRP组装基因中21个基因表达上调,且本研究与Koh等在淋巴瘤中发现的剪接基因存在3个重叠基因,即WDR77、GEMIN4和SNRPD1,提示WDR77、GEMIN4和SNRPD1这些剪接基因在c-MYC驱动乳腺癌的进展中具有重要作用[4]。这16个剪接基因在基因组水平上有不同程度的缺失和扩增;生存分析表明WDR77、GEMIN4和SNRPD1与患者的总生存期和无复发生存期显著相关,提示与c-MYC相关的剪接基因在乳腺癌的发生和进展中具有重要作用。
综上所述,c-MYC调节的剪接基因在乳腺癌的发生和发展中扮演重要角色,本研究为乳腺癌的治疗和预后评估提供了重要参考价值,但关于c-MYC如何调节剪接基因的表达及剪接基因如何介导乳腺癌的发生发展还需进一步研究,同时充分了解c-MYC影响剪接的具体机制可能对未来的靶向MYC依赖性的肿瘤治疗提供重要理论依据。
[1]Dvinge H,Kim E,Abdel-Wahab O,et al.RNA splicing factors as oncoproteins and tumor suppressors[J].Nat Rev Cancer,2016,16(7):413-430.
[2]Walz S,Lorenzin F,Morton J,et al.Activation and repression by oncogenic MYC shape tumour-specific gene expression profiles[J].Nature,2014,511(7510):483-487.
[3]Sabò A,Kress TR,Pelizzola M,et al.Selective transcriptional regulation by Myc in cellular growth control and lymphomagenesis[J].Nature,2014,511(7510):488-492.
[4]Koh CM,Bezzi M,Low DH,et al.MYC regulates the core pre-mRNA splicing machinery as an essential step in lymphomagenesis[J].Nature,2015,523(7558):96-100.
[5]Singh B,Eyras E.The role of alternative splicing in cancer[J].Transcription,2017,8(2):91-98.
[6]Ghigna C,Riva S,Biamonti G.Alternative splicing of tumor suppressors and oncogenes[J].Cancer Treat Res,2013,158:95-117.
[7]Chen BJ,Wu YL,Tanaka Y,et al.Small molecules targeting c-Myc oncogene:promising anti-cancer therapeutics[J].Ⅰnt J Biol Sci,2014,10(10):1084-1096.
[8]Kuzyk A,Mai S.c-MYC-induced genomic instability.Cold Spring Harb Perspect Med[J],2014,4(4):a014373.
[9]Lin CY,Lovén J,Rahl PB,et al.Transcriptional amplification in tumor cells with elevated c-Myc[J].Cell,2012,151(1):56-67.
[10]David CJ,Chen M,Assanah M,et al.HnRNP proteins controlled by c-Myc deregulate pyruvate kinase mRNA splicing in cancer[J].Nature,2010,463(7279):364-368.
[11]Lee SC,Abdel-Wahab O.Therapeutic targeting of splicing in cancer[J].Nat Med,2016,22(9):976-986.
[12]Chen J,Weiss WA.Alternative splicing in cancer:implications for biology and therapy[J].Oncogene,2015,34(1):1-14.
[13]Hsu TY,Simon LM,Neill NJ,et al.The spliceosome is a therapeutic vulnerability in MYC-driven cancer[J].Nature,2015,525(7569):384-388.