APP下载

脑胶质瘤可变剪接调控机制研究进展

2018-06-13吕俊杰王科俊熊新炎袁翠玲汤秀丽任付宾

生物学杂志 2018年3期
关键词:亚型胶质瘤癌症

吕俊杰, 王科俊, 熊新炎, 袁翠玲, 汤秀丽, 任付宾

(1.哈尔滨医科大学 生物信息科学与技术学院, 哈尔滨 150081;2.哈尔滨工程大学 自动化学院, 哈尔滨 150080)

可变剪接(alternative splicing, AS)现象广泛存在于真核生物基因中,调控众多关键的基因后转录过程。由于可变剪接与多种人类重大疾病,尤其是癌症,有着很大的相关性,越来越受到广大科研工作者的关注,对可变剪接调控机制的研究层面也越来越广泛。最初研究数据来源于表达序列标签(expressed sequence tag, EST),由于受测序深度不够的限制,对可变剪接的研究只能停留在单个基因层面上[1];后来随着cDNA 微阵列(cDNA microarray)技术的出现,人们估计大约有 60%的人类基因可能包含至少一个能够发生可变剪接的可变外显子(alternative exon),但是由于对微量mRNA亚型的敏感性设计不足等限制,仍然缺乏在全基因组范围内对可变剪接的认识[2]。近年来,随着二代测序技术的出现和生物信息学技术的不断发展,不但使得在全基因组内对可变剪接事件的研究成为可能,而且通过各组学数据之间的相互整合,对可变剪接的研究更为全面,更为系统,最新的研究发现人类基因约95%的外显子都能够产生可变剪接[3]。可变剪接调控机制的异常可能会导致癌症[4]。脑胶质瘤是脑恶性肿瘤之一,致死率非常高,术后存活率低。已有的研究表明,多种与胶质瘤相关的基因、酶、离子通道等均受可变剪接的调控。本文综述近年来脑胶质瘤可变剪接调控机制研究的进展,并对剪接层面的临床治疗进行了展望。

1 pre-mRNA可变剪接调控机制

可变剪接又称选择性剪接,是调节真核生物pre-mRNA为成熟mRNA的关键过程。 可变剪接调控机制复杂,剪接形式多样,目前,经典的分类方法将可变剪接形式分为7种类型,如图1所示。其中,外显子跳过是哺乳动物中最常见的类型,约占人类可变剪接事件的38.4%,在这种模式中,外显子与成熟的mRNA一起从侧翼的内含子中切除;可变5′/ 3′剪接位点也是比较常见的类型,分别约占可变剪接事件的7.9%和18.4%; 内含子保留类型,顾名思义是指内含子保留在所得的成熟mRNA中,约占可变剪接事件的2.8%。 其他类型的可变剪接包括互斥外显子,可变初始外显子,可变终末外显子,这些剪接模式约占可变剪接事件的32.5%[5]。

调节可变剪接机制的基本元素有顺式作用元件和反式作用因子。顺式作用元件是指剪接一致序列和一些辅助元件,它们共同决定剪接的最终结果[6];反式作用因子由一群富含丝氨酸/富含精氨酸(SR)蛋白,以及一些核糖核蛋白(hnRNP)和小核糖核蛋白(snRNP)构成[7-10]。顺式作用元件和反式作用因子相互作用,共同精确调节可变剪接的过程。关于各剪接调控元件及其作用机制的详细介绍可以参考Black的综述文章——Mechanisms of alternative pre-messenger RNA splicing[11]。

图1可变剪接主要类型[11]Fig 1 Main patterns of alternative splicing[11]

2 脑胶质瘤中的可变剪接调控机制

2.1 癌症与可变剪接

在正常组织分化期间,可变剪接调控精密,错误的可变剪接可能导致产生异常的蛋白质亚型,从而导致疾病甚至癌症。基因组范围内研究表明[12]:超过15 000种肿瘤相关的剪接变体广泛存在于癌症中。计算分析肿瘤相关的剪接变体揭示出可变剪接参与癌细胞生物学的几乎每个方面,包括增殖、分化、细胞周期控制、代谢、凋亡、运动、侵入和血管生成。在所选择的剪接变体的功能筛选中,发现乳腺癌和/或卵巢癌特异性10%(41个测试中的4个)可变剪接事件有助于癌细胞存活[13]。 尽管癌症特异性可变剪接事件的功能意义还没有被完全探索清楚,但是已有大量研究证实:异常可变剪接和癌症之间有着密切的联系。

异常的可变剪接事件经常反映出剪接调控机制的异常,前体mRNA剪接一般由初级转录物中的顺式作用剪接序列(顺式作用元件)和结合这些RNA序列的反式剪接因子来调控[14]。蛋白质水平的改变和剪接调节因子活性的改变,顺式作用元件中的点突变以及剪接调控机制本身的核心组分中的突变,都可导致异常可变剪接的发生,从而导致癌症以及许多癌症表型[15]。研究肿瘤中的pre-mRNA 可变剪接调控机制对肿瘤的临床诊断及治疗都非常重要。

2.2 脑胶质瘤的可变剪接调控机制的复杂性

人类脑胶质瘤是最常见的颅内类型恶性肿瘤,发病率占所有原发性脑肿瘤的60%以上,根据世界健康组织对神经系统肿瘤的分类,脑胶质瘤被分为6类[16]:弥漫性星形细胞瘤(II级)、少突胶质细胞瘤(OD,II级)、间变性星形细胞瘤(III级)、间变性少突胶质细胞瘤(III级)、间变性少突星形细胞瘤(III级)和胶质母细胞瘤(GBM,IV级),其中,GBM是最常见,最有侵袭性的原发性脑肿瘤,占恶性星形细胞瘤的80%。胶质母细胞瘤可原发于脑实质内,亦可呈继发性。继发性胶质母细胞瘤多数由间变性星形细胞瘤进一步恶变而来,少部分可由混合性胶质瘤、少突胶质瘤或室管膜瘤演变而成。虽然GBM被认为主要是星形胶质细胞的神经胶质瘤,但是也有少部分GBM表现出OD样肿瘤细胞分化。OD是在成人中观察到的高分化,生长缓慢,呈弥漫性浸润的肿瘤,并且通常位于脑半球中。尽管近年来神经外科,化疗和放射治疗技术方面取得了快速的进展,但是胶质瘤通常预后效果不好。 因此,明确胶质瘤发生发展的基因通路十分必要。

已有研究表明:肿瘤特异性可变剪接在癌症的发生发展过程中对基因表达和相关的蛋白质功能起着重要的调控作用,已经发现多种具有肿瘤特异性,同一肿瘤不同级别特异性的异常可变剪接转录体,这些转录物已被作为疾病进程的标志物。多项研究表明[17-20]:脑胶质瘤的发生和/或发展受异常剪接亚型的影响,例如:表皮生长因子受体,磷酸酶和张力蛋白同源物,肿瘤蛋白p53(TP53),增殖相关的Ki-67抗原,鼠mutS同源物,血小板衍生生长因子α等这些剪接亚型的异常都和脑胶质瘤有关。可变剪接的异常和肿瘤发生之间的关系已经作为癌症生物学的研究新方向。胶质瘤中可变剪接基因的识别可以为胶质瘤的诊断和治疗提供新的分子标志物。然而,可能导致胶质瘤的发生和发展的可变剪接相关的分子机制仍然不是十分清楚。所以,研究脑胶质瘤的pre-mRNA 可变剪接调控机制对于临床治疗有着划时代的意义。

脑胶质瘤中发生可变剪接的基因数量很多,其调控机制受多种因素的影响,所以,想要基于单一数据对不同类型的胶质瘤发生过程,甚至从同一种肿瘤的原发瘤和继发瘤发生过程中分析研究脑胶质瘤可变剪接,得出的结果中必然存在很大的假阳性。要想对脑胶质瘤的可变剪接调控机制进行深入细致的研究,需要整合多组学数据,系统地将可变剪接调控过程分析与定量分析结合起来,筛选出肿瘤形成中可变剪接的变化。随着多组学数据的产生以及生物信息技术的不断发展,我们对各类型胶质瘤的发生以及转移的分子机制将得到深层次的了解,为胶质瘤的诊断治疗提供更好的依据。

3 脑胶质瘤可变剪接调控机制的研究策略

3.1 组学时代的可变剪接调控机制

目前,对于可变剪接调控机制的研究,已不局限于单个基因、单个细胞和单个器官的分析研究。随着实验与计算生物技术的发展,尤其是高通量测序技术的发展,对可变剪接的研究已进入组学时代。对可变剪接与基因组、转录组、蛋白质组等组学的相互整合分析,可多方位系统研究可变剪接调控机制[21]。可变剪接可使pre-mRNA产生不同的转录体,这些转录体经过翻译成为结构、功能各不相同的蛋白亚型(isoform)。蛋白质是机体功能的最终执行者[22],这样可变剪接现象极大地扩增了生物体内的蛋白质数量,同时也产生了很多原来蛋白质不具备的功能,这些功能涉及细胞增殖与凋亡、免疫调节、急性炎症响应、转录调节、细胞再生及分化、胆固醇运输等,这迫使人们不得不以更加深入的眼光看待可变剪接这一过程,今后对于蛋白功能的研究必须从基因层面向亚型层面进行深化。

3.2 多组学数据整合分析脑胶质瘤可变剪接调控机制

以往的蛋白质组质谱技术对于同一种蛋白的不同亚型间的细小差别不能很好地区分,随着组学时代的到来,以及测序技术的不断发展,尤其是二代测序技术的出现,使得大量针对蛋白亚型特异性研究成为可能[23]。但是面对如此海量的信息,单分子或多分子研究显然不能满足研究的需要。为了在亚型层面上对蛋白质的功能进行深入、系统、全面和大规模地研究,需要对多组学数据进行整合分析来建立大规模、高通量的蛋白质亚型功能的研究方法。随着深度测序技术的发展,整合 RNA-Seq 数据与金标准数据集的研究方法由于具有较高的准确性和易行性而逐渐成为一种新兴的研究手段,特别是海量 RNA-Seq 数据的不断产出,为其提供了丰富的数据资源。未来多组学数据整合分析将成为分析研究方法的主流。

疾病的发生与发展往往涉及多个层面的因素,包括基因表达、后转录调控、表观遗传学、蛋白质以及各种代谢网络等不同层面的病理生理过程[24]。一个层面数据的改变很难解释疾病的整个发生过程,通过多组学数据的整合分析,可以有效去除单个层面的随机事件,将有助于人们对疾病形成更加系统全面的认识。不再局限于 RNA-Seq 数据,外显子芯片、Chip-Seq数据,转录后调节、单核苷酸突变、蛋白的翻译后修饰等大规模组学数据均可通过它们之间线性或非线性关系进行相互整合,这将大大提高分析的精确性与准确性,最终建成经济、稳健的分析模型。在分子层面上解释疾病的发生发展过程,同时也在亚型的水平上,对蛋白质-RNA互作网络,蛋白质-DNA互作网络以及蛋白质互作网络等进行全面的分析研究,并且对如长非编码 RNA(long non-coding RNA,lncRNA)领域的研究也有重要的借鉴意义。

目前,在多组学数据整合分析研究重大疾病,尤其是癌症已经取得初步进展。Fang等通过整合ChIP-seq技术,微阵列表达数据以及microRNA 数据对胶质母细胞瘤中的重要调控元件SOX2的反应机制进行了分析研究,取得了很好的效果[24];Kmin-seok等整合mRNA数据与microRNA 数据,建立支持向量机模型(SVM)识别出诊断胰腺癌的多种生物标记(biomarkers)[25];Ping等通过整合多维基因组数据,包括DNA突变、拷贝数、甲基化、基因表达和miRNA表达谱,以及调节网络和蛋白质相互作用网络,确定基于多因素介导的失调网络的驱动模块及其失调基因,识别出胶质母细胞瘤中17种基因及其失调基因的核酸模块[26]。Agyeman 等将转录组数据与蛋白组数据进行整合,分析乳腺癌的潜在化学预防剂莱菔硫烷(SFN)的作用机理[27];Szklarczyk等研究发现糖酵解过程和代谢组、蛋白组和基因组都相关[28]。这些研究都表明了疾病的发生发展过程涉及众多的细胞调控过程,是一个系统的、多方面因素相互影响协调的复杂过程。脑胶质瘤的生物学发生十分复杂,存在pre-mRNA 可变剪接的基因较多[29],单组学数据很难分析其可变剪接调控过程,通过基因组、转录组和表观组等多个层面的数据之间线性或非线性关系等将它们联系到一起,进行多组学数据的整合分析,这将是未来对脑胶质瘤可变剪接调控机制研究的新方向。

4 展望

最后,由于数据来源的多样性,可将来源于不同年龄、不同类型的胶质瘤,或不同病理分型的胶质瘤数据进行整合分析,研究基因亚型水平的表达模式,进而探求在特定状态下基因亚型的表达差异及其所可能具有的功能及意义[30]。利用多组学数据整合分析研究,可以找出导致胶质瘤的异常可变剪接发生的生理病理过程,例如,细胞凋亡相关基因、细胞周期调控蛋白、肿瘤抑制基因、各种酶、离子通道、细胞表面受体等[31]。所幸的是,这些关键基因所发生的可变剪接除了作为胶质瘤的诱发因素外,同时能够作为临床上的诊断或治疗靶点,为胶质瘤在可变剪接层面的治疗提供新的思路。

[1]ZHENG S, BLACK D L.Alternative pre-mRNA splicing in neurons: growing up and extending its reach[J].Trends Genet, 2013, 29(8):442-448.

[2]MATERA A G, WANG Z.A day in the life of the spliceosome[J].Nat Rev Mol Cell Biol, 2014, 15(2):108-121.

[3]FU X D, ARES M J R.Context-dependent control of alternative splicing by RNA-binding proteins[J].Nat Rev Genet, 2014,15(10):689-701.

[4]LEE Y, RIO D C.Mechanisms and regulation of alternative pre-mRNA splicing[J].Annu Rev Biochem, 2015, 84:291-323.

[5]SALTON M, VOSS T C, MISTELI T.Identification by high-throughput imaging of the histone methyltransferase EHMT2 as an epigenetic regulator of VEGFA alternative splicing[J].Nucleic Acids Res, 2014, 42(22): 13662-13673.

[6]ZHANG Y, KWOK J S, CHOI P W, et al.Correction: pinin interacts with C-terminal binding proteins for RNA alternative splicing and epithelial cell identity of human ovarian cancer cells[J].Oncotarget, 2016, 14, 7(10):11397-11411.

[7]KANG J, XU E Y.An integrated hierarchical Bayesian approach to normalizing left-censored microRNA microarray data[J].BMC Genomics, 2013, 14:507.

[8]JEONG S.SR proteins: binders, regulators, and connectors of RNA[J].Mol Cells, 2017, 40(1):1-9.

[9]SUGNET C W, KENT W J, ARES M J R, et al.Transcriptome and genome conservation of alternative splicing events in humans and mice[J].Pac Symp Biocomput, 2004:66-77.

[10]吕俊杰.采用智能方法的可变剪接调控机制与相关疾病研究[D].哈尔滨:哈尔滨工程大学, 2012.

[11]CIEPLY B, CARSTENS R P.Functional roles of alternative splicing factors in human disease[J].Wiley Interdiscip Rev RNA, 2015, 6(3): 311-326.

[12]BLENCOWE B J.Alternative splicing: new insights from global analyses[J].Cell, 2006, 126(1): 37-47.

[13]GAMAZON E R, STRANGER B E.Genomics of alternative splicing: evolution, development and pathophysiology[J].Hum Genet, 2014, 133(6):679-687.

[14]QU W, CINGOLANI P, ZEEBERG B R.A bioinformatics-based alternative mRNA splicing code that may explain some disease mutations is conserved in animals[J].Front Genet, 2017, 8: 38.

[15]ZHANG W, SPECTOR T D, DELOUKAS P, et al.Predicting genome-wide DNA methylation using methylation marks, genomic position, and DNA regulatory elements[J].Genome Biol, 2015, 16(1):14.

[16]RICCI-VITIANI L, PALLINI R, BFFONI M, et al.Tumour vascularization via endothelial differentiation of glioblastoma stem-like cells[J].Nature, 2010, 468(7325):824-828.

[17]CHENG L, HUANG Z, ZHOU W C, et al.Glioblastoma stem cells generate vascular pericytes to support vessel function and tumor growth[J].Cell, 2013, 153(1):139-152.

[18]LANG M F, YANG S, ZHAO C, et al.Genome-wide profiling identified a set of miRNAs that are differentially expressed in glioblastoma stem cells and normal neural stem cells[J].PLoS One, 2012, 7(4):e36248.

[19]LICATALOSI D D, YANO M, FAK J J, et al.Ptbp2 represses adult-specific splicing to regulate the generation of neuronal pre-cursors in the embryonic brain[J].Genes Dev, 2012, 26(14):1626-1642.

[20]CARRO M S, LMI W K, ALVAREZ M J, et al.The transcriptional network for mesenchymal transformation of brain tumours[J].Nature, 2010, 463(7279):318-325.

[21]JAGTAP P, GOSLINGA J, KOOREN J A, et al.A two-step database search method improves sensitivity in peptide sequence matches for metaproteomics and proteogenomics studies[J].Proteomics, 2013, 13(8):1352-1357.

[22]SHEYNKAMN G M, SORTREEDH M R, FREY B L, et al.Large-scale mass spectrometric detection of variant peptides resulting from nonsynonymous nucleotide differences[J].J Proteome Res, 2013, 13(1):228-240.

[23]SHEYNKAMN G M, SORTREEDH M R, FREY B L, et al.Discovery and mass spectrometric analysis of novel splice-junction peptides using RNA-Seq[J].Mol Cell Proteomics, 2013, 12(8):2341-2353.

[24]FANG X, YOON J G, LI L, et al.The SOX2 response program in glioblastoma multiforme: an integrated ChIP-seq, expression microarray, and microRNA analysis[J].BMC Genomics, 2011, 12: 11.

[25]MIN-SEOK K W, YONGKANG K, SEUNG L, et al.Integrative analysis of multi-omics data for identifying multi-markers for diagnosing pancreatic cancer [J].BMC Genomics, 2015, 18:88.

[26]PING Y Y, DENG Y, WANG L, et al.Identifying core gene modules in glioblastoma based on multilayer factor-mediated dysfunctional regulatory networks through integrating multi-dimensional genomic data [J].Nucleic Acids Research, 2015, 43(4): 1997-2007.

[27]AGYEMAN A S, CHAERKADY R, SHAW P G, et al.Transcriptomic and proteomic profiling of KEAP1 disrupted and sulforaphane-treated human breast epithelial cells reveals common expression profiles[J].Breast Cancer Res Treat, 2012, 132(1):175-187.

[28]SZKLARCZYK D, FRANCESCHINI A, WYDER S, et al.STRING v10: protein protein interaction networks, integrated over the tree of life[J].Nucleic Acids Res, 2015, 43:D447-D452.

[29]CIRILLO D, BOTTA T, TARTAGLIA G G.By the company they keep: interaction networks define the binding ability of transcription factors[J].Nucleic Acids Res, 2015, 43(19):e125.

[30]CHENG K O, LAW N F, SIU W C.Iterative bicluster-based least square framework for estimation of missing values in microarray gene expression data[J].Pattern Recogn, 2012, 45(4):1281-1289.

[31]YU F, FU W M.Identification of differential splicing genes in gliomas using exon expression profiling [J].Nucleic Acids Res, 2015, 11(2): 843-850.

猜你喜欢

亚型胶质瘤癌症
体检发现的结节,离癌症有多远?
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
TGIF2调控胶质瘤细胞的增殖和迁移
DCE-MRI在高、低级别脑胶质瘤及脑膜瘤中的鉴别诊断
Ikaros的3种亚型对人卵巢癌SKOV3细胞增殖的影响
ABO亚型Bel06的分子生物学鉴定
Sox2和Oct4在人脑胶质瘤组织中的表达及意义
99mTc-HL91乏氧显像在恶性脑胶质瘤放疗前后的变化观察