APP下载

翻译组学相关技术的应用研究进展

2020-10-13罗锦堂张晓娟奚英杰张林林郭益文丁向彬郭宏李新

天津农业科学 2020年7期

罗锦堂 张晓娟 奚英杰 张林林 郭益文 丁向彬 郭宏 李新

摘    要:随着高通量测序技术和质谱技术的兴起与发展,全基因组学、转录组学、蛋白质组学等多种组学技术被广泛的应用于生物研究领域用以深入探究细胞或组织中基因和蛋白的表达模式及调控机理。转录组测序和蛋白质谱技术是当前研究基因和蛋白功能的主要技术手段,但因从mRNA到蛋白质的翻译过程受到转录及转录后水平、翻译及翻译后水平等多种不同水平的调控影响。转录组结果和蛋白组结果二者间相关性较低,匹配度较差,无法对基因和蛋白的功能及调控途径进行最为有效的机制分析,而翻译组学技术作为蛋白质组学与转录组学之间的“桥梁”,可以提供参与核糖体翻译过程的RNA信息,显著增加了RNA和蛋白质之间的相关性,揭示了RNA到蛋白质的中间进程,为阐释转录本丰度与蛋白质丰度之间差异原因,分析遗传信息从核苷酸到氨基酸的过程途径提供了技术支撑。本文介绍了目前翻译组学中最常用的四种技术方法的原理、应用以及优缺点,以期为将来利用翻译组学技术手段开展相关研究提供参考。

关键词:转录组学;蛋白质组学;核糖体新生肽链复合物;mRNA;翻译组学

中图分类号:Q81          文献标识码:A          DOI 编码:10.3969/j.issn.1006-6500.2020.07.004

Abstract: With the rise and development of high-throughput sequencing technology and mass spectrometry technology, genome-wide genomics, transcriptomics, proteomics and other omics technologies are widely used in the field of biological research to deeply explore genes in cells or tissues and protein expression patterns and regulatory mechanisms. Transcriptome sequencing and protein profiling technologies are the main technical means for studying the function of genes and proteins. However, because the translation process from mRNA to protein is affected by many different levels of regulation, including transcription and post-transcription level, translation and post-translation level, transcription. The results of transcriptomics and proteomics are relatively low in correlation, and the degree of matching is poor. It is impossible to analyze the functions and regulatory pathways of genes and proteins in the most effective mechanism. "Bridge" can provide RNA information involved in the translation process of ribosomes, significantly increasing the correlation between RNA and protein, revealing the intermediate process of RNA to protein,to explain the reason for the difference of abundance between transcript and protein, provides technical support for the analysis of the genetic information from nucleotides to amino acids. This article introduced the principles, applications, advantages and disadvantages of the four most commonly used technical methods in translation omics at present, in order to provide a reference for future research using translation omics technology.

Key words: transcriptomics; proteomics; ribosomal nascent peptide complex; mRNA; translationomics

在各種生命进程中,蛋白质的功能发挥均受到有机体的精准调控。根据中心法则可知,产生一个可以发挥功能的蛋白质需要经历以下4个调控步骤即:RNA的合成调控(包括表观遗传和转录调控)、RNA的降解调控、蛋白质的合成调控(翻译调节)和蛋白质的降解调控[1]。随着多种组学技术的发展,研究人员通过构建数学模型和组学测量分析表明,蛋白质的合成调控占整个蛋白质合成过程中总数的一半以上[2]。因翻译调控的存在,转录组学和蛋白质组学产生的结果并不直接相关, mRNA的表达丰度不能真实地反应蛋白质的表达丰度,即当mRNA丰度低时,可能在翻译后期突然大量翻译致使蛋白表达丰度显著增加,反之,mRNA丰度高时,也可能发生翻译暂停,从而导致蛋白质丰度减低。Maier等[3]对多对转录组和蛋白质组的对应结果进行比较研究发现,mRNA表达水平与其编码蛋白的表达水平间的相关系数为0.01至0.5。由此可知,以mRNA 的表达水平作为判断蛋白质表达水平的依据有可能产生较大的分析误差。翻译组学主要用于研究翻译过程中涉及的所有元素,如正在翻译的mRNA、调控RNA、新生肽链及各种翻译因子等。它的出现让RNA到蛋白质的中间进程得以呈现,作为连接转录组学与蛋白质组学的桥梁,更准确地揭示遗传信息的传递过程和调控机制。

1 转錄组学、蛋白质组学及翻译组学的比较

转录组测序(RNA-Seq)主要研究特定细胞在某一功能下所能转录出来的RNA集合,在中心法则中mRNA是蛋白质合成的直接模版,RNA-Seq可以直接地反映mRNA在细胞中的种类和数量,同时还可以检测mRNA的序列变异和可变剪接[4],因此,RNA-Seq被广泛用于研究目标基因的表达水平,阐明动植物生长发育和应激反应的机制。特别是对于未知基因组序列的物种,可以从转录组序列中推断出蛋白质序列,对于这些物种的开发利用发挥了重要作用。从mRNA到蛋白质的翻译过程分别受转录调控、转录后调控和翻译水平调控,并且翻译后的修饰、活化及降解调控也对蛋白质丰度有重要影响,所以仅凭RNA-seq无法准确且真实反映细胞内蛋白质水平。

随着分子生物学相关技术的发展和成熟,蛋白质组学在分子生物学研究中得到了广泛的应用,其中贯穿整个蛋白质组学的通用技术为质谱技术(MS)[5]。质谱技术为帮助研究人员定量及定性研究蛋白质提供了强有力的方法手段,同时质谱技术也因为可以从复杂的混合物中较易获得有用的相关信息等优点成为蛋白质组学研究中发展最快的技术手段。特别是基于二次质谱技术的液相色谱与质谱技术联用的方法(LC-MS/MS)已成为研究蛋白质最有效的方法之一。质谱技术的基本原理是先将蛋白质经胰酶消化成肽片段的混合物,随后在质谱仪中进行检测,具有不同质荷比(即质量和电荷的比值:M/Z)的肽段被检测器分别收集进而得出M/Z值,获得实际的一级质谱和二级质谱。之后再通过与蛋白质序列数据库中的蛋白质经胰酶消化后所产生的理论上的一级质谱和二级质谱峰图进行比较鉴定蛋白质的类型和含量。与之前的双向电泳等方法相比质谱法具有灵敏度高和速度快的优点,并且可以同时提供蛋白质鉴定和定量信息[6]。同时,质谱技术还可以富集复杂的蛋白质混合物中的目标蛋白质,识别翻译后修饰的位点,此外,许多调控修饰,如磷酸化、乙酰化和甲基化均可以通过质谱进行大规模分析。然而,质谱法在蛋白质鉴定方面也存在一定的局限性,主要体现在解析度低,难以检测到丰度较低的蛋白;蛋白质本身的理化性质也会影响质谱检测,而且如疏水性膜蛋白、结构抗消化的致密蛋白以及易于降解的蛋白等蛋白都不容易被检测到[7];而且,质谱法仅能鉴定已知的蛋白质,无法鉴定新的或未知的蛋白质。

mRNA通过与核糖体结合起始蛋白质翻译进程,在整个翻译过程中包括起始、延伸和终止3个阶段。许多研究均已证明翻译进程中的第一个阶段即起始阶段是蛋白质合成的主要限速步骤[8-10]。在真核生物中,核糖体小亚基40S首先与翻译起始因子结合并识别mRNA5'端的甲基化帽子。待mRNA与小亚基结合后,tRNA(tRNAMet)通过反密码子与mRNA中AUG起始序列结合,形成40s起始复合物[11]。然后核糖体大亚基(60S)与起始复合物相结合。结合后完整的80S核糖体-mRNA翻译起始复合物开始合成肽链[12-13]。在合成过程中,其余核糖体也可以与该mRNA结合从而形成多聚核糖体(polysome)。翻译过程中核糖体-新生肽链复合物(Ribosomenascent-chaincomplex,RNC)中的mRNA即是能翻译成蛋白的mRNA,而没有形成复合物的mRNA,则无法被翻译成蛋白质。而翻译组学研究主要是测定参与核糖体翻译事件中的RNA序列,因此,翻译组测定在一定程度上可以测定出所有待翻译蛋白,为全面揭示mRNA到蛋白质的翻译调控机制提供了有效手段。

2 翻译组研究常用技术

翻译组的广义定义包括直接参与翻译过程的所有元素,如结合核糖体的mRNA、核糖体、tRNAs、一些调节性RNA(miRNA、lncRNA等)、新生多肽链和各种翻译因子。由于广义的翻译组需要研究的内容较多,极大增加了研究的难度,故而引申出翻译组的狭义定义,即主要特指正在参与翻译过程的mRNA,因为mRNA对蛋白质的合成提供了蓝图,所以研究翻译中的mRNA就成了研究翻译组学的首要任务。目前,翻译组学研究主要有多聚核糖体图谱技术(Polysomeprofiling)、翻译谱分析技术(RNC-Seq)、核糖体足迹谱技术(Ribosomeprofiling)、翻译核糖体亲和纯化技术(Translating Ribosomeaffinitypurification,TRAP)[1]。

2.1 多聚核糖体图谱技术

多聚核糖体图谱技术(Polysome profiling)始于20世纪60年代,是一种基于蔗糖密度梯度超速离心的蛋白质分析技术。核糖体是大多数高密度细胞中最大的大分子细胞器,一个结合了许多核糖体的mRNA分子在蔗糖梯度中沉降系数更大故沉淀的速度更快。在蔗糖密度梯度离心后,游离RNA和蛋白质由于其密度小而漂浮在蔗糖梯度的顶部。蔗糖溶液从底部缓慢泵出,可以在蔗糖溶液分离出与不同数量核糖体结合的mRNAs。然后通过Northernblot、微阵列或RT-PCR分析各组分中的结合了不同数量核糖体的mRNA,以反映转录物的翻译分布。但当环境胁迫时翻译的全局状态会发生巨大变化[14]。例如,在高渗透压下观察到单个核糖体结合的mRNA数目就会显著增加即含有一个核糖体的mRNA会变多,含有多个核糖体的mRNA就会变少,而在氧化应激压力下结合到多个mRNA的核糖体数目会显著增加,结合单个核糖体的mRNA数目变少等[15]。多聚核糖体图谱技术通常还用于转座子的研究[16]。在离心过程中根据与mRNA结合的核糖体的数量进行沉淀,并在分级分离后将有效翻译的mRNA鉴定并合并,之后再使用DNA芯片或RNA-seq对mRNA池进行定量,以得出转座子的数据。多聚核糖体图谱技术的主要缺点是难以对全翻译mRNAs(RNC-mRNA)进行深入分析。由于蔗糖梯度的体积很大,每个部分的RNC-mRNA浓度都比较低,同时高浓度的蔗糖进一步抑制了某些酶类反应。从蔗糖梯度中回收的RNC-mRNA总量通常仅足以满足RT-PCR等试验操作,除非使用大量的起始材料,否则很难回收到足够的mRNA用于全谱分析,限制了后续功能研究的深入开展。

2.2 翻译谱分析技术

2013年,暨南大学张弓教授实验室发明了全长翻译mRNA测序技术也称翻译谱分析技术(RNC-seq)[17],有效地解决了多聚核糖体图谱技术样本回收量低的难题。RNC-seq技术通过将细胞裂解液注入单一浓度(约30%)的蔗糖缓冲液中,经超速冷冻离心从游离mRNA和其他细胞成分中分离出与核糖体结合的所有翻译mRNA,随后进行离心并抽提沉淀,提取出核糖体新生肽链复合物,最后进行高通量测序,就可以得到所有正在翻译mRNA的全长信息以及RNC-mRNA的丰度和类型。通过优化离心和蔗糖缓冲条件,RNC的回收率可以高达90%以上,且回收的RNC仍然保留了翻译活性。RNC-Seq技术的难点在于完整RNC-mRNA复合体的分离,RNC的脆弱性导致核糖体离解和mRNA断裂及降解。且翻译谱分析技术无法明确分析出在翻译过程当中核糖体究竟结合到mRNA全长的哪一位置,即确定不了核糖体分布的位置信息。因此,RNC-mRNAs的分析结果可能存在一定的偏差与缺陷。

2.3 核糖体足迹谱技术

核糖体足迹谱技术(Ribo-seq)是利用核糖体印迹的经典分子方法[18],体外翻译的mRNA经过核酸酶处理以破坏未由核糖体保护的区域。这种处理留下了大约30个核苷酸的“足迹”,可以将其定位回原始mRNA,以明确翻译核糖体的确切位置。Ribo-Seq,首次由Ingolia[19]等研究发现。他们用低浓度的RNase处理细胞裂解物来降解没有被核糖体保护的mRNA,而由核糖体保护的RNA片段则不会受到影响。而后通过下一代测序(NGS)分析20-30nt左右的mRNA片段(称为核糖体保护片段迹,RFPs)揭示核糖体的位置和密度。基于位置信息,可以推断核糖体在每个转录体上的分布和密度、核糖体具体滑动到哪一密码子,据此可以进一步推断出起始密码子位置(包括非ATG起始)、密码子使用偏差、上游ORF(uORFs)[20]等信息,这些信息是其他翻译组学技术无法获得的。近几年,一种更加优化的核糖体序列分析方法即超分辨率核糖体分析(super-resolutionribonomeprofiling)被开发出来。HsuPollyYingshan等[21]用该技术发现了拟南芥基因组注释中缺失的蛋白质,证实了计算预测的非规范翻译事件,并发现了可能在植物中具有重要功能的未注释的小蛋白质。然而核糖体图谱技术操作比较复杂,且对初始样本的需求量也比较大。有些RNA结合蛋白可以保护在结合区域的RNA不受RNase的降解而存留下来,但这些被保护留存下了的RNA片段并不是处于被翻译的状态[22]。此外,Ribo-seq还经常生成许多被比对到非编码RNA的“RFP”,这表明该分析存在较大的假阳性率。

2.4 翻译核糖体亲和纯化技术

翻译核糖体亲和纯化技术(TRAP)是由Gerber等人报道提出的,该技术主要利用组织特异性启动子表达结合核糖体大亚基的L25蛋白质,并在C-端连接亲和标签,之后转化细胞,随后利用特异性抗体结合含有标签的核糖体,进而抓取获得结合在核糖体上正在翻译的mRNA,以供后期分析研究。TRAP技术通过对核糖体保护的mRNA片段进行深度测序,可以发现新的编码转录本和蛋白质同工型,并对翻译效率进行精确测定。TRAP技术的优点是不需要固定或解离组织,也不需从组织中提取细胞来捕获细胞类型特异性mRNA。与其他方法相比,该优点使TRAP的灵敏度更高。此外,TRAP转基因用增强的绿色荧光蛋白(EGFP)标记待研究的细胞类型,因此可以在免疫组化或电生理研究中可视化。与其他基因表达谱分析方法相比,TRAP的另一个优势在于它揭示了细胞翻译后的mRNA含量[23]。核糖体亲和纯化技术的主要难点在于,如果是直接在动物层面进行操作则需要首先制备相关转基因动物模型,如果要对原核生物或细胞样本操作则需要构建表达载体,此过程繁琐、耗时,且只能适用于已经建立稳定转化体系的物种。故该项技术在应用方面依然存在一定的局限性。

3 总结与展望

综上所述,基于mRNA转录为核心的转录组技术并不能直接反应出蛋白质的翻译水平,且翻译调控比转录调控更快、更敏感,同时可以解释转录组和蛋白质组之间的差异,对翻译调控的研究可以帮助我们更好地理解基因表达调控机制。翻译组研究技术方法的未来改进方向将集中于减少测序时所需要的样品量(例如,单细胞转化组学),增加样品种类(不同细胞和组织等)、提高灵敏度,降低假阳性,增加空间和时间分辨率,降低成本和操作复杂性等方面。目前,笔者从基因组到转录组的相关调控机理研究的较为透彻,但从转录组到蛋白组的调控机理研究还非常薄弱,而翻译组恰恰是连接转录组和蛋白组的桥梁。

传统的多组学联合分析大多局限在基因组、转录组、蛋白组和代谢组等,随着翻译组的进步与发展,联合翻译组进行的多组学分析已经表现出极高的研究价值。如广西大学的罗祖朋[24]通过MeRIP-Seq和RNC-Seq的联合运用,探究高脂营养条件对小鼠肝脏的m6A甲基化模式和正在翻译的mRNA的影响,结果显示甲基化差異基因在脂质代谢、翻译等相关重要生物学过程中显著富集。Wang等[25]通过分析了全基因组范围内的mRNA,RNC-mRNA和蛋白质的相对丰度,对肺癌细胞和正常支气管上皮细胞进行比较,发现mRNA长度显著的促进了翻译调节。虽然,目前翻译组学的研究还处于比较初级阶段,但相信随着研究的持续深入,翻译组学在揭示蛋白翻译奥秘、丰富和发展分子生物学理论等方面,将体现出特有的重要价值。加入了翻译组的多组学联合分析将有助于获得更加全面的分子生物学相关信息。

参考文献:

[1]ZHAO J, QIN B, NIKOLAY R, et al. Translatomics: The Global View of Translation[J]. International journal of molecular sciences, 2019, 20(1): 212.

[2]SCHWANHAUSSER B, BUSSE D, LI N, et al. Corrigendum: Global quantification of mammalian gene expression control[J]. Nature, 2011, 473(7347): 337-342.

[3]MARIER T, GUELL M, SERRANO L. Correlation of mRNA and protein in complex biological samples[J]. FEBS letters, 2009, 583(24): 3966-3973.

[4]NAGARAJ N, WISNIEWSKI J R, GEIGER T, et al. Deep proteome and transcriptome mapping of a human cancer cell line[J]. Molecular systems biology, 2011, 7(11): 548-554.

[5]MATTHIESEN R, BUNKENBORG J. Introduction to mass spectrometry-based proteomics[J]. Methods in molecular biology (Clifton, N.J.), 2013, 1007: 1-45.

[6]COX J, MANN M. Max Quant enables high peptide identification rates, individualized p. p. b. -range mass accuracies and proteome-wide protein quantification[J]. Nature Biotechnology, 2008, 26(12): 1367-1372.

[7]COX J, NEUHAUSER N, MICHALSKI A, et al.Andromeda: a peptide search engine integrated into the MaxQuant environment[J]. Journal of proteome research, 2011, 10(4): 1794-1805.

[8]JACKSON R J, HELLEN C U, PESTOVA T V. The mechanism of eukaryotic translation initiation and principles of its regulation[J]. Nature reviews molecular cell biology, 2010, 11(2): 113-127.

[9]Ali Muhammad Umar, Ur Rahman Muhammad Saif, Jia Zhenyu, et al. Eukaryotic translation initiation factors and cancer[J]. Tumour biology: the journal of the international society for oncodevelopmental biology and medicine, 2017, 39(6).

[10]SHIROKIKH N E, ARCHER S K, BEILHARZ T H, et al. Translation complex profile sequencing to study the in vivo dynamics of mRNA-ribosome interactions during translation initiation, elongation and termination[J]. Nature protocols, 2017, 12(4): 697-731.

[11]ZHONG J Y, XIAO C L, GU W, et al. Transfer RNAs mediate the rapid adaptation of Escherichia coli to oxidative stress[J]. PLoS genetics, 2015, 11(6): e1005302.

[12]NERURKAR P, ALTVATER M, GERHARDY S, et al. Eukaryotic ribosome assembly and nuclear export[J]. International review of cell and molecular biology, 2015, 319:107-140.

[13]PICCIRLLO C A, BJUR E, TOPISIROVIC I, et al. Translational control of immune responses: from transcripts to translatomes[J]. Nature immunology, 2014, 15(6): 503-511.

[14]DAVID HO J J, WANG M L, AUDAS T E, et al. Systemic Reprogramming of Translation Efficiencies on Oxygen Stimulus[J]. Cell reports, 2016, 14(6): 1293-1300.

[15]LIANG S, BELLATO H M, LORENT J, et al. Polysome-profiling in small tissue samples[J]. Nucleic acids research, 2018, 46(1): e3.

[16]KING H A, GERBER A P. Translatome profiling: methods for genome-scale analysis of mRNA translation[J]. Briefings  in functional genomics, 2016, 15(1): 22-31.

[17]LU S H, WANG T, ZHANG G, et al. Understanding the proteome encoded by "non-coding RNAs": new insights into human genome[J]. Science China(Life Sciences), 2020, 63(7): 986-995.

[18]WOLIN S L, WALTER P. Ribosome pausing and stacking during translation of a eukaryotic mRNA[J]. The EMBO journal, 1988, 7(11): 3559-3569.

[19]INGOLIA N T, GHAEMMAGHAMI S, NEWMAN J R, et al. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling[J].Science, 2009, 324(5924): 218-223.

[20]PAULET D, DAVID A, RIVALS E. Ribo-seq enlightens codon usage bias[J]. DNA research: an international journal for rapid publication of reports on genes and genomes, 2017, 24(3): 303-210.

[21]HSU P Y, CALVIELLO L, WU H L, et al. Super-resolution ribosome profiling reveals unannotated translation events in Arabidopsis[J]. Proceedings of the national academy of sciences of the United States of America, 2016, 113(45): E7126-E7135.

[22]魏康寧, 崔俊霞, 王梦蕾, 等. 转录组测序技术的研究和应用进展[J].生物技术通报, 2019, 35(7): 222-229.

[23]MORAN P, GUO Y, YUAN R, et al. Translating Ribosome Affinity Purification (TRAP) for RNA Isolation from Endothelial Cells In vivo[J]. J Vis Exp, 2019, (147): 10.3791/59624.

[24]罗祖朋. 高脂对小鼠肝脏基因RNA甲基化的影响[D]. 南宁:广西大学, 2019.

[25]WANG T, CUI Y Z, JIN J J, et al. Translating mRNAs strongly correlate to proteins in a multivariate manner and their translation ratios are phenotype specific[J]. Nucleic acids research, 2013, 41(9): 4743-4754.