植物可变剪接研究进展
2022-08-19申子萌
徐 悦,王 希,申子萌,5
(1黑龙江大学现代农业与生态环境学院/中国农业科学院甜菜研究所,哈尔滨 150080;2黑龙江省普通高等学校甜菜遗传育种重点实验室/黑龙江省甜菜工程技术研究中心,哈尔滨 150080;3国家糖料改良中心/中国农业科学院北方糖料作物资源与利用重点开放实验室,哈尔滨 150080;4上海信致医药科技有限公司,上海 200000;5中资蓝天生态科技(北京)有限公司,北京 100083)
0 引言
可变剪接又称选择性剪接(Alternative Splicing,AS),指在一个mRNA 前体中通过不同的剪接方式产生不同的mRNA 异构体的过程。它是真核生物中常见的生物学事件,是生物体产生多种蛋白质的一个重要机制。在高等真核生物中,可变剪接的基本机制是相似的,然而,植物和动物之间在基因结构、剪接和转录机制方面存在着大量的差异,与之相关的可变剪接的调控也是植物特有的[1],如诱导开花、响应非生物胁迫、节律现象等[2-4]。随着高通量测序技术的发展,越来越多的可变剪接事件在高等植物中被发现。以植物为对象展开可变剪接的研究有助于帮助我们对花发育、胁迫响应、生理适应等多种过程的深入了解。我们可进一步了解其性状及关键基因的分子机制,为研究植物可变剪接提供新的思路。本研究介绍了可变剪接的多样性、基本机制、研究方法以及拟南芥、大豆、水稻、玉米、甘蓝型油菜可变剪接的最新进展,发现了可变剪接与植物生长发育、昼夜节律等方面存在一定相关性,在基因调控、蛋白质多样性和复杂性方面也发挥着重要作用,为未来深入研究植物可变剪接提供了帮助。
1 可变剪接的机制
1.1 可变剪接的多样性
可变剪接在动植物细胞中都有发生,可分为7 种类型(图1):内含子保留(Intron Retention,IR)、外显子跳跃(Exon Skipping,ES)、互斥外显子(Mutually Exclusive Exon,MEE)、5’端可变剪接(Alternative 5’splice Site,A5SS)、3’端可变剪接(Alternative 3’splice Site,A3SS)、首部外显子可变剪接(Alternative First Exon,AFE)、尾部外显子可变剪接(Alternative Last Exon,ALE)。植物中出现最多的类型是内含子保留,如水稻基因中内含子保留占可变剪接事件总数的47%以上[5],拟南芥基因中内含子保留事件的发生约为56%[6]。
图1 可变剪接的类型
1.2 可变剪接的基本机制
前体mRNA 的剪接对真核基因组编码信息的准确表达起到关键作用。剪接过程包括识别剪接位点、形成剪接复合体、剪切内含子、连接外显子及其产物、复合体解散。整个过程是由剪接体执行的,剪接体由5个小核糖核蛋白复合体(snRNPs)和非snRNP蛋白因子组成[7]。剪切位点的选择不仅取决于核心剪接体成分,而且在很大程度上还取决于其他RNA 结合蛋白,主要是富含丝氨酸/精氨酸(SR)的蛋白质和异质核糖核蛋白(hnRNPs),它们与位于内含子或外显子的顺式调控元件结合,从而激活或抑制剪接。SR蛋白和hnRNPs都参与了除剪接之外的转录后调控的各个步骤[8-10]。
2 可变剪接的研究方法
可变剪接的分析及鉴定方法主要有表达序列标签(EST)[11-13]、cDNA微阵列技术、生物芯片法[14]、第二代测序[15]、单分子测序等。
2.1 表达序列标签
用表达序列标签可以发现新的可变剪接位点,但准确程度要依赖EST序列数据的质量,还要对结果进行生物学的分析验证[16]。Modrek等[17]提出了EST数据预测可变剪接事件的局限性,如序列质量好坏不定,不能覆盖全部基因等。Sablok等[18]使用表达序列标签的方法,比较了苹果、葡萄、甜橙和草莓不同果树的可变剪接事件,分别鉴定到苹果有2039 个可变剪接事件,葡萄有2454个,甜橙有1425个,草莓有444个。
2.2 cDNA微阵列技术
cDNA 微阵列技术可大规模的进行可变剪接分析,并且剪接效率和准确性较EST 也有了大幅提升,但其设计过程和数据处理都比较复杂[19-21]。
2.3 生物芯片法
基于生物芯片技术的研究方法主要有剪接连接点芯片技术和外显子芯片技术两种类型。利用外显子与外显子连接部分的片段作为探针而设计的芯片可以用来验证特定可变剪接的发生,并研究其表达特性,适合全基因组范围的研究[22]。
2.4 第二代测序技术
第二代测序技术具有定量更准确、可重复性更高、适用范围更广、分析更加可靠等优点,为基因组和转录组的深入硏究提供了可能[23-25]。全基因组测序的成本也随着第二代测序技术的发展而逐步降低。转录组高通量测序对于研究可变剪接及其调节来说是一个强有力的实验工具,但同时也必须要有特殊的分析方法和工具。RNA-Seq测序提供了深度的转录组数据,可以用于识别比对组之间差异的可变剪接事件。
2.5 单分子测序技术
单分子测序技术又称第三代测序技术,测序速度极快,能够直接对RNA 进行测序,不需要逆转录[26-29]。操作过程简单,能够较准确的预测可变剪接事件,但目前单分子测序技术的数据较少,很难得到广泛的应用。
3 几种植物的可变剪接研究进展
3.1 可变剪接在拟南芥上的研究进展
研究表明,60%的拟南芥内含子都经历了可变剪接[30]。截至2004年,拟南芥中可变剪接的基因达到了291 个,共形成679 个转录本[31]。Werneke 等[32]最早发现RCA基因可以在拟南芥的叶片中发生可变剪接,形成了44 kd和47 kd两个同源体,并且这两个同源体都能够催化Rubisco的活性。邢永强等[33]通过GEO数据库的RNA-seq 数据,使用SUPPA2 等工具识别了拟南芥的种子、根、叶、花、花梗、节间、长角果7种组织的可变剪接事件,鉴定拟南芥不同组织的可变剪接事件,结果表明,内含子保留是可变剪接类型中占比最多的,而互斥外显子占比最低,这也证实了内含子保留是植物可变剪接事件中发生最多的类型。花和花梗上发生的可变剪接事件最多,而节间和长角果只鉴定了少量的可变剪接事件,进一步分析出可变剪接可对拟南芥花器官的生长发育起到一定的调控作用,为研究可变剪接与植物基因生物学的关系提供了帮助。
3.2 可变剪接在大豆上的研究进展
Shen 等[34]使用高通量测序鉴定了28 个不同发育阶段的大豆样品,包括子叶、根、枝、叶、花、豆荚,还有处于不同发育阶段的种子,最终发现超过63%的基因都经历了可变剪接。在分析的154469 个可变剪接事件中,内含子保留是最丰富的类型,占所有事件的26.47%,而外显子跳跃只占8.89%,这与拟南芥的观察结果一致。可变剪接在较老发育阶段的组织中发生的数量较低,多发生在较年轻发育阶段的组织中。在剪接位点方面,GT-AG位点在所有可变剪接类型中所占比例最高,而GC-AG 是第二常见的剪接位点,这也与其他植物相一致[35-36]。通过计算分析表明,可变剪接的频率和类型的变化与基因特征和基因转录水平的变化显著相关。研究表明,基因结构和转录水平的变化可能在调控可变剪接中起重要作用。
3.3 可变剪接在水稻上的研究进展
Wei等[37]对节水抗旱水稻(WDR)保持系HuHan2B和轮回亲本HanfengB 的转录组序列进行了可变剪接复杂性分析。内含子保留是水稻可变剪接的主要类型,占可变剪接观察事件的42%。差异表达分析显示,转录本在不同的品种和条件下会优先表达。根据基因本体论预测,HuHan2B干旱诱导转录产物的生物学功能在转录调控、叶绿体成分和非生物刺激反应等基因中显著富集,而在生殖发育过程中主要富集于HanFengB。此外,一些基因被证实以干旱诱导的方式积累新的剪接转录本。这些结果表明,HuHan2B 和HanFengB具有相似的可变剪接特征,但在转录调控网络中可变剪接含量增加的基因子集可能有助于通过育种提高水稻保持系HuHan2B 的抗旱性。研究结果表明,可变剪接的复杂性通过一个多外显子基因的转录本的选择性表达,促进了遗传网络的协同调控。
Lu等[38]报道了水稻中可变剪接的基因比例较高,58%的可变剪接相关基因具有多个可变剪接事件,导致单个基因产生大量转录本。他们还证明了水稻中59%的可变剪接事件是特异性的。对可变剪接基因的基因结构分析表明,水稻中76%的可变剪接事件发生在蛋白质编码区。可变剪接在水稻基因调控、蛋白质多样性和复杂性方面也起着重要作用。
3.4 可变剪接在玉米上的研究进展
玉米55.3%的基因都会受到可变剪接的影响[39]。Tian 等[40]在热带玉米系CML288 中鉴定了3 个ZmCCA1 剪接异变体,他们通过同源克隆和3’RACE技术证实了ZmCCA1 经历了丰富的可变剪接。可变剪接可能受到组织类型、光周期和非生物胁迫的影响。通过克隆ZmCCA1剪接变异体,得到了一个高度保守的N末端和不同的C末端,它们受光周期、组织类型和干旱胁迫的影响。此外,ZmCCA1基因的可变事件可能发生物种特异性。因此,此研究为了解玉米ZmCCA1在玉米抗旱性中的作用奠定了基础,为进一步揭示玉米赤霉病的昼夜节律、可变剪接和非生物胁迫提供了新的证据[41-42]。
3.5 可变剪接在甘蓝型油菜上的研究进展
可变剪接是调控植物对非生物胁迫反应的重要机制[43-46]。肖燕等[47]在研究甘蓝型油菜响应低氮胁迫时发现,甘蓝型油菜在经过3 h和72 h的低氮处理后,地上部和地下部都发生了可变剪接。这一发现说明甘蓝型油菜可以利用可变剪接的调控积极适应低氮胁迫。
研究发现,甘蓝型油菜生长发育对硼的需求远高于其他品种。韩林宏等[48]和Gu 等[49]使用高效品种Qingyou10 和低效品种Westar10 进行对比实验。2 个品种无论是在缺硼还是硼充足的情况下,内含子保留和3’端可变剪接都比其他类型的可变剪接多。在缺硼条件下,甘蓝型油菜的可变剪接事件有明显的上升,表明可变剪接可能是转录后调控基因表达的重要方式,可变剪接的增加可以提高分子的可塑性以适应非生物胁迫。
4 展望与总结
随着生物信息学、转录组学、测序技术的不断进步,越来越多的剪接体被发现,植物的可变剪接也取得了一些新的成果。深入研究植物基因的可变剪接,将会为提高植物抗逆性、农作物产量等提供帮助。可变剪接数据库也在更新丰富,研究者应结合基因特征提高预测可变剪接事件的准确度。虽然目前已经发现了很多剪接异变体,但对其生理功能却知之甚少,值得进一步研究。