长链非编码RNA 在植物中的研究进展
2020-12-23孙薏雯李金宝杨丹丹于海洋刘祎良孔心茹
孙薏雯,李金宝,杨丹丹,于海洋,刘祎良,周 敏,孔心茹,刘 飞,徐 娜
济宁医学院 生物科学学院,山东 日照 276800
生物体内存在的RNA 主要分为编码RNA 和非编码RNA,即直接参与编码蛋白质的RNA 和不具有编码蛋白质功能、或者间接参与翻译过程的RNA。起初认为非编码RNA 是转录的副产物,不具有生物学功能,但随着科技的进步和研究的深入,非编码RNA 的角色发生了很大的变化,其在动、植物的多个生物进程中都发挥着重要的调节作用[1-3]。长链非编码RNA lncRNA(long noncoding RNA)是一类长度大于200 nt 的非编码RNA[4]。迄今为止,lncRNA 在动物中的研究报道较多,其在细胞的增殖、分化、个体发育及肿瘤发生等多个生物学过程中发挥作用[5-10]。相比之下,lncRNA 在植物中的研究还非常有限。本文围绕近年来国内外对lncRNA 的研究成果,就其在植物中的产生、特点、功能及其发挥作用的分子机制进行了系统地总结,以期为未来lncRNA 在植物中的研究提供参考。
1 LncRNA 的概述
人类基因组中约有93%的DNA 可以被转录为RNA,而这些RNA 中用在编码蛋白质方面的比例只有2%左右,剩下的RNA 根本不具备编码蛋白潜能或编码能力较低[11],这些RNA 被称为非编码RNA。根据非编码RNA 的长度可以将其分为3 大类:长度小于50 nt 的microRNA、siRNA、piRNA等;长度在50 nt~200 nt 的rRNA、tRNA、snRNA、snoRNA 等;长度大于200 nt 的长链非编码RNA(lncRNA)。人类DNA 元件百科全书发现,lncRNA 占总RNA 的4%~9%[1],这一发现证明了lncRNA的重要性,且越来越多的研究表明其在多个生物进程中发挥重要的调节作用。长链非编码RNA 广泛存在于真核生物中,多数lncRNA 的结构与mRNA 类似,具有帽子结构和polyA 尾巴,其转录是由RNA 聚合酶II 完成的;还有一部分lncRNA 的转录可以由RNA 聚合酶III/IV/V 的作用完成,其主要作为小干扰RNA(siRNA)的前体RNA 或参与介导基因转录沉默等[12,13]。有研究表明,人类的lncRNA 有两种:含poly(A)+及不含poly(A)-[14]。基于此,有研究对拟南芥的幼苗进行不同的胁迫处理,且对所获得的材料进行RNA-seq 测序,检测上述两类lncRNAs。经分析发现,与poly(A)+的lncRNAs 相比,poly(A)-的lncRNAs 的长度更短、表达量更低、对胁迫响应的特异性更强[15]。
1.1 植物中lncRNA 的分类
根据lncRNA 的基因组起源在染色体上与编码基因的相对位置来分,通常有以下几种:起源于两个基因之间的区域的lncRNA,即基因间长链非编码RNA(Intergenic non coding RNA,lincRNA);起源于启动子区域启动子的lncRNA,即启动子相关长链非编码RNA(Promoter-associated lncRNA);起源于非翻译区的lncRNA,即非编码区相关的lncRNA(UTR associated lncRNA);起源于内含子区域的lncRNA,即内含子长链非编码RNA(Intronic lncRNA);除此之外,还有起源于反义长链的非编码RNA(Antisense lncRNA),与之相对,还存在正义长链非编码RNA,即从具有相同启动子的蛋白编码基因重叠区域转录来的lncRNA[16,17]。
1.2 LncRNA 的特点
LncRNA 虽然不具有编码蛋白质的能力,但本质上仍是由核苷酸组成的RNA 长链。(1)lncRNA最显著的特点即“长”和无编码蛋白质的能力,且与编码RNA 类似,多数具有poly A 尾巴和启动子结构;(2)lncRNA 有组织与空间特异性,不同组织或处于相同组织不同生长阶段的lncRNA 的表达均不相同;(3)调控多样性,lncRNA 可以从转录前、转录中和转录后等多个方面对基因的表达调控造成影响;(4)序列保守性低,lncRNA 的物种间差异较大,不同物种之间很少找到相似的lncRNA;(5)lncRNA 的所在位置比较集中,主要分布于细胞核中,表达水平与mRNA 比相对较低。lncRNA的这些特点决定了它在植物中发挥的作用与机制。
2 LncRNA 调控植物的生长和生殖发育
随着二代测序的快速发展,越来越多的lncRNA 被鉴定出来,但由于lncRNA 调控机制的复杂多样性,使得植物中lncRNA 功能的研究进展十分有限。已有的研究发现些lncRNA 对植物的生长和生殖发育都具有非常重要的调节作用。
2.1 LncRNA 在植物中的功能
光是植物正常生长发育所需的一个重要的环境因子。植物的光形态建成是一个受转录和转录后水平调控的复杂过程。Wang Y,et al.[18]发现了第一个在持续红光条件下(cR)能促进光形态建成的lncRNAHID1(HIDDEN TREASURE 1)。在cR 条件下,lncRNAHID1表达敲除的突变体hid1中,光形态建成的关键抑制基因PIF3的转录水平显著提高,使得突变体的下胚轴明显比野生型显著增长[19]。对HID1的二级结构进行预测发现其有两个茎环结构,且这两个茎环结构对cR 条件下幼苗的下胚轴生长都具有调节作用。此外,HID1可以与核蛋白形成大的复合物,该复合物可直接结合至PIF3的第一个内含子区并抑制PIF3的转录,进而调控幼苗的光形态建成。
氮素是植物生长发育所需的重要营养元素之一,提高作物的氮素利用率对农业的可持续发展具有非常重要的意义。Liu F,et al.[20]结合RNA-seq 测序和qPCR 技术鉴定出6 个受强烈诱导的lncRNAs,并对诱导量最高的lncRNAT5120的功能进行了深入的探索。研究发现T5120过表达系中响应基因的诱导量明显升高,表明T5120调控植物对的响应。进一步的研究结果显示,转录因子NLP7 可以结合T5120的启动子并调控其表达,T5120作用于NLP7 的下游调控信号。同时,T5120过表达系的硝态氮还原酶活性和氨基酸含量明显升高,表明T5120能增强植物的同化能力。此外,过表达T5120可以提高植物的生物量,促进根系发育,从而改善植物的生长。
AtR8lncRNA 是由RNA 聚合酶Ⅲ转录而来的,其长度约为260 nt,主要在植物的根中及培养细胞的细胞质中大量积累[21]。根中AtR8的表达量受低氧胁迫以及水杨酸处理的影响[22]。研究发现,在低浓度(20 μM)水杨酸处理下,atr8突变体的主根长度明显比野生型短,说明在水杨酸胁迫条件下AtR8可以调控主根的生长[22]。与AtR8同源性最高的lncRNA 是甘蓝中的BoNR8,两者的同源性达到了78%[23]。BoNR8同样是由RNA 聚合酶Ⅲ转录产生的,其长度为272 nt,主要表达在发芽种子根伸长区的表皮组织中,且其转录水平受非生物胁迫的调控[23]。过表达BoNR8的株系表现出发芽率降低,主根变短,果荚发育不完整的表型。此外,BoNR8还可以调控甘蓝对盐胁迫及ABA 胁迫的敏感性[23]。这些成果说明了lncRNA 具有调控植物生长发育的功能。
2.2 LncRNA 调控植物的生殖发育
花粉发育是维持植物育性与产量的关键因素。1973 年,研究者鉴定出水稻光敏性雄性不育系“农垦58S”[24],随后的研究发现调控该株系育性的关键基因为一条水稻特异的lncRNALDMAR(long-day-specific male-fertility-associated RNA)[25]。LDMAR是一条长度为1236 nt 的lncRNA,在长日照条件下,水稻花粉正常发育需要LDMAR的充分表达。通过与可育的野生型“农垦58N”进行比较,发现“农垦58S”不育系中的LDMAR产生了一个从有C 到G 的单碱基突变,进而使得不育系中LDMAR的表达量显著下降,最终“农垦58S”光敏雄性不育。LDMAR的单碱基突变可能改变了lncRNA的二级结构,从而影响了LDMAR的积累。此外,有研究发现“农垦58S”不育系中的siRNAPsi-LDMAR的表达丰度明显提高,该siRNA 是由转录本AK111270产生的[26]。siRNAPsi-LDMAR是通过介导LDMAR启动子区的甲基化抑制LDMAR的转录水平,最终引起“农垦58S”不育系的花药绒毡层的细胞程序性死亡,造成其光敏雄性不育。
有研究在玉米成熟花粉的CDNA 文库中利用差异筛选并结合冷菌斑筛选的方法克隆出一个在花粉里特异表达的lncRNAZm401(Zea mays 401)[27,28]。为研究Zm401在花粉发育中的作用,Zhao等[29]构建了玉米Zm401的过表达系,研究发现过表达系在生殖发育阶段表现出玉米穗变小、花药退化、花粉粒的数目和活性显著降低等表型。之后的研究发现,在zm401缺失突变体中与花粉发育相关基因ZmMADS2、MZm3-3 和ZmC5的表达都发生明显的改变,导致小孢子和绒毡层的发育异常,最终造成zm401突变体雄性不育[30]。将玉米中花粉特异的启动子ZM13与Zm401的cDNA 连接构建成表达载体,并将其转入烟草中异源表达,发现Zm401只在转基因烟草的花粉中特异表达[31]。研究发现所有的Zm401转基因烟草都表现出不同程度的不育现象,对花药发育的深入分析发现,转基因烟草的花药发育后期出现异常,具体表现为绒毡层和结缔组织降解滞后、内胚层细胞纤维带沉积失败、花粉粒发育中止等[31]。此外,Zm401在单子叶植物中具有高度的序列保守性以及稳定的RNA二级结构表明Zm401可能在植物的花粉发育中发挥重要的作用,可用于玉米雄性不育植株的培育。
Song JH,et al.[32]也在油菜中成功克隆出一个花粉特异表达的lncRNABcMF11,其长度为828bp且带有poly(A)的尾。为研究BcMF11在花粉发育中的功能,Song JH,et al.[33]构建了BcMF11的反义RNA 株系,该株系中BcMF11的表达明显下降。BcMF11表达的降低使得花粉萌发率下降、花粉管伸长延缓。进一步的细胞学观察发现BcMF11的反义RNA 株系出现绒毡层降解滞后、小孢子分离及花粉粒发育异常等现象。这些结果说明BcMF11在油菜的花粉发育和雄性不育中发挥重要的作用。
3 LncRNA 发挥功能的分子机制
LncRNA 作为一类新的调节子参与植物的多个生物进程中,其调控机制十分复杂,可在转录、转录后、表观遗传等水平上调控蛋白编码基因的表达进而影响植物的生长发育。
3.1 LncRNA 作为小RNA 的前体
作为一类新的调节子,lncRNA 可以被直接或间接的加工成更短的非编码RNA 即小RNA 发挥作用。TAS(trans-acting-siRNA-producing locus)是反式作用小干扰RNA(tasiRNA)产生的前体,目前植物体内已鉴定出四个TAS成员,分别为TAS1、TAS2、TAS3和TAS4。tasiRNA 是植物体内一类特异的内源小RNA,研究表明其在植物的多个生物进程中都发挥重要的作用。TAS可在miRNA的作用下被剪切,剪切产物在RDR6(RNA-DEPENDENT RNA POLYMERASE6)和DCL4(DICERLIKE4)的作用下形成双链的RNA 分子即tasiRNA[34-37]。AT3G17185(TAS3a)是TAS家族中的一个成员,其可在miR390 的作用下被剪切,然后经过一系列的加工,最终形成tasiRNAs。miR390的表达可被生长素IAA 诱导,进而促进了tasiRNAs 的产生,这些tasiRNAs 可以抑制生长素相关基因ARF2、ARF3及ARF4的表达,最终促进侧根的生长,表明TAS3a可通过形成tasiRNAs 参与生长素诱导侧根形成的过程[35]。
Ben AB,et al.[38]通过分析拟南芥全长cDNA 文库,发现76 条新的npcRNA,通过与现有的小RNA数据库进行序列比对,推测其中可能有9 条为miRNA、tasiRNA 或24nt siRNA 的前体。其中npc83是miR869a 的前体,并能在dcl4突变体中积累。此外,Boerner S,et al.[39]从玉米的一组全长cDNA文库中鉴定得到的1802 条lncRNA,发现其中可能有60%的lncRNA 是miRNA 的前体序列。
3.2 LncRNA 作为miRNA 的模拟靶基因
小RNA miRNA 可以利用序列互补性结合至特异的mRNA 上,造成位点特异地剪切或抑制mRNA 的翻译。伪靶基因”是指一类可与miRNA 相结合,进而抑制miRNA 的活性但又不被miRNA降解的内源非编码RNA。研究发现,一些lncRNA 可以作为miRNA 的伪靶基因发挥功能。IPS1是拟南芥中一个表达受磷饥饿诱导的lncRNA,其部分序列可通过碱基互补配对至同样受磷饥饿诱导的miR399 上,但由于包含一个不匹配环使得IPS1不能被miR399 切割。过表达IPS1可以妨碍miR399与其靶基因PHO2的结合,致使PHO2的积累量增加,导致地上部磷含量降低[40]。根据lncRNA 的这一功能特性,我们可以人工合成miRNA 的模拟靶标(target mimicry)用来控制该miRNA 的功能,达到预期目标。
3.3 LncRNA 参与蛋白的重定位
GmENOD40最初是在豆科植物中发现的一种根瘤素基因,其序列在多个物种间的保守性很高[41-43]。通过酵母三杂交筛选出与蒺藜苜蓿中的MtENOD40互作的一个新的RNA 结合蛋白MtRBP1(Medicago truncatulaRNA Binding Protein 1)。研究发现MtRBP1 定位在植物细胞的细胞核的核小点斑中,但当MtENOD40过表达后,MtRBP1 会重新定位于细胞质中。随后的研究又发现了两个小根瘤素酸性RNA 结合蛋白MtSNARP1(Medicago truncatulasmall nodulin acidic RNA-binding protein 1)和MtSNARP2 也可以与MtENOD40结合,且这两个蛋白的定位都受到MtENOD40的调控[44]。这些研究说明MtENOD40可以通过与蛋白结合进而影响蛋白的定位,这是lncRNA 发挥功能的一种重要的作用机制。
3.4 LncRNA 参与mRNA 的可变剪切
可变剪切是调控基因表达的一种重要的方式。Bardou F,et al.[45]在拟南芥中鉴定出MtRBP1 的同源蛋白NSRa 和NSRb,这两个蛋白也是定位于细胞核的核小点中。由于NSRa 和NSRb 与一些可变剪切体是共定位的,因此研究者重点研究了这两个蛋白在可变剪切中的作用。考虑到NSRa 和NSRb可以与lncRNA 结合,利用RNA 免疫沉淀(RIP)技术筛选并鉴定出1 个可以与这两个蛋白结合的lncRNA SCO-lncRNA(Alternative Splicing Competitor lncRNA)。深入地研究发现ASCO-lncRNA 可以与mRNA 竞争性地结合NSR 蛋白,从而影响mRNA 的可变剪切。
3.5 LncRNA 参与染色质重塑
染色质重塑对动、植物发育过程中特异基因的表达具有重要的作用。LncRNA 可以通过介导染色质重塑调控相关基因的表达进而调节植物的生长发育。开花抑制基因FLC(FLOWERING LOCUS C)可以通过染色质修饰调节植物开花时间。春化作用是控制植物花期的重要机制,研究发现,冷处理可以诱导VIN3(Vernalization insensitive 3)的表达,VIN3 招募染色质重构复合物PRC2 至FLC基因上,增强了H3K27me3,进而抑制FLC的表达[46]。Swiezewski S,et al.[47]鉴定出两个非编码RNA,分别为正义lncRNACOLDAIR(Cold assisted intronic noncoding RNA)和反义lncRNACOOLAIR(Cold induced antisense intragenic RNA)。其中COOLAIR产生于FLC基因的3’端,含有5’帽子及3’poly(A)。冷处理诱导COOLAIR表达,导致FLC的转录被瞬时抑制,进一步冷处理诱导了VIN3的表达,VIN3通过招募PRC2 到FLC基因上增强H3K27me3 组蛋白修饰,沉默FLC 基因的表达,进而促进植物开花。有研究表明COOLAIR不是抑制FLC基因表达的必须ncRNA[49]。COLDAIR是自FLC的第一个内含子区转录而来,含有含有5’帽子但没有3’poly(A)结构。COLDAIR的表达受冷处理的诱导,在处理20 d 后其诱导量达到峰值,处理30 d 后其表达恢复至处理前的水平。研究发现,COLDAIR缺失突变体在冷处理后表现出开花延迟的现象,说明COLDAIR可以调控植物的开花。进一步的研究发现COLDAIR可以与PRC2 复合体的重要组成成分CLF 相互作用[50]。因此,冷处理下,COLDAIR可能通过募集PRC2 到FLC染色质引起FLC的表观沉默,抑制其表达,最终促进开花[48]。COLDAIR是植物中首次发现的参与基因染色质表观遗传学修饰的lncRNA[46]。此外,lncRNAAPOLO(AUXIN REGULATED PROMOTER LOOP)是由RNA 聚合酶II 和V 从距离PID(PINOID)基因上游约5 kb处转录而来。APOLO可以通过调控PID基因启动子区的染色质环调节PID的表达,进而影响植物对生长素的响应[49]。
4 结语与展望
已有研究表明lncRNA 是一类重要的维持动、植物正常生长发育的调节子,这使得lncRNA 成为当前生物科学家研究的热点。近年来,随着高通量测序技术的进步和生物信息学手段的应用,越来越多的lncRNA 被鉴定出来,但由于lncRNA 调控机制的复杂多样性,使得植物中lncRNA 功能及作用机理的研究还处于起步阶段。lncRNA 研究中面临许多亟待解决的问题,如一些lncRNA 中包含有非常短的开放阅读框,对其功能是lncRNA 还是小肽在发挥作用还存在争议;lncRNA 的构成单元是核苷酸,某些碱基的改变不影响其功能,使得其突变体构建成为实验技术上的难点;lncRNA 可用数据库少,信息不全面,加上多数lncRNA 在物种间的保守性低,增加了对新的lncRNA 研究工作的难度。因此需要建立更多更有效的方法、技术应用于lncRNA 的研究。相对于在人和动物中的研究,植物中lncRNA 的相关研究十分匮乏,我们可以借鉴动物中丰富的lncRNA 的信息及其成熟的研究手段和技术用于植物中lncRNA 的研究。综上,随着科技的快速发展,在不同的植物物种中筛选lncRNA已经不再困难。目前研究者的重点已转移到解析lncRNA 的功能及其作用机制上来,相信未来会有越来越多的lncRNA 被深入研究,对拓宽lncRNA 的应用范围具有重要的意义。