蔬菜作物中长链非编码RNA的研究进展
2021-06-01沈锦纯张琳淳李越赵竑博
沈锦纯 张琳淳 李越 赵竑博
(华南农业大学园艺学院,广东 广州 510642)
高通量基因测序和转录组研究表明,真核生物基因组中只有极少数的转录本可以用于蛋白质的编码,仅占全基因组的1%~2%,而剩下的大部分转录本是非编码RNA(non-codingRNA,ncRNA)[1]。ncRNA曾被认为是不具有特定生物学功能的“转录噪声”[2],但随着转越来越多的ncRNA被发现和鉴定,许多ncRNA已被证明在生物体的生长发育中具有关键功能[3-6]。根据转录本的长度,ncRNA分为小于200 bp的短链非编码RNA(small non-coding RNA)和大于200 bp的长链非编码RNA(long non-coding RNA,lncRNA)[7,8]。与得到广泛研究的短链非编码RNA相比,长非编码RNA(lncRNA)的研究才刚刚处于起步阶段,属于研究尚不足够的一类非编码转录本[9]。
本文主要介绍了lncRNA的类型和生物学特性,总结了lncRNA在蔬菜作物生命历程中发挥的各种生物学功能以及其功能发挥所涉及的调控基因表达的分子机制,以期为在蔬菜作物上进一步研究lncRNA提供重要参考依据。
1 概述
紫花苜蓿早期根瘤蛋白基因enod40编码的正义lncRNA是第1个被鉴定并分离出来的植物lncRNA,定位于根瘤原基细胞的细胞质中,在植物发育中起到“核调节因子”的作用[10]。enod40的发现促使了人们对核RNA结合蛋白MtRBP1的亚细胞定位的新认识[10,11]。此后,对植物lncRNA的研究更加深入,其各种生物学功能也逐渐被验证。如,调节miRNA活性[12]、调控表观遗传[13]、参与重塑染色质结构[14]等。
1.1 lncRNA的分类
依赖于其描述性和独特性,lncRNA的分类方式多达数10种[8]。其中,最常用的是根据lncRNA转录位置的不同,将其划分为5类,如图1,分别为启动子型lncRNA(enhancer lncRNA,eRNA):从增强子区域转录而来的;内含子型lncRNA(intronic lncRNA):从内含子区域转录而来;正义lncRNA(sence lncRNA):从基因重叠区域转录而来的;天然反义lncRNA(antisense lncRNA,NAT):从编码基因互补区域转录而来;基因间lincRNA(long intergenic noncoding RNAs,lincRNA):从2个基因之间的区域转录而来。其中,lincRNA数量最多,占总数70%~90%[3,15-17]。
1.2 lncRNA的生物学特性
1.2.1 转录本的丰度和大小
lncRNA的转录本长度超过200个核苷酸,不具备或具备极低编码蛋白质能力,广泛存在于白菜、黄瓜、番茄和辣椒等蔬菜作物中[18]。根据方法不同,同一物种中lncRNA的数量也有差异,如利用链特异性RNA测序等鉴定的技术,在辣椒中分别鉴定出10655、11999个lncRNA[3,19]。lncRNA通常比蛋白质编码的mRNA转录本短、表达量低且包含的外显子较少[5]。另外,部分lncRNA含有开放阅读框架(ORF),且具有产生小肽的潜力[20]。
1.2.2 结构
大多数lncRNA由RNA聚合酶II合成,其结构与mRNA相似,具有5’末端帽子结构和3’末端poly(A)尾巴[21-23]。少数的lncRNA由聚合酶III、IV和V合成,并充当小干扰RNA(siRNA)的前体或在RNA定向的DNA甲基化中用作支架[24]。lncRNA可以折叠成二级或更高级的结构,使其在靶向蛋白质或基因位点时更加灵活[25,26]。
1.2.3 亚细胞定位
在基因表达过程中,mRNA通常被输出到细胞质中进行翻译。相比之下,加工后的lncRNA的位置没有太多限制,可以驻留在细胞核中,也可以输出到细胞质或其它亚细胞位置和细胞器,如线粒体[27]。lncRNA通常更容易在细胞核中富集,这得益于lncRNA中的序列元件以及RNA结合蛋白[27,28]。植物中许多已知的lncRNA定位于细胞核,并在细胞核内起作用。如,与番茄成熟相关的lncRNA1459定位于细胞核,通过促进乙烯和类胡萝卜素生物合成来调控果实发育[26]。
1.2.4 表达特异性和保守性
lncRNA表达具有高特异性和低保守性的特性,其中特异性包括种系特异性和组织特异性。在拟南芥中,约有32%的lncRNA表现出器官特异性表达[29];在卷心菜中,lncRNA BoNR8在萌发种子根伸长区的表皮组织中特异表达[30]。木薯在干旱胁迫下,lncRNA的表达具有组织特异性[31]。大多数lncRNA的序列保守性较弱,其表达随组织的不同,发育阶段甚至种与种而变化[32]。研究表明,白菜中只有一小部分lncRNA与其它芸苔属植物中lncRNA具有较高的同源性[33]。
1.3 蔬菜作物lncRNA研究概况
最早关于lncRNA的研究主要在动物和人类医药领域开展,在植物中的研究也仅限于在模式作物拟南芥中进行。但随着转录组测序和生物信息学等检测分析技术的发展,近几年研究人员在番茄、辣椒和甘蓝型油菜等蔬菜作物中也开展了相关的研究,并建立了相应的lncRNA数据库[26,34,35]。lncRNA作为重要的新型调控因子,在蔬菜作物中的功能研究成为了人们关注的焦点。现有研究表明,lncRNA在蔬菜作物生殖发育、果实成熟、生物胁迫和非生物胁迫等方面发挥关键的调节作用[3,19,36]。本文系统地整理了lncRNA在蔬菜作物中的生物学功能和功能发挥的具体分子机理。
2 lncRNA在蔬菜作物中的生物学功能
2.1 调控生殖发育
生殖发育是植物繁衍过程中至关重要的一环[37-40]。目前,许多lncRNA被证实在花粉发育、雄性育性、受精以及种子萌发等生殖发育过程中起调控作用,如BcMF11、bra-eTM160-1、bra-eTM160-2、LINCAP2[37-40]。在油菜(Brassica Campestris SSP)中,BcMF11在花粉中特异表达,参与花粉发育和雄性育性[39]。lncRNA(bra-eTM160-1和bra-eTM160-2)通过抑制miRNA表达,上调生长素反应因子(ARF),参与花粉形成和雄性育性。LINCAP2是一个与花发育调控因子基因APETALA2(AP2)相近的基因间连接lncRNA,当被芜菁皱缩病毒感染时,AP2表达下调,而LINC-AP2的表达上调,并且LINC-AP2的强烈上调与花结构异常相关。BrMYB80bSSLncRNA过表达导致白菜转基因植株的部分花粉出现4个萌发沟[40]。此外,许多研究表明lncRNA在花发育、雄性不育等过程中具有潜在作用[40-42]。如,辣椒不育系中lncRNA1336、lncRNA7479和lncRNA8303的下调可能导致花粉和绒毡层发育缺陷,最终导致辣椒败育[19]。Khemka等以鹰嘴豆为研究对象,发现lncRNA作为miRNA的靶标,与各种发育和生殖过程的调控网络有关[43]。BoNR8是由甘蓝RNA聚合酶III编码产生的lncRNA,在拟南芥中过表达BoNR8的品系种子发芽率降低,根和角果生长降低[30]。
2.2 参与果实成熟过程
近年来,关于lncRNA调控蔬菜作物果实成熟的研究也取得了一定进展。lncRNA主要通过调控激素信号传导、物质合成(类胡萝卜素和乙烯)、糖类及主要有机酸代谢等过程,从而控制蔬菜作物果实发育[3]。在番茄中,lncRNA1459与果实成熟相关,影响番茄果实中类胡萝卜素和乙烯的产生以及番茄红素积累。利用CRISPR/Cas9系统敲除lncRNA1459会使番茄的成熟期严重滞后[26]。Zhu等研究发现,沉默番茄基因间lncRNA(lncRNA1459和lncRNA1840)明显延缓了野生型果实的成熟[44]。DcMYB7是胡萝卜中关键花青素生物合成转录因子,Chialva等通过研究发现,lncRNA可能通过与DcMYB7相互作用激活花青素生物合成[45]。Zuo等人通过对差异表达lncRNA的靶标进行了分析,发现一些靶标与果实的颜色、质地、风味和香气形成以及ET和其它激素途径有关,这表明lncRNA在辣椒成熟过程中具有特异的调控功能[3]。另外,lncRNA还可以通过反式调控编码miRNA降解核酸酶的基因Capana04g001478,切割和降解miRNA,从而调控辣椒的成熟[6]。
2.3 参与生物胁迫响应
蔬菜作物在生长发育过程中经常遭受各种生物胁迫,如真菌、细菌、病毒和线虫的侵染[46]。其中,真菌病害对蔬菜作物危害尤为严重,如马铃薯晚疫病菌引起的晚疫病是制约当前番茄生产重要因素之一[47]。在番茄中,lncRNA与对致病疫霉的抗性有关。如lncRNA16397、lncRNA33732和lncRNA23468的过表达增强了番茄对侵染疫霉的抗性,l而沉默lncRNA42705、ncRNA08711和lncRNA23468则降低了抗性[48]。进一步研究表明,lncRNA通过诱导相关基因的表达,减少活性氧积累,减少细胞膜损伤,从而增强对致病疫霉的抗性[49]。如lncRNA16397、lncRNA23468和lncRNA39026分别调控SlGRX、NBS-LRR和PR基因的表达,诱导番茄对致病疫霉产生抗性[47-49]。此外,lncRNA可能通过调节ceRNA以诱骗miRNA,并作为其靶基因,增强对致病疫霉的抗性[50]。在甜瓜中,lncRNA可能通过调控转录因子CmWRKY21和氧化还原途径相关基因的表达,从而提高甜瓜对白粉病的抗性[16]。有益的根际细菌可以通过诱导系统抗性来抵抗叶片病原菌的入侵,研究表明lncRNA(MSTRG18363)参与了该过程。在番茄植株中,枯草芽孢杆菌SL18R诱导MSTRG18363的表达有利于调节miR1918和SlATL20的表达,从而激发番茄叶片对灰霉病菌侵染的系统抗性。
在抗细菌方面,lncRNA与马铃薯响应胡萝卜软腐果胶杆菌危害的防御基因表达高度相关[51]。在抗病毒方面,lncRNA具有增强番茄黄化曲叶病毒(TYlCV)抗性的功能,对部分接种前后差异表达的lncRNA进行瞬时沉默分析后,番茄接种TYlCV后病毒量显著上升[15,52,53]。根结线虫严重影响植物的生长和生产力,几种商品化生防菌剂可以提高植物对根结线虫的抗性,如恶臭假单胞菌[54]。Yan等发现lncRNA参与了恶臭假单胞菌Sneb821诱导的番茄对南方根结线虫的抗性[36]。在小白菜中,lncRNA通过与mRNA形成共表达的调控网络参与油菜疟原虫侵染反应[55]。
2.4 参与非生物胁迫响应
研究表明,蔬菜作物lncRNA参与调控非生物胁迫响应过程[35,50,56]。其中,蔬菜作物lncRNA在调控干旱、冷害以及高温胁迫方面的研究较多,而在其它非生物胁迫方面的研究则较为不足,如重金属毒害、营养缺乏和盐分胁迫[57]。
2.4.1 参与干旱应答过程
植物可以通过调控各种生理、生化和复杂的分子网络,包括各种信号转导通路的级联,来缓解干旱逆境造成的不利影响[35,58]。近年研究表明,lncRNA在蔬菜作物中参与干旱应答过程,其作用机制是lncRNA与基因、miRNA、mRNA以及转录因子形成共表达网络[59,60]。在不同的蔬菜作物中已经报道了干旱响应型lncRNA,如番茄[50,56]、黄瓜[35]、木薯[31,61]、芥子油菜[62]。Eom等研究表明,番茄lncRNA通过lncRNA-mRNA共表达在干旱应答过程中发挥关键作用[56]。Li等人在木薯中鉴定出153个NAT lncRNA参与干旱胁迫的反应[61]。其作用机制是在干旱条件下lincRNA340的表达增加,从而降低了靶标miR169的活性,最终提高了核因子Y(NF-Y)基因的表达[61]。Ding等人表明,lncRNA Tons_00060863和Tons_00097416分别参与干旱胁迫下的脱落酸和乙烯信号转导途径[31]。StFLORE是马铃薯StCDF1转录因子的天然反义lncRNA,研究发现,转录因子StCDF1通过与StFLORE启动子中的DOF基序结合来负调控后者的表达,从而调控气孔生长和昼夜开放来调节水分损失[63]。StFLORE转录本中的自然突变和CRISPR-Cas9突变都使植物对水分限制条件的敏感度增加[63]。相反,StFLORE的过表达或者StCDF1的下调导致的StFLORE的高表达都可以通过减少水分损失来提高抗旱性[63]。
2.4.2 提高蔬菜作物的耐热性
高温胁迫是主要的非生物胁迫,会严重影响植物的生长、生理、代谢活性发育和产量表现[64]。在不结球白菜中,位于蛋白质编码基因Bra021232下游的lncRNA TCONS_00004594通过顺式调节其表达水平,参与耐热性调控[65]。此外,lncRNA TCONS_00048391和TCONS_00010856充当油菜miR164a的内源性模拟靶标,参与调节热应激反应[65]。因此,在热胁迫下,油菜miR164a的上调和lncRNA TCONS_00048391的下调以及靶标Bra030820(NAC1)基因在“XK”品种中表现出耐热性。lincRNA159与保守的miR164的结合降低了靶向miR164的3个NAC基因的表达[61]。He等人对黄瓜中对热应激反应的lncRNA,circRNA和miRNA进行系统的鉴定,发现lncRNA与mRNA竞争miRNA结合位点,推测lncRNA可能通过植物激素信号转导途径与miR9748相互作用,以响应高温胁迫[66]。
2.4.3 参与冷害应答过程
最新报道证明,lncRNA在甘蓝型油菜、辣椒、木薯、番茄等蔬菜作物中参与冷胁迫调控[34,61,67]。Shea等在甘蓝型油菜中鉴定出2088个lncRNA,其中位于BrFLC基因位点的3个lncRNA有助于冷胁迫调控[68]。在甜椒中,为揭示全基因组响应冷害的lncRNA,共捕获了380个lncRNA和3个完整的ceRNA(内源竞争RNA)网络,表明lncRNA在甜椒冷害过程中具有特定的调控作用[34]。在木薯中,作为miR164模拟靶标的lincRNA159降低了冷胁迫下NAC基因的表达[61]。在番茄中,lncRNA和大量的编码冷胁迫相关蛋白的基因表达,如冷热休克蛋白,这表明lncRNA可能参与了冷害过程[67]。
3 lncRNA调控蔬菜作物基因表达的分子机理
3.1 lncRNA充当miRNA的前体
miRNA是lncRNA功能实现的重要环节,二者之间的相互作用在植物的发育调节中发挥着关键作用[9,69]。目前,lncRNA与miRNA主要有2种互作方式,单个lncRNA与多个miRNA相互作用;单个miRNA与多个lncRNA相互作用[70]。Wang等人在LeERFl转基因番茄中鉴定出LeERF1是miRNA1919b和miRNA1919c的前体,lncRNAZ081是miRNA6027的前体[71]。Li等在木薯中鉴定出12个lncRNA作为11种已知的miRNA前体,在这些lncRNA中,有7个lncRNA在寒冷、干旱胁迫的响应中差异表达,表明这些miRNA可能参与了胁迫响应[71]。Baruah等在辣椒中鉴定了30个lncRNA作为miRNA的前体,其中包括miR167b、miR167c、miR167e、miR5300、miR5303d等[70]。
3.2 lncRNA充当miRNA的模拟靶标
模拟靶标是指一类可与miRNA相结合,进而抑制miRNA的活性但又不被miRNA降解的内源非编码RNA[62]。先前研究表明,lncRNA可以被miRNA靶向,也可以作为内源性模拟靶标而发挥作用[72,73]。其主要机制是lncRNA按照碱基互补原则与miRNA发生特异性结合,阻止miRNA对靶基因的降解,进一步调控基因的表达[9]。在番茄中,Wang等发现lncRNA Slylnc0195和Slylnc1077分别作为miR166和miR399的模拟靶标参与TYLCV感染的应答[53]。而在甘蓝型油菜中,lncRNA TCONS_00048391和TCONS_00010856充当miR164a的内源性模拟靶标,参与调节热应激反应[65]。在马铃薯中,lncRNA作为miRNA的模拟靶标参与发芽调控[74]。Khemka等以鹰嘴豆为研究对象,发现lncRNA作为miRNA的靶标,与各种发育和生殖过程的调控网络有关。Ding等人表明,lncRNA Tcon_00068353是调控多种非生物胁迫响应基因miR156k和miR172c的模拟靶标[31]。
3.3 形成lncRNA-miRNA-mRNA共表达网络
lncRNA与mRNA有多种互作方式。lncRNA可以与mRNA直接或竞争性结合,形成lncRNA-mRNA共表达网络,从而调节mRNA表达[5,75]。干旱响应型lncRNA通过lncRNA-mRNA共表达在番茄发育过程中发挥关键作用[5,56]。lncRNA、miRNA和mRNA三者可以形成共表达网络调控各种生物学过程,如辣椒果实发育[6]。其主要机制是lncRNA充当miRNA的前体或模拟靶标调节miRNA活性;后者通过靶向mRNA的切割或引导翻译抑制来负向调节mRNA的表达,最终形成lncRNA-miRNA-mRNA共表达网络[76]。
3.4 lncRNA调节蛋白质编码基因的表达
lncRNA可以通过激活或抑制其上下游蛋白编码基因的活性,使基因表达上调或下调,进而调控相关的发育和其它生物学过程[63]。如,lncRNA TCONS_00004594位于不结球白菜中蛋白质编码基因Bra021232的下游,通过增加Bra021232的表达,从而参与耐热性调控[65]。番茄感染致病疫霉过程中,lncRNA16397作为SIGRX22的反义转录本影响其表达[77];lncRNA39026诱导PR基因表达提高番茄对致病疫霉的抗性[48]。lncRNA还可以通过反式调控基因Capana04g001478(小RNA降解核酸酶),切割和降解miRNA,从而调控辣椒的成熟[6]。以往研究表明,从启动子区域转录的lncRNA对其下游蛋白质编码基因的转录的影响最大,其主要机制是通过在下游基因的启动子中形成三重螺旋来调节基因表达[78]。
3.5 lncRNA与转录因子的相互作用
lncRNA与转录因子间具有多种相互作用方式。转录因子可以被lncRNA靶向激活或被招募至靶基因启动子区域,进而抑制或增强下游基因的表达;转录因子通过调控lncRNA的表达,进而对目的基因起调控作用,从而影响其活性[63,79]。转录因子RIN通过识别lncRNA启动子区域的MADS-box元件,激活LncRNA2155、LncRNA1780、LncRNA3197等lncRNA的表达,进一步调控成熟相关基因来参与番茄果实的成熟[80]。Cui等研究发现,转录因子WRKY1可以识别lncRNA33732启动子区域的W-box元件,激活lncRNA33732的表达并诱导H2O2的积累和RBOH基因表达,从而参与番茄对致病疫霉的抗性机制[81]。StFLORE是马铃薯StCDF1转录因子的天然反义lncRNA,转录因子StCDF1通过与StFLORE启动子中的DOF基序结合来负调控后者的表达[63]。DcMYB7是胡萝卜中关键花青素生物合成转录因子,lncRNA可能通过与DcMYB7相互作用激活花青素生物合成[45]。
4 结论与展望
在蔬菜作物中,lncRNA在各种生理和代谢过程中可能起到关键的调节作用。虽然在少量蔬菜作物中已经发现lncRNA可以通过与其上下游基因、mRNA、miRNA或转录因子发生顺式或反式结合,进而调控靶基因的表达[5,63,75,79],但到目前为止人们对大多数蔬菜作物lncRNA的认识仍不明确。出现这种情况的原因主要有:lncRNA具有高度的种系和组织特异性,lncRNA的作用可能只能在特定条件下才能观察到。大多数lncRNA在物种间的保守性低,增加了对新的蔬菜lncRNA研究工作的难度。lncRNA具有异质性,能够与调控DNA的序列结合,这使得评估其特定功能变得困难。因此,需要建立更多更有效的方法和技术,更深入和快速地探索各种蔬菜中lncRNA的生物学功能,找到不同蔬菜作物lncRNA的异同点和其它规律,以期更充分地探索和理解lncRNA在蔬菜作物生长代谢调控中的巨大作用及其发挥作用的机制。
果实成熟一直是蔬菜作物研究的一大热点。目前仅在番茄和辣椒中鉴定出具有调控果实成熟的lncRNA[3,6,26,44,45],而且并不深入和系统,因此各种蔬菜中具有调控果实成熟功能的lncRNA的研究还需不断完善。研究发现,lncRNA参与蔬菜作物逆境应答过程。在抗生物胁迫方面,lncRNA可以提高蔬菜作物对真菌病害的抗性,目前仅在番茄中研究较深入[47-49];而lncRNA在抗细菌、病毒和线虫侵害方面的作用仍有待研究。在抗非生物胁迫方面,蔬菜作物lncRNA主要参与干旱、高温和冷害应答过程[35,50,56]。目前已在番茄[50,56]、黄瓜[35]、辣椒[34]、白菜[65]、芥子油菜[62]等蔬菜作物中鉴定出非生物胁迫响应型lncRNA,而蔬菜作物lncRNA在重金属毒害、盐分胁迫、营养缺乏等方面的功能仍不清楚,未来研究可以加强这方面的研究。此外,蔬菜作物lncRNA是否具有调控开花时间的功能还没有得到验证。功能表征是一项具有挑战性的任务,大规模筛选突变文库的高级成像技术的发展应该会加速蔬菜作物lncRNA功能研究进展。未来研究可以利用对蔬菜作物lncRNA功能的了解,为蔬菜育种研究开辟新的可能性,从而提高蔬菜作物的品质和性能。
随着转录组测序和计算生物学的快速发展,越来越多的新型高效的方法和工具都可以帮助预测准确的lncRNA和新型lncRNA的功能注释,应用这些新的技术方法可以促进蔬菜lncRNA分子机制的研究。目前,CRISPR/cas9技术已应用于lncRNA调控番茄果实成熟的研究中[26]。此外,适配体标记的RNA序列可能是未来研究lncRNA细胞定位和相互作用的有用工具。lncRNA的结构稳定是和蛋白质结合所必需的,所以RNA结构的计算分析也成为识别蔬菜作物lncRNA潜在功能的重要工具。应用单细胞测序和单分子测序技术也可以为识别蔬菜作物lncRNA创造新机会。