陆地棉开花整合子调控机制解析
2023-08-01陈丽婷阎媛媛
陈丽婷, 阎媛媛
(河北农业大学农学院,华北作物种质资源研究与利用教育部重点实验室,河北省作物种质资源重点实验室,河北 保定 071000)
棉花起源于亚热带地区,是重要的纤维原料作物。野生棉生育期长达180 d,其对热量的需求限制着栽培区域。通过不断的驯化培育,早熟棉生育期缩短至100 d左右,使得棉花栽培区域扩张到46°N,且使粮棉轮作成为可能,极大地提高了土地利用率和经济效益[1]。早熟棉驯化的关键在于其对光周期及温度的适应,使花芽分化和开花提前。喻树迅等[1]研究发现,棉花早熟性是包含多个农艺性状(生育期、现蕾期、开花期、吐絮期、第1果节位、霜前花率等)的综合复杂性状,其中现蕾期、开花期是决定棉花早熟的关键时期。目前,种质资源狭窄是早熟棉育种工作的瓶颈,挖掘调控棉花开花相关的重要基因和解析开花调控机制是发挥分子育种优势、加快早熟棉种质创新的重要基础。
植物开花事件始于花芽分化的起始,标志着植物从营养生长进入生殖生长,是外因和内因共同决定的结果。来自光周期途径、春化途径、环境温度途径、赤霉素途径、自主途径和年龄途径的信号共同促进开花整合子基因LFY(LEAFY)、SOC1(SUPPRESSOR OF OVEREXPRESSION OF CO 1)和FT(FLOWERING LOCUS T)的转录,进而激活花分生组织决定子,启动花芽分化[2]。
FT及其同系物TSF(twin sister of FT)属于磷脂酰乙醇胺结合蛋白(phosphatidyl ethanolaminebinding proteins, PEBP),被视作植物“成花素”[3-4],受光周期和温度的调控。拟南芥FT和TSF、番茄的SFT(single flower truss)和水稻的Hd3a(heading date 3a)[5-7]均在维管束韧皮部伴胞细胞中产生,随后被运输到顶端分生组织(shoot apical meristem,SAM),与bZIP转录因子FD(flowering locus D)形成复合物,激活花分生组织特异性基因的表达,包括AP1(APETALA1)和LFY。拟南芥FT基因研究的比较清楚,过表达FT能促进拟南芥开花,而其突变体明显比野生型植株开花晚[3]。水稻中FT同源蛋白Hd3a与GF14c和OsFD1形成激活复合体,促使水稻开花,显著缩短营养生长期[7]。Mcgarry等[8]发现,在棉花中异位表达FT基因能促使其开花,并影响花序。将GhFT1基因在拟南芥中异源表达,促进早花,并能部分挽救ft-10突变体晚花表型[9];将其在烟草中异位表达,同样促进烟草开花,此外,呈现基部生长更多的侧生芽、叶片的形态发生改变等表型[10]。
SOC1基因编码MADS蛋白,具有典型MIKC类MADS-box转录因子的结构特征,是关键的开花调控和花器官决定因子。其整合了来自多个途径的信号,包括光周期途径、春化途径、赤霉素途径和自主途径[11]。在拟南芥中,SOC1受FLC(FLOWERING LOCUS C)、FT和CO基因调控[11-12]。超表达GhSOC1基因可以促进拟南芥开花,棉株株高变矮,其通过直接调控AP1/FUL-like基因促进开花[13]。
在拟南芥中,LFY作为植物花分生组织的决定子,整合了来自光周期途径和赤霉素途径的信号[14-15],同时也与其他MADS蛋白共同调控花发育程序[16-17]。从金鱼草中克隆得到LFY基因的同系物FLO(FLORICAULA),并发现其影响花分生组织形成。拟南芥LFY基因不仅决定花分生组织,而且也影响植物从营养生长向生殖生长的转变,控制植物开花时间。长日照条件下,LFY在拟南芥幼苗的整个营养生长阶段的叶原基中均有表达[18];经成花诱导后,LFY基因活化,LFYmRNA起初积累于顶端花序分生组织的周边区,继而强表达于花原基,而后在开花期表达量急剧上升,其表达水平决定了植物开花时间的早晚及花发育的成败[19]。拟南芥转LFY基因植株的侧芽全部转变为单一的花,且开花时间大大提前[20]。在烟草[21]、山杨[20]、水稻[22]等物种中,LFY同源基因具有相同的功能。Li等[23]从陆地棉中克隆得到GhLFY基因,ChIP试验结果表明,GhLFY基因受GhSOC1的调控,GhLFY转基因拟南芥形态发生了改变,茎生花替代了侧枝,开花提前。
叶片感受光照和温度信号,通过CO、SVP等蛋白及组蛋白修饰水平,精确调控FT基因的表达。叶片中FT蛋白通过维管束迅速移动到顶端分生组织,激活SOC1基因的表达,在AGL24的协助下,细胞质中积累的SOC1蛋白进入细胞核,结合到LFY基因的启动子区域,激活其转录[24]。SOC1在叶片和顶端分生组织中均大量表达,其在顶端分生组织中如何激活花芽分化已经明确。在叶片中,FT的大量积累会增加SOC1的转录[25],且SOC1受GA、春化路径和内源生长信号的调控,但叶片中SOC1的积累并不影响FT的转录[6]。因此,叶片中SOC1具有整合信号的功能,但其如何影响花芽分化尚不清楚。
尽管有花植物的开花整合子在进化过程中相对保守,但仍存在物种特异性,如菊花叶片中受长日照诱导的CsAFT移动到茎尖后与FT复合体竞争,精确调控花芽分化的起始[26]。此外,对四倍棉基因组研究表明,A、D亚组上同源基因的转录和功能可能存在差异[27],因此明确四倍体棉花中开花整合子的数目及功能,对解析棉花开花调控机制至关重要,是早熟棉遗传改良的理论基础。本文鉴定了棉花基因组中开花整合子,明确了其在二倍体和四倍体棉花基因组中的数目及进化关系,分析了其在棉苗生长过程中的时空表达特征,并明确了其功能及调控关系,为解析棉花开花调控网络奠定了分子基础。
1 材料与方法
1.1 供试材料
陆地棉栽培种‘TM-1’和哥伦比亚野生型拟南芥由本实验室保存。
DNA聚合酶购自南京诺唯赞生物科技公司,限制性内切酶购自赛默飞公司,琼脂糖凝胶回收试剂盒和质粒提取试剂盒均购自天根生物科技有限公司,植物RNA提取试剂盒购自北京艾德莱生物科技公司,反转录试剂盒、Infusion连接酶购自TaKaRa公司,荧光定量试剂盒购自US EVERBRIGHT®INC公司,大肠杆菌感受态DH5α购自北京天根生化科技有限公司,农杆菌GV3103感受态为自制,pGreen载体由本实验室提供。引物合成与测序均由金唯智生物科技有限公司完成。
1.2 样品准备
将拟南芥以每穴3棵×3棵的密度种植于营养土中,培养于光照培养室(23 ℃,16 h光照/8 h黑暗),在子叶展平后9 d取样,用于基因表达分析。棉花培养于河北农业大学温室(28 ℃,12 h光照/8 h黑暗),2片真叶期开始取样,到4片真叶期结束,每次选取长势均匀一致的棉株叶片及顶端分生组织用于基因的实时定量表达分析及相关基因克隆。在4片真叶期取根、茎、叶、顶端,用于基因的组织表达特异性分析,所取材料立即投入液氮中冷冻,然后于-80 ℃冰箱保存备用。利用试剂盒提取RNA,使用TaKaRa RR047A试剂盒进行反转录。
1.3 生物信息学分析
拟南芥氨基酸序列下载自TAIR网站(https://www.arabidopsis.org/),通过公开的测序数据库(NCBI)在线进行blastP比对。在CottonFGD网站(https://cottonfgd.org/)进行基因注释分析,获得与之同源的陆地棉开花整合子基因。基于CDD数据库(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)对其结构域进行预测。使用DNAMAN及ClustalX2软件进行多重序列比对,使用MEGA7软件中的邻位相接法构建进化树。
1.4 基因克隆和拟南芥的遗传转化
根据‘农大棉8号’基因组序列[28]设计引物(表1),以‘TM-1’的cDNA为模板进行克隆。使用Infusion连接酶将GhFT-2、GhSOC1-5和GhLFY-2连接到植物表达载体pGreen,构建融合表达载体,转化大肠杆菌DH5α后将阳性克隆菌液送至金唯智测序,并保存测序正确的单克隆菌液以供后续试验使用。野生型(Col)拟南芥花蕾期沾取农杆菌溶液(5%蔗糖,0.05% Silwet L-77),创建转基因植株,并用Basta进行筛选[25]。
表1 本研究中所用引物序列Table 1 Primer sequences in the study
1.5 转基因拟南芥目的基因qRT-PCR
以拟南芥的AtTUB2、棉花的His作为内参基因,利用Fast Super EvaGreen qPCR Master Mix进行qRT-PCR,所用仪器为Applied Biosystems 7500实时定量PCR仪。每个样品进行3次试验重复,采用2-ΔΔCt分析试验数据[29]。利用SPSS 11.0软件处理数据,Graphpad Prism 7.00软件作图。
2 结果与分析
2.1 棉花开花整合子鉴定及序列分析
从NCBI网站下载毛白杨(Populus tomentos)、葡萄(Vitis vinifera)、拟南芥(Arabidopsis thaliana)和烟草(Nicotiana tabacum)的开花整合子同源蛋白序列,cottonFGD在线比对(blast)棉花中同源序列,综合全部已公开棉花基因组序列及注释,鉴定棉花中FT、SOC1和LFY同源序列。因MADS家族成员结构域高度保守,在鉴定SOC1同源序列时,同时参考了棉花MADS家族成员鉴定结果[30-31]。综合blast结果,‘农大棉8号’基因组[28]中开花整合子序列具有其他基因组序列的共性,故以‘农大棉8号’基因组作为本文的参考序列。
棉花开花整合子包含2个FT、6个SOC1、和2个LFY基因,分别命名为GhFT-1/GhFT-2、GhSOC1-1/GhSOC1-2/GhSOC1-3/GhSOC1-4/GhSOC1-5/GhSOC1-6和GhLFY-1/GhLFY-2。GhFTs包含保守基序[FYL]-x-[LVM]-[LIVF]-x-[TIVM]-[DC]-P-D-x-P-[SNG]-x(10)-H和决定FT功能的关键氨基酸位点Tyr85(Y)和Gln140(Q)(图1A);GhSOC1s均含有MADS-box和K-box保守域,以及1个典型的SOC1 motif(图1B);GhLFYs包含1个保守的FLOLFY结构域(图1C)。基因结构分析可知,GhFTs基因包含4个外显子和3个内含子,GhSOC1s基因包含7个外显子和6个内含子,GhLFYs包含3个外显子和2个内含子,均与拟南芥的序列结构一致。GhFTs基因结构最为保守,GhLFY在A、D亚组上的序列也相对保守,但GhSOC1s在外显子长度上差异较大,暗示其功能在进化中可能产生差异。
图1 植物开花整合子序列分析Fig.1 Sequence analysis of cotton floral integrator
2.2 棉花开花整合子基因进化分析
本研究分析了棉属开花整合子基因序列的进化关系,发现陆地棉和海岛棉中的FT和LFY基因各有2个成员,亚洲棉和雷蒙德氏棉中各有1个成员(图2A、C),表明棉属进化过程中FT和LFY比较保守。不同于FT和LFY,在亚洲棉和雷蒙德式棉中分别含有3和2个SOC1序列,海岛棉A、D亚组中共5个SOC1序列,且与二倍体棉的同源序列相似度高;值得注意的是,陆地棉较海岛棉多了1个SOC1序列,除保留了二倍体棉中的5个SOC1序列外,来自A基因组的GhSOC1-3序列在D亚组增加了1个相似度高的序列GhSOC1-4,可能由片段复制而来,该现象证明海岛棉和陆地棉进化事件的独立性。此外,四倍体棉中SOC1-1/2/3/4序列与其对应的二倍体棉中序列均能聚在1个进化分支上,但GhSOC1-5/6序列较其二倍体中同源序列相似度略低,说明GhSOC1-5/6序列在进化过程中产生了变异(图2B)。
图2 植物开花整合子基因的进化树Fig.2 Phylogenetic analysis of plant floral integrator genes
综上,陆地棉在进化过程中,开花整合子FT和LFY相对保守,而SOC1序列在陆地棉棉形成过程中数量增加,且基因编码序列和非编码序列均产生了变异,这可能与陆地棉对环境的适应性增强有关。
2.3 棉花开花整合子基因表达特征分析
植物叶片是感受环境并产生生物信号的主要部位,而花芽分化的起始部位在顶端分生组织,开花调控基因的时空表达特征与其功能紧密相关。在拟南芥中,尽管FT、SOC1和LFY均促进植物开花,但它们的表达部位完全不重合。棉花3个开花整合子基因均在顶端分生组织中优势表达,且GhLFY-2在叶片中也有较高的表达(图3A),三者的表达情况与拟南芥不尽相同,预示着棉花开花调控网络的物种特异性。随着棉苗的不断生长,在第4片真叶展平时(4thtrue leaf stage, 4TLS),3个开花整合子基因在叶片和顶端分生组织中的表达均大幅升高,且在叶片中的升高更为剧烈,表明棉花TM-1在4TLS进入生殖生长,3个开花整合子基因在促进植物开花的功能上是保守的(图3B和C)。
图3 开花整合子基因在陆地棉中表达Fig.3 Expression of floral integrators genes in Gossypium hirsutum
2.4 棉花开花整合子基因对植物开花的影响
为进一步明确棉花开花整合子基因的功能,分别克隆了GhFT-2、GhSOC1-5和GhLFY-2。GhFT-2与GhFT1的相似度达到了99%,预示其功能的保守性。SOC1有6个成员,GhSOC1-5编码序列长度为666 bp,与‘农大棉8号’基因组一致,而比其他陆地棉参考基因组在3’端少15 bp,说明‘农大棉8号’基因组在该位点的组装相对较优。GhLFY-2与GhLFY大小一致,存在9个氨基酸差异,序列上二者相对保守。
分别构建克隆序列的转基因拟南芥,最后各获得10个以上转基因株系,与WT相比,过表达3个基因的拟南芥均呈现不同程度的早花表型(图4A)。分别选取4个T3代纯合株系进行开花时间及基因表达水平分析(图4B),发现随着基因表达量的升高,转基因植株的开花时间越早,即3个开花整合子促进开花的功能均具有剂量效应。其中,GhFT-2基因对植物开花的促进作用最强,株系#1和#2抽薹最早(当5~6片轮作叶形成时),开花时间提早1倍(图4C)。此外,在GhLFY-2转基因植株的莲座叶叶腋里伸出3~4朵单生花(图4D),表明GhLFY影响花分生组织分化。
图4 棉花开花整合子促进开花Fig.4 Cotton flowering integrators promotes flowering
2.5 开花整合子相互作用关系
选取生长14 d的转基因拟南芥,检测其开花相关基因的表达量,以探究棉花开花整合子间的相互作用。从图5可以看出,在GhFT-2转基因的株系中开花整合子AtSOC1和AtLFY的表达量都不同程度的上调(图5A)。在GhSOC1-5转基因的株系中,AtLFY的表达量显著上调,而AtFT基因表达量变化不大(图5B)。在GhLFY-2转基因的株系中,AtFT和AtSOC1均无明显变化(图5C)。由以上结果可推测,棉花LFY基因位于FT和SOC1基因的下游,而FT可直接影响SOC1的表达(图6)。
图5 拟南芥开花整合子基因转录水平Fig.5 Expression of floral integrator genes in transgenic Arabidopsis plants
图6 棉花开花整合子调控机制模式Fig.6 Model of cotton flowering regulatory mechanism
3 讨论
调控植物开花的众多基因相互作用,形成复杂的调控网络。其中,SOC1、FT和LFY整合来自环境和内源的各种信号,最终激活花芽分化决定子的表达,开启生殖生长。陆地棉和海岛棉是异源四倍体,由二倍体棉基因组融合而来。在驯化过程中,陆地棉开花时间提前,使得栽培区域得以北移。本文鉴定了陆地棉、海岛棉、亚洲棉和雷蒙德氏棉中的开花整合子,其中FT和LFY基因在二倍体和四倍体棉基因组中相对保守,四倍体棉花中各有2个成员,二倍体棉花中各有1个成员。而在拟南芥中只有1个SOC1基因,但棉花中SOC1基因的数量加倍,海岛棉保留了全部二倍体棉中的5个SOC1序列,而陆地棉D亚组增加了1个SOC1序列,共6个成员。且GhSOC1s编码序列和基因组序列差异明显,这可能与陆地棉对环境的适应性有关。如藜麦随着种植纬度的降低,其对长日照的需求发生了变化,FT基因序列的多样性与藜麦对光周期的适应相关[32]。
以往的研究显示,除了在根中很难检测到GhFT1(Gh_D08G2407,GhFT-1)基因的表达外,在叶片、茎秆、花、胚珠等组织中都有表达,但在叶片中的表达量最高[9],其在营养组织中的表达模式与拟南芥AtFT一样[8]。叶脉FT转录为mRNA并合成FT蛋白,FT蛋白再由韧皮部经过长距离运输到顶端分生组织,促进下游SOC1基因的活跃转录。本研究超表达GhFT-2使拟南芥开花时间减少1倍,与转GhFT1基因的拟南芥超表达植株对比,GhFT-2对开花的促进作用较GhFT1强,说明陆地棉中A、D亚组中的FT基因功能均被保留。樊红娟等[33]以3798品系(陆地棉零式果枝)和‘华中94’(正常果枝)为材料进行组织特异性表达分析,发现正常果枝中GhFT1在各组织中表达水平差异并不大,但是在零式果枝中,其茎尖的表达量要明显高于其他组织,其次在花芽中的表达量也相对较高,表明GhFT1可能参与花器官的发育。Mcgarry等[8]对拟南芥及棉花的FT基因进行了超表达和VIGS(virus-induced gene silencing)沉默研究,发现GhFT1基因影响花分生组织的决定。本研究在棉花顶端分生组织中检测到高水平的FT转录本,也预示GhFT调控开花时间的机制不同于其他物种,GhFT对SOC1的调控不必依赖于叶片中FT蛋白的积累及向上运输,棉花顶端分生组织细胞可自己合成所需FT蛋白,促进开花,这可以使棉花对环境变化的响应更迅速。
不同植物LFY同源基因的时空表达模式不同。金鱼草FLO基因只在开花期表达,四轮花器官中仅雄蕊中不表达[34]。在拟南芥、烟草、豌豆、葡萄等植物中,LFY同源基因在叶原基中及其开花阶段均有表达[35-38]。水稻RFL在幼穗中表达,而在成熟的小花和叶片中不表达,明显有别于双子叶植物[22]。这种时空上的表达差异反映了LFY同源基因的表达与植物本身花结构的进化有关,同时表明LFY同源基因在植物的发育过程中具有重要的作用。本研究在棉花叶片中检测到GhLFY的高水平转录,这不同于其他植物LFY的空间表达特征。转GhLFY-2植株开花早,茎基有单生花,花器官正常,与GhLFY-1(Gh_A07G0404,GhLFY)的功能一致[23],说明陆地棉A、D亚组GhLFYs促进开花、影响花序形成的生物学功能是保守的。叶片中GhLFY的转录可能参与了棉花成花诱导,响应环境或内源信号。
Guo等[9]发现,GhFT1转基因植株中的开花整合子SOC1和LFY以及AP1的表达量均显著的提高,而本研究中FT-2仅促进了LFY的转录,说明陆地棉2个FT基因促进开花的功能是保守的,但调控机制不同。在拟南芥中,SOC1在顶端分生组织中直接激活LFY的转录,进而激活AP1的转录,开启花芽分化。超表达GhSOC1-5显著促进了LFY的转录,表明棉花中FT-SOC1-LFY-AP1调控路径的保守性。与本研究结果不同,超表达GhSOC1-3(Gh_A11G0755,GhSOC1)极大促进了FT和AP1的转录,且GhSOC1-3可结合在AP1的基因序列上[13]。陆地棉中存在独立于FT-SOC1-LFY-AP1的另1条开花时间调控路径,GhSOC1-3可直接调控AP1,且在GhSOC1-3和GhFT间存在正反馈调节,即GhSOC1-3的积累会进一步促进GhFT的积累。综上,陆地棉GhSOC1s参与不同的开花调控路径,这与其序列的多样性相吻合,可能与陆地棉对环境的适应有关。
本研究鉴定并对比了四倍体棉和二倍体棉基因组中开花整合子的序列,发现FT和LFY在棉属中的进化很保守,而SOC1序列在陆地棉中的增多及序列的变异,导致陆地棉中既存在保守的FT-SOC1-LFY-AP1调控路径,又特异性进化出SOC1-AP1调控路径。陆地棉开花整合子调控路径的丰富,可能与其对环境适应性的提高相关。