APP下载

棉花主要早熟性状开花时间调控位点及机制研究进展

2022-11-21阎媛媛张子豪

河北农业大学学报 2022年5期
关键词:光周期拟南芥开花

阎媛媛,张子豪

(河北农业大学 农学院,河北 保定 071001)

棉花被认为是研究植物多倍体的模式物种,为了解植物基因和基因组的进化模式和机制提供了组织框架和系统发育的视角[1]。异源四倍体栽培品种陆地棉(Gossypium hirsutumL)是目前种植最广泛的棉种,为纺织业提供主要纤维原料。陆地棉起源于热带地区,随着驯化培育和自然选择,其熟性得到了很大的提高,特别是全生育期已减少到大约140 d,例如‘中213’,全生育期在105 d 以内,纤维品质好,产量高[2]。我国棉花的主要生产区—西北内陆棉区,绝大多数地区有效积温偏低,严重影响了中、晚熟棉花的成熟吐絮,此环境对棉花的早熟性状要求更为迫切[3]。1919 年我国从美国引进早熟性好、结铃性强的金字棉,并将其驯化成了我国棉花品种的“早熟源”,使我国短季棉育种进入了一个新的时代[4]。由于早熟棉的成功选育,新疆北部的种植面积已扩大到北纬46 度[5]。在黄河和长江流域,小麦/油菜与棉花的轮作是早熟棉利用的又一显著成效,通过一年两熟甚至多熟,实现棉粮双丰收,有效提高土地经济效益。因此,培育早熟棉被认为是缓解当前粮棉争地矛盾、提高植棉经济效益的有效途径。本文综述了棉花早熟性主要性状调控位点及机制,为早熟棉分子育种提供理论支撑。

1 棉花早熟相关位点的鉴定

早熟是短季棉的一个显著特征,是数量遗传的一个复杂农艺性状[6]。在品种选育方面,早熟性包含苗期、蕾期、开花时间、花铃期和全生育期[7]。其他农艺性状,如株高、第一果枝节位、第一果枝节位高度和霜前花率等也被用作早熟指标[8-9]。喻树迅认为苗期、蕾期、脱落率、第一果枝节位及霜前花率是鉴定棉花早熟性的可靠形态指标,主要受基因遗传控制,遗传率高[10];赵伦一等认为现蕾期或盛絮期是评定陆地棉早熟性的指示性状[11]。林昕[12]通过对早熟棉花各性状相关关系的研究发现株高与早熟性呈显著负相关关系,果枝数与早熟性成显著正相关。这些描述棉花早熟性的性状均属于数量性状,而对棉花早熟性遗传规律的探究表明早熟性状的遗传模式符合加性—显性遗传模型[9,13-15]。

近年来,随着分子标记技术及基因组测序技术的不断发展,许多与早熟性状相关的QTL 陆续被鉴定,包括与开花时间(FT)、全生育期(WGD)、第一果枝始节(NFFB)、花铃期(FBP)、株高(PH)和第一果枝高度相关位点。结合早熟相关农艺性状的相关性,我们总结了3 个早熟重要指标 性 状NFFB、WGP 和FT 相 关 的QTLs。SSR 标记连锁分析与全基因关联分析(GWAS)分别定位到256 和28 个早熟相关位点,共284 个,分布在陆地棉26 条染色体上。其中,D03 染色体定位到的早熟相关位点最多,包含遗传群体连锁分析定位到的70 个位点和自然群体GWAS 关联分析定位到的10 个位点,这些位点较均匀的分布在该染色体上,而在35.47~39.84 Mb 区段存在FT 富集位点,在13.56 Mb 处 定 位 到2 个WGP、2 个FT 和1 个NFFB 位点,表明这些位点包含调控开花的重要基因,但我们对其功能知之甚少。在25.21~25.60 Mb和35.49~40.29 Mb2 个区间内,遗传群体和自然群体均定位到早熟相关位点,其中GhCIP、GhTOC1和GhCOL2基因均响应光照,参与光周期调控[16-20],这些位点可能贡献了陆地棉光周期适应性的拓宽。其次,A02、A03、A08、A10、D01、D08、D10 和D13 包含10 个以上早熟相关位点,但这些位点包含的早熟相关基因功能尚不清楚,其中GWAS 关联到赤霉素合成和信号转导路径的基因,表明赤霉素能够调控棉花开花及熟性。另外GhELF4基因的定位,进一步证实棉花对光周期的适应性同时伴随着温度适应性的改变[21-23]。在A02 染色体2.76 Mb处、A04 染色体22.5 Mb 处、A10 染色体14.4 Mb和28.24 Mb处定位到与WGP和FT相关的共同位点,在A04 染色体31.12 Mb 和D08 染色体27.33 Mb 处存在与NFFB 和WGP 共同相关的位点,表明棉花全生育期、开花时间与第一果枝节位性状间存在基因组水平的关联性,这一现象在对早熟棉自然群体的GWAS 分析中亦存在[24],预示这些描述棉花早熟性的性状可能受相同基因调控。

根据前人定位与早熟性相关的QTL,在多组生育期差异明显的材料中,均在D03 染色体的不同区段上定位到全生育期和开花时间等早熟性相关的QTLs,本文指出D03 染色体对于棉花早熟性调控十分重要,进一步解析这些主效稳定QTL 位点包含的遗传信息,如基因功能、结构变异及表观遗传Marker 的变异,对理解棉花熟性相关性状调控机制有重要意义,同时也为分子育种改良提供设计思路。

2 陆地棉开花相关基因研究进展

目前,多个棉花基因组的测序与组装拓宽了我们在基因组水平对棉花多倍体进化事件、变异与适应的认识,同时推进棉花研究进入后基因组时代。对于棉花功能基因组学的研究大多集中于抗病和纤维发育领域,对棉花开花调控的研究较少,多为已知开花调控基因在棉花中同源基因的克隆与功能验证,对棉花开花调控基因拷贝数及调控机制知之甚少[25-26]。

2.1 已克隆棉花开花调控子功能

开花时间是描述棉花早熟性的关键指标性状。第一个被克隆的棉花开花时间调控子为LFY 同系物[25],其在顶端分生组织(SAM)中高表达,叶片中也能检测到其表达,这与拟南芥仅在SAM 和叶原基的表达模式不同,并且随着棉苗的发育,GhLFY的转录水平不断升高。超表达GhLFY不仅促进拟南芥开花,还表现出次生花取代次生枝的表型,说明GhLFY功能保守,具有促进开花和花序构成的双重功能。

MADS 家族以其在植物开花时间调控和花器官发育中的重要作用而被熟知。MADS-box 基因家族 分 为2 大 类,MADS intervening keratin-like 和C-terminal (MIKC)-type MADS-box 基因,在陆地棉中研究最多的为MIKC 型MADS-box 基因[27]。对棉花MADS 家族成员的鉴定表明,棉属基因组中没有FLC 亚族,这与其起源于热带、亚热带地区,不需要春化作用促进开花的生长习性相吻合。Suppressor of overexpression of constans 1(SOC1),APETALA1(AP1) 和Short vegetative phase(SVP) 等是MADS 家族中开花调控的明星基因,SOC1 是重要的开花时间整合子,直接激活LFY的转录,进而促进AP1的表达,AP1 在花序分生组织中的积累被认为是花器官发育的起始;SVP 与FLC 形成开花调控网络中的关键抑制子,防止植物早花造成的生殖失败。GhAP1.7能够促进棉花开花,但沉默或超表达该基因均未表现出任何花器官或植株结构的变化[28],而GhMADS42(D12 染色体上的AP1-like基因)不仅促进拟南芥开花,超表达植株同时表现出花器官结构和主茎分枝结构的异常[29],说明GhMADS42影响了花序的建成。这些结果说明AP1同源基因在四倍体棉中既有功能冗余,又有功能差异,这一现象说明多倍体基因组进化的复杂性,解析同源基因不同拷贝的功能是棉花功能基因组研究的重要组成。GhAP1 蛋白能够与赤霉素(GA)路径蛋白GhGAI 和GhNFYC4 互作[30],可能是GA 促进棉花开花路径的效应子,这一机制不同与拟南芥,由于目前尚缺少GA 调控棉花开花的研究,GA 调控棉花开花的机制未知。GhSOC1和GhMADS29(SVP-like基因)均在叶片中高表达,表明其在开花调控过程中是植物感受环境信号变化的重要效应子。GhMADS29随着棉苗的发育表达量升高,表达趋势与拟南芥SVP相反[31],预示其可能促进棉花开花,且高水平GA 处理植株,叶片中GhMADS29表达量在6 h 内明显下降,可能参与了GA 调控开花这一路径。而酵母双杂交实验表明GhMADS40(SVP-like基因)与GhSOC1 互作,GhSOC1与GhAP1的多个同系物互作[29],共同调控棉花开花时间。棉花MADS 蛋白互作的复杂性与其通过不同多聚体识别不同间距的两个CArG-box的分子机制一致,也因四倍体棉中MADS 基因的扩增使得棉花开花时间调控网络更为复杂。GhSOC1在拟南芥中过表达促进开花,通过直接结合GhLFY和AP1-like 基因启动子的CArG-box 序列促进下游GhLFY和GhAP1s基因的转录,而GhSOC1 并未结合在检测的GhFT启动子区段[25,29]。与这一结果不同,拟南芥中FT-SOC1-LFY-AP1 形成线性调控,进一步解析棉花整合子在调控网络中的机制,对解析棉花开花调控网络十分重要,这可能为我们认识棉花适应环境提供新思路。此外,GhAGL17.9在拟南芥中过表达促进了LFY和SOC1的转录,进而导致开花提前[27]。拟南芥AGL17响应光周期变化,在长日照条件下直接促进LFY的转录,行使开花促进子的功能[32]。但AGL17与SOC1的调控关系未知,棉花中GhAGL17.9的调控机制有待进一步解析。陆地棉中报道含有207 个MADS 家族成员,其中MIKC 成员108 个,尽管已知很多成员在花器官中高表达,如GhAP1s,GhAGs,GhSEPs和GhSOC1s[27,33],但其功能尚不清楚。作为开花时间调控的重要转录因子,大量参与棉花成花诱导过程的MADS 成员尚未鉴定。

磷脂乙醇胺结合蛋白(Phosphatidyl ethanolaminebinding proteins)在花序分生组织和开花时间调控中具有中心地位,被视为是成花素的主要成分。拟南芥FT 蛋白在维管束韧皮部伴胞细胞中产生,被运输到顶端分生组织与bZIP 转录因子FD 相互作用,并结合下游基因AP1和LFY的启动子来激活花分生组织特异性基因的表达[34]。在单子叶模式作物水稻中也同样发现,FT 的同源蛋白Hd3a 能结合水稻OsFD1的启动子调控该基因的表达[35]。陆地棉中鉴定到20 个PEBP 基因,分为4 个亚家族:FT、FT-like、TFL1 和MFT[36,37]。GhTFLb和GhTFLd在SAM 中高表达,GhFEBP2在叶片和SAM 中高表达,预示其参与成花诱导。GhFT,GhTFL1a,GhTFLc,GhTFL1d,GhMFT1,GhMFT2和GhFEBP2的转录水平随棉苗的发育不断升高,且第3 片或第4 片真叶时表达量升高到高水平,表达趋势与GhSOC1一致,符合开花促进子的功能[25,37]。然而拟南芥TFL 是开花抑制子,FT 与其竞争结合FD,进而去除TFL1对LFY的抑制作用,使营养分生组织转变为生殖分生组织[38]。棉花中多个TFL 同系物功能的差异有待挖掘。GhFT在光照4 h 时转录达到峰值,随后降低,在黑暗开始时转录水平最低,但不同与其他物种,陆地棉GhFT在长日照和短日照条件下表达模式相同[39]。超表达GhFT促进拟南芥和烟草开花[37,39,40],陆地棉中FT 进化保守,A、D 亚组各含有1 个拷贝,其启动子序列的差异导致D 亚组GhFT-D的转录水平较高,但2 个基因拷贝均在SAM 与叶片维管束中特异表达[41]。FT 被视作光周期路径的整合子,汇聚了来自光照的信号通路。野生棉是严格的短日照植物,随着陆地棉的驯化,其对光周期的适应性增强,适当延长日照时间能促进棉花开花。对比陆地棉光周期敏感型半野生品种与光周期不敏感型现代品种中基因表达量发现现代品种中GhFT和GhSOC1对长短日照响应的差异性消失,而GhTFL1a,GhMFT1和GhFBEP2的表达仍保持对日照长短的差异响应[37],另一项研究也证明在驯化的陆地棉和海岛棉中GhFT的表达量在长日照下较野生型升高,表明GhSOC1和GhFT可能贡献了陆地棉光周期适应性的拓宽[20]。GhMFT1和GhMFT2影响GA 通路,在种子萌发和发育过程中起调节作用,并且其均与GhFD 互作。因此,GhMFT1和GhMFT2可能是棉花开花调控网络中GA 路径的又一参与者,但其如何平衡光周期与GA 信号间的关系,该过程是否有GhFD 的参与,这些问题尚没有答案。此外,对棉属14-3-3 基因家族分析揭示家族成员大多有较高的转录水平,在组织器官中表达差异预示着功能的多样性,VIGS 沉默不同GhGRF基因,棉株表型的不同证明了该点。该家族成员GhGRF3/6/9/14/15 均与GhFT 在细胞质和细胞核内互作,而仅在细胞核内与GhFD 互作[42-43]。尽管FT-14-3-3-FD 蛋白复合体在不同植物中是保守的,但水稻14-3-3 与Hd3a(FT 同系物)在细胞质中的互作协助FT 进入细胞核,形成Hd3a-14-3-3-OsFD2 复合物,维持SAM 的营养性生长,而OsFD1 竞争结合形成Hd3a-14-3-3-OsFD1 复合体促进开花[44]。棉花GhGRF3/6/9/15抑制开花,而GhGRF14 促进开花,因此棉花中GhFD-GhFT 可能通过与不同GhGRF 形成复合体决定SAM 的生长状态。更为复杂的是陆地棉中含有5个GhFD基因,各在A、D 亚组上存在1 个拷贝,且他们在根、茎叶、花和SAM 的表达各不相同,GhFD1/2对开花时间有促进作用,而GhFD3/4/5则对根的生长发育影响更大。因此GhFD1/2-GhGRFGhFT 可能在开花调控过程中发挥主要作用,激活GhAP1的转录而诱导开花;而GhFD3可能通过与GhFT 的互作调控Auxin 受体,将光信号传递到地下部位[42]。但由于我们对GhFD功能及表达特性认识的不足,尚不清楚蛋白互作对GhFT 功能的影响,且GhFDs和GhGRFs是否响应不同环境和内源信号,进而行使不同功能,这些问题的答案将为我们揭示GhFT调控机制的物种特异性。

Constans (CO)是光周期路径的又一重要因子。Cai 等在陆地棉中鉴定了23 个CO-like 基因GhCOLs,它们在不同组织器官中的表达具有特异性,且昼夜表达模式及对长短日照短的响应不同,说明其参与不同光周期响应生物过程。GhCOL1-A和GhCOL1-D的异位表达均通过FT 促进拟南芥开花[45]。基因组水平DNA 甲基化研究发现四倍体棉驯化品种GhCOL2D区段DNA 甲基化水平明显降低,进而导致其转录水平的升高,在长日照条件下显著促进GhFT的转录,使四倍体棉在长日照条件下能够较早开启生殖生长,打破野生棉对短日照的依赖性[20]。另2 个昼夜节律钟基因GhLUX1和GhELF3,在长日照、短日照、恒光和恒暗条件下均出现节律性表达模式,拟南芥中GhLUX1和GhELF3的过表达均会推迟FT的峰值,延缓开花,而沉默GhLUX1或GhELF3均增加了GhFT的表达,导致棉花早花。尽管GhLUX1和GhELF3的周期震荡曲线并非完全重合,但二者以具体的形式共同抑制GhFT的表达[46],二者蛋白水平可能同步,或其通过错峰表达精确调控GhFT。

Squamosa promoter binding protein-like (SPL)基因是一类植物特异性转录因子,其蛋白产物含有高度保守的SBP-box 结合域。目前,对SPLs 转录因子相关调控网络的研究主要集中在对miRNA 的表 达 调 控。SPL3/4/5的3' UTR 存 在miR156 的 结合位点,从幼年到成年的转变伴随着miR156 水平的下降和SPL3水平的升高,miR156 通过转录后水平抑制SPL3的表达[47-48]。水稻基因组中有19个OsSPLs基因,其中11 个可能是OsmiR156s 的靶基因,OsmiR156b和OsmiR156h在水稻中过表达导致严重矮化、穗缩小、开花延迟[49]。Zhang等从陆地棉中鉴定出24 个GhSPLs基因,发现18个GhSPLs基因可能是GhmiR156的靶基因,而开花整合子GhSOC1可能结合GhSPL3的启动子而不是GhSPL18调控开花[50]。GhHB12可能受长日照诱导,与GhSPL10竞争调控GhFT,抑制棉花开花[51],平衡光照路径与年龄路径对开花的诱导。此外,GhSPL10还存在独立于GhHB12路径的调控,可直接促进GhSOC1和GhFUL的表达[51],保障植物的生殖成功。

此外,GhAAI66通过GhELF4促进开花[52],GhFPF1促进拟南芥开花[26],GhHDA2/7/13/15/16在成花诱导过程中早熟棉中的表达高于晚熟棉,预示其可能参与开花调控[53]。

表1 棉花开花调控基因Table 1 Flowering time regulators in cotton

2.2 陆地棉开花调控网络

栽培棉对光照和温度适应性的拓宽,是其成为主要天然纤维和纺织纤维来源的重要基础。已报道的早熟相关基因的研究大多数是基于拟南芥或其他模式作物上的开花机理解析,选取已报道的开花调控基因,在棉花基因组中进行匹配克隆和转基因研究,验证棉花同源基因的开花功能。而寻找新的开花关键调控基因或调控机制的研究较少,随着雷蒙德氏棉、亚洲棉和陆地棉的全基因组测序结果相继公布,棉花基因组学的快速发展为我们认识该过程提供了重要信息。根据早熟相关基因定位及功能研究,我们将棉花开花调控路径总结为4 类,分别为赤霉素路径,光周期路径,年龄路径和温度路径,如图2。与模式植物不同,棉花不存在春化路径,因此基因组中也缺失FLC 基因。另外,内源路径相关基因仅发现FVE 和FLK,且缺少相关功能机制研究,因此未在本文总结。这4 个路径中,已挖掘的光周期路径参与基因数目最多,包括了5 个具有光周期节律的基因,以及核心震荡子之一GhTOC1。但这些基因的表达曲线各不相同,棉花内在节律如何稳定尚无法预测。值得注意的是GhTFL1a 基因作为TFL1 的同源序列,其功能与TFL1相反,并参与了光周期路径。尽管有TFL 同源序列响应红光或蓝光的报道[59-60],GhTFL1a 对光周期的响应拓宽了我们对该基因功能的认识。而不同日照时间下,GhFT对GhSOC1和GhAP1表达量的影响预示棉花响应长、短日照激活花芽分化的机制不同,而该过程可能由GhFD和GhGRF家族的不同成员参与。GhMFT1/2和SVP-like基因受赤霉素诱导,且GA合成和信号转导路径基因均影响棉花熟性,说明GA调控开花时间的功能在棉花中是保守的,但该调控是否具有光周期依赖性有待进一步试验。DELLA 蛋白通过GhNFYC4 与GhAP1 互作,但棉花中GhAP1是否调控GhLFY尚不清晰,因此GA 信号路径如何开启棉花生殖生长尚不清楚。GhSPLs与miR156s是年龄路径的重要参与者,GhSOC1则是该路径信号的整合子。不同与其他植物,GhSOC1 能特异性结合GhSPL3启动子,这可能是一种反馈调节。另外,受长日照诱导的GhHB12 可与GhSPL10 拮抗,平衡光周期与年龄路径的信号。迄今为止,我们对温度路径的认识尚浅,对棉花而言,仅几个可能参与该路径的候选基因,可以说我们对棉花响应温度变化调控开花时间的认识空白,但棉花生长对温度的依赖性较强。解析该路径参与基因的功能,对我们认识棉花对环境的适应性十分重要。有研究表明,光周期与温度路径并非两个独立的通路,蛋白互作与表观遗传调控是两个路径的连接纽带[5,61-63],这可能是我们探究棉花同时适应光照和温度机制的方向。

图2 棉花开花调控网络。Figure 2 Network of cotton flowering time control.

棉花3 个开花整合子GhFT 和GhLFY 在A、D亚组各存在序列高度保守的1 个拷贝,然而SOC1同源序列数目较多,其功能又尚不清楚,这增加了棉花整合子调控开花的复杂性,加之AP1 多个同源序列的存在,其功能的冗余性和多样性对明晰棉花开花调控网络十分重要。VIGS 技术和CRISP 技术具有同源沉默或敲除的效果,是棉花复杂功能基因组学研究必不可少的工具。

综合已明确功能的棉花开花调控基因,大多为开花促进子,仅4 个基因表现为抑制开花的功能。然而,在环境尚未达到适宜期,且植株生物量积累不够时,抑制花芽提早分化是保障生殖成功的重要方面,该过程中开花抑制子十分重要。拟南芥中,SVP-FLC 复合体是核心抑制子,而棉花中GhMADS29 作为SVP 同源基因,其功能可能为促进开花,加之棉属基因组中FLC 的缺失,使得棉苗保持分生组织营养性这一生物过程变得未知。挖掘抑制花芽分化起始的调控基因,对完善棉花开花调控网络必不可少。

3 展望

作为世界棉产量第一大国,我国高端原棉长期依赖进口,棉花产量尚不能满足本国纺织业需求。目前,尽管我国成功培育出一系列丰产、优质、高抗的早熟棉品种,但是棉花早熟性机理研究还处于探索阶段,真正利用有价值的QTLs 培育出优良品种的事例寥寥无几。依据已克隆的陆地棉开花基因以及早熟性状相关QTLs 共同定位发现(图1),仅有光周期基因GhLUX1和MADS 家族基因GhAGL17.9在染色体上的位置与早熟性位点相近,而大多早熟相关QTLs位点的开发利用尚不充分。随着基因组学和功能基因组学的深入研究,棉花早熟调控机制的认识不断丰富,为早熟棉改良由传统育种向分子育种转变提供理论基础。

图1 早熟性状关联位点总结Fig. 1 Summary of QTLs relating to early maturity traits

现阶段,我国棉花育种目标从单一性状改良发展成为高产、优质、高抗、早熟、适轻简化综合改良。在推进棉花产业高质量发展过程中,不断优化棉花品种结构,解决了棉花品种多乱杂和原棉品质一致性差问题。但是还存在几方面需要育种家去探索和实施。

(1)创制早熟棉新种质。通过远缘杂交、分子标记辅助育种,以及转基因技术将野生棉优质性状基因转育到栽培棉中是拓宽新种质的重要方法,为早熟棉育种提供新的优异种质资源。

(2)进一步开发利用早熟相关QTLs 位点。剖析优异的遗传位点,解析有利等位基因的遗传基础,是探究自然变异引起棉花熟性变化的原因,同时推进有利基因聚合育种和转基因育种在早熟棉改良中的应用。

(3)早熟与优质、高产、高抗协同发展。早熟往往面临着早衰,而病虫害和旱薄盐碱逆境等影响是制约早熟棉育种的主要原因之一,加速解析早熟与其他性状负相关性机理的探究,并深化配套栽培管理措施的研发,实现农机和农艺的结合、棉田全程机械化,才能真正解决早熟、高产、优质协同改良的技术难题。

猜你喜欢

光周期拟南芥开花
不同光周期对甜椒幼苗生长的影响
富天冬酰胺蛋白增强拟南芥辐射抗性的研究
不同光周期对高粱叶片和蚜虫体内营养物质含量和相关酶活性的影响
《一棵开花的树》
雨开花
今天的光周期是多少?
计算今天的光周期
两种LED光源作为拟南芥生长光源的应用探究
木醋液与6-苄基腺嘌呤对拟南芥生长的影响研究