4个禾本科植物NAC基因家族的系统进化及其在玉米中的干旱表达谱分析
2022-07-28李丽华郭颖彬
李丽华,郭颖彬,魏 昕
(1.河南省农业科学院粮食作物研究所,河南 郑州 450002;2.济宁技师学院,山东 济宁 272100)
转录因子是一类在多种生物学过程中起重要功能调节的蛋白。在植物中,NAC(NAM/ATAF/CUC2)蛋白是最大的转录因子家族之一,它们存在于多种植物中,并且在植物生长发育过程中扮演重要角色。而随着植物基因组测序工作的不断完成,越来越多物种内的NAC成员也被鉴定分析。比如,在双子叶植物拟南芥(Arabidopsisthaliana)内鉴定出105个ANAC候选基因[1],大豆(Glycinemax)内鉴定出101个GmNACs[2],桉树(Eucalyptusgrandis)内鉴定出189个EgrNACs[3],杨树(Populustrichocarpa)内鉴定出148个PtNACs[4]等;单子叶植物玉米(Zeamays)内鉴定出116个ZmNACs[5],小麦(Triticumaestivum)内鉴定出453个TaNACs[6]等。一般情况下,NAC转录因子的结构特征是在N端包含一个高度保守的DNA结合结构域,该结构域可分为5个亚结构域(A~E),C端通常含有转录调控区[7]。此外,一些NAC蛋白因为含有跨膜基序(Transmembrane Motifs, TMs),因此又被称为NAC膜结合转录因子(Membrane-bound NAC transcription factors, NTLs)[8-9]。
NAC转录因子家族广泛参与植物体内各种生长发育和逆境应答反应[7]。在模式植物拟南芥和水稻中,已经报道了许多NAC转录因子的功能。例如,研究发现拟南芥NAC1基因的表达由生长素诱导,并且NAC1的表达可以影响侧根的发育[10];拟南芥ANAC019,ANAC055或ANAC072的过表达植株都表现出对干旱胁迫耐受性增加的表型[11];水稻SNAC1基因的过表达植株表现出抗旱性和耐盐性明显增加的表型[12];水稻内SNAC1和SNAC2的过表达水稻植株对低温胁迫和盐胁迫的耐受性增加[13];水稻中OsNAC5的过表达使水稻根的木质部和通气组织增生,进而提高水稻的耐旱性[14];水稻中SNAC3的过表达植株表现出对氧胁迫、干旱和高温等胁迫的耐受性增强的表型[15]。水稻ONAC096基因可以通过调节叶片衰老和穗数影响籽粒产量[16];水稻OsNAC2基因作为生长素和细胞分裂素信号的上游整合子,可以影响冠状根的缺失和周期蛋白依赖性蛋白激酶的产生从而调节根发育过程[17];陆地棉(Gossypiumhirsutum)GhXND1的过表达会抑制次生壁及木质部的形成[18];鹰嘴豆(Cicerarietinum)的CarNAC1基因棉花品系可能通过降低气孔导度、增强渗透条件等方法提高转基因棉花的抗旱能力[19];玉米内的ZmNAC111的过表达使植株表现出了苗期耐旱性增强,水分利用率提高的表型,并且诱导了干旱胁迫下有关应答基因的上调[20]。
虽然植物内NAC基因家族的相关研究不断增加,但仍存在聚焦单物种、缺少多物种动态进化分析等问题。本研究选取禾本科内4个代表性单子叶物种的NAC基因家族进行了分子进化,并以玉米NAC基因为例进行表达模式分析,进而探索了禾本科NAC基因家族成员的系统发育、基因结构和扩增模式,基于玉米在不同生长条件以及不同组织和发育时期的转录组数据,筛选了潜在的响应干旱胁迫的NAC功能基因,为进一步研究NAC基因的功能提供参考。
1 材料与方法
1.1 高粱、玉米、二穗短柄草、水稻NAC基因的鉴定及筛选
在Ensembl Plants数据库(http://plants.ensembl.org/index.html)内下载玉米(Zeamays)、水稻(Oryzasativa)、高粱(Sorghumbicolor)和二穗短柄草(Brachypodiumdistachyon)的蛋白组数据及基因组注释信息。从PFAM数据库(http://pfam.xfam.org)内下载NAC转录因子保守结构域的隐马尔可夫模型(PF02365.15)。使用HMMER软件中的hmmsearch,对玉米、水稻、高粱和二穗短柄草等4个物种的蛋白组数据进行筛选,阈值设置为0.02。鉴于一个基因可能存在多个转录本,且NAC转录因子的保守结构域长度在150个氨基酸残基左右,因此去除长度短于75个氨基酸残基的序列,并且当候选基因含有多个转录本时,保留最长的转录本序列。
1.2 高粱、玉米、二穗短柄草、水稻NAC蛋白的理化性质分析
使用ExPASy在线工具(https://web.expasy.org/compute_pi/),对筛选出的玉米、高粱、水稻、二穗短柄草4个物种的NAC蛋白序列进行等电点和分子量等理化性质分析。
1.3 高粱、玉米、二穗短柄草、水稻NAC蛋白系统发育树构建
使用MAFFT软件对NAC蛋白序列进行多序列比对,然后使用FastTree软件进行系统发育树的构建,bootstrap值设置为1 000。使用香蕉NAC转录因子GSMUA_Achr4G02380作为外群序列。在NCBI(https://www.ncbi.nlm.nih.gov/Taxonomy/CommonTree/wwwcmt.cgi)上获取玉米、水稻、高粱、二穗短柄草和香蕉5个物种的系统发育关系。使用iTOL(https://itol.embl.de/)和FigTree对构建的系统发育树进行可视化展示。
1.4 禾本科NAC祖先基因的预测
基于物种进化关系和基因系统进化关系,使用Notung软件[21]对谱系内的NAC基因进行演化树的重构建以分析禾本科NAC基因在进化过程中的复制和丢失情况。
1.5 高粱、玉米、二穗短柄草、水稻的NAC转录因子跨膜结构域预测
使用TMHHM在线服务器(http://www.cbs.dtu.dk/services/TMHMM/),对4个物种内含有膜定位结构域的NAC蛋白进行预测。
1.6 高粱、玉米、二穗短柄草、水稻的NAC基因的复制分析
对4个禾本科物种内的串联复制基因的定义标准为:(1)同一物种内的NAC基因位于同一染色体或同一染色体骨架内;(2)位于同一染色体或染色体骨架内的两对基因间距离小于100 kb并且中间间隔的基因数不超过10个。此外,在CoGe服务器(https://genomevolution.org/CoGe/SynMap.pl)上分析玉米NAC基因的大片段复制情况。
1.7 玉米NAC基因在干旱胁迫下的表达谱分析
使用玉米在正常和干旱胁迫生长条件下的RNA-seq数据[22],分析玉米在干旱胁迫生长情况下NAC基因在V12、V14、V18、R1 4个发育期的雌穗、雄穗以及叶片3个组织内的表达情况。数据处理方法参照前人研究[23],基因表达水平用FPKM(Fragments per kilobase of transcript per million fragments mapped)值表示(FPKM>1的基因被定义为表达基因),差异表达基因的定义标准为:|log2(倍数变化)|≥1,且错误发现率(FDR, false discovery rate)≤0.05。
2 结果与分析
2.1 禾本科NAC基因家族的鉴定及系统发育分析
从4个禾本科物种中共计鉴定出556个NAC基因,其中玉米164个,高粱127个,水稻144个,二穗短柄草121个。进一步对4个物种内的556个NAC基因进行多序列比对及系统发育树的构建,结果发现依据系统发育树的拓扑结构可以将4个物种的NAC基因分为6个进化枝,依次命名为进化枝1、进化枝2、进化枝3、进化枝4、进化枝5和进化枝6(图1)。在这6个进化枝内,最小的进化枝2内包含48个NAC基因,最大的进化枝6内包含132个NAC基因,其余4个进化枝内,进化枝3包含101个、进化枝4包含109个、进化枝5包含103个、进化枝1包含63个。进化枝1、3和5内4个物种的NAC基因数目整体较接近,进化枝2和4内玉米NAC基因数目多于其他物种,在进化枝6内水稻NAC基因数目多于其他物种,这一情况暗示了不同物种内基因复制的差异。
2.2 禾本科NAC基因家族的理化性质分析
为进一步探索4个禾本科物种NAC转录因子的系统进化关系,计算了556个NAC蛋白的相对分子质量和等电点等理化性质以观察其中的规律。结果发现4个禾本科物种的NAC理化性质较相似无明显差别,进一步结合系统发育分析发现,进化枝1、进化枝2和进化枝3内的NAC转录因子的相对分子质量相似且分布集中,主要分布在32 000~43 000 kD,而进化枝4、进化枝5和进化枝6内的NAC转录因子的相对分子质量分布范围较大,主要分布在27 000~58 000 kD,并且进化枝5内的NAC蛋白相对分子质量的变异幅度最大,进化枝3的相对分子质量的变异幅度最小(图2)。对等电点进行分析发现,除了进化枝4和进化枝6外,其余4个进化枝的等电点有着相似的分布,进化枝1、进化枝2、进化枝3和进化枝5内的NAC转录因子均分布在pI=7左右,而进化枝4和进化枝6的大部分NAC转录因子的pI<7,呈弱酸性(图2)。这一结果表明进化枝1、2和3内的NAC转录因子有着较相似的理化性质,进化枝4、5和6内的NAC转录因子的理化性质则较不保守,序列分化较明显。
2.3 禾本科植物中含跨膜结构域NAC蛋白的鉴定分析
膜结合转录因子是指一类特殊的含有跨膜结构域的转录因子蛋白,跨膜结构域可以使该类转录因子与内质网、核膜或细胞膜等结合。该类转录因子的跨膜结构域通常在植物应答特定的发育或胁迫后被水解,然后转运至细胞核发挥其调节功能[24]。例如,前人研究发现NTL6参与植物胁迫应答和激素调节通路[8]。
使用TMHHM在线服务器,对4个物种内含跨膜结构域的NAC转录因子进行鉴定,结果从4个物种内共鉴定出27个含有跨膜结构域的NAC转录因子(NTLs),其中玉米8个,水稻6个,高粱6个,二穗短柄草7个,并且这些NTLs均只含有1个跨膜结构域(图3)。结合系统发育树分析发现,其中24个膜定位NAC转录因子位于系统发育树的进化枝4内,剩余3个(高粱、二穗短柄草、水稻各一个)则位于进化枝5内,这一结果表明禾本科NTLs基因序列相似性较高,进化关系较保守,可能存在功能相似或冗余的情况。
2.4 祖先禾本科NAC基因的鉴定分析
为了探索禾本科植物NAC基因的进化历史,基于4个禾本科物种的进化关系和NAC基因系统进化关系,使用Notung软件,对禾本科内的NAC基因进行进化树的重构建以分析NAC基因的得失情况。从556个NAC基因内共鉴定出174个禾本科单系群,表明禾本科植物分化前有174个祖先基因,随后产生分化,最终形成4个物种内的556个NAC基因。图4展示了禾本科进化过程中NAC基因的数目变化。4个禾本科物种在进化过程中有相似的基因丢失数量(69~86个),而复制基因数目则有较大差异,玉米内的复制基因数目最多(76个),其余3个物种内的复制基因数目则较接近(19~39个)。这可能是由玉米物种特异的全基因组复制事件导致的,这也是导致4个禾本科物种内NAC基因数目差异的主要原因。
2.5 玉米内串联复制和片段复制NAC基因的鉴定及分析
进一步对4个禾本科物种NAC基因复制事件进行分析发现,4个禾本科物种中共鉴定出47个NAC串联复制基因簇,共计116个基因,占基因总数的20.9%(116/556)。其中玉米内鉴定出22个串联复制NAC基因,水稻内43个,高粱内29个,二穗短柄草内22个(图5)。结合系统发育树分析发现,进化枝2内没有串联复制NAC基因,超半数的NAC串联复制基因(59.3%,67/113)位于进化枝6内,其中玉米和水稻的数目最多,分别有20个和24个NAC基因位于进化枝6。值得一提的是,除玉米外,其余3个物种均出现串联复制基因对的两个成员各自位于不同进化枝的情况(共12对)。以水稻为例,LOC_Os12g03040基因位于进化枝1内,而其串联复制基因LOC_Os12g03050则位于进化枝3内,表明串联复制基因对的保守性已发生变化,并且可能是发生在禾本科植物分化前。而玉米内的串联复制基因对成员则都是位于同一进化枝内,表现出相对保守的特点。
图5 高粱、玉米、二穗短柄草和水稻NAC串联复制基因分析Fig.5 NAC gene tandem replication statistics of sorghum, maize, brachypodium and rice
为进一步探索玉米NAC基因复制情况,对玉米基因组内的大片段复制NAC基因进行鉴定,结果发现玉米内含有50个大片段复制NAC基因。发生片段复制的基因在进化枝1至进化枝6中均有分布,在进化枝3和进化枝5中最多(图6)(进化枝1~6中包含的数量分别为6、6、12、9、15个和2个)。并且只有一个串联复制基因对位于片段复制基因内,表明玉米内的NAC基因复制事件相对独立,不同进化枝内的基因扩增模式是不同的。
图6 玉米NAC基因的片段复制(线条连接基因表示片段复制基因)Fig.6 Fragment replication of maize NAC gene (genes are connected by lines are segment duplications)
2.6 玉米NAC基因的干旱应答表达谱分析
为了探究不同进化枝内NAC转录因子潜在功能的差异,以玉米为例,对正常生长和干旱胁迫下的玉米叶片、雄穗和雌穗3种组织以及4个发育时期(V12,V14,V16,R1)的转录组数据进行分析。结果发现,正常生长和干旱胁迫下,在3个组织和4个发育时期中共有106个玉米NAC基因表达(FPKM>1),占玉米NAC基因总数的64.6%(106/164);进化枝1中NAC基因表达数目最多 (83.3%,15/18),而进化枝6中大约87%(26/30)的玉米NAC基因不表达或低表达,并且其中大部分都是串联复制基因。干旱胁迫下,共鉴定出51个差异表达基因(|log2(fold-change)|>1,FDR<0.05),进化枝1~6内的基因数目分别为11、8、12、11、6个和2个(图7);在叶片和雌穗内的差异表达基因数目多于雄穗。进一步对不同组织和发育时期内的NAC基因表达情况分析发现,随着干旱胁迫的进行,叶片中干旱响应的NAC基因数目在不断增加,发生上调与下调的基因数基本保持一致,未见明显的特异性;雌穗和雄穗中干旱响应的NAC基因大多表现出下调趋势;玉米NAC基因在V18时期的雄穗中没有表达(图7)。值得一提的是,玉米内片段复制NAC基因大部分都表达并且应答干旱胁迫。
图7 干旱胁迫下玉米NAC基因的差异表达谱Fig.7 Expression profiles of differentially expressed NAC genes of maize under drought stress
3 讨 论
本研究对4个禾本科物种包括玉米、高粱、水稻和二穗短柄草内的NAC基因家族进行了鉴定和系统发育分析。结果发现,玉米内鉴定出164个NAC基因,高粱内鉴定出127个NAC基因,水稻内鉴定出144个NAC基因,二穗短柄草内鉴定出121个NAC基因。系统发育分析表明4个物种的556个NAC基因聚类为6个进化枝,进化枝2(48个)是最小的进化枝,进化枝6(132个)是最大的进化枝,进化枝1、3和5内的4个物种的NAC基因数目整体较接近,其余进化枝内则存在数目差异,这暗示了不同进化枝内基因扩增模式存在差异。对进化枝的理化性质分析发现,4个禾本科物种的NAC蛋白理化性质无明显差别,且不同进化枝的相对分子质量和等电点表现出相似性。对膜定位结构域进行分析,共鉴定出27个含跨膜结构域的NAC转录因子,并且大部分(88.9%)都位于进化枝4内。玉米中8个具有跨膜结构域的NAC蛋白处在进化枝的同一簇上,结合基因表达分析发现大多对干旱胁迫不敏感,这可能暗示了膜定位NAC蛋白功能的独特性。前人研究鉴定出7个ZmNTLs,其中有6个定位在质膜上,1个定位在内质网上;当植物被脱落酸或过氧化氢处理时,这7个基因在根和茎中均被上调表达,而在叶片中则被下调[25]。本研究内的8个ZmNTLs只有Zm00001d040318应答干旱胁迫并被下调,因此玉米内NTLs在植物生长发育和干旱胁迫应答间的功能关系仍有待确定。
使用逐步溯源法从4个禾本科物种内共鉴定出174个祖先基因,进一步观察物种基因获得和丢失数目发现,4个禾本科物种在进化过程中有相似的基因丢失数量(69~86个),而复制基因数目则有较大差异,玉米内的复制基因数目最多(76个),可能是由于全基因组复制事件导致的,其余3个物种内的复制基因数目则较接近(19~39个)。玉米116号单系群中聚类为一个包含26个NAC基因的进化枝,其中包含23个串联复制基因。此外,基因家族的复制分析发现,串联复制对这4个物种的NAC基因扩增贡献明显(20.9%,116/556),玉米内基因组大片段复制事件对玉米NAC基因扩增贡献明显(30.5%,50/164)。
对玉米NAC基因家族进行了转录表达谱分析,结果发现在干旱胁迫下玉米内鉴定出51个差异表达基因,且不同组织内的差异表达基因数目存在差异,叶和雌穗内的差异表达基因数目多于雄穗。前人研究发现ZmNAC84参与ABA信号通路并且在烟草内的过表达可以提高烟草的抗旱性[26],本研究内的表达分析发现ZmNAC84在营养组织内表达而在生殖组织内表达水平较低。此外,与ZmNAC84为片段复制基因对的Zm00001d008817则在玉米雌蕊和叶的R1期、叶V18期应答干旱胁迫,表明这对复制基因功能已发生分化。
玉米内发生串联复制的NAC基因多数都不表达,只有少量表达;与之相反的是玉米内发生了大片段复制的NAC基因大部分都表达并且应答干旱胁迫。在玉米NAC基因的组织特异性表达谱和干旱胁迫应答表达谱中,除进化枝6外,其余进化枝中的基因大部分都有表达,推测潜在的功能基因主要分布于除进化枝6外的进化枝中。本研究为进一步探究禾本科物种NAC基因进化以及鉴定玉米NAC功能基因提供参考。