单叶蔷薇bZIP转录因子家族鉴定与表达分析
2022-06-14孙彦琳潘会堂张启翔
孙彦琳,于 超,罗 乐,潘会堂,张启翔
(1花卉种质创新与分子育种北京市重点实验室,北京 100083;2国家花卉工程技术研究中心,北京 100083;3城乡生态环境北京实验室,北京 100083;4园林环境教育部工程研究中心,北京 100083;5林木花卉遗传育种教育部重点实验室,北京 100083;6 北京林业大学 园林学院,北京 100083)
碱性亮氨酸拉链(basic leucine zipper,bZIP)转录因子家族,是真核生物中最大、种类最多的家族之一。其特征在于具有高度保守的bZIP结构域,其长度为60~80个氨基酸,由两部分组成:基本的DNA结合区域和亮氨酸拉链[1]。目前,bZIP转录因子家族成员已在许多植物基因组中被鉴定,拟南芥(Arabidopsisthaliana)中有78个[1],水稻(Oryzasativa)中有89个[2],大豆(Glycinemax)中有131个[3],玉米(Zeamays)中有170个[4],苹果(Malusdomestica)中有114个[5],山茶中有61个[6]。研究发现,bZIP转录因子能够调控植物生长发育,如叶片[7]、花芽[8-9]和种子的发育[10-11]。此外,bZIP转录因子能够在生物和非生物胁迫响应中发挥重要作用[12],包括干旱、寒冷、高温、盐胁迫以及调控ABA信号传导和病原体防御[5]。Liao等[3]发现,大豆中GmbZIP44、GmbZIP62和GmbZIP78基因是ABA信号的负调节器,在抗盐和耐冻性方面发挥作用。近年来,有学者对萝卜(Raphanussativus)[13]、柳枝稷(Panicumvirgatum)[14]和红花(Carthamustinctorius)[15]等植物中bZIP转录因子的胁迫响应机制进行了研究。
单叶蔷薇(Rosapersica)是蔷薇科蔷薇属单叶蔷薇亚属植物,其叶为单叶,花瓣基部有紫红色斑点(多数蔷薇属植物为奇数羽状复叶且无花斑),曾被分成一个单独的属——单叶蔷薇属(Hulthemia)[16-17]。经大量实地调研证实,该种与《中国植物志》记载的小檗叶蔷薇(R.berberifolia)为同一种;且全球公认的邱园索引(Index Kewensis)通常将小檗叶蔷薇作为单叶蔷薇的异名处理。单叶蔷薇在我国仅分布于新疆[17],新疆生境条件较为恶劣,当地花卉大多具有抗旱、抗寒、抗风、耐盐碱、耐瘠薄等特点[18]。冯久莹等[19]对14种新疆野生蔷薇属植物进行调查,发现单叶蔷薇耐热性最好。惠俊爱等[18]发现,单叶蔷薇对干旱、寒冷、贫瘠有较强的抗性。此外,惠俊爱等[20]还发现,单叶蔷薇有典型的旱生结构,从解剖学及细胞学角度解析了单叶蔷薇的抗旱机制。本研究对单叶蔷薇bZIP转录因子家族进行全基因组水平鉴定,并对其进行系统进化关系、结构特征、保守基序和顺式作用元件等生物信息学分析,为探究bZIP转录因子家族在单叶蔷薇生长发育过程中的作用机制奠定基础。
1 材料与方法
1.1 数据来源与bZIP转录因子家族鉴定
单叶蔷薇的基因组测序数据、基因转录序列、CDS序列、蛋白质序列及其注释GFF文件来源于本课题组前期研究结果(未公开)。从蛋白质家族数据库Pfam(http://pfam.sanger.ac.uk/)[21]中下载bZIP域(PF00170)的隐马尔可夫模型(HMM)配置文件,并通过HMMER软件搜索蛋白序列(E值<1×10-5),利用NCBI CDD(http://www.ncbi.nlm.nih.gov/Structure/cdd/)在线工具确认bZIP域的完整性。利用DNAMAN软件进行bZIP转录因子家族的理化性质分析,包括蛋白质长度、分子质量、等电点。通过在线工具WoLF PSORT (http://psort.hgc.jp/)[22]进行亚细胞定位分析。
1.2 单叶蔷薇bZIP转录因子家族系统发育分析
根据Dröge-Laser等[1]对拟南芥bZIP转录因子家族的鉴定,从拟南芥数据库网站(https://www.arabidopsis.org)下载78条拟南芥bZIP蛋白序列。通过MUSCLE[23]软件对单叶蔷薇和拟南芥bZIP蛋白进行多序列比对,并用IQ-TREE软件[24]构建进化树(VT+F+R7,1 000自展值),用iTOL在线软件[25](https://itol.embl.de)进行进化树展示。
1.3 单叶蔷薇bZIP转录因子家族保守序列、基因结构和启动子分析
利用MEME软件[26]分析单叶蔷薇bZIP蛋白保守基序,设置基序长度为6~200个氨基酸残基,基序最大发现数目为10个,其他参数为默认值。通过NCBI CD-Search在线工具对预测的保守基序进行功能注释(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)。通过单叶蔷薇基因组注释文件获得基因的结构信息,用TBtools软件[27]对结果进行可视化处理,绘制保守基序分布和基因结构图。从单叶蔷薇注释文件中提取bZIP转录因子家族成员起始密码子上游2 000 bp序列,将序列提交到PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[28]数据库分析启动子的顺式作用元件。利用Excel绘制顺式作用元件数目统计图。
1.4 单叶蔷薇bZIP转录因子家族基因定位与共线性分析
使用BLASTp和MCScanX软件[29]分析基因家族中的重复事件,通过单叶蔷薇基因组GFF文件获得每个基因的染色体位置信息。利用TBtools软件[27]对单叶蔷薇bZIPs的染色体位置及染色体重复信息进行可视化。
1.5 单叶蔷薇bZIP转录因子家族表达分析
2020年5月,于新疆维吾尔族自治区呼图壁县采集单叶蔷薇根、茎、叶片、果实和花5种器官,对其进行RNA-seq文库的构建,并利用PacBio测序平台对构建的cDNA文库进行测序(由武汉菲沙基因公司负责完成),测序获得的Raw date尚未公布。以RNA-seq数据为基础,以lb(RPKM+1)作为表达量值,通过TBtools软件[27]绘制热图,分析单叶蔷薇bZIPs在不同器官中的表达谱。另外,根据差异显著性分析结果,分析单叶蔷薇12个bZIPs在5种器官中的特异性表达情况。
2 结果与分析
2.1 单叶蔷薇bZIP转录因子家族的鉴定与特征分析
单叶蔷薇bZIP转录因子家族基本信息见表1。
表1 单叶蔷薇bZIP转录因子家族基本信息Table 1 Basic information of bZIP transcription factor family in R. persica
通过使用HMMER分析以及NCBI CDD数据库验证,共鉴定了50个bZIP转录因子家族成员(表1)。bZIP蛋白理化特性分析结果表明,蛋白质长度为149~700 个氨基酸,分子质量为17.14~75.47 ku,等电点为4.42~10.72。WoLF PSORT预测结果显示,除Rbe021699定位在内质网膜上外,其余49个bZIP蛋白皆定位在细胞核。
2.2 单叶蔷薇bZIP转录因子家族系统发育分析
为了探索bZIP转录因子家族的进化关系和分类,使用来自单叶蔷薇和拟南芥的bZIP成员氨基酸序列构建系统发育树,结果见图1。根据之前在拟南芥中的研究,将单叶蔷薇bZIP蛋白分为12亚族(图1)。在Dröge-Laser等[1]研究的进化树中,ATbZIP72单独组成M亚族,但是在单叶蔷薇与拟南芥共同构建的进化树中,ATbZIP72被分入E亚族中。不同亚族单叶蔷薇的基因数目不同,最大的S亚族和A亚族具有9个成员。J亚族不含单叶蔷薇bZIP蛋白,推测这些蛋白质在单叶蔷薇进化过程中丢失。
2.3 单叶蔷薇bZIP转录因子家族保守序列、基因结构与启动子分析
单叶蔷薇bZIP转录因子家族的基序分布和基因结构分析结果见图2。在10个保守基序中(图2-A),所有的单叶蔷薇bZIP蛋白都包含基序1。同一亚族中的bZIP蛋白序列具有相似的保守基序构成,例如,基序5和9只存在于A亚族,基序8只存在于F亚族,基序2和3只存在于D亚族,且基序2属于DOG1结构域。bZIP转录因子具有不同的功能,这些基序可能发挥特定的功能。
为了探索单叶蔷薇bZIP转录因子家族的基因结构,分析每个成员的内含子/外显子结构,结果(图2-B)表明,同一亚族的成员具有相似的基因结构,而不同亚族间结构差异较大。单叶蔷薇bZIPs包含1~15个外显子,在S亚族的9个成员中,有7个没有内含子;Ⅰ亚族均含有4个外显子。同一亚族中bZIP成员的保守基序组成和基因结构相似,支持了进化树和亚族分类的可靠性。
为了进一步研究单叶蔷薇bZIP转录因子家族基因在非生物胁迫响应中的潜在机制,对其启动子进行顺式作用元件预测。如图3所示,分析了5个与非生物胁迫有关的顺式作用元件,分别是ABA响应元件(ABRE)、干旱诱导响应元件(MBS)、低温响应元件(LTR)、防御和应激反应元件(TC-rich repeats)及创伤响应元件(WUN-motif)[18]。除Rbe014240和Rbe021919不含此5个元件外,其余bZIPs的启动子含有1~15个与非生物胁迫有关的顺式作用元件,其中Rbe006639最多(15个),而Rbe002638、Rbe004377、Rbe020114、Rbe025658仅含有1个。有38个单叶蔷薇bZIPs(76%)的启动子含有ABRE元件,表明单叶蔷薇bZIP可能对ABA有较强响应;25个单叶蔷薇bZIPs(50%)的启动子含有LTR元件和MBS响应元件,24个(48%)具有WUN-motif响应元件,17个单叶蔷薇bZIPs(34%)的启动子具有TC-rich repeats响应元件,推测单叶蔷薇bZIP转录因子家族基因能够响应不同非生物胁迫。
2.4 单叶蔷薇bZIP转录因子家族基因的染色体定位和共线性分析
染色体定位结果(图4)显示,除Rbe029759未被锚定在染色体上外,其余49个单叶蔷薇bZIPs在7条染色体上分布不均,染色体上的bZIPs数目与染色体大小无关,最大的5号染色体包含6个基因,6号染色体包含14个bZIPs。使用BLASTp和MCScanX分析了转录因子家族基因中的重复事件,仅发现一对串联重复事件(Rbe002635和Rbe002636)。此外,共鉴定出7个基因对(图5),这些基因对属于片段重复事件,发生在7条染色体中的6条上,其中有3对属于S亚族,其他4对分属A、C、I、E亚族。
2.5 单叶蔷薇bZIP转录因子家族基因的表达分析
通过单叶蔷薇的RNA-seq数据,分析单叶蔷薇bZIP转录因子家族基因在根、茎、叶、花、果实中的表达谱(图6)。由图 6可知,在5个器官中未检测到Rbe018776的表达,D亚族和E亚族成员整体表达量较低,Rbe010493、Rbe014412、Rbe006220在5个器官中表达量都较高。根据差异显著性分析的结果(图7),某些基因在特定器官中高度表达,Rbe013649在花中特异性表达,Rbe006639和Rbe028637在根中特异性表达,Rbe004215、Rbe028400、Rbe002636、Rbe002635在果实中特异性表达,Rbe011331在叶片中特异性表达。
3 讨 论
随着高通量测序技术的快速发展,许多物种完成了全基因组测序,为功能基因的筛选奠定了基础。研究[12,30]表明,bZIP转录因子家族基因参与植物生长发育的多种生物学和生理过程,以及对生物/非生物胁迫的响应。通过对单叶蔷薇bZIP转录因子家族进行分析,可为研究该家族在单叶蔷薇生长发育中的作用提供依据。
本研究共鉴定出50个单叶蔷薇bZIP转录因子,与草莓(Fragariavesca,50个)[31]、桃(Prunuspersica,50个)[32]的bZIP转录因子家族数量相似,但明显少于苹果(Malusdomestica,114)的数量[5],可能是由于苹果基因组发生了全基因组复制事件而导致了bZIP转录因子家族的剧烈扩增[33]。将单叶蔷薇bZIPs和已知的拟南芥bZIPs共同构建系统进化树,并按前人研究[1]分为12亚族。在前人构建的拟南芥bZIP转录因子家族进化树中,ATbZIP72单独组成M亚族,但是在本进化树中ATbZIP72被分入E亚族中,可能是建树模型不同所致。
同一亚族中bZIP成员的基因结构和蛋白保守基序组成相似,支持了进化树和亚族分类的可靠性。在50个单叶蔷薇bZIPs中,有9个(18%)成员没有内含子,与草莓(20%)[31]、苹果(20%)[34]的比例相似。此外,bZIP转录因子具有不同的功能,不同的基序可能发挥特定的功能。对预测的保守基序进行分析,结果显示基序2属于DOG1结构域,与种子的休眠调控有关[35],其他基序没有具体的注释信息,功能有待阐明。
基因的串联重复和片段重复对于基因家族基因的产生具有重要的作用。单叶蔷薇bZIP转录因子家族重复基因对中的2个基因均分布于一个亚族中,且具有相似的外显子数量和长度,表明片段或串联重复扩大了bZIP 转录因子家族。片段重复事件在bZIP转录因子家族扩张中的贡献大于串联重复事件[36],在毛白杨[36]、桃[32]的 bZIP转录因子家族基因中分别有72.1%和48%为片段重复基因。本研究在单叶蔷薇5号染色体上发现一对串联重复基因Rbe002635和Rbe002636,这2个基因均属于A亚族,基因的结构和基序的组成均极其相似;此外,发现7对共线性基因对,片段重复基因约占所有单叶蔷薇bZIPs的28%,在单叶蔷薇中片段重复事件数大于串联重复事件,但是与前人的研究相比所占比率较小。
基因的组织表达特征与其功能紧密相关。本研究发现,单叶蔷薇有3个bZIPs(Rbe010493、Rbe014412、Rbe006220)在5种器官中均高表达,推测其在单叶蔷薇的生长发育过程中发挥广泛作用。此外,某些基因在组织中特异性表达,这些基因可能参与单叶蔷薇相关器官的发育。Rbe013649在花中特异性表达,且相对表达量较高(2 803.08),属于H亚族,在进化树中与AtbZIP56(HY5)分于同一小支。研究发现,大部分调控花青素生物合成的基因和转录因子受HY5控制[37]。在拟南芥中,HY5不仅能直接调节CHS、F3H和F3′H等花青素结构基因的表达[38],还可以与MYB等转录因子的启动子结合,间接调控花青素相关基因的表达[39]。由此推测,Rbe013649可能调控单叶蔷薇中花青素的合成。此外,干旱胁迫下,根系的形态结构是植物生长发育水平和适应外界环境能力的直接体现[40]。Rbe006639在根中特异性表达,且启动子中含有15个与非生物胁迫有关的顺式作用元件,可能在单叶蔷薇抗旱过程中起重要作用。
4 结 论
从单叶蔷薇基因组数据库中鉴定出50个单叶蔷薇bZIPs转录因子基因,分为12亚族,其中D亚族特有的基序 2属于DOG1结构域,与种子的休眠调控有关,该亚族可能具有相关功能。单叶蔷薇bZIP转录因子家族基因的启动子含有1~15个与非生物胁迫有关的顺式作用元件,表明单叶蔷薇bZIP转录因子家族可能响应不同的胁迫。检测到49个bZIP转录因子家族基因的表达,其中Rbe013649在花中相对表达量较高(2 803.08),可能调控单叶蔷薇中花青素的合成;Rbe006639在根中特异性表达,且含有最多的与非生物胁迫有关的顺式作用元件,可能在单叶蔷薇抗旱过程中起重要作用。