小麦AP2/ERF转录因子家族生物信息学分析
2022-10-15卞云迪王雪晴杨晨晓王光钰刘晓颖王振英
卞云迪,张 驰,王雪晴,杨晨晓,王光钰,刘晓颖,王 颖,方 芳,王振英
(1.天津师范大学生命科学学院,天津 300387;2.天津市动植物抗性重点实验室,天津 300387;3.天津市宝坻区林业发展服务中心,天津 301899)
植物在适应各种逆境胁迫的过程中进化出了复杂的调控网络系统[1],其中,转录因子可以通过识别不同的顺式作用元件来调控下游一系列相关基因的表达,进而提高植物的抗逆性[2].APETALA2/乙烯响应因子(APETALA2/ethylene-responsive factor,AP2/ERF)是植物特有的转录因子,一般包含一个或多个AP2保守结构域[3],该家族在植物的生长发育、生物和非生物逆境响应等过程中发挥了极其关键的调控作用[4-7].AP2/ERF超家族可以分为DREB(dehydration-responsive element binding protein)、ERF(ethylene-responsive element binding factors)、AP2(AP-ETALA 2)、RAV(related to ABI3/VP1)以及Soloist 5个亚族[8].随着测序技术的发展,在多种植物中鉴定出了AP2/ERF家族成员[9-13].小麦基因组约为16 Gb,重复序列达85%.目前,高质量的中国春小麦基因组序列已释放(http://www.wheat genome.org/)[14],但关于小麦TaAP2/ERF转录因子家族生物信息学方面的研究报道相对较少.本研究利用小麦全基因组数据库信息,在全基因组范围内鉴定小麦AP2/ERF转录因子家族成员,分析该家族成员的基因结构、顺式作用元件及其可能调控的下游基因,为小麦转录因子的功能研究和利用提供参考.
1 材料与方法
1.1 TaAP2/ERF基因家族成员鉴定与序列特征分析
从Ensembl Plants数据库(http://plants.ensembl.org/index.html)下载小麦的全基因组数据、开放阅读框、染色体定位信息等.从Pfam数据库(http://pfam.xfam.org)下载AP2/ERF基因特有的保守结构域模型(PF09425和PF06200),利用该模型在小麦蛋白数据库Blastp中进行比对,得到候选基因,将其提交到Hmmer、NCBI-CDD等在线网站进行保守域的结构分析,最终得到TaAP2/ERF基因.利用在线工具ExPASy(http://web.expasy.org/protparam/)预测TaAP2/ERF基因编码蛋白的等电点(pI)、相对分子质量、氨基酸长度和染色体定位信息等属性,利用CELLO V.2.5(http://cello.life.nctu.edu.tw/)在线网站进行亚细胞定位分析.
1.2 TaAP2/ERF基因家族成员保守motif和基因结构预测
利用在线数据库MEME(http://meme-suite.org/)预测TaAP2/ERF基因家族成员的保守结构域.按照WebLogo(http://weblogo.berkeley.edu/)默认设置获取序列标识进行基因结构分析.
1.3 顺式作用元件分析作图
选取TaAP2/ERF基因上游1 500 bp基因序列,利用PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行启动子的顺式作用元件分析.把具有类似功能的启动子元件归为一类,再用TBtools软件汇总归类.
1.4 TaAP2/ERF家族基因表达分析
利用在线数据库expVIP(http://www.wheat-expression.com/)分析TaAP2/ERF家族各基因的表达量,分析基因在不同生物/非生物胁迫下的表达水平,绘制基因表达热图.
2 结果与分析
2.1 TaAP2/ERF基因家族成员的理化性质
以小麦全基因组数据为基础,共鉴定出74个TaAP2/ERF基因,根据基因的同源关系进行命名.利用ExPASY网站分析TaAP2/ERF基因编码蛋白质的基本理化性质,具体如表1所示.预测TaAP2/ERF基因家族编码蛋白质在180~484个氨基酸之间,相对分子质量为18.77×103~51.07×103,等电点为4.62~10.79.TaAP2/ERF家族编码的氨基酸多数为酸性,其中47个蛋白的等电点小于7,偏酸性;其余27个蛋白的等电点大于7,偏碱性.利用CELLO在线预测亚细胞定位,发现53个TaAP2/ERF蛋白定位在细胞核中,这与多数转录因子的报道相一致;而定位在其他部位的蛋白则需通过实验确定其功能.
表1 小麦AP2/ERF转录因子家族基因的基本信息Tab.1 Basic information of AP2/ERF transcription family genes in wheat
续表
2.2 TaAP2/ERF基因家族成员的保守motif和基因结构特征
对小麦的74个TaAP2/ERF蛋白序列进行分析,结果如图1所示.TaAP2/ERF基因家族共有10个保守基序,利用TBtools软件结合进化树对得到的结果进行可视化分析(图1(b)),结果发现,鉴定出的TaAP2/ERF蛋白中保守基序的数量和类型略有不同.所有蛋白均含有Motif1和Motif3,这2个结构共同组成了较为保守的AP2/ERF结构域,大多数的保守结构域位于蛋白N端,表明这些Motif对于TaAP2/ERF蛋白行使功能特别重要.相邻蛋白之间的Motif分布虽然有较高相似性,但在保守基序的种类、数量以及分布上存在差异,暗示TaAP2/ERF家族蛋白各亚家族成员之间可能存在功能上的分化,而保守基序的功能尚待研究.
图1 小麦TaAP2/ERF基因的系统进化、保守结构域和基因结构Fig.1 Phylogenetic evolution of TaAP2/ERF genes,conservative structure domain and genetic structure
对TaAP2/ERF家族成员结构进行分析,绘制基因结构示意图,如图1(c)所示.在鉴定到的74个TaAP2/ERF基因中,外显子数量从0到4个不等,内含子数量从0到10个不等.少数家族成员含有多个内含子插入,如AP2-B含有10个外显子和9个内含子;CBF亚家族成员没有内含子,如CBF-5C、CBF-2A、CBF11等.由此可见,不同分类群间内含子的数量差异较大,相同亚族中内含子数量的差异较小,即具有相似的结构,如ERF061-like、ERF071-like等.TaAP2/ERF成员之间的内含子长度、外显子位置和数目存在差异,说明小麦TaAP2/ERF家族在进化过程中产生了较强的分化,可能也是导致其成员功能不同的原因之一.
2.3 TaAP2/ERF基因家族成员的顺式响应元件分类特点
选取小麦TaAP2/ERF基因上游1 500 bp的基因组序列,分析小麦TaAP2/ERF基因的顺式作用元件,整理出与激素和非生物胁迫相关的顺式作用元件,结果如图2所示.
图2 小麦TaAP2/ERF基因的激素和非生物胁迫响应相关的顺式作用元件分析Fig.2 Analysis of cis-acting elements related to hormone and abiotic stress response of wheat TaAP2/ERF genes
由图2可知,TaAP2/ERF启动子区域包含多种应答元件,包括光、干旱、激素等逆境相关的应答元件.另外,还发现了厌氧诱导、创伤响应、昼夜节律调控、细胞周期调控、低温响应的应答元件.其中,光应答元件分布在所有TaAP2/ERF基因家族成员中,推测光在诱导TaAP2/ERF表达调控中可能发挥着重要作用.激素响应元件分布也较为广泛,如48.64%的家族成员启动子序列中存在生长素响应元件,44.59%存在赤霉素响应元件,83.78%存在茉莉酸甲酯响应元件,91.89%存在脱落酸响应元件,这说明激素与TaAP2/ERF的表达有密切关系.与非生物逆境胁迫相关的元件有3种,如83.78%的家族成员具有厌氧诱导响应元件,48.64%的家族成员含有干旱诱导的响应元件,43.24%的家族成员含有低温响应元件.除鉴定到参与干旱、厌氧、低温等逆境损伤的应答元件外,还鉴定到了参与创伤的响应元件(CBF2A、CBFIIId-16.1)、参与昼夜节律调控的响应元件(ERFVII.2-2B、CBFIIId-B19、CBFIVd-26.1、CBFII-5.1b、CBF5).这 些 结 果 表 明,TaAP2/ERF基因可能在植物光合作用、逆境胁迫响应以及激素调控途径中发挥了重要作用.
2.4 TaAP2/ERF家族基因在不同发育时期和生长条件下的表达分析
利用expVIP数据库分析TaAP2/ERF家族各基因的表达,部分基因的热图分析如图3所示.
图3 小麦部分TaAP2/ERF基因的热图分析Fig.3 Heat map analysis of partial TaAP2/ERF genes of wheat
由图3可以看出,不同生长发育时期和生长条件下,各基因的表达水平呈现多样化:ERFL2c、ERFL2a、ERFL1c和ERFL1a基因在所有条件下均保持较高表达水平;CBFIVa-25.3等16个基因在所有条件下均未检测到表达;CBFIVd-D9等16个基因在生物或非生物胁迫下的表达量呈现波动,其中,AP2-S、CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1响应非生物胁迫的基因在小麦叶片和根中表达上调,CBFIVb-D21和CBF2基因在病原菌侵染后的幼苗期叶片中平均表达量下调,营养生长期平均表达量上调.虽然不同生长时期的CBFIVb-D21和CBF2基因表达模式不同,但二者均能够对病原菌侵染做出响应.
3 讨论与结论
随着水稻、玉米、小麦等重要农作物基因组数据的释放,利用生物信息学技术分析基因家族序列的特征和进化关系,为作物基因功能的研究提供了很多帮助[15-16].AP2/ERF转录因子通常参与植物生长发育、细胞周期调控及逆境胁迫响应等重要生物过程[17].本研究对小麦基因组中的TaAP2/ERF转录因子进行了全基因组鉴定,对家族成员进行了系统的生物信息学分析.以中国春小麦基因组信息为基础,共鉴定到74个小麦TaAP2/ERF转录因子基因,不规则分布在1~7染色体上.与多数转录因子的亚细胞定位情况一样,大部分TaAP2/ERF蛋白位于细胞核内,少部分存在于叶绿体、细胞质和细胞膜,表明TaAP2/ERF蛋白的多个成员可能在小麦的生长发育过程中行使不同功能.TaAP2/ERF蛋白的等电点范围为4.62~10.79,超过63%的TaAP2/ERF蛋白为酸性蛋白.进化分析结果表明,TaAP2/ERF转录因子家族保守基序较多且较为复杂,基因结构相似的转录因子亲缘关系相近,如CBFIIIc-B10和CBFIIId-D19、ERFL1a和ERFL2a、AP2-B和AP2-S等.TaAP2/ERF转录因子的顺式作用元件分析结果表明,所有TaAP2/ERF基因家族成员的启动子区均含有光响应元件和不同的激素响应元件(如赤霉素和生长素顺式作用元件[18-19])、非生物胁迫响应顺式作用元件(如干旱胁迫和低温胁迫响应元件等[20]).这说明TaAP2/ERF家族基因通过自身顺式作用元件的差异响应小麦的多个生长发育过程.进一步分析TaAP2/ERF家族基因在生物和非生物胁迫下的表达量变化,结果发现,AP2-S、CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1在非生物胁迫下发生特异表达,且CBFIIId-B19、CBFIIId-D19和CBFIIId-24.1这3个基因结构相同,推测CBFIIId亚家族基因可能在小麦响应非生物胁迫的过程中发挥了重要作用;CBFIVb-D21和CBF2为病原菌侵染后的特异表达基因,基因结构相似度也很高.因此,可将这些基因作为后续研究的切入点,分析TaAP2/ERF在小麦响应生物和非生物胁迫中的功能.
综上所述,本研究利用多个生物学网站和软件系统,分析了小麦TaAP2/ERF基因家族的定位、基因结构、顺式作用元件以及表达模式,筛选获得6个在生物胁迫或非生物胁迫下特异表达的基因作为备选基因,为后续研究基因功能及其在小麦生长发育和胁迫应答过程中的调控机制提供参考.