大豆胞囊线虫病抗性相关AP2/EREBP转录因子生物信息学分析
2020-09-10韩英鹏卜凡珊田利峥姜海鹏
韩英鹏,卜凡珊,田利峥,姜海鹏,赵 雪
(东北农业大学大豆研究所,大豆生物学教育部重点实验室,农业农村部东北大豆生物学与遗传育种重点实验室,哈尔滨 150030)
大豆胞囊线虫病(Soybean cyst nematode,SCN,Heterodera glycines Ichinohe)是世界范围大豆寄生性病害[1-2],因其不同种群存在致病力差异而被分为不同生理小种,我国以致病小种1号、3号、4号为主,其中3号生理小种是东北大豆产区优势生理小种[3]。目前选育优良抗性品种是控制SCN发生最经济、有效方法,因此筛选抗病候选基因分子辅助育种具有重要意义[4]。
转录组测序技术(RNA-Seq)已在大豆胞囊线虫基因资源挖掘方面得到广泛应用[5]。吴书峰等以抗SCN 4号生理小种黑豆为研究对象,在大豆胞囊线虫侵染后两个发育时期作转录组测序,分别获得2 180个和4 210个差异表达基因[6]。Li等通过转录组表达谱分析发现感染SCN 3号生理小种后大豆根系基因表达量显著上调或下调[7]。
AP2/EREBP为参与植物生长发育,调控细胞周期及应对逆境胁迫的一类植物中特有的转录因子超家族[8],Shigyo等将其又划分为AP2、DREB、RAV、ERF和Soloist等5个亚家族,AP2亚家族(APETALA2)含有两个重复的AP2/ERF结构域[9]。RAV亚家族(ABI3/VP1)包含一个AP2/ERF结构域和一个B3结构域,可识别CAACA和CACCTG序列[10-11]。DREB亚家族(脱水反应元件结合蛋白)和ERF亚家族(乙烯反应因子)包含一个AP2/ERF结构域,两个亚家族主要区别为ERF亚家族AP2结构域第14位和第19位氨基酸残基为丙氨酸和天冬氨酸,而DREB亚家族为缬氨酸和谷氨酸,其中缬氨酸在DNA结合特异性中发挥重要作用[12]。
随着大豆抗病遗传育种研究不断深入,相关AP2/EREBP基因家族研究也逐渐深化。AP2/ERF家族中GmERF057与大豆耐盐性和抗病性相关[13],GmRAV可能作为一种负调节因子作用于光合作用和植物生长[14]。Mazarei等在大豆中依次分离出4个CBF/DREB同源基因[15],但其与SCN作用机制尚不清楚,有待验证。
本研究利用转录组测序技术筛选大豆胞囊线虫病3号生理小种抗性相关AP2/EREBP家族转录因子,并对其作生物信息学分析,为进一步研究大豆胞囊线虫病相关AP2/EREBP转录因子调控机制奠定基础,进而为选育抗SCN品种提供基因资源和理论依据。
1 材料与方法
1.1 材料
大豆材料“东农L-10”来源于东北农业大学大豆生物学教育部重点实验室,大豆胞囊线虫病3号生理小种采集自东北农业大学大豆研究所试验田,已鉴定其抗病性。
1.2 方法
1.2.1 转录组测序材料准备
将东农L-10材料种植于蛭石中,每行10株,设置对照,3次重复,在室温24℃,光照16 h,黑暗8 h条件下培养。待大豆种子长成幼苗后,转移至病土中培养。
1.2.2 转录组测序
线虫侵染0和8 d后,取大豆根组织,迅速液氮处理,然后利用Trizol Reagene(Invitrogen,Carlsbad)提取总RNA,保存于-80℃冰箱备用。利用Illumina TruSeq RNA样品制备试剂盒构建cDNA文库,Illumina HiSeqTM2500 cDNA测序。在测序结果中筛选大豆胞囊线虫病3号生理小种在东农L-10大豆胁迫条件下差异表达的AP2/EREBP转录因子。
1.2.3 蛋白质理化性质分析
大豆胞囊线虫病3号生理小种相关AP2/EREBP转录因子信息下载于NCBI(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。通过在线软件ExPASy-ProtParam tool(https://web.expasy.org/protparam/)分析大豆胞囊线虫病AP2/EREBP家族转录因子氨基酸残基数、分子质量、脂肪系数、等电点和蛋白质疏水性等理化性质。
1.2.4 AP2/EREBP保守结构域分析
通过在线软件TAIR(https://www.arabidopsis.org/browse/genefamily/index.jsp)下载拟南芥全基因组AP2/EREBP转录因子信息。利用MEGA 5.05软件将候选大豆胞囊线虫与拟南芥AP2/EREBP家族蛋白作多序列比对,通过GeneDoc软件分析大豆胞囊线虫AP2/EREBP转录因子蛋白保守域和结构元件。
1.2.5 构建系谱进化树
利用上述氨基酸序列比对结果,通过MEGA 5.05软件绘制系谱进化树。
1.2.6 亚细胞定位
利用WoLF PSORT:Protein Subcellular Localization Prediction(https://wolf psort.hgc.jp/)在线工具对14个AP2/EREBP作蛋白质亚细胞定位预测。
1.2.7 蛋白质结构预测
利 用 SOPMA(https://npsa-prabi.ibcp.fr/npsa_sopma.html)分析AP2/EREBP转录因子家族蛋白质二级结构,且通过SWISS-MODEL(https://www.swissmodel.expasy.org)预测其蛋白质三级结构。
2 结果与分析
2.1 差异表达AP2/EREBP转录因子分析
通过转录组测序结果筛选出14个差异表达AP2/EREBP转录因子,利用NCBI鉴定AP2/EREBP转录因子结构,确定有无AP2结构域,再根据结构特点,初步筛选并分类AP2/EREBP转录因子,结果见表1。
2.2 AP2/EREBP转录因子蛋白质理化性质分析
通过在线软件Protparam分析大豆胞囊线虫AP2/EREBP家族转录因子蛋白质理化性质。结果表明,AP2亚族蛋白质氨基酸残基数195~488,ERF亚族为122~408,DREB亚族为333~352;AP2亚族中AP2-1和AP2-3蛋白质等电点呈碱性,AP2-2和AP2-4蛋白质等电点呈酸性;ERF亚族中除ERF-4和ERF-6蛋白中等电点呈碱性,其余均呈酸性;DREB亚族中DREB-1和DREB-2蛋白质等电点分别为8.23和5.71,分别呈酸性和碱性。总体上看,蛋白质等电点在酸性范围内转录因子数量多于碱性范围,大豆胞囊线虫AP2/EREBP转录因子家族蛋白富含酸性氨基酸,且全部家族蛋白质总平均亲水性GRAVY均为负值,表明均属于亲水性蛋白,且热稳定性较高(见表1)。
表1 AP2/EREBP转录因子家族蛋白理化性质Table 1 Physicochemical properties of AP2/EREBP transcription factor family
2.3 AP2/EREBP转录因子保守结构域分析
通过在线软件MEGA 5.05和GeneDoc对大豆胞囊线虫14个AP2/EREBP转录因子和拟南芥结构域作序列比对。结果表明,两者存在差异,但以YRG元件、RAYD元件、WLG基序为核心的保守结构域保守性高(见图1)。序列ERF-2和DREB-1含有FIG元件,序列ERF-8和DREB-2含有FRG元件,除此之外大部分序列均含有YRG元件;序列AP2-3、ERF-2、ERF-4、ERF-6和DREB-2均含有LAYD元件,序列AP2-2和AP2-4均含有TAYD元件,序列ERF-1、ERF-3和ERF-8分别含有MAYD、AAYD、IVYD元件,仅序列AP2-1、ERF-5、ERF-7和DREB-1含有RAYD元件;ERF-6序列保守结构域与拟南芥ERF-B3-AT3G32400、ERF-B6-AT4G27960序列保守结构域内第14位及第19位分别为丙氨酸和天冬氨酸,可推测上述序列属于ERF亚族。其中DREB-1保守结构域14位为缬氨酸,第19位为天冬氨酸,而拟南芥DREBA2-AT3G11020第19位为谷氨酸,两者存在显著差异(见图1)。
2.4 AP2/EREBP转录因子家族系谱进化分析
利用拟南芥数据库筛选45个拟南芥AP2/EREBP序列,包括AP2、ERF、DREB、RVA以及Soloist 5个亚族,其中ERF亚族又可分为B1、B2、B3、B4、B5和B6共6个亚组,DREB分为A1、A2、A3、A4、A5和A6共6个亚组。利用MAGA 5.05软件构建系谱进化树(见图2)。结果表明,大豆胞囊线虫AP2/EREBP转录因子分别分布在AP2、ERF和DREB亚族中。AP2亚族包含4个转录因子分别为AP2-1、AP2-2、AP2-3和AP2-4;ERF亚家族转录因子分别与ERF-B5-AT4G23750、ERF-B3-AT4G34410和ERF-B3-AT3G23240处于同一分支,表明大豆胞囊线虫ERF亚族分属于B3、B5亚类;DREB亚族中DREB-1和DREB-2均与DREB-A2-AT3G11020和DREB-A5-AT1G46768距离较近,说明其同源性高,进一步验证上述初步分类结果。大豆胞囊线虫与拟南芥AP2/EREBP转录因子氨基酸序列之间存在差异,但其家族蛋白分类与拟南芥AP2/EREBP各亚族分类相似,遗传路径相同。
2.5 亚细胞定位
通过对AP2/EREBP蛋白质亚细胞定位预测(见表2),结果显示AP2-1和ERF-2定位于线粒体中,DREB-1定位于叶绿体中,其余11个AP2/EREBP转录因子均定位于细胞核中,说明植物在受到逆境胁迫,尤其是遭遇大豆胞囊线虫病时,AP2/EREBP转录因子家族发挥重要作用的位置可能为细胞核,其次为线粒体,最后为叶绿体。
表2 AP2/EREBP基因家族亚细胞定位预测Table 2 Prediction of subcellular location of AP2/EREBP gene family
2.6 蛋白质结构预测
2.6.1 蛋白质二级结构预测
利用SOPMA分析大豆胞囊线虫AP2/EREBP蛋白质二级结构(见图3),结果显示氨基酸序列以无规则卷曲为主要组成成分,α-螺旋次之,β-折叠和β-转角则散布于蛋白序列中。
2.6.2 蛋白质三级结构预测
在3个亚家族中选取代表性序列,利用SWISSMODEL预测蛋白质三级结构,AP2、ERF和DREB分别以AP2-3、ERF-1和DREB-1为代表,与拟南芥蛋白质三级结构预测模型比对,AP2亚族有两个相同AP2结构域,而ERF和DREB亚族含1个AP2结构域。结果表明,大豆胞囊线虫AP2/EREBP家族蛋白质三级结构预测模型与拟南芥接近(见图4)。
3 讨 论
转录因子在植物生长发育、形态建成、次生代谢、抗逆性等方面发挥重要调控作用。自Paz-Ares首次克隆玉米转录因子以来,相继分离出数百种与植物生物胁迫和非生物胁迫相关转录因子[16]。其中AP2/EREBP家族作为植物最大转录因子家族之一,其转录因子家族成员全基因组发掘及鉴定已在拟南芥[17]、烟草[18]、水稻[19]等多种植物中开展,但在大豆(Glycine max L.)中缺少相关报道。本文通过转录组测序技术在大豆品种东农L-10中鉴定出14个与大豆胞囊线虫病3号生理小种抗性相关的AP2/EREBP转录因子,并分析其相关生物信息学。
目前转录因子研究倾向于亚族及亚类分析。AP2亚家族具有调控花、胚珠和种子发育的功能,在拟南芥花分生组织建立和花同源性基因表达调控中,AP2结构发挥核心作用[20]。ERF和DREB两类亚家族可调节乙烯、ABA等植物激素,干旱、高盐、低温等非生物逆境胁迫应答反应[21]。位于同一亚族基因可能具有相同或相似功能,小麦bZIP转录因子家族AtbZIP44基因受低温诱导表达,与其所属S家族功能一致[22]。构建系谱进化树结果表明,AP2/EREBP转录因子家族聚集在AP2、ERF和DREB亚族附近,ERF和DREB亚族转录因子又分布在B3、B5、A2和A5亚类分支上,位于同一分支上的转录因子结构及功能虽有差异但存在高度保守性,可推测上述转录因子不仅参与花形态构建,且与植物非生物逆境胁迫密切相关。其中AP2-3处于拟南芥AP2亚族一个分支,但未与任何转录因子聚于一簇,Giri等发现拟南芥AP2/EREBP类转录因子家族At4g13040基因与其他成员亲缘关系较远,但可增强对病原菌抗性,所以AP2-3可能是AP2亚族特有的一类转录因子,且可提高SCN抗性[23]。
多序列比对结果表明,大豆胞囊线虫病3号生理小种AP2/EREBP结构域与拟南芥高度保守,均含有YRG元件、RAYD元件和WLG基序,相较于拟南芥,个别SCN转录因子碱基发生变化,Zhang等在红豆杉AP2/EREBP转录因子中发现同样高度保守的元件[24]。DREB-1序列第14位为缬氨酸,第19位为天冬氨酸,与拟南芥不同,Qin等发现玉米maDREB1蛋白第19位谷氨酸突变为天冬氨酸后转录功能受到影响[25],由此推测DREB-1可能参与DNA合成,且转录激活能力发生改变。
AP2/EREBP亚细胞定位预测结果表明,11个AP2/EREBP蛋白定位于细胞核中,表明AP2/EREBP转录因子调控大豆胞囊线虫3号生理小种抗性的主要位置是细胞核;理化性质分析表明该家族蛋白质均为亲水性蛋白,且多数为酸性蛋白。蛋白质二级结构分析表明,氨基酸序列以无规则卷曲为主要组成成分,α-螺旋次之,β-折叠和β-转角则散布于蛋白序列中。选取代表性AP2/EREBP 3个亚族序列构建三级结构预测模型,且与拟南芥蛋白质三级结构预测模型比对,发现不同亚族之间蛋白质三级结构具有较大差异,而同一亚族之间无差异或者差异可忽略,与查英等对艾纳香AP2/EREBP转录因子家族蛋白三级结构预测结果一致[26],蛋白质高级结构越接近,其生理功能越相似。
综上所述,亲缘关系相近蛋白质,其转录因子可能具有相同或相似结构域,发挥相同或相似生物学功能。因此本研究参考拟南芥AP2/EREBP转录因子家族,对大豆胞囊线虫3号生理小种AP2/EREBP转录因子作结构分析及功能预测,为AP2/EREBP基因家族挖掘和功能研究及培育大豆胞囊线虫抗性品种提供理论依据。
4 结 论
利用抗线品种东农L-10在大豆胞囊线虫病3号生理小种胁迫下转录组数据,筛选出14个与大豆胞囊线虫病3号生理小种相关AP2/EREBP转录因子,14个转录因子之间理化性质存在差异,但均为亲水性蛋白;14个转录因子聚集在AP2、ERF和DREB亚族附近,且属于B3、B5、A2、A5亚类,其中AP2-3是AP2亚族特有的一类转录因子,功能有待验证;14个转录蛋白均具有高度保守YRG元件、RAYD元件和WLG基序,DREB-1氨基酸序列第14位和第19位分别为缬氨酸和天冬氨酸,与拟南芥不同;11个AP2/EREBP转录因子定位于细胞核,2个定位于线粒体,1个定位于叶绿体;蛋白质二级结构含有无规则卷曲,α-螺旋,β-折叠和β-转角等4种成分,但以无规则卷曲为主;同一亚族AP2/EREBP转录蛋白三级结构与拟南芥相似,预示其功能相似性。