野生二粒小麦NBS-LRR类抗病基因家族的鉴定及其表达分析
2021-09-23聂小军宋卫宁
李 爽,高 英,杨 光,聂小军,宋卫宁
(西北农林科技大学农学院,陕西杨凌 712100)
在漫长的进化过程中,植物形成了一系列复杂的防御机制来抵抗环境中的真菌、细菌、病毒等病原物[1]。抗病基因(R)可以直接或间接地通过基因和基因之间的相互作用特异性识别病原物,然后产生并传递胁迫信号,引起防御响应,并激活下游通路[2]。因此,R基因在植物免疫系统和防御机制中发挥着至关重要的作用。大部分植物的R蛋白都含有核苷酸结合位点(nucleotide binding site,NBS)和富含亮氨酸的重复序列(leucine rich repeat,LRR),属于NBS-LRR 基因家族。同时,一些R基因蛋白也包含Toll-白细胞介素-1受体结构域(TIR,与果蝇Toll蛋白和哺乳动物白细胞介素-1受体的细胞质结构域同源)、卷曲螺旋(coiled-coil,CC)或亮氨酸链式(leucine zipper,LZ)结构域、跨膜结构域(transmembrane domain,TM)、蛋白激酶结构域(protein kinase domain,PK)等[3]。根据所含结构域的不同,可以将R基因分为两大类: NBS-LRR类和非NBS-LRR类[4]。 NBS-LRR类R基因在植物的R基因中占比最高,主要由高度保守的NBS和LRR两部分组成,同时还含有P-loop、Kinase-2、Kinase-3、GLPL等4个保守结构域。根据N端结构的不同,NBS-LRR基因可以分为TIR类、CC(或LZ)类和non-motif类[5]。前人围绕NBS-LRR类R基因已开展了大量研究,不仅在全基因组水平上对其组成和结构特征进行了分析,而且多个重要的NBS-LRR类R基因已经被成功克隆[6-7]。在小麦基因组中,共鉴定出400多个NBS-LRR类R基因[6],其中,大部分与抗条锈病相关。截止目前,从普通小麦及其近缘种中已成功克隆出9个R基因,其中有6个R基因具有种属特异性抗性[8]。同时,在全基因组水平鉴定和分析NBS-LRR类R基因家族已在多个植物中完成,包括拟南芥、乌拉尔图小麦、向日葵等[9-13]。
野生二粒小麦是普通小麦A、B染色体组的供体,具有抗病、粒大、蛋白质含量高等重要特征,对改良小麦的抗病性具有重要价值。虽然R基因家族在多个植物(包括小麦)中已有大量研究,但是目前有关野生二粒小麦R基因的研究还比较少。野生二粒小麦全基因组的破译为从全基因组水平上鉴定其NBS-LRR类R基因家族提供了可能[14]。因此,本研究拟利用最新发布的野生二粒小麦基因组信息,通过生物信息学分析方法,在全基因组水平上对其R基因进行鉴定,分析其成员间的系统进化关系,并利用RNA-seq数据对其表达特性进行分析,以期为研究野生二粒小麦R基因的系统进化关系及其生物学功能奠定基础,也为利用野生二粒小麦R基因改良小麦抗病性提供一定参考。
1 材料与方法
1.1 试验材料
本试验所用野生二粒小麦品系A9由本实验室保存,白粉菌菌株E09由西北农林科技大学农学院韩德俊教授提供。
1.2 研究方法
1.2.1 野生二粒小麦NBS-LRR类R基因家族的鉴定
从Ensemble数据库(http://plants.ensembl.org/index.html)下载野生二粒小麦的基因组信息及其蛋白序列,构建本地蛋白信息库;然后,下载拟南芥、水稻和普通小麦中已知的R基因序列作为探查序列,使用本地BLASTP程序进行搜索(E值<1e-5,一致性>50%,覆盖度>50%);利用拟南芥和水稻中已鉴定的R基因序列构建HMM模型,使用hmmsearch工具搜索本地蛋白质数据库;将HMMER和BLASTP的结果合并,手工去除冗余后,将得到的序列提交到NCBI Batch CD搜索数据库(http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)和PFAM数据库(http://pfam.xfam.org/)确认结构域的有无及其完整性,只保留具有完整NBS和LRR结构域的基因作为候选R基因;在此基础上,利用NCBI收录的野生二粒小麦EST序列,对候选R基因比对映射,最后保留具有EST序列支持的基因作为最终的野生二粒小麦R基因集,用于下游分析。使用在线数据库ExPASy中的pI/Mw工具(http://web.expasy.org/compute_pi/)计算预测的R蛋白的理论等电点(pI)和分子量(Mw)。
1.2.2 野生二粒小麦NBS-LRR类R基因的系统发育分析及序列特征分析
利用ClustalX工具对鉴定到的NBS-LRR类基因的蛋白序列进行多序列比对;利用MEGA 6.0软件的NJ法(Neighbor-Joining method)构建系统进化树,Bootstrap值设为1 000,其他参数为默认值。从Ensemble植物数据库(http://plants.ensembl.org/index.html)中下载野生二粒小麦的基因组注释信息gtf文件,使用perl脚本提取NBS-LRR类R基因的结构信息,然后提交到Gene Structure Display Server(GSDS)网站(http:/gsds.cbi.pku.edu.cn/)上,构建其内含子-外显子结构示意图;使用MEME软件(http://meme-suite.org)预测这些基因的蛋白结构域和保守基序,预测基序数量设置为15个,其他参数设定为默认值。
1.2.3 野生二粒小麦NBS-LRR类R基因染色体定位及上游顺式作用元件分析
利用Tbtools提取鉴定到的所有NBS-LRR类R基因CDS序列上游的2 000 bp序列,利用PlantCARE在线数据库(http://bioinformatics.psb.ugent.be/webtools/Plantcare/html/)预测其顺式作用元件。
1.2.4 野生二粒小麦NBS-LRR类R基因的表达模式分析
为了初步明确这些NBS-LRR类R基因在不同组织和不同时期中的表达特性,从NCBI SRA数据库下载野生二粒小麦的RNA-seq测序数据(SRA检索序列号为:ERP022006),包括颖片、外稃、根、花(105和112 d)、籽粒(123和134 d)、叶(54和77 d);利用TopHat和Cufflinks软件计算每个基因的FPKM值,然后使用R软件中的heatmap包绘制热图。
1.2.5 野生二粒小麦NBS-LRR类R基因的qRT-PCR分析
随机选择4个野生二粒小麦NL类R基因(TRIDC1BG003060、TRIDC7BG071700、TRIDC- 5BG013030、TRIDC1BG002860)用于验证其在白粉菌侵染下的表达特性,根据其cDNA序列设计引物。将野生二粒小麦品系A9种植于营养钵,并置于23±1 ℃的培养箱中培养,光周期为16 h光照/8 h黑暗;当植物长至两叶一心期时,接种白粉菌菌株E09,以未经处理的幼苗作为对照。在处理后0、6、12、24、48和72 h收集处理及对照条件下的叶片,3次生物学重复,液氮冷冻后存于-80 ℃冰箱,备用;使用Plant RNA Kit试剂盒(Omega Bio-Tek,USA)提取样品的总RNA,用 1.0%的琼脂糖凝胶电泳检查RNA的完整性;利用TaKaRa的PrimeScriptTMRT reagent Kit with gDNA Eraser(Perfect Real Time) 反转录试剂盒和SYBR Premix Ex TaqTMII(Tli RNaseH Plus)荧光定量试剂盒做qRT-PCR分析,每个样品设置3个生物学重复和3个技术重复,具体操作参考Lei等[15]的方法。
2 结果与分析
2.1 野生二粒小麦NBS-LRR类R基因家族的鉴定结果
利用BLASTP和HMMER工具搜索,并结合保守结构域以及EST序列验证,在野生二粒小麦基因组中共鉴定到429个可信度较高的NBS-LRR类R基因,约占总基因数的0.69%。序列特征分析发现,野生二粒小麦NBS-LRR类R基因的蛋白序列长度为303~1 594 aa,蛋白分子量为33.38~177.68 kD,理论等电点为5.12~ 9.34,表明不同成员间具有较大的理化特性差异;进一步对这些基因所包含的保守结构域进行分析,发现66个蛋白只含有NBS结构域,属于N亚家族;205个蛋白包含有CC-NBS-LRR结构域,属于CNL亚家族;76个蛋白具有NBS-LRR结构域,属于NL亚家族;79个蛋白具有CC-NBS结构域,属于CN亚家族;3个蛋白具有RPW8-NBS结构域,属于PN亚家族(表1)。
2.2 野生二粒小麦NBS-LRR类NL亚家族R基因的染色体定位及系统发育分析
鉴于NL亚家族R基因在植物抗病上的主要作用,主要以NL亚家族R基因为对象,进行进一步的分析。结果发现,野生二粒小麦的76个NL亚家族基因在所有染色体上都有分布,其中6B染色体上最多,达到22个,其次为1B、4A和6A染色体;同时,还发现NL亚家族基因在染色体上呈现出成簇存在的特性,推测这可能是由于发生了大量的基因复制造成的。在A和B两个同源染色体组之间,NL基因的数量差异不大,分别有37和39个。
表1 野生二粒小麦以及其他部分植物NBS-LRR类R基因各亚家族成员的数量Table 1 Distribution of the subfamilies of NBS-LRR type R genes in wild emmer wheat and other plant species
为了初步明确野生二粒小麦NL亚家族成员间的系统进化关系,进一步将这76个基因的全长蛋白序列进行多序列比对,并构建系统发育树(图1)。根据系统进化关系,可将这76个NL亚家族基因划分成6类,其中第Ⅰ类基因数目最多,有30个,III类次之,有20个,其余Ⅱ、IV、V和VI类分别有9、5、4和8个。
2.3 野生二粒小麦NL亚家族R基因的蛋白结构域与上游顺式作用元件分析
进一步对这些NL蛋白上的蛋白结构域基序进行预测,结果共预测到20个保守的蛋白结构域(图2),其中基序2、13、15和18最为保守,位于基因的末端;所有的R基因均包含有基序2,基序4在R基因中一般连续重复出现。结合系统进化树,发现在进化树上聚为一类的基因通常也具有相同或相似的保守结构域,推测亲缘关系较近的蛋白可能具有相似的生物学功能。基因结构分析发现,这些NL亚家族基因大部分都包含1~3个内含子,另外,包含的基序越多,它们的基因结构越复杂。
上游顺式作用元件分析结果发现,这些NL亚家族基因启动子序列主要包含响应植物激素、调节植物生长发育和响应生物和非生物胁迫相关的顺式作用元件(图3)。其中,响应植物激素的顺式作用元件种类最多,有9类,包括TATC框(TATC-box)、茉莉酸甲酯响应元件(CGTCA-motif)、水杨酸响应元件(TCA-element)等,并且所有基因均含有响应植物激素的顺式作用元件,除TRIDC3AG061190只包含TCA-element元件外,其余75个基因均含有2个以上的激素响应元件,而且58个NL基因还含有与MeJA合成相关的CGTCA-motif和 TGACG-motif元件;胁迫响应顺式作用元件有5类,包括干旱诱导元件(MBS)、光响应元件(ARE)和逆境防御响应元件(TC-rich)等。说明NL亚家族基因在调节激素、环境胁迫响应和耐受性方面存在广泛的潜在作用。
2.4 野生二粒小麦NL亚家族R基因的表达模式
基于RNA-seq数据对野生二粒小麦NL亚家族R基因的表达特性进行初步分析。结果(图4)表明,部分基因表现出组织特异性,比如TRIDC1BG002710、TRIDC2AG002690、TRID-C2AG004570、TRIDC2 BG086110、TRIDC4AG070-760、TRIDC5BG 004360、TRIDC6BG001800、TRID-C6BG068140、TRIDC6BG073310、TRIDC7AG047320等10个基因都只在105 d的花瓣中表达,且表达量非常高,这说明这几个基因对于花瓣的生长发育有重要作用。另外,在不同的组织中表达基因的数量均有差异,在颖片,外稃,根中分别有31、49和58个基因发生了表达。在花组织中,105 d有65个基因表达,而112 d则只有41个基因表达。在籽粒中,123 d和134 d分别有38和53个基因表达。在叶组织中,54 d和77 d分别有48和52个基因表达。这些结果均表明,NL亚家族R基因在野生二粒小麦中发生了时空表达差异。
2.5 部分NL类R基因表达特性的验证
随机选取4个NL类R基因(TRIDC1BG-003060、TRIDC7BG071700、TRIDC5BG013030和TRIDC1BG002860),对其在白粉菌侵染条件下的表达模式进行验证。结果如表2所示,这4个基因整体上均呈现先下降后上升的表达模式,在接种24 h内它们的表达量都有下降,在接种48 h后其表达量明显上升,其中TRIDC1BG002860在48和72 h时,其表达量分别是对照的4.5和5.8倍。推测其原因可能是这些R基因参与了野生二粒小麦的抗病响应过程。
表2 4个NL亚家族R基因在白粉病侵染不同时间的表达量Table 2 Relative expression level of the four R genes belonging to NL subfamily under Bgt infection at different time
3 讨 论
小麦是我国乃至全世界最重要的粮食作物之一,小麦的持续增产和稳产对保障世界粮食安全具有重要意义[16]。当前,随着全球气候变化,小麦生长过程中面临着诸多挑战(生物胁迫如病虫害,非生物胁迫如干旱胁迫、盐胁迫等)。但由于植物驯化和人工选择的影响,大大限制了现代农作物的遗传多样性,使得栽培小麦对胁迫更加脆弱和敏感。野生二粒小麦是普通栽培小麦的野生近缘祖先种,具有粒大、蛋白含量高、抗病性强、耐逆性好等优异性状,并且野生二粒小麦具有丰富的遗传多样性。加强野生二粒小麦优异性状基因的挖掘与利用对提高小麦抗逆性以应对各类胁迫和逆境具有重要意义,从而保障小麦生产水平和粮食安全[17]。
NBS-LRR类R基因是植物抗病机制中具有关键作用的重要基因,且大量的研究表明,其参与了小麦对多种病原菌的抗性反应[1,18-19]。本研究基于野生二粒小麦的基因组数据,利用生物信息学手段,对野生二粒小麦的NBS-LRR类R基因进行了系统的研究。通过对野生二粒小麦基因组的筛选和验证,剔除NB-ARC结构不完整的基因,共鉴定到了429个野生二粒小麦NBS-LRR基因,丰富了麦类作物R基因资源。拟南芥基因组中有170个NBS-LRR类基因,其中TNL亚家族基因的数量为79个,远多于CNL等其他亚家族基因[11],而在小麦[6,20]、水稻[21]、玉米[12]、狗尾草(Setariaitalica)[22]以及野生二粒小麦等单子叶植物中,CNL亚家族成员基因的数量最多,未鉴定到TNL亚家族基因,推测R基因在单子叶和双子叶植物进化过程中发生了明显的分化。
基因的结构往往决定基因的功能。本研究发现,野生二粒小麦NBS-LRR类基因结构较为简单,外显子为1~4个,内含子为1~3个,这与栽培六倍体小麦[23]和乌拉尔图小麦[11]中R基因的结构特征类似。蛋白结构分析发现,亲缘关系越近的R基因具有更相似的保守结构域组成,推测它们具有相似的功能,这与报道的其他物种中R基因的家族特征一致[11-12]。
研究发现,R基因可与多个抗病相关的基因互作,共同构建植物抗逆机制网络[24]。除此之外,R基因还广泛参与了植物体内诸多其他生物学过程,在生长发育、环境适应、逆境响应等过程中发挥了一定作用[1,25]。在本研究中,基于RNA-seq的表达模式分析发现,在野生二粒小麦的不同组织和生长时期参与的R基因数量不同。进一步深入研究这些特异表达的R基因的生物学功能,将为阐明R基因的更多调控功能及其作用机制提供重要信息。最后,本研究采用qRT-PCR的方法,对侵染白粉病的野生二粒小麦叶片中4个R基因的表达模式进行了试验验证,结果发现,这4个R基因在白粉病的抗性响应过程中表达量发生了变化,说明它们可能参与了野生二粒小麦对白粉菌的抗病应答过程,但其具体生物学功能还有待进一步研究。