苜蓿全基因组WRKY转录因子基因的分析
2011-03-27江腾林勇祥刘雪江海洋朱苏文
江腾,林勇祥,刘雪,江海洋,朱苏文
(安徽农业大学生命科学学院 安徽省作物生物学重点实验室,安徽 合肥230036)
转录因子在高等植物的生长发育及其对外界环境的反应中起着重要的调控作用,典型的高等植物转录因子含有DNA结合域、转录调控域、寡聚化位点和核定位信号,转录因子通过这些结构域与顺式元件相互作用调控基因的表达。转录因子也称反式作用因子,其主要功能是激活或抑制基因的转录效应[1,2]。WRKY蛋白是植物所特有的转录因子家族。因WRKY结构域是一个60个氨基酸左右的保守结构,所有结构域均含有高度保守的WRJKYGQK氨基酸序列而得名[3,4]。WRKY基因是首先从植物中分离得到的一类调节蛋白质。至今已从多种植物中分离,如甜土豆(Ipomoea batatas)、野燕麦(Avena sativa)、皱叶欧芹(Petroselinum crispum)、拟南芥(Arabidopsisthaliana)、烟草(Nicotiana tabacum)、水稻(Oryza sativa)等[5-9]。WRKY 基因家族的名字来源于这类蛋白质的一个主要特征即含有WRKY结构域。
在拟南芥、烟草和水稻中,已有大量的文献报道WRKY转录因子参与了水杨酸和茉莉酸信号传导相关基因的调控和抗病性[10-12]。水稻的一个WRKY45基因被证实与稻瘟病的抗性相关,过量表达WRKY45基因导致水稻的抗稻瘟病能力增强[13]。拟南芥中的WRKY18,WRKY40和WRKY60基因与灰霉菌(Streptomyces griseus)和假单孢菌(Pseudomonasaeruginosa)的抗性密切相关[14]。近年来,随着多种植物全基因组数据的公布,利用全基因组数据分析某一基因家族基因的特征越来越多,最早是拟南芥中抗病基因的全基因组分析,利用生物信息学方法从拟南芥中共发现149个NBS(nucleotide binding site)基因,并对该基因家族进行染色体定位,分类,保守的基序(motif)分析[15],该研究对近几年拟南芥NBS抗病基因的克隆和功能验证起着重要的作用。随后利用生物信息学方法对其他基因家族的全基因分析的报道也日益增多,而WRKY基因作为一类较为重要的基因家族,一直是分子生物学中研究的重点,在拟南芥全基因组中有72个WRKY基因,共含有85个WRKY结构域,其中有13个WRKY蛋白包含着2个WRKY结构域,对水稻全基因组WRKY基因研究表明,水稻中共有102个WRKY转录因子基因[16],对拟南芥和水稻WRKY基因的研究大大加速了对这类基因的了解。
蒺藜苜蓿(Medicago truncatula),豆科蝶形花亚科苜蓿属一年生黄花苜蓿,耐旱,已经成为研究豆科植物的模式植物[17,18],基因组小(全基因组470 Mb),因其转化和培养较为容易,目前,在豆科植物功能基因的研究中应用较多[19-21]。苜蓿全基因组的精细序列(Mt2.0)已经公布,目前,利用生物信息学方法分析基因家族的特征、进化关系成为热点[22,23]。本研究利用生物信息学方法分析了苜蓿全基因组WRKY基因的种类、数目和进化特点,对促进苜蓿WRKY基因家族功能基因组学的进一步研究具有重要意义。
1 材料与方法
1.1 试验材料
本研究以苜蓿最新的全基因组数据库(Mt2.0)为对象,苜蓿全基因组数据和蛋白质数据下载于苜蓿基因组测序网站(http://www.medicago.org)。
1.2 试验方法
1.2.1 WRKY基因的确定 因为苜蓿基因组的注释并不完全,因此利用蛋白家族数据库(Pfam)中选取的WRKY蛋白家族序列(PF03106),利用序列的同源性搜索工具(Blastp)筛选苜蓿全部基因,P值设为10-3[24],把候选WRKY基因进行Pfam分析,以证实其蛋白含有保守的WRKY结构域。而水稻的WRKY基因已经在基因组中有较好的注释,直接从水稻基因组网站中下载全基因序列,获取水稻的102条WRKY基因序列。
1.2.2 WRKY类型基因分类 对基因家族进行分组是功能分析的一项重要内容,转录因子基因家族常含有高度保守的功能域或有DNA结合功能的保守域。根据预测得到的WRKY域的氨基酸序列对苜蓿WRKY基因进行分组。参照Eulgem和Somssich[3]的分组原则及结合系统发育分析的结果进一步分组,含有2个WRKY保守结构域的定义为Ⅰ类,含有1个WRKY保守结构域且含有C2H2保守锌指基序(motif)的定义为Ⅱ类,含有1个WRKY保守结构域且含有C2HC保守的锌指motif的定义为Ⅲ类。这样WRKY域可以分为3个大组(Ⅰ、Ⅱ、Ⅲ)。
1.2.3 WRKY类型基因的染色体定位 WRKY类型基因通过苜蓿基因组数据库(http://www.medicago.org/genome/)提供的染色体BLAST工具进行苜蓿染色体物理定位,首先将每个WRKY基因与苜蓿全基因组进行BLAST搜索,寻找最匹配的染色体位置,从而确定每个WRKY类型基因在染色体上的具体位置。
1.2.4 WRKY类型基因系统发生学分析 选取苜蓿中所有的WRKY类型基因与水稻102个已鉴定的WRKY基因利用CLUSTALW软件进行序列比对[25],然后利用MEGA 4.0软件进行系统进化树的构建,分析苜蓿与水稻WRKY基因间的进化关系[26]。此外,对所有WRKY基因中的所有WRKY结构域进行序列比对,然后根据结构域的比对结果绘制WRKY结构域的系统进化树。
1.2.5 WRKY结构域(domain)的motif分析 苜蓿WRKY类型基因的预测motif分析通过MEME(multiple expectation maximization for motif elicitation)在线分析[27],MEME是美国圣地亚哥超级计算机中心(SDSC)开发的一套用来寻找一组相关的DNA序列或者蛋白质序列基序的程序。利用此软件来预测苜蓿WRKY基因中的保守motif以及WRKY结构域上的保守motif。
2 结果与分析
2.1 WRKY类型候选基因的确定与染色体定位
利用Pfam数据库的WRKY结构域的标准序列,在苜蓿全基因组中进行BLAST搜索,P值设为10-3,然后把候选序列进行序列比对。通过这种方法,从苜蓿基因组中共找到28个WRKY候选基因,分别命名为Mt-WRKY1-MtWRKY 28(表1)。水稻已经报道共有102个WRKY基因,即使是同为双子叶植物的拟南芥中也发现了72个WRKY基因,苜蓿的基因组大小与水稻相当,这说明了WRKY基因家族并不与基因组大小有直接的对应关系,拟南芥的基因组是苜蓿的1/4左右,但是其WRKY基因总数是苜蓿的3倍左右。进一步把28个苜蓿的WRKY进行染色体定位,发现WRKY基因并没有均匀的分布在染色体上,其中,5号染色体分布最多,共含有8个WRKY基因,1号染色体有4个基因,3和4号染色体都有3个基因,7号染色体有2个基因,8号染色体有6个基因,而2和6号染色体上不含有WRKY基因,水稻、拟南芥等植物的WRKY基因分布也有此特点。此外,26个WRKY基因都已经精确定位到染色体上,而MtWRKY14和MtWRKY15两个基因并没有定位在任何染色体上,主要是因为其所在的BAC(细菌人工染色体,bacterial artificial chromosome)克隆目前没有被定位,导致基因不能够与拼接的染色体序列匹配。
2.2 WRKY基因序列比对与分类
拟南芥和水稻WRKY基因的研究已经对这个基因家族有了一些理解,一般而言该基因可以分为3个大类和若干小类,采用了文献的方法将苜蓿的28个WRKY基因进行了分类,也可以分为3类,其中MtWRKY1-MtWRKY 5因为其含有2个保守的WRKY结构域而划分为Ⅰ类。MtWRKY27与Mt-WRKY28因为其除了含有1个WRKY结构域外,还含有C2HC的保守motif,而划分为Ⅲ类,其他的WRKY基因含有1个WRKY结构域且在C端包含C2H2的保守motif而划分为Ⅱ类。此外,把所有基因的WRKY保守结构域的氨基酸序列进行比对分析,其中含有2个WRKY结构域的Ⅱ类基因,把N端的结构域命名为NW,发现WRKY结构域长度为51~63个氨基酸(图1),相对于 C端的WRKY结构域,其N端WRKY结构域之间具有相似的序列构成。对WRKY结构域进行系统发生学分析,可以明显的分为3个分枝(图2),且所有基因的NW结构域基本上在同一进化分枝上,说明它们与C端的WRKY结构域并不是简单的复制现象造成,有其单独的起源和进化关系。此外,WRKYGQK 7个氨基酸被视为WRKY基因最保守的结构,从结构域的序列比较可以发现,第1组和第3组基本上比较保守,WRKYGQK基本上没有变异,而第2组中WRKYGQK中的Q残基变异较大,说明了不同类型的WRKY基因的选择压力和进化模式是不同的。
2.3 苜蓿WRKY基因的系统发生学关系
利用苜蓿的28个WRKY基因氨基酸序列与水稻102个WRKY基因氨基酸序列进行序列比对,然后进行系统进化树绘制(图3)。可以明显的看出苜蓿的WRKY基因集中分布在几个分枝上,共有17个基因是单独位于分枝上,说明了苜蓿与水稻WRKY基因的起源和进化关系不同。如MtWRKY8-11单独在一分枝上,与水稻WRKY具有较远的进化距离。此外,可以明显的看出水稻的WRKY基因分布在外围分枝的基因较多,而且一些基因与苜蓿的WRKY基因差异较多,证实水稻的WRKY基因变异较多,苜蓿的WRKY基因更加保守。
表1 苜蓿WRKY基因的分类和定位信息Table 1 Classification and location of WRKY genes in M.truncatula
2.4 苜蓿WRKY转录因子的motif分析
对28个WRKY基因的氨基酸进行MEME软件在线分析,结果显示,在苜蓿WRKY基因中共找到46个预测的motif,可以看出不同类型的WRKY基因含有的motif数目和种类有所差异,如Ⅰ组WRKY基本上都含有2个motif 1,这是WRKY结构域的特征,motif的多样化也说明了WRKY基因广泛参与细胞内的多样代谢途径和反应。此外选取28个基因的33个WRKY结构域序列进行motif分析,结果共发现5个motif(表2),其中最长的motif长度为26个氨基酸,最短的为10个氨基酸,其中motif 1最为保守,是WRKY基因最保守的motif(图4)。
图1 苜蓿WRKY结构域的氨基酸比对Fig.1 Amino acid alignment of M.truncatula WRKY domain
图2 苜蓿WRKY结构域的系统发生树Fig.2 Phylogenetic tree of M.truncatula WRKY domain
图3 苜蓿和水稻WRKY基因的的系统发生树Fig.3 Phylogenetic tree of rice and M.truncatula WRKY genes
图4 苜蓿WRKY蛋白推测的保守motifFig.4 Forty six putative motifs identified in the WRKY family
3 讨论
WRKY基因家族是植物特有的一类重要的转录因子基因,已经克隆的基因表明该基因广泛参与植物的抗病、抗旱等逆境的调控,在细胞代谢和防卫反应中具有重要的作用。但是目前对WRKY基因的研究还处在一个初步认识的阶段,大大地限制了人们对该类基因家族完全功能的认识和了解[28]。随着众多模式植物全基因组测序的完成,利用全基因组数据分析基因家族成为可能。本研究利用苜蓿最新的基因组数据(Mt2.0)进行WRKY基因家族的分析,详细研究了该基因家族的特点和进化关系,并发现其与水稻、拟南芥WRKY基因具有一定的差异。
表2 苜蓿推测的WRKY结构域的motifTable 2 M.truncatula putative WRKY domain motif
在苜蓿全基因组中共有28个WRKY基因被确认,占整个基因总数的0.072%,而在拟南芥中这一比例为0.199%,水稻中这一比例为0.407%,无论是基因的总数还是所占比例,苜蓿都远远少于模式植物拟南芥和水稻。已经有研究表明,水稻和拟南芥WRKY基因家族存在较明显的基因复制现象,而苜蓿中这一现象并不是很明显,此外,苜蓿28个基因在7条染色体都有分布,相对于拟南芥和水稻而言分布不集中,说明了苜蓿基因组中WRKY基因复制事件较少,这可能是苜蓿WRKY基因较少的原因之一[29]。此外,苜蓿WRKY基因的同源性较高,在进化树上分布相对集中,而水稻WRKY基因差异较大,不少基因分布在进化树外围,苜蓿相对水稻而言,WRKY基因较为保守。
对苜蓿和水稻WRKY基因的系统发生学分析证实了水稻和苜蓿的大部分WRKY基因并不在同一分枝上,说明了水稻和苜蓿的WRKY基因在进化上具有较大差异,进一步证实了这些差异可能早在单子叶与双子叶植物分化前就已经产生,这也进一步说明了苜蓿的WRKY基因在进化上比较保守,而水稻的WRKY在进化上发生了更多的基因复制,导致WRKY基因的快速扩张。对苜蓿WRKY结构域的系统进化树分析证实了位于N端的WRKY结构域与C端具有较大的差异,并不是结构域的简单复制而来,可能起源于不同的结构域,特别是第1组5个基因的N端WRKY在一个分枝上,C端WRKY也在同一分枝上,说明了N端与C端WRKY结构域的起源不同。
[1]Arce A L,Cabello J V,Chan R L.Patents on plant transcription factors[J].Recent Patents on Biotechnology,2008,2(3):209-217.
[2]Jain M,Tyagi A K,Khurana J P.Genome-wide identification,classification,evolutionary expansion and expression analyses of homeobox genes in rice[J].Febs Journal,2008,275(11):2845-2861.
[3]Eulgem T,Somssich I E.Networks of WRKY transcription factors in defense signaling[J].Current Opinion in Plant Biology,2007,10:366-371.
[4]张秋平,杨宇红,谢丙炎,等.植物转录因子的超表达及其在分子育种中的应用[J].分子植物育种,2005,3(3):401-408.
[5]Chujo T,Takai R,Akimoto-Tomiyama C,et al.Involvement of the elicitor-induced gene OsWRKY53 in the expression of defense-related genes in rice[J].Biochemica et Biophysica Acta,2007,1769:497-505.
[6]Li J,Brader G,Palva E T.The WRKY70 transcription factor:A node of convergence for jasmonate-mediated and salicylatemediated signals in plant defense[J].Plant Cell,2004,16:319-331.
[7]Liu X,Bai X,Wang X,et al.OsWRKY71,a rice transcription factor,is involved in rice defense response[J].Journal of Plant Physiology,2007,164:969-979.
[8]Peng Y,Laura E B,Chen X W,et al.OsWRKY62 is a negative regulator of basal and Xa21-mediated defense against Xanthomonas oryzae pv.oryzae in rice[J].Molecular Plant,2009,1:446-458.
[9]Qiu D,Xiao J,Ding X H,et al.OsWRKY13 mediates rice disease resistance by regulating defense-related genes in salicylateand jasmonate-dependent signaling[J].Molecular Plant-microbe Interactions,2007,20:492-499.
[10]Eulgem T,Rushton P J,Robatzek S,et al.The WRKY superfamily of plant transcription factors[J].T rends in Plant Science,2000,5:199-206.
[11]田云,卢向阳,彭丽莎,等.植物WRKY转录因子结构特点及其生物学功能[J].遗传,2006,28(12):1607-1612.
[12]Shimono M,Sugano S,Nakayama A,et al.Rice WRKY45 plays a crucial role in benzothiadiazole-inducible blast resistance[J].Plant Cell,2007,19:2064-2076.
[13]Xu X,Chen C,Fan B,et al.Physical and functional interactions between pathogen-induced arabidopsis WRKY18,WRKY40,and WRKY60 transcription factors[J].Plant Cell,2006,18:1310-1326.
[14]Hara K,Yagi M,Kusano T,et al.Rapid systemic accumulation of transcripts encoding a tobacco WRKY transcription factor upon wounding[J].Molecular and General Genetics,2000,263:30-37.
[15]M eyersa B,Kozika A,Griego A,et al.Genome-wide analysis of NBS-LRR-encoding genes in arabidopsis[J].Plant Cell,2003,15:809-834.
[16]Wu K L,Guo Z J,Wang H H,et al.The WRKY Family of transcription factors in rice and arabidopsis and their origins[J].DNA Research,2005,12:9-26.
[17]张改娜,贾敬芬.豌豆清蛋白1(PA1)基因的克隆及对苜蓿的转化[J].草业学报,2009,18(3):117-125.
[18]刘圈炜,王成章,严学兵,等.苜蓿青饲对波尔山羊屠宰性状及肉品质的影响[J].草业学报,2010,19(1):158-165.
[19]何树斌,刘国利,杨惠敏.不同水分处理下紫花苜蓿刈割后残茬的光合变化及其机制[J].草业学报,2010,18(6):192-197.
[20]燕丽萍,夏阳,梁慧敏,等.转BADH基因苜蓿T1代遗传稳定性和抗盐性研究[J].草业学报,2010,18(6):65-71.
[21]冯毓琴,曹致中.天蓝苜蓿野生种质的品质分析研究[J].草业科学,2009,26(10):80-84.
[22]Boutrot F,Chantret N,Gautier M F.Genome-wide analysis of the rice and arabidopsis non-specific lipid transfer protein(nsLtp)gene families and identification of wheat nsLtp genes by EST data mining[J].BioMed Central Genomics,2008,9:86.
[23]Wang D,Guo Y,Wu C,et al.Genome-wide analysis of CCCH zinc finger family in arabidopsis and rice[J].BioMed Central Genomics,2008,9:44.
[24]Zhou T,Wang Y,Chen J Q.Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes[J].Molecular Genetics and Genomics,2004,271(4):402-415.
[25]Higgins D G,Thompson J D,Gibson T J.CLUSTAL W:Improving the sensitivity of progressive multiple sequence alignment through sequence weighting,position-specific gap penalties and weight matrix choice[J].Nucleic Acids Research,1994,22:4673-4680.
[26]Tamura K,Dudley J,Nei M,et al.MEGA4:molecular evolutionary genetics analysis(M EGA)software version 4.0[J].M olecular Biology and Evolution,2007,24:1596-1599.
[27]Bailey T L,Elkan C.The value of prior knowledge in discovering motifs with MEME[J].Proceedings International Conference on Intelligent Systems for Molecular Biology,1995,3:21-29.
[28]Pandey S P,Somssich I E.The role of WRKY transcription factors in plant immunity[J].Plant Physiology,2009,150(4):1648-1655.
[29]Lai Z,Vinod K,Zheng Z.Roles of arabidopsis WRKY3 and WRKY4 transcription factors in plant responses to pathogens[J].BioMed Central Plant Biology,2008,8:68.