赤桉EcWRKY50转录因子基因的电子克隆及生物信息学分析
2014-08-15王鹏良韦翠娥覃柳辉杨利平张照远
王鹏良+韦翠娥+覃柳辉+杨利平+张照远+吴幼媚+覃子海
摘 要:WRKY转录因子参与植物生长发育、抗病虫、耐逆境等众多过程,并在其中起重要作用。为了研究WRKY在赤桉中的结构和功能,本研究利用电子克隆的方法克隆了赤桉与AtWRKY50高度同源的一个WRKY基因EcWRKY50,并利用生物信息学方法对该基因编码蛋白的氨基酸组成,理化性质,亚细胞定位和高级结构等方面进行预测和分析。结果表明,EcWRKY50基因全长为585 bp,包含一个480 bp的开放阅读框,编码159个氨基酸,该基因蛋白分子量为18.187 KD,理论等电点为5.45。该蛋白含有一个WRKYGKK的保守结构域和C2H2结构域,属于GroupⅡc成员,很可能在细胞质中起转录和转录调控的作用;并对该蛋白进行了同源性分析。这些研究为该基因功能的进一步分析奠定了坚实的基础。
关键词:赤桉 EcWRKY50转录因子 基因电子克隆 生物信息学分析
桉树是桃金娘科(Myrtaceae)桉树属(Eucalyptus)的总称,原产于澳大利亚及其附近岛屿。桉树生长迅速,轮伐周期短,用途广泛,经济效益显著,已经成为我国主要的短周期工业用材树种。
赤桉(Eucalyptus camaldulensis)是在澳大利亚分布最广,引种较多的树种[1 ]。赤桉其木材可制作高档家具,工艺品,还可以作为锯材、纸桨材、干材和薪炭林等重要用途,同时其对干旱[1 ],低温[2-5 ],高温[6 ]和盐碱等逆境有较好的适应能力,而且耐瘠薄。由于其良好耐逆性,赤桉已经在全世界广泛种植,而且种植面积呈日趋扩大之势。
WRKY转录因子是植物特有的最大的转录因子家族之一,WRKY转录因子由其N端的保守氨基酸WRKY而得名,由于其在不同的进化模式,从而产生了多样的WRKY基因成员[7 ]。研究人员已经在水稻,短柄草等多种植物中鉴定出近百个WRKY基因成员[8-10 ],其成员广泛参与植物的抗逆,抗病,生长发育和衰老等多个生理代谢通路,并起重要作用[11]。WRKY50基因是WRKY转录因子家族基因的一个成员,但尚未见赤桉WRKY50基因克隆及分析的相关报道。
电子克隆(In silico cloning)是在基因组或EST测序的基础上,利用生物信息学手段进行基因克隆的新方法[12 ]。本研究利用该技术开展赤桉WRKY50转录因子的克隆及序列分析,并对基因编码蛋白的氨基酸组成、理化性质、结构等多方面进行分析和预测,为该基因的实验克隆,功能分析及其应用奠定良好基础。
1 材料与方法
1.1 EST序列来源
2013年12月5日从dbEST/GenBank(http://www.ncbi.nlm.nih. gov/ nucest)中以FASTA格式下载58584条EST序列。
1.2 基因全长的获得
①利用Trimmer截去EST序列两端的载体序列,再利用编写的Perl脚本提取可能含有WRKY氨基酸的EST序列。
②利用NCBI中Blastx(http://blast.st-va.ncbi.nlm.nih.gov/Blast.cgi)对可能含有WRKY氨基酸的EST进行比对,其中数据库为Nr(Non-redundant protein sequences)。
③利用NCBI中ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)对含有WRKY保守结构域的EST搜索开放阅读框(ORF, Open Reading Frame),得到WRKY转录因子全长基因。
1.3 EcWRKY50基因编码的蛋白质生物信息学分析
① EcWRKY50蛋白氨基酸序列一级结构的预测 利用ExPASy服务器(http:// www. expasy. org/ resources)中的ProtParam、Compute pI/Mw和ProtScale软件预测EcWRKY50蛋白的氨基酸组成、分子量、等电点、疏水性/亲水性、不稳定系数及脂肪系数等。
②EcWRKY50蛋白的亚细胞定位 利用在线软件PSORT(http://psort.hgc.jp/form. html),预测EcWRKY50蛋白的位置。
③EcWRKY50蛋白的二级结构预测 利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)预测该蛋白二级结构。
④EcWRKY50蛋白结构域的三维结构预测 利用ExPASy 中SWISS-MODEL workspace(http://swissmodel.expasy.org/)预测该蛋白的三维结构。
⑤EcWRKY50基因的功能分类 利用ProtFun(http://www.cbs.dtu.dk/services/ ProtFun/)预测该基因的功能分类。
⑥EcWRKY50基因的同源性分析 利用NCBI中Blast程序对EcWRKY50蛋白进行比对,并选择与该蛋白同源性高的不同物种构建系统进化树。
2 结果
2.1 EcWRKY50基因的克隆
首先对下载的赤桉58584条EST序列两端各截去25 bp,以去除载体序列,再以WRKY蛋白对应的DNA为探针,利用自己编写的perl脚本搜索到110条可能含有WRKY蛋白的EST序列。利用NCBI中Blastx程序对110条可能含有WRKY蛋白的EST序列进行注释,获得17条含有WRKY的EST序列,再利用NCBI中ORF Finder对获得的17条EST序列进行开放阅读框的搜寻,只获得1条拥有完整的开放阅读框的EST序列。该EST序列的长度为585 bp,开放阅读框(63~542 bp)的长度为480 bp,以ATG为起始密码子,以TAG为终止密码子,编码159个氨基酸。其推导的氨基酸序列N端具有1个WRKYGKK的保守结构域,C端具有Cx4-5Cx22-23HxH结构域(图1),因此认为该基因为WRKY家族基因成员。由于该基因与AtWRKY50高度同源,属于WRKY家族基因GroupⅡc成员,故命名为EcWRKY50。
2.2 EcWRKY50蛋白氨基酸序列的一级结构预测
利用ExPASy服务器中的ProtParam和Compute pI/Wm程序,预测EcWRKY50蛋白质一级结构的氨基酸组成、分子量、等电点、平均疏水性、不稳定系数及脂肪系数等。由表1可见,该蛋白的不稳定系数为53.31,大于40,说明该蛋白不太稳定;平均疏水性为-1.136,说明该蛋白可能是亲水性蛋白。
由表2可知,该蛋白由20种氨基酸组成,其中Ser(S)含量最高,为10.1%,其次为Glu(E),占9.4%;Cys(C)和Trp(W)含量最低,均为1.3%。
疏/亲水性是蛋白质的重要属性,其对蛋白质二级结构的预测和分析具有重要参考价值。因此利用ProtScale对EcWRKY50蛋白进行疏/亲水性分析,结果见表2。采用Kyte & Doolittle标度计算,得到明显的亲水信号,如图2。图2显示,除了5个小峰表现疏水性外,整体表现为亲水性,这再次表明该蛋白为亲水性的不稳定蛋白。
2.3 EcWRKY50蛋白的亚细胞定位
基因编码的蛋白质在细胞中的分布与该蛋白的功能紧密相关,从而在一定程度上反映了该基因的功能。研究采用PSPORT程序预测EcWRKY50的可能分布位置,从表3来看,该蛋白分布在细胞质中的可能性最大。
2.4 EcWRKY50蛋白二级结构预测
蛋白质的二级结构是指多肽链骨架通过α螺旋、β折叠、β转角和无规则卷曲等方式盘绕折叠而成。二级结构预测结果,由表4,图3表明,该蛋白由α螺旋、β折叠、延伸链和无规则卷曲构成,其中α螺旋和无规则卷曲的比例较高,分别为25.16%和53.46%,延伸链和β折叠的比例相对较低,分别为14.47%和6.92%。
2.5 EcWRKY50蛋白结构域的三维结构预测
正常情况下蛋白质并不是以完全伸展的多肽链而是以紧密折叠的结构存在, 并且一个特定蛋白质行使其功能的能力通常是由它的三维结构或构象决定。因此,研究利用ExPASy 中SWISS-MODEL workspace程序预测了其蛋白的三级结构,结果见图4。
2.6 EcWRKY50的功能分类
基因功能分类是基因注释过程中的重要环节之一。为了加强对EcWRKY50基因的认识,增加对该基因功能了解,研究对该基因进行了功能分类,功能分类结果(见表5)表明,EcWRKY50最重要的功能是转录调控和转录,其概率分别为0.345和0.269,这符合转录因子的功能。
2.7 EcWRKY50基因的同源性分析
以EcWRKY50为探针,利用NCBI中Blast程序与reference protein数据库进行比对,搜索到与该探针蛋白同源性较高的蛋白,这些蛋白基本上都是来自不同物种的WRKY50蛋白。研究选与该蛋白同源性高的橙子(Citrus sinensis),可可(Theobroma cacao),蓖麻(Ricinus communis),葡萄(Vitis vinifera),黄豆(Glycine max),鹰嘴豆(Cicer arietinum),蒺藜苜蓿(Medicago truncatula),拟南芥(Arabidopsis thaliana),琴叶拟南芥(Arabidopsis lyrata)9个物种的WRKY蛋白进行氨基酸的多序列比对(见图5),发现在保守结构域上氨基酸相似度高,在非保守结构域上氨基酸的变化较大。
研究利用上述9个物种的WRKY蛋白和EcWRKY50构建系统进化树,从图6中显示,亲缘关系较近的拟南芥和琴叶拟南芥聚为一类,在一定程度上反映了物种间的亲缘关系的远近。
3 讨论
随着EST计划,基因组计划的深入开展,伴随着测序技术的快速改进,产生的EST序列和基因组数据越来越多,基因组研究已经开始从结构基因组学转向功能基因组学的时代,获得基因全长是研究基因功能不可或缺的环节。在这样的情况下,电子克隆应用而生,其特点非常明显,高效快速,成本低,对实验要求也低[13 ],势必大大推动功能基因组的研究。
在电子克隆过程中,探针的选择对能否成功地获得基因全长起到重要作用,当选择的探针较长时,能较完整匹配的序列就少,减少了获得全长的可能性;当选择探针较短时,能更多地匹配相应序列,经过对匹配序列的拼接,可获得较多的序列,增加了获得全长的可能性;同时也增加了工作量。考虑到使用序列的来源不同(不同的树种、单株或处理),通过电子克隆获得的基因全长与真实状况下的基因可能存在差异[14 ],需要进一步的实验证明。
WRKY基因家族拥有众多成员,参与植物生长发育,抗病虫,耐逆境及衰老等许多方面起重要作用。据报道,AtWRKY50蛋白参与水杨酸和低油酸抑制茉莉酸信号的通路从而调控植物对病虫害的抗性[15 ]。实验利用电子克隆技术克隆EcWRKY50蛋白基因,并对其结构和功能进行了预测,为进一步利用实验手段研究该基因的结构和功能奠定了坚实的基础。
参考文献
[1] 邹绍荣,罗建中,蓝贺胜,等. 卫闽赤桉幼林种源/家系的遗传变异[J].桉树科技,2004,64(1): 19-23.
[2] 吴良栋,陈强,余青云,等. 福建南平引种赤桉和邓恩桉试验[J]. 林业科技开发,2004,18(6):20- 22.
[3] 唐三定,李俊芳,俞一见. 寒害天气对永州市赤桉组培苗造林的影响[J]. 桉树科技,2008,25(1):31-34.
[4] 汤勇华. 赤桉 8 号、 2 号无性系在闽东沿海山地适应性试验初报[J]. 浙江林业科技,2006,26(4):24-26.
[5] 项东方,陈健波,陈崇征,等. 广西耐寒桉树研究进展[J]. 广西林业科学,2002,31(4):178- 180.
[6] 郑益兴,段安安. 国内外赤桉育种研究回顾及云南的现状与对策[J]. 西南林学院学报,1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荆邵娟,付坚,等. 13 个水稻 WRKY 基因的克隆及其表达谱分析[J]. 科学通报,2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黄骥,张红生,曹雅君,等. 水稻功能基因的电子克隆策略[J].中国水稻科学,2002,16(4):295- 298.
[13] 胡皝,萧浪涛. 生物信息学在新基因全长 cDNA 电子克隆中的应用[J].生物技术通报,2007,4(93-96).
[14] 李国印,阙友雄,许莉萍,等. 甘蔗 MYB2 转录因子的电子克隆和生物信息学分析[J]. 生物信息学,2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.
[6] 郑益兴,段安安. 国内外赤桉育种研究回顾及云南的现状与对策[J]. 西南林学院学报,1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荆邵娟,付坚,等. 13 个水稻 WRKY 基因的克隆及其表达谱分析[J]. 科学通报,2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黄骥,张红生,曹雅君,等. 水稻功能基因的电子克隆策略[J].中国水稻科学,2002,16(4):295- 298.
[13] 胡皝,萧浪涛. 生物信息学在新基因全长 cDNA 电子克隆中的应用[J].生物技术通报,2007,4(93-96).
[14] 李国印,阙友雄,许莉萍,等. 甘蔗 MYB2 转录因子的电子克隆和生物信息学分析[J]. 生物信息学,2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.
[6] 郑益兴,段安安. 国内外赤桉育种研究回顾及云南的现状与对策[J]. 西南林学院学报,1999,19(4):258-262.
[7] Agarwal,P.,Reddy,M.P.,Chikara,J. WRKY: its structure,evolutionary relationship,DNA- binding selectivity,role in stress tolerance and development of plants[J]. Mol Biol Rep,2011,38(6):3883-3896.
[8] 仇玉萍,荆邵娟,付坚,等. 13 个水稻 WRKY 基因的克隆及其表达谱分析[J]. 科学通报,2004, 49(18):1860-1869.
[9] Ramamoorthy,R.,Jiang,S.-Y.,Kumar,N.,et al. A Comprehensive Transcriptional Profiling of the WRKY Gene Family in Rice Under Various Abiotic and Phytohormone Trea- tments[J]. Plant Cell Physiol 2008,49(6): 865-879.
[10] Tripathi,P.,Rabara,R.C.,Langum,T.J.,et al. The WRKY transcription factor family in Brachypodium distachyon[J]. BMC Genomics, 2012,13:270.
[11] Eulgem,T.,Rushton,P.J.,Robatzek,S.,et al. The WRKY superfamily of plant transcription factors[J]. Trends Plant Sci,2000,5(5): 199-206.
[12] 黄骥,张红生,曹雅君,等. 水稻功能基因的电子克隆策略[J].中国水稻科学,2002,16(4):295- 298.
[13] 胡皝,萧浪涛. 生物信息学在新基因全长 cDNA 电子克隆中的应用[J].生物技术通报,2007,4(93-96).
[14] 李国印,阙友雄,许莉萍,等. 甘蔗 MYB2 转录因子的电子克隆和生物信息学分析[J]. 生物信息学,2011,9(1):24-27.
[15] Gao,Q.M.,Venugopal,S.,Navarre,D.,et al.,A. Low oleic acid-derived repression of jasmonic acid-inducible defense responses requires the WRKY50 and WRKY51 proteins[J]. Plant Physiol,2011,155(1):464-76.