水稻Dof转录因子家族的鉴定与生物信息学分析
2015-03-26纪剑辉周颖君杨立明
纪剑辉, 周颖君, 杨 雯, 谢 晶, 华 慧, 杨立明
(淮阴师范学院生命科学学院/江苏省环洪泽湖生态农业生物技术重点实验室/江苏省区域现代农业与环境保护协同创新中心,江苏 淮安 223300)
转录因子主要通过与基因5′端上游特定序列进行专一性结合,保证目的基因能够在特定时间与空间表达的蛋白质分子。Dof转录因子家族为锌指蛋白质家族的1个亚家族,一般由200至400个氨基酸组成[1-2]。此外,Dof转录因子还包含2个主要的结构域:1个位于N末端的保守DNA结合结构域,另1个位于C末端的多变调控结构域。位于N末端DNA结合结构域含有52个氨基酸,并且组成1个Zn2+与4个Cys残基共价结合的单锌指结构,此单锌指结构中,它能够特异性的结合包含核心序列5′-T/AAAAG-3′的顺式作用元件[1,3]。位于C末端的调控结构域从其氨基酸序列上看不具有保守型,这使Dof转录因子家族的不同基因在植物中表现为功能多样性的一个原因[4]。植物中第1个被鉴定报道的是玉米ZmDof1转录因子基因[5]。此后,其他植物中的Dof基因相继被预测和鉴定出来,如拟南芥全基因组中预测存在36个Dof基因[6],水稻中存在30个Dof基因[7],小麦中存在31个Dof基因[8],大麦中存在26个Dof基因[9],大豆中存在79个Dof基因[10],高粱中存在28个Dof基因[11]。目前研究结果表明Dof转录因子对植物生长发育过程中多种生物学途经起作用。如C4植物玉米的碳代谢调控过程主要通过Dof1和Dof2转录因子调控PEPC基因的表达而起作用[12];玉米的PBF及其同源的大麦和小麦PBF转录因子对于胚乳特异性贮藏蛋白质基因的表达起调控作用[13];烟草的 Nt-BBF1基因在顶端分生组织和微管组织中通过响应生长素信号从而实现对原癌基因 rolB的表达调控[14];大豆的GmDof4和GmDof11通过调控脂肪酸生物合成相关基因的表达从而调控大豆种子的油脂含量[15];拟南芥Dof家族基因OBP1受到水杨酸和氧化胁迫等处理后,可以调控植物防御基因的表达[16];水稻的OsDof12能够调控Hd3a和OsMADS14基因的表达,最终影响水稻的开花时间[17]。小麦中的Dof基因在种子发育和生殖生长中起作用[18]。在拟南芥中,有一些Dof基因(如AtDof2.4,AtDof5.8和AtDof5.6/HCA2)被报道为特异性的在一些早期的生长组织中高效表达[19-20]。
本试验利用生物信息学的方法获取和鉴定了水稻、拟南芥、二穗短柄草以及高粱的Dof基因序列,并对其同源基因进行了聚类分析,从而探索其可能存在的进化规律。另外,通过分析水稻Dof基因在不同组织中的表达情况,从而为进一步揭示Dof转录因子的生物学功能提供线索。
1 材料与方法
1.1 Dof转录因子家族的数据收集与分析
利用 Pfam数据库(http://pfam.sanger.ac.uk/),以拟南芥Dof同源蛋白质检索Dof家族蛋白质特征结构域[21],标号为 PF02701。随后从水稻TIGR基因组数据库下载水稻全基因组序列,其次利用HMMER3程序(http://hmmer.janelia.org/)以PF02701隐马可夫模型对水稻全基因组序列搜索含有Trihelix结构域特征的序列(E≤10-10被认为是候选蛋白质)。最后利用SMART在线程序检测候选蛋白质序列,去除不含Dof结构域特征的序列[22]。利用TFDB数据库(http://planttfdb.cbi.edu.cn/index.php,v3.0)[23]获得拟南芥、玉米、二穗短柄草和高粱的Trihelix基因序列。
1.2 水稻Dof转录因子家族保守基序的鉴定和分析
为了分析水稻Dof转录因子家族的蛋白质结构特征,利用MEME在线程序 (http://meme.nbcr.net/meme/cgi-bin/meme.cgi)[24]对候选水稻Dof转录因子的基序进行了分析,相关参数设置为:(1)基序重复的数量为any;(2)基序的长度为6~200; (3)基序的数量设置为10。
1.3 多序列联配、蛋白质保守序列比对和系统进化树的构建
利用Cluster 3.0程序对候选水稻Dof转录因子保守区域氨基酸进行多序列联配分析[25]。利用WebLogo程序图示化候选水稻Dof转录因子保守区域氨基酸的保守性[26],之后序列联配比对结果通过Mega5程序(http://www.megasoftware.net/)[27]进行分析,采用邻接法(Neighbor-Joining Method,NJ)生成水稻Dof转录因子保守区域的系统进化树,进化树校验参数Bootstrap设为1 000次重复,以同样的方法对水稻、拟南芥、二穗短柄草、玉米和高粱中Dof转录因子家族进行进化树分析。
1.4 不同物种中Dof基因家族所在染色体区段复制分析
利用植物基因组复制数据库PGDD(http:// chibba.agtec.uga.edu/duplication/)[28]对候选水稻Dof基因所在染色体区段的复制进行分析。Dof基因在水稻染色体上的复制情况通过MapInspect(http://www.dpw.wau.nl/pv/pub/MapComp/)软件进行构建;水稻与二穗短柄草,水稻与高粱之间Dof基因所在区段染色体的复制情况通过Circos(http:// circos.ca/)软件进行构建[29]。
1.5 水稻Dof基因在不同组织表达水平分析
利用水稻 Ricexpro在线芯片数据(http:// ricexpro.dna.affrc.go.jp/data-set.html)分析水稻Dof基因在不同组织部位的表达情况。这些组织部位包括水稻的叶片、叶鞘、根、茎、穗、花药、雌蕊、外稃、内稃、胚珠、胚和胚乳。样本包含三组重复,采用的是Agilent在线表达谱芯片分析系统(Agilent onecolor(Cy3)microarray-based gene analysis system)。所有这些Dof基因在水稻不同组织中的表达水平通过Cluster 3.0程序对其进行层次聚类分析,再通过TreeView软件(http://jtreeview.sourceforge.net/)对其结果进行Heatmap图示[30]。
2 结果与分析
2.1 水稻Dof转录因子家族的鉴定
利用Pfam程序和SMART数据库,我们鉴定到30个含有Dof典型结构域的水稻转录因子,随后我们利用Clustal X程序对这些Dof转录因子的Dof结构域氨基酸序列进行多序列比对(图1A),通过图1A可以明显看出这30个Dof转录因子均含有一个明显的锌指结构,且锌指结构内均含有保守的4个Cys(图1B)。
图1 Dof结构域在水稻中的保守性分析Fig.1 The conservation analysis of Dof domain in rice
2.2 Dof转录因子家族的进化
我们通过Cluster 3.0程序对水稻Dof结构域进行多序列比对,然后运用Mega5软件对Dof的保守区域进行进化分析(图2)。从图2可以看出,虽然水稻中的Dof基因具有较高的同源性,但其仍然可以明显的区分出差异性,我们初步将其分成6个亚家族(自举值≤50%)。为了更好地分析水稻和其他植物Dof转录因子进化上的关系,我们又对水稻、拟南芥、二穗短柄草、玉米和高粱中的Dof转录因子进行了进化分析(图3),并初步将这5个物种中的Dof转录因子按照其亲缘关系远近分成8个分支。整体来看,每一个分支提示其可能在物种演化过程中具有更高的序列相似性。此外,除了第V家族均为拟南芥基因外,每一个物种在另外7个分支上都存在相关基因。
图2 水稻Dof转录因子进化及水稻Dof转录因子的基序Fig.2 The phylogenetic tree of the Dof transcription factor family and the MEME-defined motifs of rice Dof family
图3 水稻、拟南芥、二穗短柄草、玉米和高粱中Dof转录因子的比较进化树Fig.3 Comparative phylogenetic tree of Dof family constructed using the neighbor-joining method in rice,Arabidopsis,Sorghum,maize and Brochypodium distachyon
2.3 水稻Dof转录因子家族蛋白质氨基酸基序
我们利用MeMe在线程序对水稻Dof转录因子家族的蛋白质氨基酸基序进行了分析,结果显示水稻Dof转录因子除了均含有Dof典型保守基序Motif1之外,还含有其他一些相对保守的基序。从图2我们可以看出第VI亚家族Os01g15900、Os07g48570、Os01g17000、Os03g07360和Os10g26620这5个基因编码的蛋白质氨基酸序列的C端均含有Motif2和5两个基序,而后3个基因Os01g15900、Os07g48570、Os01g17000编码的蛋白质在序列中部还含有Motif10基序,以及在核心保守基序Motif1的左侧紧连Motif9,因此推测这3个基因相对亲缘关系更加靠近。在第IV亚家族中,部分转录因子在Motif1的左侧含有Motif4基序,但这一基序并没有在IV亚家族所有转录因子中出现。
2.4 水稻Dof基因的染色体复制
在物种进化过程中,不单只有1个基因在不同物种之间存在亲缘关系,在一定的染色体区段上,同样存在进化上的复制关系。为了研究这种染色体区段的进化,我们通过PGDD数据库及MapInspect软件来分析水稻30个Dof转录因子是否在水稻自身存在某些染色体区段的复制。从图4可以看出,水稻Dof基因分布在除11号染色体之外的其他所有染色体上面,其中1号和3号染色体分布最多,分别有6个Dof基因,6、8和9号染色体上分布最少,各有1个Dof基因。此外,我们也发现,这30个Dof基因在染色体上的分布也存在聚集现象,如在1号染色体的9 Mb、2号染色体的29 Mb、3号染色体的22 Mb和32 Mb、12号染色体的23 Mb位置都存在2个或2个以上基因集中分布的现象。另外,从表1也可以看出,具有大量基因所在的染色体复制区域有6个,少量基因所在染色体复制区域有5个。除了8号染色体上的Os08g38220基因不存在跟其他染色体的复制,其他染色体均有Dof基因存在跟其他染色体的复制情况。Os01g48290和Os01g55340 2个基因在1号染色体长臂上存在染色体复制,但这种复制的区段并不是很大,从我们的检测结果看仅仅只有10个基因在该区段存在同源性。此外,Os03g60630分别与Os07g13260、Os05g02150 2个基因的区段存在复制情况,但两者的复制情况并不完全相同,Os03g60630与Os07g13260具有100个基因区段复制,而Os03g60630与Os05g02150在相关区段则仅有8个基因复制(表1)。
图4 水稻Dof基因在染色体上的复制Fig.4 Chromosomal locations,region duplications,and predicted clusters of rice Dof genes
2.5 Dof基因在水稻和高粱以及水稻和二穗短柄草之间染色体复制
由于水稻、高粱和二穗短柄草作为单子叶中较具代表性的作物且相互间具有较高的亲缘性,因此我们利用生物信息学方法对水稻、高粱和二穗短柄草之间的染色体复制情况进行了分析。结果表明,在水稻中有 22个 Dof基 因 (Os01g09720、Os02g15350、Os03g16850、Os03g38870、Os04g58190、Os07g32510、Os09g29960和Os12g39990除外)与二穗短柄草中的Dof基因具有线性同源性(图5A);25个Dof基因(O-s01g09720、Os02g15350、Os03g38870、Os06g17410和Os07g32510除外)与高粱中Dof基因具有线性同源性(图5B)。推测这些基因在进化过程中经历复制、重排和缺失,导致一些同源基因的丢失。
2.6 Dof基因在水稻不同组织中的表达
为了分析水稻Dof基因在不同组织的表达情况,我们利用RiceXPro数据库(http://ricexpro.dna.affrc.go.jp/data-set.html)下载水稻Dof基因的表达数据。数据显示Dof基因的表达几乎涉及整个植物的生长过程,我们首先将这些数据进行汇总,然后通过构建Heatmap图综合分析了这些Dof基因在水稻中的表达情况,并用Cluster和Treeview程序加以图示化(图6)。结合Cluster的结果,我们将27个基因的表达聚类分成6个不同的亚区,不同的亚区提示其具有相似或者相近的表达谱。从Heatmap图可以看出,位于VI亚区的Os10g26620、Os06g17410、Os05g02150 3个基因主要在叶片和叶鞘的不同时期具有较高的表达量,提示其可能主要参与叶片的发育过程;位于 V亚区的 Os04g47990、Os02g45200、Os07g32510、Os03g60630 4个基因主要在根和茎的组织中具有较高的表达;III亚区的Os08g38220、Os05g36900、Os10g35300、Os04g58990、Os01g64590 5个基因的表达则主要集中于根部以及花器官组织中(花药、雌蕊、外稃、内稃、胚珠);II亚区的Os03g-55610、Os03g42200、Os12g38200、Os05g02150、Os0-2g47810、Os01g55340 6个基因则分别在穗、雌蕊、胚中具有高表达,但是在花药中的表达却并不高,这提示他们的功能可能与雌配子的发育相关。
3 讨论
表1 水稻Dof基因在染色体上的复制分析Table 1 Duplicated Dof genes in rice chromosomes
本研究通过对水稻Dof转录因子全基因组分析,共获得了30个具有明显保守Dof结构域特征的基因,通过对这30个Dof基因编码的蛋白质氨基酸序列的分析,我们发现Dof基因存在保守结构域特征,且这些结构域的特征与Dof转录因子家族的分类具有一致性。此外,我们结合水稻内部以及水稻和其他物种之间的染色体复制情况,对Dof基因的进化规律做了进一步的分析。在基因进化过程中,基因复制是基因家族扩张过程中的重要事件,复制的基因能够为新基因的产生和功能分化提供物质前提,因此,研究基因复制以及局部染色体的复制能够帮助研究者更好地认识基因和物种的进化。本试验中我们对水稻内部以及水稻和其他物种之间的基因线性同源关系进行了分析,结果显示在水稻内部以及水稻和其他物种之间均存在着大量的同源基因,但水稻中也有少数Dof基因与其他物种不存在线性同源关系,依此我们推测Dof在进化过程中通过复制得到了扩增,但有少量基因在进化过程中发生了选择性缺失。
图5 Dof基因在水稻和二穗短柄草及水稻和高粱间的染色体线性复制Fig.5 The chromosome synteny and replication of Dof genes in rice and Brochypodium distachyon,and in rice and sorghum
目前在水稻中只有3个Dof基因被克隆和分析,第1个是Os03g07360(OsDof12)[17,31],该基因过表达后,在长日照条件下通过调控Hd3a和OsMADS14的表达水平来促进水稻的开花。在我们的研究中,通过表达谱分析可以看出,位于表达谱I亚区的Os03g07360基因在花序(0.6~1.0 cm;3.0~4.0 cm)、外稃(小花7.0 mm)、内稃(小花7.0 mm)以及雌蕊(穗长10.0~14.0 cm)中高表达,表明其可能与花器官发育相关,但我们也发现,该基因在不同长度的花药组织中均没有高表达,因此推断该基因可能并不影响雄配子体的发育。第2个报道的基因是Os03g38870(OsDof3)[32-33],该基因被认为参与种子发育的调控过程,它的表达主要集中于发芽的种子,并且通过赤霉素信号途径在水稻种子萌发过程起作用。从本研究图6可以发现该基因在子房、胚和胚乳中均呈现出高表达。第 3个基因是 Os08g38220 (OsDof25)[34],研究者通过在拟南芥中过度表达OsD-of25基因,发现其能够改变碳氮代谢,从而增加了氨基酸的浓度,此外,该基因还被发现能够提高氨的转运蛋白(AtAMT1.1 and AtAMT2.1)的表达水平以及抑制硝酸盐转运蛋白(AtNRT2.1)的表达。从本研究图6可以发现该基因在花药、雌蕊、外稃和內稃中均呈现出高表达。我们认为基因的表达模式与基因的功能有着密切的关系,相关基因的表达芯片数据能为水稻Dof转录因子进一步的功能验证提供线索。
图6 Dof基因在水稻不同组织不同时间的表达Heatmap图分析Fig.6 Heatmap representation and hierarchical clustering of rice Dof transcription factor genes in different rice tissues
[1] YANAGISAWA S,SCHMIDT R J.Diversity and similarity among recognition sequences of Dof transcription factors[J].The Plant Journal,1999,17(2):209-214.
[2] RIECHMANN J L,HEARD J,MARTIN G,et al.Arabidopsis transcription factors:genome-wide comparative analysis among eukaryotes[J].Science,2000,290(5499):2105-2110.
[3] YANAGISAWA S.A novel DNA-binding domain that may form a single zinc finger motif[J].Nucleic Acids Research,1995,23 (17):3403-3410.
[4] YANAGISAWA S.Dof DNA-binding domains of plant transcription factors contribute to multiple protein-protein interactions[J].European Journal of Biochemistry,1997,250(2):403-410.
[5] YANAGISAWA S,IZUI K.Molecular cloning of two DNA-binding proteins of maize that are structurally different but interact with the same sequence motif[J].Journal of Biological Chemistry,1993, 268(21):16028-16036.
[6] YANAGISAWA S.The Dof family of plant transcription factors[J].Trends in Plant Science,2002,7(12):555-560.
[7] LIJAVETZKY D,CARBONERO P,VICENTE-CARBAJOSA J.Genome-wide comparative phylogenetic analysis of the rice and Arabidopsis Dof gene families[J].BMC Evolutionary Biology,2003,3:17.
[8] SHAW L M,MCINTYRE C L,GRESSHOFF P M,et al.Members of the Dof transcription factor family in Triticum aestivum are associated with light-mediated gene regulation[J].Functional&Integrative Genomics,2009,9(4):485-498.
[9] MORENO-RISUENO M A,MARTINEZ M,VICENTE-CARBAJOSA J,et al.The family of Dof transcription factors:from green unicellular algae to vascular plants[J].Molecular Genetics and Genomics,2007,277(4):379-390.
[10]GUO Y,QIU L J.Genome-wide analysis of the Dof transcription factor gene family reveals soybean-specific duplicable and functional characteristics[J].PLoS One,2013,8(9):e76809.
[11]KUSHWAHA H,GUPTA S,SINGH V K,et al.Genome wide identification of Dof transcription factor gene family in sorghum and its comparative phylogenetic analysis with rice and Arabidopsis[J].Molecular Biology Reports,2011,38(8):5037-5053.
[12]YANAGISAWA S.Dof1 and Dof2 transcription factors are associated with expression of multiple genes involved in carbon metabolism in maize[J].The Plant Journal,2000,21(3):281-288.
[13]VICENTE-CARBAJOSA J,MOOSE S P,PARSONS R L,et al.A maize zinc-finger protein binds the prolamin box in zein gene promoters and interacts with the basic leucine zipper transcriptional activator Opaque2[J].Proceedings of the National Academy of Sciences of the United States of America,1997,94(14):7685-7690.
[14]BAUMANN K,DE PAOLIS A,COSTANTINO P,et al.The DNA binding site of the Dof protein NtBBF1 is essential for tissue-specific and auxin-regulated expression of the rolB oncogene in plants[J].The Plant Cell,1999,11(3):323-333.
[15]WANG H W,ZHANG B,HAO Y J,et al.The soybean Dof-type transcription factor genes,GmDof4 and GmDof11,enhance lipid content in the seeds of transgenic Arabidopsis plants[J].The Plant Journal,2007,52(4):716-729.
[16]CHEN W,CHAO G,SINGH K B.The promoter of a H2O2-inducible,Arabidopsis glutathione S-transferase gene contains closely linked OBF-and OBP1-binding sites[J].The Plant Journal,1996,10(6):955-966.
[17]LI D,YANG C,LI X,et al.Functional characterization of rice OsD-of12[J].Planta,2009,229(6):1159-1169.
[18] DONG G,NI Z,YAO Y,et al.Wheat Dof transcription factor WPBF interacts with TaQM and activates transcription of an alphagliadin gene during wheat seed development[J].Plant Molecular Biology,2007,63(1):73-84.
[19]GUO Y,QIN G,GU H,et al.Dof5.6/HCA2,a Dof transcription factor gene,regulates interfascicular cambium formation and vascular tissue development in Arabidopsis[J].The Plant Cell,2009,21(11):3518-3534.
[20]KONISHI M,YANAGISAWA S.Sequential activation of two Dof transcription factor gene promoters during vascular development in Arabidopsis thaliana[J].Plant Physiology and Biochemistry,2007,45(8):623-629.
[21]FINN R D,BATEMAN A,CLEMENTS J,et al.Pfam:the protein families database[J].Nucleic Acids Research,2014,42:222-230.
[22]LETUNIC I,DOERKS T,BORK P.SMART 7:recent updates to the protein domain annotation resource[J].Nucleic Acids Research,2012,40(D1):302-305.
[23]JIN J,ZHANG H,KONG L,et al.PlantTFDB 3.0:a portal for the functional and evolutionary study of plant transcription factors[J].Nucleic Acids Research,2014,42(Database issue):1182-1187.
[24]BAILEY T L,BODEN M,BUSKE F A,et al.MEME SUITE:tools for motif discovery and searching[J].Nucleic Acids Research,2009,37:202-208.
[25]THOMPSON J D,GIBSON T J,PLEWNIAK F,et al.The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools[J].Nucleic Acids Research,1997,25(24):4876-4882.
[26]CROOKS G E,HON G,CHANDONIA J M,et al.WebLogo:a sequence logo generator[J].Genome Research,2004,14(6):1188-1190.
[27]TAMURA K,PETERSON D,PETERSON N,et al.MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods[J].Molecular Biology and Evolution,2011,28(10):2731-2739.
[28]LEE T H,TANG H,WANG X,et al.PGDD:a database of gene and genome duplication in plants[J].Nucleic Acids Research,2013,41:1152-1158.
[29]KRZYWINSKI M,SCHEIN J,BIROL I,et al.Circos:an information aesthetic for comparative genomics[J].Genome Research,2009,19(9):1639-1645.
[30]EISEN M B,SPELLMAN P T,BROWN P O,et al.Cluster analysis and display of genome-wide expression patterns[J].Proceedings of the National Academy of Sciences of the United States of America,1998,95(25):14863-14868.
[31] LI D,YANG C,LI X,et al.Sense and antisense OsDof12 transcripts in rice[J].BMC Molecular Biology,2008,9:80.
[32]WASHIO K.Identification of Dof proteins with implication in the gibberellin-regulated expression of a peptidase gene following the germination of rice grains[J].Biochimica et Biophysica Acta,2001,1520(1):54-62.
[33] WASHIO K.Functional dissections between GAMYB and Dof transcription factors suggest a role for protein-protein associations in the gibberellin-mediated expression of the RAmy1A gene in the rice aleurone[J].Plant Physiology,2003,133(2):850-863.
[34]SANTOS L A,DE SOUZA S R,FERNANDES M S.OsDof25expression alters carbon and nitrogen metabolism in Arabidopsis under high N-supply[J].Plant Biotechnology Reports,2012,6(4):327-337.