毛竹生长素反应因子基因的生物信息学分析及差异表达
2017-08-16程占超马艳军
程占超,侯 丹,马艳军,高 健
(国际竹藤中心 国 家林业局竹藤科学与技术重点开放实验,北京100102)
毛竹生长素反应因子基因的生物信息学分析及差异表达
程占超,侯 丹,马艳军,高 健
(国际竹藤中心 国 家林业局竹藤科学与技术重点开放实验,北京100102)
生长素反应因子(ARF)基因家族在植物的生长发育中起至关重要的作用。关于毛竹Phyllostachys edulis ARF基因家族在花器官中生物信息学分析未见报道。以毛竹花器官为材料,采用生物信息学的方法,对毛竹中ARF基因进行筛选,并对其系统进化关系、保守基序及在花器官中的差异表达模式进行了初步的分析。结果表明:毛竹全基因组中含有44个ARF基因,分为Ⅰ,Ⅱ,Ⅲ类。与拟南芥Arabidopsis thaliana和水稻Oryza sativa分别比较,发现毛竹与水稻存在11个姐妹同源基因对。此外,PheARF13,PheARF14和PheARF35在花芽、雌蕊和幼胚中高量表达,同时PheARF2,PheARF30,PheARF14,PheARF13,PheARF35,PheARF7,PheARF37,PheARF38在雌蕊和幼胚中高量表达,推测这些基因可能在花发育和种子发育中发挥重要的作用。图3表1参32
林木育种学;毛竹;生长素应答因子;花发育
植物生长激素能够调节或者影响植物不同的生理过程,比如顶端优势、侧根萌发、导管分化、胚胎发育和芽的伸长,也可以促进细胞的分裂、延伸和分化[1]。在分子水平上,生长素能够特异性地调节基因的表达[2]。生长素信号转导相关的3类主要蛋白是Aux/IAAs,ARFs和SCF复合体[3-4]。作为生长素信号途径一个重要的成员,ARFs基因能够通过结合生长素启动子上的AuxRE来调控生长素反应基因的表达[5]。这些ARFs基因调控不同的发育过程,比如顶芽形成,导管组织的形成,胚胎、花和果实的形成[6]。一个经典的ARF蛋白,结构相对简单,大部分蛋白的分子量为70~130 kD,含有3个保守的结构域,它们分别是N末端DNA结合结构域(DBD),中间区域(MR)和C末端二聚体结构域(CTD)。不同的结构域也决定ARF不同的功能,DBD在信号转导中起着鉴别作用,CTD可以使ARF之间形成二聚体,而MR则起着转录激活或抑制的功能[7]。ULMASOV等[8]鉴定出第1个ARF基因,即AtARF1,先后在拟南芥Arabidopsis thaliana和水稻Oryza sativa中鉴定出23和25个ARF基因[9-10]。ARFs大部分在植物中发现,比如在双子叶、单子叶、裸子和蕨类植物中都有发现,但是在动物和微生物中至今没有发现。因此,ARFs是植物中特有的一类转录因子[11]。ARF的生物学功能主要来自拟南芥ARF基因功能缺失的表型,到目前为止,已经发现很多ARF基因及其功能,比如ARF3和ARF7[12-14]。研究表明:拟南芥arf3的突变体会出现花蕊基部和顶端的发育不良,说明ARF3在调节花器官发育上起作用;缺失ARF7,导致上胚轴的向光性和下胚轴的向地性功能的消失。这2个ARF基因有着不同的功能,很少在功能上出现冗余现象。毛竹Phyllostachys edulis与水稻、玉米Zeamays等同属于禾本科Gramineae单子叶植物,但是,毛竹营养生长周期长,开花时期不确定,开花后死亡,导致竹林面积减少,对经济发展和生态环境造成重大损失和破坏,竹子开花的调控机制一直是竹类植物研究中的难点和热点。目前,ARF家族基因在模式植物拟南芥、水稻、玉米中已有研究,而毛竹ARF家族基因在花器官和幼胚发育上鲜有报道。本研究通过生物信息学的方法,根据毛竹的基因组,鉴定ARF基因家族,进行进化树分析、基序分析、基因差异表达模式分析,为研究ARF基因在毛竹花和种子发育过程中的功能奠定基础。
1 材料与方法
1.1 实验材料
毛竹开花实验地位于广西壮族自治区桂林市南岭山系的西南部。该毛竹林属于自然生长状态,基本无人为干扰。以毛竹的花器官为材料,进行解剖,分离出花芽、苞片、颖片、稃片、雄蕊、雌蕊和幼胚以及未开花的成熟叶片,建立8个样本进行转录组高通量测序。
1.2 方法
1.2.1 毛竹中PheARF家族成员的检索 从拟南芥基因组数据库(http://www.arabidopsis.org/)和水稻基因组数据库(http://rice.plantbiology.msu.edu/index.html)中分别检索拟南芥和水稻中ARF蛋白序列;毛竹ARF相关蛋白序列从毛竹基因组数据库(http://www.bamboogdb.org/index.jsp)中获得。毛竹PheARF家族蛋白的序列号,开放阅读框的长度、氨基酸数目、分子质量和等电点在表1中提供。毛竹ARF分子量及等电点数据通过ExPASY(http://web.expasy.org/compute_pi/)获得。
1.2.2 进化树分析 用ClustalX 1.83(http://www.clustal.org/)[15]软件对蛋白全长的多序列比对进行分析,进化树分析前去掉比对序列的差异和不明确序列。用no-rooted neighbor-joining方法通过 MEGA 6.0(http://www.megasoftware.net/mega.html)[16]构建系统进化树。
1.2.3 基序分析 MEME version 4.11.2(http://meme-suite.org/)[17]在线工具鉴定候选蛋白序列的保守区域,公式为any,maximum number ofmotifs=20,minimum width≥6和maximum width≤200。
1.2.4 表达量分析 将花芽、苞片、颖片、稃片、雄蕊、雌蕊和幼胚以及未开花的成熟叶片的FPKM值输入到Cluster 3.0,用Java TreeView生成热点图[18]。
2 结果
2.1 毛竹PheARF家族序列鉴定
通过23个拟南芥和25个水稻ARF蛋白序列检索毛竹基因组数据库,共得到44个ARF蛋白(表1)。从表1可以看出,ARF家族的蛋白的等电点为5.22~9.23,蛋白序列的长度为192~1 257个氨基酸,分子量的大小为31.70~139.07 kD。
表1 毛竹中ARF成员数量及其属性Table 1 Properties and numbers of ARF identified from Phyllostachys edulis
2.2 毛竹PheARF家族进化分析
系统进化结果显示:44个基因之间相似性比较高(图1)。将44个毛竹的ARF蛋白列同23个拟南芥和25个水稻的蛋白序列同时比对,发现可以将这3个物种的ARF分为三大类,分别为Ⅰ,Ⅱ和Ⅲ。其中有13个基因分布在Ⅰ类,17个基因分布在Ⅱ类,还有14个基因属于Ⅲ类。大部分的PheARFs包含3个经典的结构域:DBD,结构域Ⅱ和AUX/IAA家族结构域。有11个与水稻的同源关系较近的基因对:OsAR25/PheARF30(Ⅱ),OsARF16/PheARF40(Ⅱ),OsARF19/PheARF31(Ⅱ),OsARF15/PheARF37(Ⅲ),OsARF2/PheARF14(Ⅲ),OsARF14/PheARF39(Ⅲ),OsARF3/PheARF2 6(Ⅲ),OsARF13/ PheARF38(Ⅲ),OsARF8/PheARF16(Ⅲ),OsARF10/PheARF10(Ⅲ)和OsARF18/PheARF18(Ⅲ)。这些基因大部分出现在Ⅱ类和Ⅲ类中,说明这2类的基因相对比较保守。
2.3 毛竹PheARF基序分析
为了进一步了解毛竹ARF保守区域的结构,通过MEME在线工具构建基序分析图,结果如图2所示。毛竹ARF成员含有的基序结构不一,大概有20个不同的基序组成。其中每个基因都包含不同种类的基序,大部分的基序为4~17个。大部分的PheARF基因都包含Motif1~8,Motif10,Motif11,Motif14,Motif18和Motif20等,这些基序出现的次数较多,而Motif13,Motif16和Motif17等基序在这些基因中不常见。从进化角度来看,同源关系较近的Ⅰ,Ⅱ,Ⅲ类的基因在基序的长度和种类较为相似,比如Ⅰ类的 PheARF4,PheARF9和 PheARF32等,Ⅱ类的 PheARF22,PheARF31和 PheARF33等,Ⅲ类的PheARF17,PheARF18和PheARF37等。以上结果说明大部分的毛竹ARF家族基因是相当保守的。
2.4 毛竹PheARF基因在花器官中差异表达分析
为了研究毛竹PheARF基因在花器官发育中的作用和调控机制,进一步分析PheARF基因在花芽、苞片、颖片、稃片、雌蕊、雄蕊、幼胚和未开花的叶中表达分析。结果表明:PheARF12,PheARF13,PheARF14,PheARF15,PheARF24,PheARF35,PheARF43,PheARF23和PheARF32在花芽中高量表达,说明这些ARF基因可能在开花初期起着重要的调控作用(图3)。在雄蕊中,PheARF9,PheARF29,PheARF31, PheARF10, PheARF4, PheARF22, PheARF11, PheARF25, PheARF40, PheARF8,PheARF39,PheARF1,PheARF44,PheARF45,PheARF42和PheARF41高量表达,但是这些基因在幼胚中表达量极低。PheARF2,PheARF30,PheARF14,PheARF13,PheARF35,PheARF7,PheARF37和PheARF38在雌蕊中表达量较高,同时在幼胚中也高量表达,说明这些基因同时调控毛竹雌蕊形成和幼胚的发育。PheARF13,PheARF14和PheARF35同时在花芽、雌蕊和幼胚中高表达,这3个基因可能既调控开花又能控制花的发育。此外,PheARF5,PheARF18,PheARF27,PheARF10和PheARF4在颖片和稃片中都高量表达,可能调节稃片和颖片的发育。
图1 毛竹、水稻和拟南芥ARF的系统进化树分析Figure 1 Phylogenetic analyses of the ARF proteins in Phyllostachys edulis,Oryza sativa and Arabidopsis thaliana
3 讨论
生长素是植物器官发育和模式形态形成和发育非常重要的信号分子。生长素转导途径中最重要的2类家族分别为ARFs和Aux/IAAs[19]。在发育过程中,ARFs能直接地调控下游靶基因的表达[6,20],但大部分的ARF和Aux/IAA都是以家族的形式存在,所以它们在植物体内的调控机制是相当复杂的[21-23]。ARFs基因也参与生殖过程[24]。木瓜Carica papaya和番茄Solanum lycopersicum的ARFs基因家族的分析和鉴定揭示了该家族基因在花和果实的发育过程中具有调控作用[25-26]。
在本研究中,通过生物信息学工具,检索44个毛竹的ARF基因。在拟南芥和水稻中的ARF基因分别为23和25个。ARF基因家族在不同植物中成员数量不同,这可能与植物体内的基因组复制有关[27],而基因数量多少由该基因复制事件的频率决定。毛竹基因组为2 G左右[28],大于水稻和拟南芥的基因组。以上分析表明:毛竹ARF基因复制事件的频繁发生有可能导致毛竹ARF家族成员数量增多。通过系统进化分析,毛竹ARF家族基因大致分为3个亚组(图1),亚组内的基因相似性比较高,但是亚组之间相似性不高,或许在基因功能上也有差异。毛竹与拟南芥和水稻的ARF家族的系统进化关系表明,毛竹与水稻之间有11对同源基因对,这些基因对都属于Ⅱ类和Ⅲ类,一方面说明毛竹的ARF家族与水稻有很高的同源性(图1),另一方面说明毛竹ARF家族Ⅱ类和Ⅲ类的基因保守性很高。
图2 毛竹ARF保守基序分析Figure 2 Distribution of conserved motifs in Phylloastachys edulis ARF proteins identified using MEME search tool
研究人员对水稻和拟南芥的ARF基因进行了广泛地研究[29-31]。ARF基因在花和种子发育中起着非常重要的作用,为研究毛竹的开花及种子发育提供了许多有用的信息。据报道,拟南芥的AtARF3和AtARF4参与花的发育,在花中高量表达[32]。与AtARF3和AtARF4同源的毛竹PheARF14和PheARF37在幼胚和雌蕊中都高量表达,说明2个毛竹ARF基因可能与AtARF3和AtARF4基因功能相似,推测它们在毛竹花和种子发育过程中起着关键的作用。
图3 毛竹PheARF基因在不同花器官中表达模式分析Figure 3 Expression analysis of PheARF genes among different flower organs of Phyllostachys edulis
[1] DAVIES P J.Plant Hormones:Physiology,Biochemistry and Molecular Biology[M].Dordrecht:Kluwer Academic Publishers,2013.
[2] THEOLOGISA.Rapid gene regulation by auxin[J].Ann Rev Plant Physiol,1986,37(1):407-438.
[3] GUILFOYLE T J,ULMASOV T,HAGEN G.The ARF family of transcription factors and their role in plant hormoneresponsive transcription[J].Cell Mol Life Sci,1998,54(7):619-627.
[4] SHEN Chenjia,YUE Runqing,SUN Tao,et al.Genome-wide identification and expression analysis of auxin response factor gene family in Medicago truncatula[J].Front Plant Sci,2015,6(11):3932-3935.
[5] TIWARISB,HAGEN G,GUILFOYLE T.The roles of auxin response factor domains in auxin-responsive transcription[J].Plant Cell,2003,15(2):533-543.
[6] GUILFOYLE T J,HAGEN G.Auxin response factors[J].Curr Opin Plant Biol,2007,10(5):453-460.
[7] RAMOS JA,ZENSER N,LEYSER O,et al.Rapid degradation of auxin/indoleacetic acid proteins requires conserved amino acids of domainⅡand is proteasome dependent[J].Plant Cell,2001,13(10):2349-2360.
[8] ULMASOV T,HAGEN G,GUILFOYLE T J.ARF1,a transcription factor that binds to auxin response elements[J]. Science,1997,276(5320):1865-1868.
[9] HAGEN G,GUILFOYLE T.Auxin-responsive gene expression:genes,promoters and regulatory factors[J].Plant Mol Biol,2002,49(3/4):373-385.
[10] REMINGTON D L,VISION T J,GUILFOYLE T J,et al.Contrasting modes of diversification in the Aux/IAA andARF gene families[J].Plant Physiol,2004,135(3):1738-1752.
[11] LISCUM E,REED JW.Genetics of Aux/IAA and ARF action in plant growth and development[J].Plant Mol Biol, 2002,49(3/4):387-400.
[12] SESSIONSR.Arabidopsis (Brassicaceae)flower development and gynoecium patterning in wild type and ettin mutants[J].Am JBot,1997,84(9):1179-1179.
[13] HARDTKE C S,BERLETH T.The Arabidopsis gene MONOPTEROS encodes a transcription factormediating embryo axis formation and vascular development[J].EMBO J,1998,17(5):1405-1411.
[14] HARPER R M,STOWE-EVANSE L,LUESSE D R,et al.The NPH4 locus encodes the auxin response factor ARF7, a conditional regulator of differential growth in aerial Arabidopsis tissue[J].Plant Cell,2000,12(5):757-770.
[15] THOMPSON JD,GIBSON T J,PLEWNIAK F,et al.The CLUSTAL_X windows interface:flexible strategies formultiple sequence alignment aided by quality analysis tools[J].Nucl Acids Res,1997,25(24):4876-4882.
[16] TAMURA K,STECHER G,PETERSON D,et al.MEGA6:molecular evolutionary genetics analysis version 6.0[J]. Mol Biol Evol,2013,30(12):2725-2729.
[17] BAILEY T L,ELKAN C.The value of prior knowledge in discoveringmotifs with MEME[C].Proc Third Int Conf Intel SystMol Biol,California:AAAIPress,1995:21-29.
[18] SALDANHA A J.Java Treeview-extensible visualization ofmicroarray data[J].Bioinformatics,2004,20(17):3246-3248.
[19] FARCOTE,LAVEDRINE C,VERNOUX T.Amodular analysis of the auxin signalling network[J].PloSOne,2015, 10(3):864-865.
[20] ULMASOV T,MURFETT J,HAGEN G,et al.Aux/IAA proteins repress expression of reporter genes containing natural and highly active synthetic auxin response elements[J].Plant Cell,1997,9(11):1963-1971.
[21] 王垒,陈劲枫,娄丽娜,等.黄瓜果实中 ARF和 Aux/IAA基因对外源激素的应答[J].西北植物学报,2011,31(6):1127-1131.
WANG Lei,CHEN Jinfeng,LOU Lina,et al.Expression analysis about some ARF and Aux/IAA family members in fruits of cucumberwith exogenous hormones[J].Acta Bot Boreal-Occident Sin,2011,31(6):1127-1131.
[22] 史梦雅,李阳,张巍,等.生长素反应因子作用机制研究进展[J].生物技术通报,2012(8):24-28.
SHIMengya,LIYang,ZHANGWei,et al.Progress in mechanism of auxin response factors[J].Biotechnol Bull, 2012(8):24-28.
[23] AUDRAN-DELALANDE C,BASSA C,MILA I,et al.Genome-wide identification,functional analysis and expression profiling of the Aux/IAA gene family in tomato[J].Plant Cell Physiol,2012,53(4):659-672.
[24] CHO H,RYU H,RHO S,et al.A secreted peptide acts on BIN2-mediated phosphorylation of ARFs to potentiate auxin response during lateral root development[J].Nat Cell Biol,2014,16(1):66-76.
[25] PAULL R E,IRIKURA B,WU Pingfang,et al.Fruit development,ripening and quality related genes in the papaya genome[J].Trop Plant Biol,2008,1(3/4):246-277.
[26] KUMAR R,TYAGIA K,SHARMA A K.Genome-wide analysis of auxin response factor(ARF)gene family from tomato and analysis of their role in flower and fruit development[J].Mol Gen Genomics Mgg,2011,285(3):245-260.
[27] OHNO S.Evolution by Gene Duplication[M].Heidelberg:Springer Verlag,2013.
[28] PENG Zhenhua,LU Ying,LILubin,et al.The draft genome of the fast-growing non-timber forest speciesmoso bamboo(Phyllostachys heterocycla)[J].Nat Gen,2013,45(4):456-461.
[29] QIYanhua,WANG Suikang,SHEN Chenjia,et al.OsARF12,a transcription activator on auxin response gene,regulates root elongation and affects iron accumulation in rice(Oryza sativa)[J].New Phytol,2012,193(1):109-120.
[30] COLE M,CHANDLER J,WEIJERS D,et al.DORNRÖSCHEN is a direct target of the auxin response factor MONOPTEROS in the Arabidopsis embryo[J].Development,2009,136(10):1643-1651.
[31] LIJisheng,DAIXinhua,ZHAO Yunde.A role for auxin response factor 19 in auxin and ethylene signaling in Arabidopsis[J].Plant Physiol,2006,140(3):899-908.
[32] HUNTER C,WILLMANN M R,WU Gang,et al.Trans-acting siRNA-mediated repression of Ettin and ARF4 regulates heteroblasty in Arabidopsis[J].Development,2006,133(15):2973-2981.
Bioinformatic analysis and differential expression of auxin response factor(ARF)gene in Phyllostachys edulis
CHENG Zhanchao,HOU Dan,MA Yanjun,GAO Jian
(Key Laboratory of Bamboo and Rattan Science and Technology of State Forestry Administration,International Center for Bamboo and Rattan,Beijing 100102,China)
The auxin response factor (ARF)gene family plays a key role in plant growth and developmental processes,such as root and shoot development aswell as flower and fruit development.To provide a theoretical basis for flower and seed development of Phyllostachys edulis,a genome-wide analysis of the previously undocumented ARF gene family for Ph.edulis was conducted.In this study a whole-genome survey of Ph.edulis was performed and a detailed analysis of the gene motif and phylogenetic classification was provided.Results showed 44 ARF geneswhich were classified into three groups.A comparative analysis of the ARF genes among Ph.edulis,rice,and Arabidopsis suggested a total of 11 sister pairs (OsARF-PheARF)providing insights into various orthologous relationships between OsARFs and PheARFs.For ARF expression patterns of diverse floral organs,PheARF13,PheARF14,and PheARF35 showed the highest expression in the flower bud,pistil,and young embryo;whereas,PheARF2,PheARF30,PheARF14,PheARF13,PheARF35,PheARF7,PheARF37,and PheARF38 were highly expressed in the pistil and the young embryo.This study suggested that ARF genesmay play a very critical role during flower and fruit development of Ph.edulis.[Ch,3 fig.1 tab.32 ref.]
forest tree breeding;Phyllostachys edulis;auxin response factors;floral development
S722
A
2095-0756(2017)04-0574-07
10.11833/j.issn.2095-0756.2017.04.002
2016-06-13;
2016-07-14
国家高技术研究发展计划(“863”计划)项目(2013AA102607-4);国家自然科学基金资助项目(31570673)
程占超,博士,从事林木遗传育种研究。E-mail:chengzhan_chao@126.com。通信作者:高健,研究员,博士,博士生导师,从事林木遗传育种研究。E-mail:gaojian@icbr.ac.cn