蓝莓FLC基因电子克隆及生物信息学分析
2018-05-10龙凌云毛立彦黄寿辉檀小辉於艳萍郝小玲庞新华
龙凌云, 毛立彦, 黄寿辉, 檀小辉, 於艳萍, 郝小玲, 庞新华
(广西壮族自治区亚热带作物研究所,广西南宁 530001)
花是果树极为重要的生殖器官之一,而花芽分化是果树由营养生长向生殖生长转变的重要阶段,对果树的成花过程、花数量和坐果率起着关键作用。花芽分化的早晚和质量对农林业果树生产的产量、质量有重要影响[1]。温度是诱导植物花芽分化的关键环境因子之一,落叶果树通常要经历一个较低温度的积累量(即需冷量)才能够正常诱导花芽分化和开花,需冷量不足通常会导致果树花芽分化不完整,花器官畸形或严重败育[2-3]。落叶果树花芽分化机制研究起步较晚,相关研究成果主要借鉴拟南芥等模式植物的研究。植物开花有4条不同途径,分别是依赖光周期的开花途径、自主开花途径、依赖春化的开花途径和赤霉素途径[4]。FLC(FLOWERINGLOCUSC)基因属于MADS-box基因家族成员,在植物开花过程中具有重要作用[5]。在拟南芥中,低温通过对AtFLC基因的转录及蛋白表达水平进行负调控,从而调控拟南芥花芽分化和成花过程[6]。
蓝莓(Vacciniumspp.)是一种具有独特保健作用和高营养价值的落叶果树,具有广阔的国际市场和发展潜力,我国自20世纪80年代开始开展蓝莓引种和商业化栽培,现已推广至东北三省、山东、浙江、云南、贵州、广东等多个省、区,栽培范围呈现由温带向亚热带、热带地区发展的趋势[7-8]。蓝莓作为一种温带落叶果树,通过低温春化作用达到足量需冷量是保证其花芽正常分化并提高其农林业产量、质量的关键[9-11]。近年来,国内相关科研院所和高校已经从引种栽培特性、形态结构、逆境胁迫响应等方面对温度如何影响蓝莓花芽分化的形态和生理生化机制开展了一系列研究[12-16],但是关于低温调控蓝莓花芽分化的春化途径的分子机制研究较少,尤其是FLC基因响应温度变化调控花芽分化的春化途径分子机制方面的研究尚未见报道。
目前,随着多种模式植物全基因组测序的完成,众多分子相关数据库[如表达序列标签(expressed sequence tag,简称EST)数据库]的建立以及各类生物信息学软件的开发和应用,使借助生物信息学手段对植物FLC基因进行电子克隆、结构和功能预测分析与分子进化分析等研究,以及在较短时间内和较低成本下获取大量可靠的基因、 蛋白结构与功能信
息成为可能。电子克隆技术是以物种EST、核酸序列和蛋白质等数据库为基础,选择相应的生物信息学软件,不断对EST序列进行相似性比对、聚类分析、组装拼接和序列延伸,以期快速获取功能基因的方法,具有成本低、速度快、技术要求低和针对性强等特点[17-18],可为新基因的结构分析、功能鉴定等分子生物学研究带来很大便利。目前,在拟南芥(Arabidopsisthaliana)、大豆(Glycinemax)等模式植物中的电子克隆方法应用已有较多成功先例,但在蓝莓中尚未见报道。本研究基于前人研究方法和蓝莓EST数据库,以已知的拟南芥FLC基因编码蛋白序列(GenBank登录号:AAN04056.1)作为探针,采用电子克隆方法获取1个蓝莓FLC基因,并对其进行相关生物信息学和系统进化分析,为进一步研究蓝莓FLC基因及其编码蛋白在低温调控的春化途径下如何参与蓝莓花芽分化和成花的分子机制奠定了基础。
1 材料与方法
1.1 材料
以在美国国立生物技术信息中心(national center for biotechnology information,简称NCBI)的GenBank数据库中已注册的拟南芥FLC基因编码蛋白序列(GenBank登录号:AAN04056.1)为探针,采用电子克隆方法获得蓝莓FLC基因。
1.2 方法
1.2.1 电子克隆获得蓝莓FLC基因和开放阅读框预测 以拟南芥FLC基因编码蛋白序列(GenBank登录号:AAN04056.1)为探针序列,在NCBI数据库中运用tBLASTn工具,搜索蓝莓EST序列数据库。选择BLAST获得的相似性较高的蓝莓EST序列,利用DNAStar软件进行序列拼接,将拼接后的序列作为探针反复搜索蓝莓EST数据库,并进行序列拼接,直至序列无法延伸,最后获得的序列即为电子克隆得到的蓝莓FLC基因。利用NCBI提供的ORF Finder软件,根据标准遗传代码(the genetic codes)预测蓝莓FLC基因的开放阅读框(open reading frame,简称ORF)。
1.2.2 蓝莓FLC基因编码蛋白序列的生物信息学分析 从NCBI数据库中获取拟南芥、葡萄(Vitisvinifera)、柑橘(Poncirustrifoliata)、可可树(Theobromacacao)、白桦(Betulaplatyphylla)、梨树(Pyruspyrifolia)等19种植物FLC基因,利用CLUSTAL X 2.0将它们的编码蛋白与蓝莓FLC基因编码蛋白进行多重序列比对,在GeneDOC中查看它们的蛋白保守序列。使用ProtParam在线软件分析蓝莓FLC基因编码蛋白的理化性质;使用Protscal在线软件分析蛋白亲/疏水性;使用SOPMA在线软件预测分析蛋白二级结构;使用SWISS-MODEL在线软件预测蛋白的三级结构,并用SPDBV软件查看预测的蛋白三级结构,进行Ranachandran检测。相关在线分析软件的名称和网址见表1。
表1在线分析软件的名称和网址
1.2.3 蓝莓VaFLC蛋白相似性及系统进化分析 从NCBI数据库获取拟南芥、葡萄、柑橘、可可树、白桦、梨树等19种植物的FLC基因,用MEGA5.0软件对它们的编码蛋白序列和蓝莓FLC基因编码蛋白序列进行相似性比对,采用最大似然法构建系统发育树,并对生成的系统发育树进行Bootstrap校正。
2 结果与分析
2.1 蓝莓FLC基因的获取和ORF预测
以拟南芥FLC基因的编码蛋白序列作为探针,在NCBI中的蓝莓EST数据库中进行tBLASTn检索,获得26条相似性较高的EST片段,删除冗余序列后剩下12条。利用DNAStar软件对筛选出的EST序列进行拼接,获得1个contig重叠群,将获得的contig进行重复搜索、拼接,最终电子克隆出1条完整的蓝莓FLC类基因序列,该基因cDNA全长为1 303 bp,包含1个753 bp的ORF框,起始密码子位点为第 311 bp 处,终止密码子位点为第1 063 bp处,编码250个氨基酸(图1),编码蛋白命名为VaFLC。
2.2 蓝莓VaFLC蛋白理化性质分析
蓝莓VaFLC蛋白一级结构分析结果显示,该蛋白分子量为2.908 08 ku, 等电点为7.08, 分子式为C1267H2004N368O394S12,含量最丰富的前5种氨基酸分别为亮氨酸(简称Leu,12.0%)、谷氨酰胺(简称Gln,10.4%)、谷氨酸(简称Glu,9.6%)、丝氨酸(简称Ser,7.6%)和赖氨酸(简称Lys,6.8%)。
2.3 蓝莓VaFLC蛋白保守序列、亲/疏水性、二级结构和三级结构预测分析
植物FLC类基因属于MADS-box基因家族中的重要成员[19-20],目前已知的植物MASD-box基因产物绝大多数属于植物Ⅱ型MADS-box基因,该类型基因编码蛋白主要有4个部分组成,分别是MEF2-like MADS域、I域、K域和C域[21]。蓝莓VaFLC蛋白保守序列分析(图2)、亲/疏水性预测和二级结构预测结果(图3)表明,蓝莓VaFLC蛋白在N端第1~56aa位置的氨基酸残基组成1个最高保守序列区域,且该区域与其他物种FLC蛋白的相似性高于90%;VaFLC蛋白在第85~156aa位置的氨基酸残基大多数为疏水性,与其他物种FLC蛋白类似位置的氨基酸具有一定的保守性,并且该段氨基酸残基在二级结构上可形成3个连续的α-螺旋二级结构(图4);此外,第57~84aa位置的氨基酸和C端第157~250aa位置的氨基酸残基与其他植物FLC蛋白相似位置的相似性较差,且C端多数由疏水性氨基酸残基构成。上述研究结果表明,蓝莓FLC基因编码的VaFLC蛋白符合植物Ⅱ型MADS-box基因编码蛋白的结构特征。此外,二级结构预测分析结果显示,蓝莓VaFLC蛋白中α-螺旋(alpha helix)占50.8%,无规则卷曲(random coil)、延伸链(extended strand)、β转角(beta turn)分别占22.4%、15.6%、11.2%,其中α-螺旋二级结构最多,这可能与VaFLC蛋白含有K域这一特殊的保守结构域有关。以拟南芥(Arabidopsisthaliana)中SEPALLATA3蛋白的X晶体衍射结构[22][分子模型数据库(MMDB)身份编号(ID):124051)]作为模板,在SWISS-MODEL服务器上预测蓝莓VaFLC蛋白部分片段的三级结构。经序列比对,VaFLC蛋白与模版SEPALLATA3的相似性为61.63%,符合进行同源建模的要求[23],说明检索得到的SEPALLATA3晶体结构可作为预测的VaFLC蛋白同源建模模版。由图5可知,同源建模构建的VaFLC蛋白在第89~174aa位置的氨基酸残基形成的空间结构,主链二面角Φ、Ψ落于虚线内中心区域的氨基酸残基在95%以上,落于黑线之外的主链二面角Φ、Ψ不足5%,绝大多数主链二面角Φ、Ψ均在正常范围内,仅有少量氨基酸残基的二面角Φ、Ψ落于不合理区域。理论分析表明,本试验所构建的VaFLC蛋白部分片段的空间结构是合理可靠的。基于拉氏图检测结果,由图6可知,VaFLC蛋白的部分蛋白片段预测三维结构主要由α-螺旋、无规则卷曲结构构成,这符合二级结构预测中关于VaFLC蛋白保守结构K域的特征,进一步说明本研究的电子克隆的基因属于植物FLC类基因。
2.4 蓝莓VaFLC蛋白的相似性和进化地位分析
利用NCBI中BLASTp程序,将蓝莓VaFLC蛋白序列与拟南芥等19种植物中已知的FLC蛋白序列进行同源比对。表2结果表明,VaFLC蛋白与其他植物的FLC蛋白具有广泛的相似性,除与大豆的相似性为38%外,与其他15种植物的FLC蛋白都具有高于40%的相似性,其中与葡萄、柑橘具有47%的相似性,与拟南芥、可可树、白桦具有46%的相似性,与梨树具有45%的相似性;此外,VaFLC蛋白与这19种植物FLC蛋白在N端前56个氨基酸序列的相似性高于90%,推测它们在N端的序列具有较高同源性, 可能与它们含有相同的保守结构域有关。
表2VaFLC与19种植物FLC的相似性比较结果
为了分析蓝莓VaFLC蛋白与其他植物中已知FLC蛋白之间的进化关系,笔者选取拟南芥、葡萄、柑橘、白桦、可可树、梨树等19种植物的FLC蛋白进行同源比对,构建系统进化树。由图6可知,参与比对的植物FLC蛋白在被子植物的进化过程中,最初形成2个分支,分别是草本植物分支、木本植物分支。其中,拟南芥、芥菜、白芥、盐芥、山萮菜、萝卜、甘蓝和萝卜的FLC蛋白在系统发育树上聚集于同一分支,均属于十字花科植物,而大豆FLC蛋白在草本植物方向独立分支与十字花科植物并列。在木本植物的进化方向上,山核桃、胡桃、茶树和梨树在同一分支,柑橘、娑罗双和可可树在同一分支,而葡萄、白桦、咖啡树和蓝莓的FLC蛋白分别形成独立分支,推测蓝莓FLC基因在进化过程中还保留了部分原始特征。
3 讨论与结论
植物FLC基因属于MADS-box基因家族中的重要成员,在低温需求型植物(如落叶植物)花芽分化和成花过程中起着关键作用,低温可对该类基因的转录及编码蛋白表达水平进行负调控,从而促进植物开花[24-25]。本研究基于蓝莓EST数据库,运用电子克隆方法获得1个cDNA全长 1 303 bp,包含1个753 bp开放阅读框,编码250个氨基酸的蓝莓FLC基因。该基因编码蛋白在N端含有1个由56个氨基酸残基构成的高度保守结构域(MEF2-like MADS域),是MADS-box基因家族中植物Ⅱ型(MIKC型)的特征序列之一,可作为序列特异的DNA结合单元[26],亦可参与MADS-box蛋白二聚化从而增强调控蛋白结构的多样性和增加靶标基因的多样性与特异性[27-28];生物信息学分析发现,该基因编码蛋白还含有1个半保守的K域,现有研究表明,MADS-box蛋白的K域结构具有调节蛋白间相互作用的功能[29]。亲/疏水性预测结果显示,该区域氨基酸残基主要由疏水性残基构成,二级结构预测结果显示,该区域可形成3个连续的 α-螺旋区,分别为K1、K2和K3区,通过对蓝莓VaFLC蛋白的三级结构进行预测分析,进一步表明VaFLC蛋白在K域中确实含有大量α-螺旋,符合植物Ⅱ型(MIKC型)MADS-box基因编码蛋白的序列特征。此外,蓝莓VaFLC蛋白的C端是最不保守的区域,主要由疏水性氨基酸残基构成,仅含有少量保守序列。已有研究表明,MADS-box基因编码蛋白的C端区域的变化是由进化造成的[30-31],这些序列主要参与蛋白复合体形成和转录激活的过程,推测其多样性变化决定了MADS-box基因编码蛋白的功能多样性。
MADS-box基因家族成员起源于同一祖先型基因[32],在进化过程中大量的基因重复事件产生了MADS-box基因的2个谱系Ⅰ型(TypeⅠ)和Ⅱ型(TypeⅡ),其中Ⅰ型又分为SRF型基因、植物Ⅰ型基因,Ⅱ型又分为MEF2型基因、植物Ⅱ型(MIKC型)[33]。因此,植物FLC基因及其编码蛋白在核酸和氨基酸水平上存在高度保守性和相似性。本研究结果显示,蓝莓FLC基因编码VaFLC蛋白与其他植物中FLC蛋白的相似性均高于40%,其中N端MEF2-like MADS保守结构域中的氨基酸序列相似性比对结果均高于90%,进一步表明植物FLC基因在早期存在一个共同的祖先型基因,而C端不保守结构域的多样性变化,可能是由植物Ⅱ型(MIKC型)基因进化形成的。系统进化树分析结果显示,植物FLC基因编码蛋白分为木本植物、草本植物2个分支,蓝莓FLC基因编码VaFLC蛋白位于木本植物分支上,并与葡萄、白桦和咖啡树的FLC蛋白分别形成独立分支,推测植物FLC基因早期起源于同一个被子植物祖先,蓝莓FLC基因至今仍处于较原始状态。
本研究基于蓝莓EST数据库,运用电子克隆成功获得蓝莓FLC基因,并对其氨基酸序列从结构组成、理化性质、高级结构和系统进化等方面进行了预测和分析,研究结果为进一步试验克隆蓝莓FLC基因及探究其基因和编码蛋白的结构与功能奠定了基础。
参考文献:
[1]王新平. 木本果树开花基因研究进展[J]. 山西农业科学,2015,43(5):639-642.
[2]刘国琴,郑鹏华,滕元文. 落叶果树芽休眠相关基因的研究进展[J]. 果树学报,2012,29(5):911-917.
[3]庄维兵,章 镇,侍 婷,等. 落叶果树需冷量及其估算模型研究进展[J]. 果树学报,2012,29(3):447-453.
[4]Song Y H,Ito S,Imaizumi T. Flowering time regulation:photoperiod-and temperature-sensing in leaves[J]. Trends in Plant Science,2013,18(10):575-583.
[5]Mateos J L,Madrigal P,Tsuda K,et al. Combinatorial activities of SHORT VEGETATIVE PHASE and FLOWERING LOCUS C define distinct modes of flowering regulation inArabidopsis[J]. Genome Biology,2015,16(1):31.
[6]Nishio H,Buzas D M,Nagano A J,et al. From the laboratory to the field:assaying histone methylation at FLOWERING LOCUS C in naturally growingArabidopsishalleri[J]. Genes & Genetic Systems,2016,91(1):15-26.
[7]刘 丽,郭俊英. 我国蓝莓种质资源研究进展[J]. 安徽农学通报,2014,20(22):65-66,140.
[8]李丽敏,吴 林,郝庆升,等. 中国蓝莓市场现状及产业发展对策研究[J]. 中国果树,2011(3):70-73.
[9]Pescie M,Lovisolo M,de Magistris A,et al. Flower bud initiation in southern highbush blueberry cv. O′Neal occurs twice per year in temperate to warm-temperate conditions[J]. Journal of Applied Horticulture,2011,13(1):8-12.
[10]Die J V,Rowland L J. Advent of genomics in blueberry[J]. Molecular Breeding,2013,32(3):493-504.
[11]Rowland L J,Nadim A,Omar D,et al. Generation and analysis of blueberry transcriptome sequences from leaves,developing fruit,and flower buds from cold acclimation through deacclimation[J]. BMC Plant Biology,2012,12(1):46.
[12]王庆贺,李亚东,张志东,等. 生态条件对越橘花芽分化的影响[J]. 吉林农业大学学报,2009,31(6):705-710.
[13]王瑞芳. 三个越橘品种染色体核型分析及花芽分化物候期的观察研究[D]. 重庆:西南大学,2008.
[14]李 波,夏秀英,刘 思. 蓝莓花芽休眠与解除过程中生理生化变化及DNA甲基化差异分析[J]. 植物生理学报,2015,51(7):1133-1141.
[15]宋 杨,窦连登,张红军. 蓝莓不同品种花芽形成过程中内源激素的变化[J]. 中国南方果树,2014,43(5):106-108,114.
[16]乌凤章,王贺新,陈英敏. 3种类型越橘生长发育和开花结果特性[J]. 果树学报,2010,27(5):683-688.
[17]王冬冬,朱延明,李 勇,等. 电子克隆技术及其在植物基因工程中的应用[J]. 东北农业大学学报,2006,37(3):403-408.
[18]孔祥瑞. 茶树功能候选基因电子克隆的可行性分析[J]. 分子植物育种,2014,12(2):332-337.
[19]Parenicová L 1,de Folter S,Kieffer M,et al. Molecular and phylogenetic analyses of the complete MADS-box transcription factor family inArabidopsis:new openings to the MADS world[J]. The Plant Cell,2003,15(7):1538-1551.
[20]de Bodt S,Raes J,van de Peer Y,et al. And then there were many:MADS goes genomic[J]. Trends in Plant Science,2003,8(10):475-483.
[21]Lydia G,Guenter T. A Hitchhiker’s guide to the mads world of plants.[J]. Genome Biology,2010,11(6):214.
[22]Puranik S,Acajjaoui S,Conn S,et al. Structural basis for the oligomerization of the MADS domain transcription factor SEPALLATA3 inArabidopsis[J]. The Plant Cell,2014,26(9):3603-3615.
[23]Bordoli L,Kiefer F,Arnold K,et al. Protein structure homology modeling using SWISS-MODEL workspace[J]. Nature Protocols,2009,4(1):1-13.
[24]Kole C,Quijada P,Michaels S D,et al. Evidence for homology of flowering-time genesVfr2 fromBrassicarapaand FLC fromArabidopsisthaliana[J]. Theoretical and Applied Genetics,2001,102(2/3):425-430.
[25]Sheldon C C,Rouse D T,Finnegan E J,et al. The molecular basis of vernalization:the central role of FLOWERING LOCUS C (FLC)[J]. Proceedings of the National Academy of Sciences of the United States of America,2000,97(7):3753-3758.
[26]Immink R G H,Gadella Jr T W J,Ferrario S,et al. Analysis of MADS box protein-protein interactions in living plant cells[J]. Proceedings of the National Academy of Sciences of the United States of America,2002,99(4):2416-2421.
[27]Causier B,Cook H,Davies B. An antirrhinum ternary complex factor specifically interacts with C-function and SEPALLATA-like MADS-box factors[J]. Plant Molecular Biology,2003,52(5):1051-1062.
[28]Masiero S,Imbriano C,Ravasio F,et al. Ternary complex formation between MADS-box transcription factors and the histone fold protein NF-YB[J]. Journal of Biological Chemistry,2002,277(29):26429-26435.
[29]Immink R G,Kaufmann K,Angenent G C. The ‘ABC’ of MADS domain protein behaviour and interactions[J]. Seminars in Cell and Developmental Biology,2009,21(1):87-93.
[30]Honma T,Goto K. Complexes of MADS-box proteins are sufficient to convert leaves into floral organs[J]. Nature,2001,409(6819):525-529.
[31]Lamb R S,Irish V F. Functional divergence within the APETALA3/PISTILLATA floral homeotic gene lineages[J]. Proceedings of the National Academy of Sciences of the United States of America,2003,100(11):6558-6563.
[32]王 婧. 荷花MADS-box基因的克隆及表达分析[J]. 江苏农业科学,2017,45(1):39-42.
[33]Alvarez-Buylla E R,Pelaz S,Liljegren S J,et al. An ancestral MADS-box gene duplication occurred before the divergence of plants and animals[J]. Proceedings of the National Academy of Sciences of the United States of America,2000,97(10):5328-5333.