5种蔷薇科树种多酚氧化酶比较基因组学分析
2017-05-30闫洪波李桂琴宋亚伟孟钰玉王云松关军锋
闫洪波 李桂琴 宋亚伟 孟钰玉 王云松 关军锋
摘 要 蔷薇科植物中有多种具有重要价值的水果,如苹果、梨、桃、草莓和黑树莓等。这些水果普遍容易发生由多酚氧化酶(PPO)介导的酶促褐变而导致重大经济损失,从全基因组角度分析比较PPO基因家族,有助于加深对PPO基因家族和功能的认识。 采用比较基因组学的方法,对这5种植物的PPO基因家族进行了基因鉴定、染色体定位、编码蛋白的亚细胞定位、内含子统计分析、基因系统进化、基因倍增与丢失等特征分析。从这5种植物中,共计鉴定出了42个PPO基因,其中6个基因被认定是假基因;绝大多数基因编码的蛋白定位于叶绿体,2个定位于线粒体,3个是分泌型蛋白;PPO基因在染色体上有串联重复和散布两种形式;9个基因具有内含子,聚类结果显示可以将它们分为6个类型,每个基因类型在进化过程中都发生过基因倍增和丢失;同型基因内含子的位置和大小具有相似性。这些结果揭示蔷薇科植物PPO基因内含子是伴随着基因倍增产生的,基因倍增也是推动PPO基因多样化的重要动力,PPO基因倍增和丢失差异导致PPO基因数量在不同物种之间产生差异。
关键词 蔷薇科;多酚氧化酶;基因倍增;基因进化
中图分类号 S661;Q786 文献标识码 A
Abstarct There are many important fruit plants such as apple, pear, strawberry, blackberry, peach in Rosaceae. They were liable to occurrence enzymatic browning caused by polyphenol oxidase, which result in lots of economics loss. For further analysis PPO, PPO genes were compared by genomic level among five Rosaceae plants. PPO genes were identified and those genes were anchored in chromosome, encoding proteins subcellular location, intron characters, gene duplication and loss, gene phylogeny were analyzed using comparative genomic methods. From five the plants, 42 genes were identified, of which six genes were deduced pseudogenes, 31 genes encoding proteins were located in chloroplast, two were located in mitochondria, three were secretory protein. PPO genes were anchored with tandem repeat or scatter. Phylogenetic trees showed that all these PPO genes could be classed into six types, and genes duplication and loss was occurred for each type in history. There were nine intron-PPO genes and the position and length of intron from the same type PPO gene were similar. In conclusion, the appear of PPO genes intron was an accompany to gene duplication, and PPO genes polymorphism was also caused by gene duplication. The main reason of PPO genes copy variation is gene duplication and loss with plant evolution in Rosaceae.
Key words rosaceae; polyphenol oxidase; gene duplication; gene evolution
doi 10.3969/j.issn.1000-2561.2017.02.021
蔷薇科植物中有很多重要栽培果树,如苹果(Malus domestica)、梨(Pyrus communis)、草莓(Fragaria ananassa)、桃(Prunus persica)和黑树莓(Rubus occidentalis)等,具有较高的经济价值,市场需求量大。然而这些果树产生的果实在贮藏和运输过程中容易发生褐变反应,对其外觀、风味、营养和加工性能带来不良影响,造成严重的经济损失[1]。
大量研究认为,褐变现象发生的主要原因是多酚氧化酶(Polyphenol Oxidase,PPO)介导的酶促反应[2-3]。PPO蛋白属于核编码含铜金属酶类,可分为两大类,即单酚氧化酶(Monophenol oxidase,又称酪氨酸酶,Tyrosinase EC1. 14. 18. 1)、双酚氧化酶(Diphenol oxidase,又称儿茶酚氧化酶,Catechol oxidase EC.1.10.3.1)[4]。PPO蛋白前体一般由N-端导肽(Transit peptide)、N-端催化结构域、PPO1_DWL结构域、PPO1_KFDV结构域几部分组成[5-6]。PPO除可以造成褐变外,还与病害、昆虫或机械伤害引起的防卫反应密切相关。PPO基因抗病机制主要是PPO蛋白参与植物次生代谢,产生的某些物质可以直接毒杀病原菌。也有研究表明PPO参与某些植物的色素合成途经[7-8]。
多酚氧化酶通常由一個小基因家族编码。PPO 基因目前已经从几十种植物中克隆出来。在番茄中,编码多酚氧化酶的基因有7个,该基因家族定位于第8号染色体上,并且群集在165 kb区段;在马铃薯中,编码多酚氧化酶的基因至少有6个;茄子中有11个PPO基因存在[9-11]。
虽然已经有蔷薇科植物PPO基因的报道,但是尚未见到从比较基因组水平上对PPO基因家族的研究。苹果、桃、梨、草莓和黑树莓等蔷薇科植物基因组测序已经完成[12-16],因此,本研究通过在全基因组水平上对5种植物的PPO基因家族进行基因鉴定、染色体定位、编码蛋白的亚细胞定位、内含子统计分析、基因系统进化等,目的在于对PPO基因家族进行系统的诠释,同时为PPO的遗传机制研究以及抑制褐变育种提供理论基础
1 材料与方法
1.1 材料
苹果、桃、梨、草莓和黑树莓PPO基因家族成员相关信息主要来自GDR数据库(https://www.rosaceae.org)。
1.2 方法
1.2.1 PPO基因家族鉴定 为全面鉴定PPO基因,利用已经克隆和鉴定的马铃薯、茄子、菠萝等[9-11,17]PPO基因家族氨基酸序列在(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)进行保守结构域分析,然后以保守结构域氨基酸序列作为靶序列,对相应数据库进行搜索,E值设为E<10-4,获得候选基因。将这些候选的蛋白基因序列通过MEGA7.0[18]软件提供的Clustal W(多序列比对程序)工具进行多序列比对,去除重复的基因,将剩余的候选PPO通过PFAM网站(http://pfam.Janelia.org/) 预测这些蛋白是否具有3个完整的植物多酚氧化酶典型结构域。如果存在,即为多酚氧化酶基因家族成员,如果3个结构域不完整则被认为是假基因。
1.2.2 基因物理定位和内含子确定 根据PPO基因序列信息比对相应的scaffold(BAC)或染色体序列,最终确定每个PPO基因在染色体上相应的位置。为确定基因中是否含有内含子和内含子的位置,用BLASTN方法比对转录序列和基因组序列来分析基因内含子。
1.2.3 PPO蛋白在亚细胞上定位 通过网络(http://www.cbs.dtu.dk/services/ChloroP/)分析植物多酚氧化酶的氨基酸序列,进行叶绿体定位检测[19],根据网络(http://www.cbs.dtu.dk/services/TatP/)[20]对叶绿体定位蛋白分析其类囊体定位信号。对于其他非叶绿体定位蛋白,通过网络(http://www.cbs.dtu.dk/services/TargetP/)[21]分析其可能的亚细胞定位。根据检测结果判定多酚氧化酶在叶绿体、线粒体以及其他亚细胞结构上的定位,并统计结果。
1.2.4 常见PPO序列比对及系统发育树的构建
为揭示这5种植物PPO基因家族成员的保守性以及同源基因(直系同源和旁系同源)的得失,本研究将检索到的淀粉合酶基因DNA序列用FASTA 格式保存,利用MEGA 7.0软件中的最大似然法(Maximum Likelihood,ML)进行模型筛选后,采用GTR+G+I构建系统发育树,Bootstrap值设为1 000,去除Bootstrap支持率低于50%的节点,显示各分支长度。
1.2.5 基因复制和丢失估算 基因复制和丢失估算以人工分析和软件分析相结合的方法进行。人工分析方法如下:在进化树中,每个物种都至少含有1条序列,如果未发现某个物种的序列,则认为该物种丢失了该序列,如果某物种具有2条或2条以上的序列,则认为该物种内产生了基因复制。软件分析使用MEGA7.0进行,该软件主要是通过计算基因-物种进化树来估算基因复制或者丢失。
2 结果与分析
2.1 5种蔷薇科植物基因的鉴定
利用上述PPO蛋白N-端催化结构域进行TBLASTN和BLASTP搜索及分析,从苹果、梨、草莓、桃和黑树莓中鉴定出6种PPO类型共42个PPO基因,每个基因的编号和编码蛋白特征如表1。从苹果中鉴定出16个PPO基因,其编码区长度在879(MDP0000799783)~1 830 bp(MDP0000234782)之间;从梨中鉴定出8个基因,编码区长度分布在1 035(PCP020848)~2 100 bp(PCP020847)之间,桃中共有6个PPO基因,编码区长度在1 617(Prupe.4G041800)~1 788 bp(Prupe.4G041900)之间;草莓中分析出6个PPO基因,编码区长度范围在1 761 (mrna30433.1)~1 821 bp(mrna30435.1)之间;黑树莓则只发现6个PPO基因,在数据库中只有4个编号,其中Bras_G06469区段的头部、中部和尾部分布着3个PPO基因,编码区长度在1 683(Bras_G10112)~1 818 bp(Bras_G06469-3)之间。在这5个物种中,PPO分子量变化具有显著差异,最大分子量达到79.26 ku(PCP014164),而分子量最小的是MDP000079978,仅为32.51 ku;等电点变化范围比较小,分布在5.07~7.57之间,具体分布如表1所示。
2.2 假基因鉴定
通过分析完整的植物多酚氧化酶具有的酪氨酸酶的中心域、PPO1_DWL和PPO1_KFDV 3个结构域。鉴定到的42个基因中有6个为假基因(表1),苹果中有3个,分别是MDP0000226045(酪氨酸酶不完整)、MDP0000298729(酪氨酸酶缺失)和MDP0000799783(酪氨酸酶不完整);桃中有1个假基因Prupe.4G41800.1(酪氨酸酶不完整);梨中有2个假基因分别为PCP020848.1(酪氨酸酶超家族前缺失全部180个氨基酸)和PCP020847.1(酪氨酸酶以及PPO1_KFDV超家族不完整)。
2.3 内含子统计分析
在苹果、梨、桃、黑树莓和草莓编码多酚氧化酶基因中,有多个基因存在内含子(表2)。PPOⅡ型基因在苹果(MDP0000221498)、梨(PCP020846)和桃(Prupe.4G041900)都含有内含子,内含子的位置、大小、剪切方式基本一致(图1,表2)。苹果中MDP0000500159和MDP0000744636属于PPOⅤ类型基因,它们内含子的位置和大小几乎完全一致;梨中PPOⅣ型基因PCP020851也含有内含子;PPOⅤ类型的PCP020847含有1个3.4 kb长的内含子,破坏了该基因结构导致其成为1个假基因;桃中PPOⅤ型基因Prupe.4G041800也包含有内含子;草莓PPOⅥ基因mrna19628基因也包含内含子,其它植物同类型基因都未发现内含子。
2.4 PPO基因的物理定位
根据42个PPO基因的序列特征将其定位在染色体或框架(scaffold)图相应的物理位置。苹果PPO基因散布在2、4、5、10号染色体上,PPOⅠ、PPOⅡ与PPOⅢ 3个类型分别只含有1个基因,分别位于10号染色体3.3 M和33 M以及4号染色体4.5 M,PPOⅣ类型有9个基因集中串联在一个0.7 M的区域内,位于5号染色体3.8 M和4.5 M之间,PPOⅤ类型有4个基因,其中1个基因位于2号染色体31 M,另外3个集中串联在10号染色体28 M的一个55 kb区域(图2)。桃中共有6个PPO基因,全部集中连锁在4号染色体1.9 M附近25 kb的狭窄区域内,6个基因中间未被其他基因区隔(图2)。草莓4个PPO基因分布在3号染色体,其中mrna30433.1、mrna30434和mrna30435集中分布在3号染色体2.6 M附近一个10 kb区域,而且中间没有被别的基因区隔,相应的黑树莓中3个 PPO基因分布在其一个共线性BAC片段上(图2),另一个基因在3号染色体0.9 M附近,也和黑树莓相应基因分布在共线性位置(图2)。梨中4个基因分布在scaffold 00014,另外4个基因分布在4个不同BAC片段上(图2)。
2.5 PPO亚细胞定位
从苹果、梨、桃、草莓和黑树莓5个物种共鉴定出36个基因编码完整PPO,同已知的绝大多数PPO一样,这5种植物的31个基因编码PPO定位在叶绿体中,叶绿体信号肽切割位置保守,31个蛋白叶绿体信号肽在半胱氨酸前切割如图3的左侧竖线所示,经分析这些蛋白都有潜在的类囊体定位信号如图3右侧竖线所示,说明叶绿体定位PPO蛋白的信号肽切割区域高度保守。PPO定位在线粒体的报道极少,不过苹果中MDP0000500159和MDP0000744636编码的蛋白亚细胞定位为线粒体。草莓中mrna25268、mrna19628和黑树莓中Bras_G10112编码蛋白含有分泌蛋白信号肽。
2.6 多酚氧化酶基因家族进化分析
为揭示5种蔷薇科植物物种间多酚氧化酶基因家族的系统进化关系,选取非蔷薇科植物外源植物马铃薯作为对照,构建了系统进化树(图4)。从图4可以看出,蔷薇科5种植物的PPO基因可以分为6种类型,分别为PPOⅠ、PPOⅡ、PPOⅢ、PPOⅣ、PPOⅤ、PPOⅥ(图4)。这6种类型基因中,PPOⅠ型包含7个基因,苹果、梨、桃各1个,草莓和黑树莓各2个;PPOⅡ包含3个基因,桃、梨和苹果上各1个。PPOⅢ型包含4个基因,梨2个,苹果1个,桃1个。PPOⅣ型包含12个基因,苹果有6个,黑树莓和桃各2个,梨和草莓各1个。PPOⅤ型包含7个基因,苹果4个,草莓、黑树莓和梨各1个。PPOⅥ型包含3个基因,草莓中2个,黑树莓中1个。PPOⅠ、PPOⅡ、PPOⅢ、PPOⅣ、PPOⅤ这5种基因类型均在3种以上蔷薇科植物中发现,而且同型基因之间的氨基酸相似度远大于同一物种内部不同型号基因之间的相似度,说明它们在蔷薇科植物分化之前就已经存在了。PPOⅥ虽然只在草莓和黑树莓中发现,但是这类基因在聚类时首先和马铃薯PPO基因归为一个类型,说明这类基因在蔷薇科植物与其他植物分化之前就存在。
2.7 基因倍增分析
根据PPO系统进化树,设定在蔷薇科植物分化以前,就存在6种类型的PPO基因(图4)。5种植物中PPO基因在蔷薇科植物分化以后,都有基因丢失和倍增现象发生(表3)。PPOⅠ基因在黑树莓和草莓分化之前,它们的共同祖先与其他蔷薇科植物分化以后发生了1次倍增,而且倍增产物在2个植物中都留存下来,其他3种植物只保留了1个拷贝形式。PPOⅡ基因没有发生过倍增,但是在草莓和黑树莓中发生了丢失。PPOⅢ基因在草莓和黑树莓中也发生了丢失。PPOⅣ基因在蔷薇科植物分化后发生了复杂的倍增,苹果和梨分化之前发生了1次倍增,之后梨丢失其中的1个拷贝,以后苹果2个类型的PPOⅣ基因又各自倍增2次,桃和黑树莓在各自进化中发生了1次倍增。PPOⅤ基因在桃中全部丢失,而苹果在进化中发生了2次倍增。PPOⅥ基因在苹果、桃和梨中都完全丢失,黑树莓中发生了1次倍增。
3 讨论
植物PPO基因家族通常由1个小基因家族编码,番茄多酚氧化酶的基因有7个PPO基因[9],马铃薯中编码多酚氧化酶的基因至少有6个[10],白杨中有13个PPO基因[22]。本研究发现苹果中有16个PPO基因,梨中有8个PPO基因,桃、草莓和黑树莓各自有6个PPO基因。苹果、梨和桃丢失PPOⅥ基因类型,而草莓和黑树莓则丢失PPOⅡ和PPOⅢ 2种基因类型。而同一基因类型在不同物种之间基因数量差异也很明显,苹果中PPOⅣ基因在染色体上串联重复存在高达9个,而梨、桃和草莓中只有2个PPOⅣ类型基因,黑树莓仅1个PPOⅣ基因(图2),这种差异显然是PPOⅣ基因在不同物种中倍增差异造成的(表3)。说明5中蔷薇科植物PPO基因数量的差异是PPO基因倍增和丟失差异造成的。
倍增基因命运有DRNNF、SF和DDC等几种模式[23-25]。苹果9个PPOⅣ基因中有3个基因成为了假基因,而梨PPOⅣ和PPOⅤ类型基因,分别由一个正常基因发挥功能和一个假基因形式存在(表1),这些倍增PPO基因符合DRNNF模式。苹果PPOⅤ基因经过2次倍增形成4个拷贝,它们又分化成2种类型,一种是叶绿体蛋白,另一种是线粒体蛋白,这完全符合倍增基因命运的亚功能化(SF)模式。可见PPO基因倍增进化模式差异是造成5种蔷薇科植物PPO基因功能多样化的一个重要原因。
曾经一度认为植物PPO基因不存在内含子,不过本研究所选取的5种蔷薇科植物苹果、梨、桃、黑树莓和草莓发现多个基因存在内含子(表2、3)。草莓PPOⅥ一对倍增基因mrna19628和mrna25268,前者有内含子而后者则没有(表2、3),说明mrna19628中内含子是基因倍增时产生的;苹果4个PPOⅤ型基因,MDP0000500159和MDP0000744636有内含子,它们的内含子大小、位置和剪切方式几乎完全一致,而MDP0000234782和MDP0000709073则没有内含子,而前两个基因是后两个倍增的产物,说明这2个内含子是在苹果PPOⅤ基因倍增时产生(表2、3);梨的PPOⅣ类型一对倍增基因PCP020851和PCP020848,前者有一个115 bp内含子而后者没有,PPOⅤ基因类型的一对倍增基因PCP020847和PCP025388,前者由于包含1个3.4 kb的内含子,导致该基因成为假基因,后者也有内含子(表2、3)。PPOⅡ型基因在苹果、梨和桃中都有内含子,而且内含子的位置、大小、剪切方式基本一致(图1),从GenBank数据库发现杏的PPOⅡ型基因也有内含子,而且内含子的位置、大小、剪切方式与苹果、梨和桃的也相似。PPOⅡ基因和PPOⅣ由一个祖先基因在蔷薇科植物分开前倍增产生的,PPOⅡ型基因内含子也是在这个倍增过程中产生的(表2、3)。从这几种基因获得内含子情况可以看出,这5种蔷薇科植物PPO基因内含子是伴随着基因倍增产生的。
总之,笔者比较分析了蔷薇科5个物种42个PPO基因的特征,它们可以分成6种基因类型,所有类型都起始于蔷薇科植物分化之前,PPO基因数量在不同物种之间的差异是由PPO基因倍增和丢失差异引起的,蔷薇科植物PPO基因内含子是伴随着基因倍增产生的,基因倍增也是推动PPO基因多样化的重要动力。
参考文献
[1] Li J, Zhang Q, Cui Y, et al. Use of UV-C treatment to inhibit the microbial growth and maintain the quality of yali pear[J]. Journal of Food Science, 2010, 75(7): 503-507.
[2] Mayer A M, Harel E. Polyphenol oxidases in plants[J]. Phytochemisrry, 1979, 18: 193-215.
[3] 鞠志国, 原永兵, 刘成连, 等. 急降温对活性氧和梨果心褐变的影响[J]. 中国农业科学, 1994, 27(5): 77-81.
[4] Mayer A M. Polyphenol oxidases in plants and fungi: going places? A review[J]. Phytochemistry, 2006, 67(21): 2 318-2 331.
[5] Marusek C M, Trobaugh N M, Flurkey W H, et al. Comparative analysis of polyphenol oxidase from plant and fungal species[J]. J Inorg Biochem, 2006, 100(1): 108-123.
[6] Flurkey W H, Inlow J K. Proteolytic processing of polyphenol oxidase from plants and fungi[J]. J Inorg Biochem, 2008, 102(12): 2 160-2 170.
[7] 王全華, 王秀峰. 番茄抗病基因工程育种研究进展[J]. 山东农业大学学报, 2003, 34(4): 600-604.
[8] Thipyapong P, Hunt M D, Steffens J C. Antisense down regulation of polyphenol oxidase results in enhanced disease susceptibility[J]. Planta, 2004, 220(1): 103-117.
[9] Thygesen P W, Dry I B, Robinson S P. Polyphenol oxidase in potato:A multigene family that exhibits differential expression patterns[J]. Plant Physiol, 1995, 109(2): 525-531.
[10] Thipyapong P, Steffens J C. Tomato polyphenol oxidase (differential response of the polyphenol oxidase F promoter to injuries and wound signals)[J]. Plant Physiol, 1997, 15(2): 409-418.
[11] Shetty S M, Chandrashekar A, Venkatesh Y P. Eggplant polyphenol oxidase multigene family: cloning, phylogeny, expression analyses and immunolocalization in response to wounding[J]. Phytochemistry, 2011, 72(18): 2 275-2 287.
[12] Velasco R, Zharkikh A, Affourtit J, et al. The genome of the domesticated apple(Malus × domestica Borkh.)[J]. Nat Genet, 2010, 42(10): 833-839.
[13] Darwish O, Shahan R, Liu Z, et al. Re-annotation of the woodland strawberry (Fragaria vesca) genome[J]. BMC Genomics, 2015, 16: 29.
[14] The International Peach Genome Initiative. The high-quality draft genome of peach(Prunus persica) identifies unique patterns of genetic diversity, domestication and genome evolution[J]. Nat Genet, 2013, 45: 487-494.
[15] Chagné D, Crowhurst R N, Pindo M, et al. The draft genome sequence of european pear (Pyrus communis L.‘Bartlett)[J]. PloS One, 2014, 9(4): e92 644.
[16] VanBuren R, Bryant D, Bushakra J M. The genome of black raspberry(Rubus occidentalis)[J]. Plant J, 2016 May 26. doi: 10.1111/tpj.13215. [Epub ahead of print].
[17] Imbault A K, Marie-Alphonsine P A, Horry J P, et al. Polyphenol oxidase and peroxidase expression in four pineapple varieties (Ananas comosus L.) after a chilling injury[J]. J Agric Food Chem, 2011, 59(1): 342-348.
[18] Kumar S, Stecher G, Tamura K. MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology and Evolution, 2016, 33: 1 870-1 874.
[19] Emanuelsson O, Nielsen H, von Heijne G. ChloroP, a neural network-based method for predicting chloroplast transit peptides and their cleavage sites[J]. Protein Sci, 1999, 8(5): 978-984.
[20] Jannick Dyrlv Bendtsen, Henrik Nielsen, David Widdick, et al. Prediction of twin-arginine signal peptides[J]. BMC Bioinformatics, 2005(6): 167.
[21] Olof Emanuelsson, Henrik Nielsen, Soren Brunak, et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. J Mol Biol, 2000, 300: 1 005-1 016.
[22] Tran LT, Constabel C P. The polyphenol oxidase gene family in poplar: phylogeny, differential expression and identification of a novel, vacuolar isoform[J]. Planta, 2011, 234(4): 799-813.
[23] Ohno S. Evolution by Gene Duplication[M]. Berlin, Springer-Verlag, Heidelberg, 1970.
[24] Hughes A L. The evolution of functionally novel proteins after gene duplication[J]. Proc Biol Sci, 1994, 256: 119-124.
[25] Force A, Lynch M, Pickett F B, et al. Preservation of duplicate genes by complementary, degenerative mutations[J]. Genetics, 1999, 151: 1 531-1 545.