APP下载

玉米两个亚基因组与C4途径的进化

2013-08-28雷天宇金殿川

关键词:同源光合作用高粱

张 宪,雷天宇,金殿川

(河北联合大学理学院,河北唐山 063009)

0 引言

在真核生物中普遍存在着古老的四倍体性,基因组倍增之后会形成大量的直系或旁系的同源基因。在进化过程中,倍增的同源基因中的一个拷贝会趋向于丢失,但这种基因丢失是不平衡的[1]。多个研究表明,蜀黍族祖先基因组是由10个染色体组成。玉米作为重要的粮食作物,曾在500~1200万年前,经历了一次四倍化,形成了20条染色体。玉米通过染色体融合、断裂等过程,形成现在的10条染色体,以两个亚基因组的形式存在[2-3]。值得注意的是,在四倍化后,由于纯化选择其中一个亚基因基因不断被移除,而相对的另一个亚基因组基因则更可能保持中立,从而更多的保留了下来。

玉米不仅是重要的粮食作物,同时也是重要的C4光合作用作物。C4光合途径是许多高产农作物的代谢途径方法,相对于C3植物来说,其更能高效的利用光能、水以及氮。2009年,Wang[4]等通过比较基因组学分析,证实了全基因组以及单个基因的倍增有利于C4光合作用的进化。因此,玉米在由古老的四倍体到二倍体的进化过程中,C4光合作用必然也经历了相应的进化过程。

在蜀黍族的进化过程中,高粱基因组被推测近似保留了祖先基因组。2011年,James C.S[1]等人通过对玉米和高粱进行全基因组的同源序列比对,重构了染色体水平上的玉米四倍体祖先,定义了两个亚基因组。本文旨在对玉米中两个亚基因组与C4途径的进化进行研究,进一步回答两个亚基因组基因在C4途径的进化过程中扮演什么样的角色。这将有利于我们更深入的了解玉米两个亚基因基因的进化遗传机制,以及其对C4光合作用的影响,对我们进一步提高玉米光合作用强度,从而为提高玉米产量提供重要的理论基础和材料来源。

1 材料与方法

1.1 数据准备

本研究中玉米两个亚基因组的相关数据来自于James C.S[1]等人在重构玉米染色体后,通过和高粱、水稻的同源序列比对,构建了一个Excel格式记录,主要由Maize1、Maize2以及在高粱和水稻中相应的同源基因组成。玉米中与C4光合作用途径有关的基因、酶以及反应数据,从GRAMENE(http://pathway.gramene.org/MAIZE/)数据库下载得到。

1.2 进化分析的方法概述

分子进化完整的理论分析过程主要包括四个重要的步骤,即序列相似性比较、序列同源性分析、构建系统发育树、稳定性检验。

BLAST[5](Basic Local Alignment Search Tool)是最常用的序列相似性比较的工具,其基本思想是:两个同源序列即使有很大的差异,也有可能有高分值的相似片段,这使我们能够可靠地区分相关和非相关的序列。同源序列的进化相关性可以用相似度来表示[5],而最佳的比对算法就是要使比较序列的相似度最大化。

根据相似序列的同源性分析,重建反映物种间进化关系的系统发育树。系统发育树构建方法很多种。根据所处理数据的类型,可以将系统发生树的构建方法大体上分为两大类。一类是基于距离的构建方法,利用所有物种或分类单元间的进化距离,依据一定的原则及算法构建系统发生树。这类方法包括非加权组平均法(unweighted-pair-group method with arithmetic mean,UPGMA)、近邻关系法、邻近归并法(neighbor-joining method)等。其中广泛应用的就是邻近归并法,它由一个中心节点,通过寻找最小进化树的分支长度和,相继找到相邻分支。1998年,J.Studier和 K.Keppler提出了一种快速算法[6]:

其中,N是距离矩阵中物种的数目,k是引入的外部参考物种,dij是物种i和物种j之间的距离。

另一类方法是基于离散特征的构建方法,利用的是具有离散特征状态的数据,如DNA序列中的特定位点的核苷酸。属于这一类的方法有简约法(parsimony method),主要包括无权简约法和加权简约法、最大似然法(maximum likelihood approach)等。

构建好的进化树需要进行统计上的可靠性检验,常用的检验方法是Bootstap算法,其随机进行成百上千次序列重排,对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性,一般只有以大概率(70%以上)出现的分支点才是可靠地。

2 结果与分析

2.1 玉米C4途径关键酶基因及其同源性分析

GRAMENE数据库分物种、分通路、分条目记录了基因、酶、代谢物、反应甚至通路数据。在玉米(Zea mays)C4光合途径通路下,一共获得15个与C4途径相关的基因(表1),它们不均匀的分布在染色体中。C4光合途径牵涉许多酶类的参与,其中最为关键的酶有3个,分别为磷酸烯醇式丙酮酸羧化酶(PEPC)、丙酮酸磷酸双激酶(PPDK)和NADP-苹果酸酶(NADP-ME),它们的编码基因就有14个[7],剩余的一个是叶绿体蛋白质。

高粱和玉米具有一个共同的祖先,在高粱的进化过程中近似保留了祖先基因组,将玉米C4基因与高粱基因组应用现有的生物信息分析程序BLASTN进行同源序列比对分析,得到玉米C4基因与高粱基因间的相似性,根据序列间的打分、序列一致性、匹配期望值,确定基因间的同源性,这里设定期望值小于1e-3。表1中第一列是要查询的玉米C4相关基因,对于一个基因序列在目标数据库中有多个基因序列与它匹配,匹配的百分比是两个比对的基因序列中匹配的长度占比对上长度的百分比,比对的基因序列的长度是两个基因序列的保守域的长度,而期望值的大小反映了两个基因存在进化关系的随机性可能性大小,期望值越小说明两个基因越有可能具有进化关系,匹配打分则反映了两个基因序列间的相似程度。

表1 玉米C4基因与高粱潜在同源基因集合表

续表1

这里我们选取了匹配得分最高的基因,即相似性最高的高粱基因作为玉米C4基因的相似性基因。由表1可以看到,C4途径相关基因中玉米和高粱保持了高度的相似性,相似性均达到90%以上,且期望值比较小,进一步说明了玉米和高粱C4基因间具有进化关系。

2.2 玉米C4途径基因系统发育树的构建和分析

利用MEGA软件对玉米和高粱中C4途径相关的同源基因做CLUSTAL多序列比对,然后采用邻近归并法构建系统发育树并对得到的系统发育树进行自举检验,将自举检验的值设置为500,构建的结构及分析如图1所示。从系统发育树中可以看到,玉米C4途径的三个关键酶基因分别形成了一个小的基因家族,这三个小的家族分别形成各自的分支,其中PPDK基因由两个分支组成,它们分别编码叶绿体PPDK1和细胞质PPDK2基因,其经历了不同的自适应进化过程。从整体上来看,这三个家族在C4途径中分别进行了一个快速的进化,且很可能属于自适应选择进化过程。同时C4途径中单一存在的叶绿体蛋白酶基因NADP-MDH基因,也有自己独立的适应进化过程。

图1 玉米和高粱中C4途径中同源基因的系统发育树

从图1中还可以发现,高粱基因与玉米基因进化速率一定程度上保持了一致性,且在几个分支上,一个高粱基因同时和两个玉米基因的进化保持一致,证实了玉米中两个亚基因组的存在。另外,根据James C.S[1]等人对玉米两个亚基因组的定义,分别命名为Maize1和Maize2。玉米PEPC基因家族中,Maize1包括4个,分别是 GRMZM2G083841/pep1、GRMZM2G473001/pep4、GRMZM2G069542、GRMZM2G082780;Maize2 包括2个,分别是GRMZM2G110714、GRMZM2G074122。PPDK基因家族中,Maize1包括3个,分别是 pdk2/AC217975.3_FG001、GRMZM2G306345_P05、pdk1/GRMZM2G097821;Maize2 包括 1 个,即 GRMZM2G097457_P01。对于NADP-ME基因家族,在玉米基因和高粱基因相似性分析中,由于其同义替换率(Ks)值比较大,无法准确判断其所属亚基因组,只能由其相应的物理位置大致判断出,Maize1包括 2个,分别为GRMZM5G886257_P01、me3/GRMZM2G085019;Maize2包括 2个,分别为 GRMZM2G404237_P01、me2/GRMZM2G122479。NADP-MDH基因GRMZM2G129513定义为Maize1。从总体上来看,在C4途径有关基因中,Maize1占到总基因的2/3,Maize2占到了1/3,这说明两个亚基因组中同源基因在进化过程中丢失不均衡,Maize1相对于Maize2保留了更多的基因,其对C4途径的进化具有更大的贡献。

3 结论

玉米作为C4光合作用的重要模式作物,对其C4途径进化过程的研究,为进一步提高光合作用效率,进而提高农作物产量,具有十分重要的作用。本文通过对玉米中有关C4途径的基因与高粱基因进行比较分析,并构建了相应的系统发育树,发现了C4途径中3个关键酶的基因家族以及一个叶绿体蛋白质基因,其都具有独立的适应进化过程。同时,对于玉米C4途径中两个亚基因组基因的存在,给出了明确的定义。在C4光合作用途径中,玉米两个亚基因组基因存在明显的偏向性,即亚基因组Maize1相对于Maize2保留了更多的基因。本文仅对玉米中C4途径中两个亚基因组的存在进行了研究,而两个亚基因组对于玉米其它途径的影响,还不能给出明确的说明,如果进一步对玉米中其他代谢途径进行研究,能否得到更具生物学意义的结论,这将是今后进一步研究的问题。

[1]JamesC.Schnable,Nathan M.Springer,Michael Freeling.Differentiation of the maize subgenomes by genome dominance and both ancient and ongoing gene loss[J].PNAS,2011,108(10):4069-4074.

[2]Wei F,William Nelson,Ed Coe,et al.Physical and genetic structure of the maize genome reflects its complex evolutionary history.PLoS Genet,2007,3(7):e123.

[3]Salse J,Bolot S,Throude M,et al.Identification and characterization of shared duplications between rice and wheat provide new insight into grass genome evolution [J].Plant Cell,2008,20(1):11-24.

[4]Wang X.Y,Haibao Tang,et al.Comparative genomic analysis of C4 photosynthetic pathway evolution in grasses[J].Genome Biology,2009,10:R68.

[5]C.萨科内,G.佩索莱.比较基因组学手册—原理与方法[M].北京:化学工业出版社,2008:185-198.

[6]Studier,J.A.andK.J.Keppler.A note on the neighbor-joining algorithm of Saitou and Nei[J].Mol Biol Evol.1988,5(6):729-731.

[7]李艳.玉米C4途径关键酶(PEPC、PPDK)基因的克隆及PEPC基因对小麦的遗传转化[D].河南农业大学.2009:4-10.

猜你喜欢

同源光合作用高粱
两岸年味连根同源
光合作用研究动向
高粱名称考释
高粱红了
金秋时节高粱红
以同源词看《诗经》的训释三则
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
家居布艺的光合作用
虔诚书画乃同源
例析净光合作用相关题型解题中的信息提取错误与矫正