APP下载

尾索动物线粒体基因组特征比较及分子系统发育

2012-10-13孟学平程汉良李士虎

海洋科学 2012年11期
关键词:线粒体变异基因组

申 欣, 田 美, 孟学平, 程汉良, 李士虎

(淮海工学院 海洋学院, 江苏 连云港 222005)

与单个基因或者基因的片段相比, 线粒体基因组是一个完整的体系, 具有信息量丰富和系统发育树结构稳定等优点, 在过去的十几年间已被广泛应用于后生动物分子系统演化和种群遗传的研究[1-2]。尾索动物隶属于脊索动物门(Chordata)、尾索动物亚门(Tunicata或者Urochordata), 为海洋生境中所特有的生物类群, 广泛栖息于世界各大海洋中, 从潮间带至深海均有分布。由于尾索动物在后生动物进化中处于特殊的关键位置, 其在免疫学、胚胎发育学、细胞学等各个学科领域对研究脊椎动物的起源与系统发育都有着不可取代的作用[3-4]。在GenBank线粒体基因组的数据库中, 目前有12个尾索动物的线粒体基因组全序列。作者在12个尾索动物线粒体基因组研究的基础上, 全面分析此类群线粒体基因组的基本特征、基因排列、蛋白质编码基因、选择压力、变异位点和分子系统发育等。

1 材料和方法

1.1 数据获取

从GenBank线粒体基因组数据库中检索、下载得到12个尾索动物线粒体基因组全序列。分别是隶属于海鞘纲(Ascidiacea)、内性目(Enterogona)的灯泡簇海鞘(Clavelina lepadiformis)、群体海鞘(Diplosoma listerianum)、胃海鞘(Aplidium conicum)、黑色次口海鞘(Phallusia fumigata)、具疣次口海鞘(Phallusia mammilata)、玻璃海鞘(Ciona intestinalis)和萨氏海鞘(Ciona savignyi), 褶鳃目(Stolidobranchia)的真海鞘(Halocynthia roretzi)、莫马斯赫海鞘(Herdmania momus)、小海鞘(Microcosmus sulcatus)和皱瘤海鞘(Styela plicata)以及樽海鞘纲(Thaliacea)的樽海鞘(Doliolum nationalis)[5-11]。

1.2 选择压力分析

为了检验选择压力对于尾索动物(以玻璃海鞘属为代表)线粒体基因组的影响, 通过 Clustal X[12]对线粒体基因组蛋白质编码基因的核苷酸序列进行多重序列比对。同义替换率(Ks)和非同义替换率(Ka)通过PAML[13]和DnaSP 4.10.7[14]进行了估算。

1.3 基因变异特征分析

分别以12个尾索动物、2个玻璃海鞘属物种(玻璃海鞘和萨氏海鞘)和 2个次口海鞘属物种(黑色次口海鞘和具疣次口海鞘)线粒体基因组作为数据群进行了基因变异位点分析, 蛋白质编码基因和核糖体RNA基因的核苷酸序列通过Clustal X[12]进行多重序列比对。然后通过DnaSP 4.10.7[14]分析了线粒体基因组主编码基因变异位点特征。

1.4 系统发育分析

线粒体基因组 12个蛋白质编码基因(由于部分物种atp8缺失, 所以将其排除在外)的氨基酸序列通过Clustal X[12]进行多重序列比对。然后, 通过两种方法(贝叶斯法和最大似然法)进行系统发育重建,使用的软件分别为MrBayes[15]和PHYML[16]。在贝叶斯分析中, 马尔可夫链需要运行1 000 000个世代(构树频率=1000世代), 从而保证达到收敛, 并估算贝叶斯的先验概率(以 BPP表示)。在最大似然法中,通过自展法(Bootstrap=1000)评估节点的可靠性(以BPM表示)。

2 结果和讨论

2.1 线粒体基因组的基本特征

在脊椎动物线粒体基因组中,nad6基因和一系列转运RNA基因通常在负链上编码。在头索动物线粒体基因组中, 也存在与脊椎动物线粒体基因组类似的基因分布特征[17-18]。然而, 12个尾索动物线粒体基因组的所有基因均在同一链上编码, 这与脊椎动物、头索动物线粒体基因组的基因分布特征显著不同。

尾索动物线粒体基因组长度介于13 648bp(群体海鞘)和 16 351bp(樽海鞘)之间。尾索动物线粒体基因组的基因组成与后生动物线粒体基因组标准的基因组成并不完全一致, 存在转运RNA基因数目的增加, 同时在灯泡簇海鞘、萨氏海鞘和真海鞘的线粒体基因组中缺乏atp8基因(表1)。线粒体基因组主编码链的A+T含量差别很大, 最高的达到80.8%(群体海鞘), 最低的仅为52.9%(具疣次口海鞘)。尾索动物线粒体基因组的基本特征见表1。

表1 尾索动物线粒体基因组的基本特征Tab. 1 Basic features of tunicates mitochondrial genomes

2.2 基因排列

在12个尾索动物线粒体基因组中, 发生了大规模的基因重排。即使排除容易发生易位的转运RNA基因, 它们的基因排列顺序也显著不同(图 1)。在同属物种的线粒体基因组中, 也存在主编码基因的基因重排和基因缺失。在玻璃海鞘属, 与玻璃海鞘线粒体基因组相比, 萨氏海鞘的nad1基因发生易位, 同时atp8基因发生了缺失(图1)。在次口海鞘属, 仅存在 2个保守的基因区块: (1)cox2-cob和(2)nad2-nad4L-cox3, 而其他基因的排列顺序均发生了改变(图1)。

与尾索动物线粒体基因组相比, 在头索动物线粒体基因组中, 基因排列顺序较为保守[17-18]。尽管2个类群(尾索动物和头索动物)均为脊椎动物的近亲,但在线粒体基因组基因排列的特征上却有如此显著的差别, 说明在2个类群之间, 线粒体基因组的进化机制和选择压力可能会存在明显差异, 在今后应该得到进一步的关注和探究。

图1 尾索动物线粒体主编码基因的基因排列(不包含转运RNA基因)Fig. 1 Gene order of tunicates mitochondrial major coding genes (transfer RNA genes are excluded)

2.3 蛋白质编码基因

在 3个物种(灯泡簇海鞘、萨氏海鞘和真海鞘)的线粒体基因组中存在atp8基因的缺失, 其余的 9个物种均包含后生动物线粒体基因组标准的13个蛋白质编码基因。在樽海鞘线粒体基因组的蛋白质编码基因中, 最为常用的起始密码子为“TTG”; 而在11个海鞘纲物种的线粒体蛋白质编码基因中,“ATG”出现的比例最高。除了这两种起始密码子外, 同时还存在“ATA”、“ATT”和“GTG”等3种起始密码子。真海鞘线粒体基因组所有的蛋白质编码基因均以完全终止密码子“TAA”或者“TAG”终止, 余下的 11个物种部分蛋白质编码基因中, 存在不完全的终止密码子(“TA-”或者“T-”)(表2)。尾索动物线粒体基因组蛋白质编码基因所编码的氨基酸数目并不保守。群体海鞘的cox2基因编码313氨基酸, 比萨氏海鞘的cox2基因超出 92个氨基酸;而同时, 玻璃海鞘的nad2基因编码 369个氨基酸,与群体海鞘的nad2基因相比, 多了83个氨基酸(表2)。

2.4 选择压力

为了分析尾索动物线粒体基因组蛋白编码基因的选择压力, 统计了玻璃海鞘和萨氏海鞘蛋白质编码基因的同义替换率(Ks)和非同义替换率(Ka)。2个玻璃海鞘线粒体基因组 12个蛋白质编码基因的Ka/Ks比值都低于1(介于0.0927和0.6752之间), 显示出一定的负(纯化)选择(图 2)。其中,nad6基因的Ka/Ks比值最高(0.6752), 其次是nad3和nad2基因(分别为 0.4321和 0.3916), 因此表明, 在 13个蛋白质编码基因中,nad6、nad3和nad2基因承受较小的选择压力和功能束缚。同时,cox1基因的Ka/Ks比值最低(0.0927), 其次是nad1和cob基因(分别为0.1353和 0.1484), 从而说明, 在尾索动物线粒体基因组中,cox1、nad1和cob基因承受较强的选择压力和功能束缚。

表2 尾索动物线粒体基因组蛋白质编码基因的氨基酸数量及起始、终止密码子Tab. 2 Amino acids number, initiation and termination codons in protein-coding genes of tunicates mitochondrial genomes

图2 玻璃海鞘线粒体基因组蛋白质编码基因的Ka/Ks分析Fig. 2 The ratio of Nonsynonymous and synonymous substitutions rates (Ka/Ks)was estimated in protein-coding genes of Ciona mitochondrial genomes

2.5 基因变异位点特征

在种群遗传学的研究中, 选择合适的分子标记至关重要。以12个尾索动物、2个玻璃海鞘属物种(玻璃海鞘和萨氏海鞘)和 2个次口海鞘属物种(黑色次口海鞘和具疣次口海鞘)线粒体基因组作为数据群,分别进行了基因变异位点分析。在尾索动物线粒体基因组14个主编码基因中,cox1基因最为保守, 变异位点的比例为61.57%。Cob、cox2-3、nad1和lrRNA等 5个基因变异位点的比例介于 70%~80%;atp6、nad3-5、srRNA和nad4L等6个基因变异位点的比例介于 80%~90%;nad2和nad6变异位点的比例超过90%(表3)。变异位点数最多的基因为nad5基因(1120个), 其次为nad4和cox1基因, 变异位点数分别达到1005和 931个。因此, 在尾索动物种群遗传的研究中,nad5和nad4基因可以作为备选的分子标记。

表3 尾索动物线粒体基因组蛋白质编码基因和核糖体RNA基因的变异位点分析Tab. 3 Analysis of different loci of protein-coding genes and ribosomal RNA gene in tunicates mitochondrial genomes

在玻璃海鞘属线粒体基因组的主编码基因中,cox1和cox2基因最为保守, 变异位点的比例分别为16.21%和18.85%; 变异位点数最多的基因为nad5基因(462个), 其次为nad4基因(331个)(表4)。与玻璃海鞘属线粒体基因组类似, 在次口海鞘属线粒体基因组主编码基因中,cox2和cox1基因最为保守, 变异位点的比例分别为23.68%和23.97%; 变异位点数最多的基因为nad5基因(618个), 其次为nad4基因(527个)(表5)。因此, 在玻璃海鞘和次口海鞘种群遗传的研究中,nad5和nad4仍然可以作为备选的分子标记。

表4 玻璃海鞘属线粒体基因组蛋白质编码基因和核糖体RNA基因的变异位点分析Tab. 4 Analysis of different loci of protein-coding genes and ribosomal RNA gene in Ciona mitochondrial genomes

表5 次口海鞘属线粒体基因组蛋白质编码基因和核糖体RNA基因的变异位点分析Tab. 5 Analysis of different loci of protein-coding genes and ribosomal RNA gene in Phallusia mitochondrial genomes

综上所述, 在尾索动物种群遗传的研究中,nad5和nad4可以作为备选的分子标记, 用于分析不同物种之间的遗传多样性, 为其生物多样性的保护及合理利用其生物资源提供更多保障。

2.6 系统发育关系分析

目前在国际上, 基于线粒体基因组数据分析尾索动物内部的系统发育关系才刚刚兴起[5,8], 对 12个尾索动物线粒体基因组进行全面的系统发育分析尚未见报道。作者基于12个线粒体基因组蛋白质编码基因的氨基酸序列, 通过两种方法(贝叶斯法和最大似然法)所构建系统发育树的拓扑结构完全一致(图 3)。从系统发育树的结果可以看出, 尾索动物分为两个分支: 海鞘纲和樽海鞘纲(BPP=100,BPM=100)。在海鞘纲内部, 小海鞘、皱瘤海鞘、真海鞘和莫马斯赫海鞘聚为一支, 从而支持褶鳃目为单系群(BPP=100, BPM=100)。具疣次口海鞘和黑色次口海鞘单独聚为一支(BPP=100, BPM=100), 从而导致内性目并非单系群。线粒体基因组的数据支持尾索动物在科级的亲缘关系为: (((柄海鞘科+芋海鞘科)+(((三段海鞘科+星骨海鞘科)+簇海鞘科)+玻璃海鞘科))+长纹海鞘科)+海樽科(图3)。

图3 基于线粒体基因组蛋白质编码基因的氨基酸序列构建的系统发育树Fig. 3 Phylogenetic tree based on aligned amino acids sequences from mitochondrial protein coding genes

3 结论

作者在12个尾索动物线粒体基因组全序列的基础上, 全面分析尾索动物线粒体基因组的基本特征、基因排列、蛋白质编码基因、选择压力、变异位点和分子系统发育等。12个尾索动物线粒体基因组的所有基因均在同一链上编码, 这与脊椎动物、头索动物线粒体基因组的基因分布特征显著不同。尾索动物线粒体基因组的基因组成与后生动物线粒体基因组标准的基因组成并不完全一致, 存在转运RNA基因数目的增加, 同时在灯泡簇海鞘、萨氏海鞘和真海鞘的线粒体基因组中缺乏atp8基因。在12个尾索动物线粒体基因组中, 发生了大规模的基因重排, 即使在同属物种的线粒体基因组中, 也存在主编码基因的基因重排和基因缺失。尾索动物线粒体基因组蛋白质编码基因使用的起始密码子、终止密码子及氨基酸长度存在差异。2个玻璃海鞘线粒体基因组12个蛋白质编码基因的Ka/Ks比值都低于 1(介于0.0927和0.6752之间), 显示出一定的负选择。在尾索动物群体遗传的研究中,nad5和nad4可以作为备选的分子标记, 用于分析不同物种和种群之间的生物多样性。基于线粒体基因组蛋白质编码基因的氨基酸序列, 支持将尾索动物分为两个分支: 海鞘纲和樽海鞘纲。尾索动物在科级的亲缘关系为: (((柄海鞘科+芋海鞘科)+(((三段海鞘科+星骨海鞘科)+簇海鞘科)+玻璃海鞘科))+长纹海鞘科)+海樽科。

[1]Shen X, Ma X, Ren J, et al. A close phylogenetic relationship between Sipuncula and Annelida evidenced from the complete mitochondrial genome sequence ofPhascolosoma esculenta[J]. BMC Genomics, 2009, 10:136.

[2]Shen X, Ren J F, Cui Z X, et al. The complete mitochondrial genomes of two common shrimps (Litopenaeus vannameiandFenneropenaeus chinensis)and their phylogenomic considerations[J]. Gene, 2007,403(1-2): 98-109.

[3]Dehal P, Satou Y, Campbell R K, et al. The draft genome ofCiona intestinalis: insights into chordate and vertebrate origins[J]. Science, 2002, 298(5601): 2157-2167.

[4]Delsuc F, Brinkmann H, Chourrout D, et al. Tunicates and not cephalochordates are the closest living relatives of vertebrates[J]. Nature, 2006, 439(7079): 965-968.

[5]Singh T R, Tsagkogeorga G, Delsuc F, et al. Tunicate mitogenomics and phylogenetics: peculiarities of theHerdmania momusmitochondrial genome and support for the new chordate phylogeny[J]. BMC Genomics,2009, 10: 534.

[6]Gissi C, Pesole G, Mastrototaro F,et al. Hypervariability of ascidian mitochondrial gene order: exposing the myth of deuterostome organelle genome stability[J].Molecular Biology and Evolution, 2010, 27(2):211-215.

[7]Iannelli F, Griggio F, Pesole G, et al. The mitochondrial genome ofPhallusia mammillataandPhallusia fumigata(Tunicata, Ascidiacea): high genome plasticity at intra-genus level[J]. BMC Evolutionary Biology, 2007,7:155.

[8]Yokobori S, Oshima T, Wada H. Complete nucleotide sequence of the mitochondrial genome ofDoliolum nationaliswith implications for evolution of urochordates[J]. Molecular Phylogenetics and Evolution, 2005,34(2): 273-283.

[9]Gissi C, Iannelli F, Pesole G. Complete mtDNA ofCiona intestinalisreveals extensive gene rearrangement and the presence of an atp8 and an extra trnM gene in ascidians[J]. Journal of Molecular Evolution, 2004,58(4): 376-389.

[10]Yokobori S, Watanabe Y, Oshima T. Mitochondrial genome ofCiona savignyi(Urochordata, Ascidiacea,Enterogona): comparison of gene arrangement and tRNA genes with Halocynthia roretzi mitochondrial genome[J]. Journal of Molecular Evolution, 2003,57(5): 574-587.

[11]Yokobori S, Ueda T, Feldmaier-Fuchs G, et al. Complete DNA sequence of the mitochondrial genome of the ascidianHalocynthia roretzi(Chordata, Urochordata)[J]. Genetics 1999, 153(4): 1851-1862.

[12]Thompson J D, Gibson T J, Plewniak F. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Res, 1997, 25(24): 4876-4882.

[13]Yang Z. PAML 4: phylogenetic analysis by maximum likelihood[J]. Mol Biol Evol, 2007, 24(8): 1586-1591.

[14]Rozas J, Sanchez-DelBarrio J C, Messeguer X, et al.DnaSP, DNA polymorphism analyses by the coalescent and other methods[J]. Bioinformatics,2003,19(18):2496-2497.

[15]Ronquist F, Huelsenbeck J P. MrBayes 3: Bayesian phylogenetic inference under mixed models[J]. Bioinformatics, 2003, 19(12): 1572-1574.

[16]Guindon S, Gascuel O. A simple, fast and accurate algorithm to estimate large phylogenies by maximum likelihood[J]. Syst Biol, 2003, 52(5): 696-704.

[17]Nohara M, Nishida M, Miya M. Evolution of the mito-chondrial genome in cephalochordata as inferred from complete nucleotide sequences from two epigonichthys species[J]. Journal of Molecular Evolution, 2005, 60(4):526-537.

[18]Kon T, Nohara M, Yamanoue Y, et al. Phylogenetic position of a whale-fall lancelet (Cephalochordata)inferred from whole mitochondrial genome sequences[J].BMC Evolutionary Biology, 2007, 7: 127.

猜你喜欢

线粒体变异基因组
线粒体自噬在纤维化疾病中作用的研究进展
牛参考基因组中发现被忽视基因
棘皮动物线粒体基因组研究进展
线粒体自噬与帕金森病的研究进展
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
变异危机
变异
紫花白及基因组DNA提取方法的比较
变异的蚊子