无蹼壁虎线粒体全基因组及系统发育分析
2017-09-18曾德龙高成伟秦新民
秦 峰 曾德龙 高成伟 秦新民
(广西师范大学生命科学学院,桂林,541004)
无蹼壁虎线粒体全基因组及系统发育分析
秦 峰 曾德龙 高成伟 秦新民*
(广西师范大学生命科学学院,桂林,541004)
稿件运行过程
无墣壁虎; 线粒体基因组; 系统发育
无蹼壁虎(Gekkoswinhonis)属壁虎科(Gekkonidae)壁虎属动物,主要分布于辽宁、河北、陕西、河南、山东、江苏、安徽、浙江、广西等地,常见于暖温带以及栖息在建筑物的缝隙、岩缝、石下及树上。无蹼壁虎为我国的特有物种,该物种已被列入中国国家林业局2000年8月1日发布的《国家保护的有益的或者有重要经济、科学研究价值的陆生野生动物名录》。人们对无蹼壁虎的形态、生态、行为,以及药用价值等方面进行过研究[1-6],但其线粒体基因组和系统发育的研究尚未见报道。本文对无蹼壁虎的线粒体基因组进行了测序和基因组结构特征分析,并对无蹼壁虎的系统发育进行了探讨。
1 材料与方法
1.1 材料
无蹼壁虎,采集于广西壮族自治区防城港。取其尾部肌肉为实验材料 。
1.2 方法
1.2.1 总DNA提取
DNA提取方法参照汪永庆等[7]报道的SDS/蛋白酶K裂解法进行。
1.2.2 引物设计、PCR 扩增及序列测定
本研究中部分PCR引物参考已公布的线粒体基因组扩增通用引物[8],其余通过从Genbank下载壁虎科、蜥蜴科(Lacertidae)的线粒体基因组全序列或部分序列用软件Clustal X 1.83比对,以找到合适保守位点,设计出含简并位点的引物。部分引物无法扩增出产物,待其他片断序列完成后用Primer Premier 5.0设计特异性引物,使所设计的引物能够扩增出覆盖无蹼壁虎的线粒体全基因组序列(表1)。
表1 扩增无蹼壁虎线粒体基因组全序列所用的引物
Tab.1 List of primers used to amplify and sequence the mitogenome of Gekko swinhonis
注:简并引物中所用的字符:R(A,g),Y(C,T),M(A,C),K(g,T),S(g,C),W(A,T),H(A,T,C),B(g,T,C),D(g,A,T),N(A,T,g,C)
Note:Characters of degenerate primer are as follow:R(A,g),Y(C,T),M(A,C),K(g,T),S(g,C),W(A,T),H(A,T,C),B(g,T,C),D(g,A,T),N(A,T,g,C)
本实验PCR的反应体系为50 μl,包括:25 μl 2×TaqPCR Master Mix(TIANGEN),上、下游引物各0.5 μl,模板总DNA 1.0 μl,ddH2O 23 μl。
PCR的循环程序为:94℃预变性5 min;94℃变性30 s;退火30 s,温度因引物而异,约比引物Tm值低2~5℃;72℃延伸,时间因各所扩片断而异,按1min/kb设置;循环次数为35次;循环结束后72℃保温10 min。
非简并引物扩增且无杂带的PCR产物直接委托华大基因进行双向测序,少数含非特异性条带的PCR产物经割胶纯化后再测序。简并引物扩增的PCR片段经纯化后与TaKaRa pMD19-T载体连接,转化DH5α大肠杆菌后再用载体的通用引物测序。
1.2.3 序列拼接及注释
经测序得到的DNA片断用DNAStar(DNASTAR,Inc.)软件包的SeqMan进行组装拼接。各蛋白质编码基因和rRNA基因通过与GenBank中近缘物种的线粒体基因进行同源比对定位。tRNA基因的查找、定位及二级结构预测使用在线版的tRNAscan-SE Search Server[9]。用MEGA 4.1[10]软件对蛋白质编码基因进行翻译,最后用Sequin 11.0对全序列进行注释,并提交至GenBank(登录号:JQ906550)。
1.2.4 系统发育树的构建
将35个物种(包括外群)线粒体全基因组13个蛋白质编码基因的氨基酸序列进行构树。构建系统树前,利用Clustal X 1.83的默认设置,将核苷酸序列进行比对。然后,经过软件Modeltest 3.7检测,得出用于BI法分析的最适的核苷酸和氨基酸的替代模型为GTR+I+G。最后构建系统发生树。
2 结果
2.1 全基因组的序列结构和碱基组成
2.1.1 基因组结构特征
无蹼壁虎的mtDNA为闭合环状DNA,全长16 818 bp,经注释的序列已提交至GenBank(登录号为JQ906550)。无蹼壁虎线粒体基因组共有37个基因(图1,表2),包括13个蛋白质编码基因、22个tRNA基因、1个主要的非编码区(D-loop)、2个核糖体rRNA基因(12S rRNA和16S rRNA)。其中13个蛋白质编码基因包括细胞色素b基因、腺苷三磷酸酶亚基(ATP6,ATP8)、细胞色素C氧化酶亚基Ⅰ-Ⅲ基因(CO1-CO3)和7个NADH氧化还原酶亚基(ND1-DN6,ND4L)。
图1 无蹼壁虎线粒体基因组基因结构示意图Fig.1 Diagram of structure of Gekko swinhonis mitogenome
2.1.2 碱基组成特征
无蹼壁虎线粒体基因组不同区域和蛋白质编码基因密码子各位置的碱基组成见表3。全基因组的A+T(57.63%)含量高于G+C(42.37%),呈现GC偏斜,GC偏斜为-0.308,AT偏斜值为0.088。13个蛋白质编码基因平均AT含量为57.65%。密码子第一到第三位的AT含量分别为:52.25%,58.44%和62.27%。从表3可以看出,密码子不同位置的AT偏向性的程度也不同,AT含量最低的是第一位,最高的是第三位,这主要是因为密码子第三位置上的碱基受到的功能选择压较小,可以自由突变,所以受不同链的AT偏好影响较大。
2.1.3 蛋白质编码基因
无蹼壁虎线粒体的13个蛋白质编码基因中,12个基因都使用ATG为起始密码子,只有ND2基因以ATA为起始密码子。无蹼壁虎5个基因(ND1、ATP8、ATP6、ND4L、ND4)以TAA为终止密码子,ND6和Cytb两个基因以TAG为终止密码子,CO1以AGA为终止密码,其余5个基因为不完全终止密码TA-或T-(ND2、CO2、ND5和CO3为T-,ND3为TA-)。
利用MEGA 5.1软件对无蹼壁虎线粒体基因组去除终止密码后的13个蛋白质编码基因的相对同义密码子使用频率(relative synonymous codon usage,RSCU)进行了统计(表4)。无蹼壁虎使用最多的氨基酸均为亮氨酸(L),使用频率为659,而且亮氨基的密码子恰是20种氨基酸中最多的一个,一共有6个同义密码子。单个密码子的使用情况,CUA(231次),AUU频率为150。由于密码子第三位置强烈AT偏向性的影响,同一个氨基酸的几个同义密码子中,NNU和NNA密码子RSCU基本都大于1。
表2 无蹼壁虎线粒体基因组结构和特征
Tab.2 Organization and features of Gekko swinhonis mitochonrial genome
表3 无蹼壁虎线粒体基因组不同区域的碱基组成
Tab.3 Nucleotide composition of the mitochondrial genome of Gekko swinhonis
表4 无蹼壁虎线粒体基因组蛋白质编码基因的密码子使用频率及相对同义密码子使用情况
Tab.4 Codon frequency and relteive synonymous codon usage(RSCU)of Gekko swinhonis mitogenome protein-coding genes
注:终止密码子未统计
Note:Termination codons are excluded
2.1.4 核糖体RNA基因及转运RNA基因
无蹼壁虎2个核糖体RNA基因位于tRNAPhe和tRNALeu(UUR)基因之间,中间由tRNAVal基因隔开。12S rRNA基因全长951 bp,各碱基含量分别为:33.23%(A)、20.40%(T)、28.29%(C)、18.09%(G),AT含量为53.63%;16S rRNA基因全长1 568 bp,各碱基含量分别为:33.99%(A)、20.41%(T)、27.23%(C)、18.37%(G),AT含量为54.40%。22个tRNA基因的总长度为1 514 bp,各碱基含量分别为:31.11%(A)、27.68%(T)、23.84%(C)、17.37%(G),AT含量58.78%,其中最长的tRNA为tRNALeu(UUR)和tRNASer(UCN),长度均为75 bp,最短的为tRNASer(GCU),62 bp,其二级结构缺失了DHU臂而未形成典型的三叶草结构(图2)。
图2 无蹼壁虎tRNA二级结构预测图Fig.2 Predicted secondary structure of tRNAs in Gekko swinhonis
2.1.5 控制区
无蹼壁虎线粒体控制区(D-loop)位于tRNAPro和tRNAPhe之间,长度为1 456 bp,占整个基因组的8.66%,其碱基组成为:31.99% A、27.96% C、13.57% G、26.48% T。在控制区的5′端存在一个重复6次的串联重复序列(5′-TGAATATTATATAGTACATTATATTAATGATATGGGATATACTA GTATATAGTA CATACATTTACTTACCCCA-3′),其中包含有1个终止序列(TAS)(5′-ACATTATATTAAT-3′)。此外,在控制区的3′端有3个CBS序列:分别为CSB-1(5′-ATTTCATTCATGCTCGATGGGCATA-3′),CSB-2:(5′-CAAACCCCCCTTACCCC-3′)和 CBS-3(5′-CGCCAAACCCCTAAAACG-3′)。
2.2 系统发育分析
为了探讨无蹼壁虎的系统发育地位,本研究从GenBank中下载了33个有鳞目(Squamata)物种(包括本研究的无蹼壁虎),以鳄目(Crocodylia)的Caimancrocodylus和鸟纲的Buteobuteo2个物种作为外群。以35个物种(包括2个外群)线粒体基因组中13个蛋白质编码基因的氨基酸序列为数据集进行BI系统发育树的构建,各物种的种名及GenBank登录号见表5。
表5 本研究用于系统发育分析物种的相关信息
Tab.5 List of the complete mitogenome in the phylogenetic analyses
续表5
所构建的BI系统发育树节点的支持率很高,每个节点的后验概率(posterior probability)均为1.00(图3)。系统树的拓扑结构将有鳞目分为两大支,一支蛇亚目(Serpentes)与端生齿类(Acrodonta)组成的姐妹支,另一支包括了由石龙子科(Scincidae)和双足蜥科(Dibamidae)组成的小支再与美洲鬣蜥科(Iguanidae)相聚形成的姐妹支,蚓蜥亚目(Amphisbaenia)与蜥蜴科组成的姐妹支,以及夜蜥科(Xantusiidae)、环尾蜥科(Cordylidae)和壁虎科物种。
3 讨论
本研究选用了鳄目的Caimancrocodylus和鸟纲Buteobuteo两个物种作为外群,与内群33个物种BI系统发育树。
3.1 有鳞目的基部类群
Camp[11]基于形态特征将有鳞目划分为鬣蜥亚目(Lguania)和硬舌亚目(Scleroglossa)。然而基于分子系统学的研究却与形态学上的划分方法不大一致,Vidal和Hedges[12]基于核基因序列构建系统发育树中双足蜥科位于有鳞目的基部位置,Zhou等[13]基于线粒体全序列构建系统发育树中将有鳞目划分为蛇亚目和蜥蜴亚目两大支,Albert等[14]同样基于线粒体基因组全序列的研究又得出来另一个结果:蛇与端生齿类组成的姐妹群是有鳞目群。因此,在基于分子标记的有鳞目系统发育研究中,有鳞目的基部类群尚存在较大的分歧。在本研究的BI系统发育树中,蛇亚目与端生齿类组成的姐妹支,结果与Albert等[14]观点相同,而不支持形态学上将有鳞目划分为鬣蜥亚目和硬舌亚目的观点。
图3 基于 13个蛋白质编码基因的氨基酸序列构建的BI系统发育树Fig.3 BI trees based on the concatenated amino acid sequences of the 13 PCGs
3.2 亚目分类单元的单系性
科级以上的分类群中,蚓蜥亚目、蛇亚目、端生齿类和蛇蚓下目(Anguimorpha)4个类群的单系性得到大部分系统树的支持。其中,蛇亚目和端生齿类两个类群的单系性BI系统树中得到1.00的贝叶斯后验概率支持。但石龙子下目(Scincomorpha)的单系性在本研究中未得到支持。
3.3 科级分类单元的单系性
所选的物种范围内几乎所有科级分类单元的单系性在所有系统发育树中都得到支持。仅有蚓蜥科在所有的树中都因短头蚓蜥科(Trogonophidae)的嵌入而成为并系群,而且涉及到的4个物种的关系在所有的树中也始终保存恒定,为(Blanuscinereus,(Diplometoponzarudnyi,(Amphisbaenaschmidti,Geocalamusacutus)))。
3.4 无蹼壁虎的系统发育
壁虎科在本研究的BI系统发育树中呈现出单系性。无蹼壁虎属壁虎科动物,在BI系统树中无蹼壁虎先与Tarentolamauritanica相聚,然后再与Coleonyxvariegatus聚为一支,与形态分类学的观点相符。
近年来,随着DNA测序技术的发展,越来越多物种的线粒体基因组全序列被测定,不少研究者开始利用线粒体基因组全序列的信息对有鳞目高阶元的系统发育关系进行探讨。Kumazawa(2004)[15]测定了4种蜥蜴和1种蛇类的线粒体基因组全序列,并从公共数据库中选取了另4条有鳞目序列及其他外群,构建的系统发育树支持蛇与蜥蜴的单系性。Zhou等(2006)[13]利用15个有鳞目物种代表了13个科的线粒体基因组全序列,重构了有鳞目系统发育树,结果与Kumazawa[15]相似,同样支持将有鳞目分为蛇亚目与蜥蜴亚目(Sauria)两个姐妹支。它们结果还支持壁虎下目与蚓蜥的姐妹群关系,这一观点与大部分形态学及分子数据的结论不一致。2006年,Douglas等[16]新测定了5种蛇的线粒体基因组全序列,但得出了与Zhou等[13]不一致的结果,认为与蛇关系最近的是蚓蜥,并不支持有鳞目分为蛇亚目与蜥蜴亚目的观点。随后,Kumazawa(2007)[17]又新测定了来自7个不同科的有鳞目物种线粒体基因的序列,再次探讨了有鳞目系统发育关系,结果依旧未能确定蛇类的位置,另显示石龙子下目(Scincomorpha)为并系群,壁虎下目(Gekkota)位于有鳞目基部。
目前,基于形态和分子数据得到的有鳞目系统发育关系尚没有较一致的结论,真正弄清有鳞目内部的系统发育关系仍有待今后深入研究。
[1] 邹寿昌.无蹼壁虎冬眠期的生态及形态生理研究[J].动物学杂志,1992,27(4):25-28.
[2] 姜雅风,吴伟,田敬,等.无蹼壁虎的繁殖习性[J].四川动物,1999,18(3):114-I16.
[3] 孟德荣,张桂然.无蹼壁虎对环境温度的选择及体温调节[J].动物学研究,2000,21(5):422-424.
[4] 冯照军,李宗芸,张春海.无蹼壁虎繁殖生态生物学研究[J].动物学研究,2001,22(1):83-84.
[5] 李耀辉,刘冬梅,盛继文,等.无蹼壁虎抗肿瘤成分的提取及其对CT-26小鼠结肠腺癌的抑制作用[J].第四军医大学学报,2009,30(12):1103-1106.
[6] 李耀辉,盛继文,耿秀芳,等.无蹼壁虎药用成分抗肿瘤效果[J].陕西中医,2009,30(7):899-901.
[7] 汪永庆,王新国,徐来祥,等.一种动物基因组DNA提取方法的改进[J].动物学杂志,2001,36(1):27-29.
[8] Simon C,Frati F,Beckenbach A,et al.Evolution,weighting,and phylogenetic utility of mitochondrial gene sequences and a compilation of conserved polymerase chain reaction primers[J].Annals of the Entomological Society of America,1994,87(6):651-701.
[9] Schattner P,Brooks A N,Lowe T M.The tRNAscan-SE,snoscan and snoGPS web servers for the detection of tRNAs and snoRNAs[J].Nucleic Acids Research,2005,33(suppl 2):686-689.
[10] Tamura K,Dudley J,Nei M,et al.MEGA4:Molecular evolutionary genetics analysis(MEGA)software version 4.0[J].Molecular Biology and Evolution,2007,24(8):1596-1599.
[11] Camp C L.Classification of the lizards [J].Bulletin American Museum Natural History,1923,48(11):289-480.
[12] Vidal N,Hedges S B.The phylogeny of squamate reptiles(lizards,snakes,and amphisbaenians)inferred from nine nuclear protein-coding genes[J].Comptes Rendus Biologies,2005,328(10):1000-1008.
[13] Zhou K,Li H,Han D,et al.The complete mitochondrial genome ofGekkogecko(Reptilia:Gekkonidae)and support for the monophyly of Sauria including Amphisbaenia[J].Molecular Phylogenetics and Evolution,2006,40(3):887-892.
[14] Albert E M,San Mauro D,García-París M,et al.Effect of taxon sampling on recovering the phylogeny of squamate reptiles based on complete mitochondrial genome and nuclear gene sequence data[J].Gene,2009,441(1-2):12-21.
[15] Kumazawa Y.Mitochondrial DNA sequences of five squamates:phylogenetic affiliation of snakes[J].DNA Research,2004,11(2):137-144.
[16] Douglas D A,Janke A,Arnason U.A mitogenomic study on the phylogenetic position of snakes[J].Zoologica Scripta,2006,35(6):545-558.
[17] Kumazawa Y.Mitochondrial genomes from major lizard families suggest their phylogenetic relationships and ancient radiations[J].Gene,2007,388(1-2):19-26.
Gekkoswinhonis; Mitochondrial genome; Phylogeny
经PCR扩增和序列测定,获得了无蹼壁虎(Gekkoswinhonis)的线粒体基因组全序列,其总长为16 818 bp,含有13个蛋白质编码基因、2个rRNA基因、22个tRNA基因和1个控制区。各基因的位置、排列顺序及转录方向均和大部分的有鳞目物种一致。无蹼壁虎线粒体基因组的碱基组成分别为:A(31.35%)、T(26.28%)、C(27.71%)、G(14.67%)。除Ser(GCU)缺失DHU臂外,其余的21个tRNA都可以形成典型三叶草结构。13个蛋白质编码基因中,除ND2基因以ATA为起始密码子外,其余12个基因均使用ATG为起始密码子。无蹼壁虎5个基因(ND1、ATP8、ATP6、ND4L、ND4)以TAA为终止密码子,ND6和Cytb基因以TAG为终止密码子,CO1以AGA为终止密码,其余5个基因为不完全终止密码TA-或T-(ND2、CO2、ND5和CO3为T-,ND3为TA-)。控制区位于tRNAPro和 tRNAPhe之间,全长1 456 bp,含有一些终止相关序列和保守序列(TAS,CBS1-3)。基于13个蛋白质编码基因氨基酸序列构建的BI系统发育树分析表明,无蹼壁虎与壁虎科的Tarentolamauritanica的亲缘关系最近。
Complete Mitochondrial Genome of Peking Gecko(Gekkoswinhonis)and Phylogenetic Analysis
Qin Feng Zeng Delong Gao Chengwei Qin Xinmin*
(College of Life Science,Guangxi Normal University,Guilin,541004,China)
The complete nucleotide sequence of the mitochondrial genome of Peking gecko(Gekkoswinhonis)was determined by using PCR amplification and DNA sequencing.The results indicated a circular molecule of 16 818 bp,including 13 protein-coding genes,2 rRNA genes,22 tRNA genes,as well as a control region(D-loop).The gene arrangement pattern,order,and transcribing directions proved like those of other Squamata species.The nucleotide compositions of A,T,C,G were 1.35%,26.28%,27.71% and 14.67%,respectively.The secondary structures of tRNAs were predicted by tRNAscan-SE online server,all the tRNAs could form the typical cloverleaf structure except for tRNASer(AGY),whose T-arm was lacking.Excepting the initiation codons of the ND2 gene that were a CGA codon,the other protein coding genes started with an ATA codon.Within the stop codons of 13 protein-coding genes,five genes(ND1,ATP8,ATP6,ND4L and ND4)ended with TAA stop codon.Two genes(ND6 and Cytb)ended with TAG or COI with AGA.The remaining five genes(ND3 with TA-,ND2,ND5,COII and COIII with T-)had incomplete stop codons.The control region was located between the tRNAProand tRNAPhegenes,and was 1 456 bp in length.Some tandem repeat sequences and conserved elements(TAS,CSB1-3)were found in the control region.The Bayesian inference(BI)phylogenetic analyses based on the 13 PCG amino acid sequences showed that that Peking gecko is closely related toTarentolamauritanicawithin Gekkonidae.
广西珍稀濒危动物生态学重点实验室项目(1501z003)
秦峰,男,31岁,讲师;主要从事动物分子系统学研究。
*通讯作者:秦新民,E-mail:xmqin@mailbox.gxnu.edu.cn
2016-07-03
Q951+.3 Q78
A
修回日期:2016-08-12
发表日期:2017-02-10
2310-1490(2017)01-094-09