线粒体COI、COII和CYTB基因在鲍属物种鉴定中的适用性分析
2011-03-14辛一
辛 一
(1.中国科学院 海洋研究所,山东 青岛266071; 2.中国科学院 研究生院,北京100049)
鲍(Haliotis)是一种藻食性海洋动物,有 7个种分布于中国沿海[1],其中皱纹盘鲍(H.discus hannai)和杂色鲍(H.diversicolor)等都是重要的养殖贝类[2]。中国北方普遍养殖的皱纹盘鲍和原产于日本的盘鲍(H.discus discus)在形态和生态上非常相似,对它们的分类地位尚存在不同意见[3-4]; 此外,原产于中国台湾的九孔鲍(H.diversicolor supertexta)与南方沿海的杂色鲍(H.diversicolor diversicolor)在外部形态和生长特性方面虽存在一定差别,但对于是否将二者划分为亚种仍有争议[1,5]。
线粒体DNA作为一种常用的分子标记,已在软体动物的系统发生、物种鉴定和种群结构等研究中得到广泛应用[6-7]。线粒体COI基因中的部分区域由于其变异速率适中及具有完善的通用引物,常被用作物种鉴定的DNA条形码[8]。尽管基于线粒体基因的分子标记在鲍属物种鉴定中的应用已有报道[9-11],但对于线粒体基因组中COI、CYTB等基因在鲍属物种鉴定中的适用程度,仍然缺乏深入了解。
为寻找更适于鲍属物种鉴定的线粒体基因,并补充中国鲍属物种的线粒体基因相关信息,本研究报道了中国及日本沿海5个皱纹盘鲍群体共16个个体的线粒体基因COI、COII以及CYTB的完整序列,并结合杂色鲍、疣鲍(H.tuberculata)和黑唇鲍(H.rubra)的线粒体基因组信息,对上述各基因在鲍属种内和种间序列特征的异同进行了比较,以分析COI、COII以及CYTB作为鲍属DNA条形码的适用性,为基于线粒体基因的分子标记在鲍属物种鉴定中的进一步应用提供理论依据。
1 材料和方法
1.1 样本采集
选取中国大连、青岛、威海、汕头以及日本宫城5个皱纹盘鲍群体共16个个体,每个群体至少取2个个体,包含在至少 2个取样点中。所有样本在-80℃下冷冻保存,或固定保存于 70%~80%酒精中。所有样本的采集地、样本编号、GenBank序列号等详细信息见表1,其中3个杂色鲍的线粒体基因组数据已在之前的相关工作中获得(数据未发表)。
1.2 DNA片段的扩增与测序
采用 Sambrook等[12]介绍的苯酚氯仿法抽提样本DNA。根据GenBank中皱纹盘鲍线粒体DNA序列(EU595789),设计以下引物用于片段扩增:COI:Hdis-COI-F (5′-TACCGAGGACTCACAATA-3′)和Hdis-COI-R (5′-CTTATCTTCTTCCACGACCA-3′);COII:Hdis-COII-F (5′-TGGGATGGATGTAGACAC TCGTGCTTAT-3′)和 Hdis-COII-R(5′-AGCATTATTCACCTCCCT-3′);CYTB:Hdis-CYTB-F(5′-AACATCC CAGAAGAACAC-3′)和 Hdis-CYTB-R(5′-CCCACTACCATCACCAAA-3′)。反应条件如下:起始 94℃预变性3 min,然后94℃变性30 s,48~60℃退火50 s,72℃延伸1~4 min,35个循环。最后72℃反应10 min。反应体系 25 μL,包括 2 μL dNTP (10mmol/L),正反向引物各 1μL(10 μmol/L),2.5 μL 10×buffer(Mg2+plus),0.4 μL rTaq 酶(5U/μL,Takara),1 μL DNA 模板(50 ng/μL),以及超纯水 17.1 μL。PCR 产物采用博日柱式胶回收试剂盒纯化,利用ABI 3730xl测序仪测序,每个碱基至少达到2倍的测序覆盖度。
表1 样品名录及序列信息Tab.1 Sample information
1.3 数据分析
原始测序峰图文件首先利用软件Phred处理,使每个碱基的质量值在20以上,然后在默认参数下用软件Phrap拼接[13-14],拼接结果和序列碱基质量通过Consed软件检查[15]。使用 MEGA4.1[16]内置的clustalW 进行序列比对(alignment)和碱基组成,计算基于 Kimura双参数距离模型(K2P)[17]的种内和种间遗传距离。采用DnaSP 4.10.7分析种间及种内的序列多态性[18]。4种鲍非同义替代率(non-synonymous substitutions,Ka)和同义替代率(synonymous substitutions,Ks) 比率的计算使用KaKs_Calculator[19]。
2 结果与讨论
2.1 基因特征
COI、COII和CYTB全序列的长度在鲍属4个物种间相同,分别为 1,542 bp、696 bp 和 1,140 bp。COI、COII和CYTB的G+C平均含量为38.2%~45.2%,低于 A+T的平均含量 54.8%~61.8%,密码子第二位的G+C含量在个体间的波动范围最小,其均值与第三位基本接近,而密码子第一位的 G+C含量波动范围最大,且均值明显偏高。此外通过计算发现,COI、COII和CYTB的Ka/Ks均值依次为0.010、0.021和0.033,说明 3种基因都承受强烈的负选择压力,其中COI所承受的负选择压力最大,表明COI是上述3种基因中最保守的基因。
2.2 遗传距离比较
本研究的4种鲍COI、COII和CYTB的种内最大遗传距离依次为 8.8%、10.4%和 9.5%,若去除种内亚种间遗传距离的影响,则种内最大遗传距离依次为1.3%、1.2%和1.7%,而种间最小遗传距离依次为16.4%、16.1%和17.7%。如图1所示,COI、COII和CYTB的种间遗传距离和种内遗传距离具有显著差异,根据计算,COI、COII和CYTB的种间遗传距离均值与种内遗传距离均值之比依次为 25.6、23.9和 21.5。Hebert等认为种内与种间的标准差异阈值(standard divergence threshold value)应为种内平均遗传距离的10倍(10倍法则)[20]。按照这个标准,由于本研究中上述 3种基因的鲍属条形码差异阈值应分别为6.5%、6.1%和8.9%,而鲍属种内遗传差异最大值分别为1.3%、1.2%和1.7%,属内不同种间遗传差异最小值分别为 16.4%、16.1%和 17.7%,因此利用基于COI、COII和CYTB的分子标记能够将本研究涉及的鲍属种类全部有效区分开,证实了本研究所选用的鲍属物种存在种间的条形码间隙。
图1 鲍属种间和种内个体间COI、COII和CYTB遗传距离(基于K2P)分布情况Fig.1 Distribution of intraspecific and interspecific K2P distance based on COI,COII and CYTB of Haliotis
2.3 基因序列多态性分析
比较分析了基于COI、COII和CYTB序列的鲍属种间及种内单核苷酸多态性(single nucleotide polymorphism,SNP)。如图2所示,4种鲍的种间与种内单核苷酸多态性形成明显分界。鲍属COI、COII和CYTB的序列多态性水平表明,虽然上述3种基因的全序列都可用于区分鲍属物种,但用基因不同区域进行鲍属物种鉴定时,其有效性存在差异。首先,图2中的基因区域V1、V2、V4和V6在种内和种间的单核苷酸多态性较其他区域更加丰富,因此这些区域可能更适用于区别鲍属种内和种间的序列差异;其次,COII中的高变区V3和CYTB中的高变区V5在疣鲍亚种内的单核苷酸多态性水平明显高于相应区域内皱纹盘鲍和杂色鲍的地理群体间水平,说明在进行鲍属亚种鉴定时,COII和CYTB中可能存在比COI通用区域更为有效的DNA条形码,从而为鲍的亚种鉴定提供了新的 DNA条形码参考序列; 最后,皱纹盘鲍不同群体的序列多态性水平虽在COI和CYTB的部分区域中相对较高,但由于各群体的取样个数未达到有效的统计学标准,因此无法对皱纹盘鲍群体之间的遗传多样性进行深入调查。为了开发出可靠的皱纹盘鲍群体间DNA条形码,需要在今后的工作中增加皱纹盘鲍各群体的样本数,以及扩大对线粒体基因组的探测范围等。
在本研究中,遗传距离和序列多态性的结果表明COI、COII和CYTB都可用于区分鲍属物种。鉴于目前GenBank中鲍属COI的发表序列较COII和CYTB更多,且COI具有完善的通用引物,可以更加方便高效地进行研究,本研究建议采用COI序列作为目前鲍属物种鉴定的DNA条形码。
致谢:本研究所用样本、试剂、测序等一切费用均由刘晓研究员提供,在实验设计、数据分析和论文撰写全过程中都得到了刘晓研究员的大力支持与悉心指导,在此表示衷心感谢!任建峰博士参加了部分序列分析工作,谨此致谢!
图2 基于COI、COII和CYTB序列的鲍属不同种内及种间核苷酸多态性比较图Fig.2 Comparison of intraspecific and interspecific of nucleotide diversity based on COI,COII and CYTB sequences of Haliotis.
[1]吕端华.中国近海鲍科的研究[J].海洋科学集刊,1978,14:89-98.
[2]Zhang G F,Que H Y,Liu X,et al.Abalone mariculture in China[J]. Journal of Shellfish Research,2004,23(4):947-950.
[3]黎中宝,刘文彪,韩芳,等.4种经济鲍遗传多样性与分化的研究[J].中国生态农业学报,2005,13(4):15-18.
[4]小林正裕,木岛明博,藤尾芳久.日本沿岸皱纹盘鲍形态的地理分布[J].水产育种(日),1992,17:39-48.
[5]聂宗庆.鲍的养殖与增殖[M].北京:农业出版社,1989.
[6]程汉良,夏德全,吴婷婷,等.6种帘蛤科贝类及4个地理种群文蛤线粒体COI基因片段序列分析[J].海洋学报,2007,29(5):109-116.
[7]Chen A H,Li Z X,Feng G N.Phylogenetic relationships of the genusMeretrix(Mollusca:Veneridae) based on mitochondrialCOIgene sequences[J].Zoological Research,2009,30(3):233-239.
[8]陈军,李琪,孔令锋 等.基于COI序列的 DNA 条形码在中国沿海缀锦蛤亚科贝类中的应用分析[J].动物学研究,2010,31(4):345-352.
[9]An H S,Jee Y J,Min K S,et al.Phylogenetic analysis of six species of Pacific abalone (Haliotidae) based on DNA sequences of 16S rRNA and cytochrome coxidase subunit I mitochondrial genes[J].Marine Biotechnology,2005,7(4):373-380.
[10]Estes J A,Lindberg D R,Wray C.Evolution of large body size in abalones (Haliotis):patterns and implications[J].Paleobiology,2005,31(4):591-606.
[11]王鹭骁,柯才焕,王志勇,等.中国沿岸几种鲍线粒体16S rRNA 基因片段序列比较及鲍属系统发育[J].中国水产科学,2006,13(2):167-173.
[12]Sambrook J,Fritsch E F,Maniatis T.Molecular cloning:a laboratory manual.2nd[A].New York:Cold Spring Harbor Laboratory,1989:545.
[13]Ewing B,Hillier L,Wendl M C,et al.Base-calling of automated sequencer traces using phred.I.Accuracy assessment[J].Genome Research,1998,8(3):175-185.
[14]Ewing B and Green P.Base-calling of automated sequencer traces using phred.II.Error probabilities[J].Genome Research,1998,8(3):186-194.
[15]Gordon D,Abajian C,Green P.Consed:A graphical tool for sequence finishing[J].Genome Research,1998,8(3):195-202.
[16]Tamura K,Dudley J,Nei M,et al.MEGA4:Molecular evolutionary genetics analysis (MEGA) software version 4.0[J].Molecular Biology and Evolution,2007,24(8):1596-1599.
[17]Kimura M.A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide-Sequences[J].Journal of Molecular Evolution,1980,16(2):111-120.
[18]Rozas J,Sanchez-DelBarrio J C,Messeguer X,et al.DnaSP,DNA polymorphism analyses by the coalescent and other methods[J].Bioinformatics,2003,19(18):2496-2497.
[19]Zhang Z,Li J,Zhao X Q,et al.KaKs_Calculator:calculating Ka and Ks through model selection and model averaging[J].Genomics Proteomics Bioinformatics,2006,4(4):259-263.
[20]Hebert P D N,Ratnasingham S,deWaard J R.Barcoding animal life:cytochrome c oxidase subunit 1 divergences among closely related species[J].Proceedings of the Royal Society of London Series B-Biological Sciences,2003,270:96-99.