APP下载

现代测序技术及其在海洋生物研究中的应用

2011-09-25李建军王瑞

海洋通报 2011年1期
关键词:海洋生物碱基基因组

李建军,王瑞

(1.潍坊出入境检验检疫局,山东 潍坊 261041;2.北京百迈客生物科技有限公司,北京 101300)

现代测序技术及其在海洋生物研究中的应用

李建军1,王瑞2

(1.潍坊出入境检验检疫局,山东 潍坊 261041;2.北京百迈客生物科技有限公司,北京 101300)

总结了目前常用的几种DNA测序技术原理、特点及其在海洋生物中的应用。展望了新技术的发展方向,以及对海洋生物研究的影响。DNA测序技术的快速发展,必将对海洋生物基础研究产生重要推动作用,为分子育种技术的发展提供基础支持,加快重要海水经济物种的新品种培育进程。

现代测序技术;海洋生物;育种

Abstract: In this paper, principles and characteristics of the commonly used DNA sequencing technologies, as well as their applications in the marine biological research are summed up.It was discussed the prospects of modern sequencing technology development, and the impact on aquatic biological research.It was suggested that the rapid development of DNA sequencing technology would promote the basic research of marine life.Basic support will be offered to molecular breeding, and finally accelerate the breeding process of important economic species of aquaculture.

Keywords: modern sequencing technology; marine biology; breeding

引 言

全基因组测序和基于全基因组测序的相关研究呈现出日新月异的发展势头。自从末端终止法测序技术[1]发明以来,DNA测序技术在短短三十余年内得到迅速发展,科学家们已经向着人类千元(1000美元)基因组时代发起冲击。最初由于高昂测序成本的限制,全基因组测序涉及的领域受到限制,只有细菌[2]等基因组很小的生物的全基因组被首先测定,线虫[3]、果蝇[4]、拟南芥[5]等模式生物的基因组随后被测定,人类基因组[6,7]计划的实施推动了基因组学在全世界的快速发展。这些测序工作都是采用Sanger法进行,项目实施耗时费力。随着新一代测序技术(Next-generation sequencing, NGS)的出现,越来越多的物种启动了全基因组测序计划。基因组研究机构也呈现了多极化发展趋势,中国成为国际基因组研究的重要一员。新一代测序技术基于新的测序原理,目前,边合成(连接)边测序方法占据主导位置。此外,单分子测序技术也即将得到全面发展。

海洋生物是生物学研究的重要领域,美国自1997年就开始计划投资开展罗非鱼、对虾和牡蛎等海洋生物基因组研究。多个海洋蓝藻基因组计划也相继启动[8]。随着海胆基因组[9]项目的完成,目前已有多个海洋生物基因组计划启动或部分完成[10,11]。中国已经启动了扁藻、螺旋藻、牡蛎[12]、对虾等基因组计划,这些计划充分体现了中国在海洋生物基因组学研究中所处的重要地位。

1 测序平台及应用

1.1 Sanger法测序平台

Sanger测序是基于 Sanger等发明的末端终止法发展起来的测序技术。主要的测序平台包括ABI基因分析仪系列(310、3100、3130、3700、3730等)和MegaBACE系列(MegaBACE 500、750、1000、1500、4000等)。其中3730是目前还在较为广泛使用的Sanger法测序平台。3730测序使用PCR反应体系,包括DNA模板、单链寡核苷酸引物、DNA聚合酶、4种dNTP(dATP、dGTP、dTTP和dCTP)、4种经不同荧光标记的 ddNTP(ddATP、ddGTP、ddTTP和ddCTP)和缓冲液等。每个PCR循环包括变性(90℃)、退火(50-55℃,视具体情况而定)和延伸(72 ℃)3个过程。反应过程中,DNA聚合酶在模板链指导下,逐个将dNTP加到引物的 3’末端,使引物延伸,合成出与模板互补的DNA链。由于其双脱氧核糖的 3’位置缺少一个羟基,不能同后续的dNTP形成磷酸二酯键,因此在单链延伸时,如果有双脱氧核苷三磷酸(ddNTP)加入,就会引起延伸终止。由此形成一系列长度不等的DNA单链混合物,这些单链具有相同的5’-引物端,并以ddNTP残基为3’端,通过毛细管电泳将这些带有荧光标记的不同长度的DNA分子片段分离开,再通过 3730成像系统识别荧光标记并转换为相应的测序峰图及碱基序列。

Sanger测序法仍然为分子生物学研究提供着重要的测序平台。广泛的应用于海洋生物功能基因研究、分子标记开发等领域。

表1 各种常用测序平台及其特点Tab.1 Sequencers and their characters

1.2 Illumina/Solexa’s GA 测序平台

Solexa测序技术是由 Solexa公司首席科学家David Bentley负责研发的高通量测序方法(第二代测序技术)。该技术利用可逆的荧光标记技术进行边合成边测序。首先将DNA打断,对纯化后的DNA片段进行修饰后在两端加上特定的接头,然后通过琼脂糖凝胶电泳选取所需长度范围的DNA片段。芯片(flow cell)表面连接有一层与接头互补的单链引物,经处理后的片段与芯片上的引物进行互补连接,被“固定”在芯片上。经过多轮PCR反应后,单一片段经过大量扩增,形成单克隆的 DNA簇(cluster),这些簇以双链桥的形式固定在芯片上,每个簇就是信息收集照片上的一个亮点。对这些簇进行线性化、3’端阻断等处理后作为模板使用,然后加入测序引物、DNA聚合酶、连接了阻断基团和荧光标记基团的4种dNTP等进行扩增合成。由于dNTP连接了阻断基团,因此一次合成只能加入一个碱基,通过拍照的方法捕获数据。每反应一次拍照4次(A、C、G、T各一次),获得每个DNA簇新加入的碱基信息。拍照后洗去反应液,去除3’末端的阻断基团和荧光标记基团,重新加入反应体系,继续获取碱基信息,如此反复,得到大量DNA片段序列信息。Solexa目前可以检测75 bp左右的片段长度,由于可以进行paired-end测序,因此每个DNA簇可以检测两端一共150 bp左右的碱基序列。随着技术的不断发展和完善,单向的读长甚至可以达到100bp。

Solexa是高通量测序平台,一次单通道的测序可以得到不低于200万条的序列;测序成本低廉,每碱基的测序成本约为 Sanger法的 1%;此外,Solexa测序具有分辨率高、精确度高、操作简便等特点。由于具有以上优势,Solexa测序技术已经应用在全基因组de novo测序和重测序、转录组、表达谱、Small RNA、表观遗传学、性状相关分子标记开发等研究领域。Solexa测序技术目前在海洋生物中已经得到大规模利用,用于蓝藻全基因组测序、螺旋藻全基因组测序、海洋扁藻全基因组测序、牡蛎全基因组测序、对虾全基因组测序、牡蛎转录组研究、藻类、扇贝、文昌鱼、大黄鱼表达谱研究以及紫菜、鱼类小RNA研究等(个人交流)。

1.3 Life/APG’s SOLiD测序平台

Solid测序技术是由美国Agencourt私人基因组学公司(APG)研发的新一代高通量测序方法,该技术的主要技术特点是“边连接边测序”。首先根据实验目的,将基因组DNA打断后,在短片段两端加上SOLiD接头制备片段文库,或者经过DNA环化、酶切、加接头等步骤制备末端配对文库。用制备的文库片段作为模板,采用油包水PCR技术对这些片段进行扩增,扩增得到的单克隆片段簇固定在单一的磁珠上。这些磁珠被共价结合在SOLiD玻片表面,作为测序的最小单元。SOLiD采用双碱基编码,即采用4种荧光探针的颜色编码16种碱基对,这些碱基对位于反应底物的第 1、2位,反应底物由8碱基组成,每次测序反应连接上一个反应底物。反应底物的3-5位是随机碱基,6-8位是可以与任何碱基配对的特殊碱基,因此底物序列由1-5位的碱基决定,也即SOLiD连接反应共有45种底物。单向SOLiD测序包括五轮测序反应,每轮反应含有多次连接反应。第一轮测序反应获得目标片段的第1-2、6-7、11-12等位置的碱基信息;第二轮测序反应所用连接引物比上一轮所用引物在 3’位置上减少一个碱基,因此这轮测序反应的第一次连接反应获得上轮反应所用引物的3’末端最后一个碱基(第0位)和目标序列第1位碱基的信息,随后的反应得到5-6、10-11等位置的碱基信息。五轮测序反应完成后,就能获得“0,1,2,3……”组成的SOLiD原始颜色序列。由于一种颜色编码4种碱基对信息,并非一一对应的关系,但是知道碱基对中第一个碱基后,就可以通过颜色编码读出第二个碱基,因此,通过第0位的已知碱基和获得的颜色序列,可以推理出所有的碱基。

由于SOLiD技术得到的序列长度较小,测序成本较低,因此适合用于具有reference基因组序列的物种进行重测序,或者在具有基因组序列且转录本注释较好的物种中开展转录组学研究具有较大的优势。目前,中国科学院海洋研究所组建的海洋生物基因组高通量测序平台就是基于 SOLiD测序技术构建的。

1.4 Roche/454’s GS FLX Titanium测序平台

454 GS FLX测序技术主要以焦磷酸法进行基因组序列测定,该技术把碱基的加入与发光过程偶联在一起[13]。首先,DNA样品被打断成300 bp-800 bp的片段,在DNA片段两端加上A、B两个接头,这两个接头各自含有20个碱基的PCR引物序列,20个碱基的测序引物序列,以及4个碱基的对照序列(TACG)。DNA通过这些接头连接到特定的磁珠上,然后在扩增试剂中乳化形成油包水的混合物。每个DNA片段在油包水的微环境下进行独立扩增,在磁珠上产生几百万个相同的拷贝。随后,将扩增后的DNA磁珠放入PTP板中测序。每个PTP孔只能容纳一个磁珠,孔中载有反应所需的各种酶和底物。测序开始时,依次加入T、A、C、G 4种碱基,如果某种碱基可以与模板发生配对,就会在DNA聚合酶的作用下连接到合成链的末端,每次连接反应都会在ATP硫酸化酶、荧光素酶和双磷酸酶的协同作用下释放一次荧光信号。光信号会被CCD照相机捕获,从而通过荧光信号的有无和强度实时测定DNA序列。

GS FLX系统在高通量测序平台中具有最长的读长,已经在全基因组de novo测序、重测序、宏基因组学研究、考古学、SNP开发、小分子 RNA研究、转录组分析、基因表达调控研究等领域得到大量应用。

2 新一代测序技术对海洋生物研究的影响及展望

新技术的出现开创了新的时代,生物学研究的新突破也促进了新技术的涌现。Polonator G.007测序平台、Helicos BioSciences的Heliscope测序平台已经开始得到应用。Pacific Biosciences的新型测序平台预计 2010年将投入市场[14]。目前已有十余个公司在开发新的测序技术。2009年底,中国科学院北京基因组研究所和浪潮集团宣布开始联合研发第三代基因测序仪。

新一代测序技术的飞速发展,为水产科学的发展奠定了坚实的基础。搭建起海洋生物基因组研究和资源开发平台,培养一批海洋生物基因组学研究人才,推动整个水产研究领域较快地开展基因组学研究工作。使得以全基因组测序为核心的海洋生物基因组学研究变为可能。为海洋动物的基础生物学和育种研究提供大量的基因组水平信息和资源,极大的促进了包括种质评估、育种、病害防治等各种应用研究的快速发展。在基因组测序的推动下,分子育种技术将日渐成熟,从而推动高产、优质、抗逆等优良水产品系选育工作的发展。

致谢:中国科学院海洋研究所许飞、李莉老师为文章修改提出宝贵意见,北京百迈客生物科技有限公司郑洪坤为文章完成提供大力帮助,在此一并致谢。

[1]Sanger F, S Nicklen, A Coulson.DNA sequencing with chain-terminating inhibitors [J].Proceedings of the National Academy of Sciences, 1977, 74(12): 5463-5467.

[2]Fleischmann R.Whole-genome random sequencing and assembly of Haemophilus influenzae Rd [J].Science, 1995, 269(5223): 496-512.

[3]Consortium, T.C.e.S.Genome sequence of the nematode C.elegans: a platform for investigating biology [J].Science, 1998, 282: 2012-2018.

[4]Adams M.The genome sequence of Drosophila melanogaster [J].Science, 2000, 287(5461): 2185-2195.

[5]Arabidopsis G.Analysis of the genome sequence of the flowering plant Arabidopsis thaliana [J].Nature, 2000, 408(6814): 796-815.

[6]Lander E.Initial sequencing and analysis of the human genome [J].Nature, 2001, 409(6822): 860-921.

[7]Venter J.The sequence of the human genome [J].Science, 2001, 291(5507): 1304-1351.

[8]赵方庆, 梁成伟, 秦松.海洋蓝藻基因组学研究 [J].海洋科学, 2007, 31(6): 79-86.

[9]Sodergren E The genome of the sea urchin Strongy locentrotus purpuratus [J].Science, 2006, 314(5801): 941-952.

[10]Liolios K.The Genomes On Line Database (GOLD) in 2007: status of genomic and metagenomic projects and their associated metadata [J].Nucleic acids research, 2008, 36(Database issue): D475.

[11]http://genamics.com/index.htm [DB].

[12]Zhang G..The oyster genome project - The first for an aquaculture species in China (absrtact) [Z].in The 2008 international conference on genomics.2008: Shenzheng & Hongkong.

[13]许冠东, Genome Sequencer FLX 引领快速基因组测序时代的到来 [J].微生物学通报, 2008, 35(001): 149-151.

[14]Metzker M.Sequencing technologies—the next generation [J].Nature Reviews Genetics, 2010, 11(1): 31-46.

Modern sequencing technology and its application in the marine biological research

LI Jian-jun1, WANG Rui2

(1.Weifang Entry Exit Inspection and Querantine Bureau, Shandong Weifang 261041, China; 2.Biomarker Technologies Limited, Beijing 101300, China)

P735

A

1001-6932(2011)01-0104-04

2010-03 -04 ;收修改稿日期:2010-04-05

男,硕士,工程师。

王瑞。电子邮箱:wangrui529@gmail.com。

猜你喜欢

海洋生物碱基基因组
神奇的海洋生物
海洋生物动起来
牛参考基因组中发现被忽视基因
什么样的海洋生物会发光
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
海洋生物
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
基因组DNA甲基化及组蛋白甲基化