APP下载

下一代测序技术在分子诊断中的应用

2013-04-18魏军赵志军

分子诊断与治疗杂志 2013年3期
关键词:碱基基因组测序

魏军赵志军

•述 评•

下一代测序技术在分子诊断中的应用

魏军★赵志军

DNA测序是破译人类疾病的一种强大技术,尤其在癌症方面。飞速发展的下一代测序(next-generation sequencing,NGS)极大降低了测序成本,并且实现了高通量,这使我们可以获得整个基因组的序列,以及那些临床上确诊病人的全部基因组信息。然而下一代测序技术带来诸多益处的同时也带来了挑战,那就是怎样使这个技术在临床诊断中成为常规手段。本文就目前NGS的几大技术平台原理,在临床诊断中的应用,以及目前面临的挑战等进行综述。

下一代测序;基因组学;分子诊断

近年来,下一代测序(next-generation sequencing,NGS)技术迅猛发展,它的高通量测序技术,是对传统测序技术的革命性变革[1]。现有的技术平台主要包括Roche Applied Science[454 Genome Sequencer FLX GS(FLX)System],Illumina(Genome Analyzer),Applied Biosystems(SOLiD™)以及Helicos BioSciences(HeliScope™ Single Molecule Sequencer)。虽然对基因组的测序曾今是一个巨大的工程,但是NGS的出现极大地降低了成本,缩短了时间,使得DNA测序成为许多实验的一种低成本选择,也使得一些研究者敢于做一些以前受技术限制和经费限制的实验,例如临床诊断方面。

在过去的30年,人类遗传学上最伟大的研究之一莫过于Sanger测序,并且成为了迄今为止DNA测序的主流方法。但是科学的发展使得传统的Sanger测序已经不能完全满足研究的需要,对模式生物进行基因组重测序以及对一些非模式生物的基因组测序,都需要费用更低、通量更高、速度更快的测序技术。为了克服Sanger测序的瓶颈,NGS做了很多技术上的突破,包括文库的构建、锚定桥接、预扩增等等,使得上百万的测序反应同时发生在一个反应里[2]。与第一代测序Sanger技术不同的是,NGS技术可以通过反复测序同一区域的DNA片段以达到很高的灵敏度和准确度,同时高通量、自动化,能在很短的时间内完成对上百亿碱基的测序,实现极短时间内对人类转录组和基因组进行细致的研究。

2005年到现在,NGS作为一个高通量技术,它的快速发展打开了许多新的研究领域以及应用方向[3]。医学领域中与NGS相关的文献也是飞速增长,NGS在医学领域中显示出了巨大的应用价值[4],前进中的NGS技术将会不断的向减少成本、工作流程的简易化的方向发展[5,6],而且将会越来越走向临床诊断和个性化用药的领域[7]。这篇文章中我们讨论NGS对临床诊断带来的应用和冲击。

1 NGS测序原理

下一代测序技术的核心思想是边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454 GS FLX、Illumina/Solexa Genome Analyzer、Helicos BioSciences公司的HeliScope™Single Molecule Sequencer;以 及 连 接 法 测 序(Sequencing by Ligation),即通过引物来定位核酸信息,技术平台有Applied Biosystems/SOLiD™ system。

1.1 罗氏公司(Roche)的454测序仪测序原理

454公司首先将焦磷酸测序(pyrosequencing)应用在测序技术上,之后便被罗氏诊断公司收购,形成了目前的Roche 454 GS FLX测序系统。其测序过程大致是,待测DNA样品被打断成300~800 bp的片段,然后3'和5'端分别加上接头,这些接头会使DNA片段结合到微珠上。测序PCR反应就发生在固相的微珠上,并且整个PCR反应和相关的酶被油包水的液滴包裹,每个油滴系统只包含1个DNA模板,进行独立的PCR扩增。扩增后,每个DNA分子可以得到富集,每个微珠只能形成一个克隆集落。454测序仪的测序通道体积非常狭小,只能容纳一个微珠。测序过程中,GS FLX系统会将引物上dNTP的聚合与荧光信号释放偶联起来,通过检测荧光信号,就可以达到DNA测序的目的。相对于Sanger测序、Solexa和Solid测序而言,454测序仪可以提供中等的读长和适中的价格,适合de novo测序、转录组测序、宏基因组研究等。

1.2 Illumina公司的Solexa基因组分析仪测序原理

Solexa测序其核心技术是DNA簇(DNA cluster)和可逆终止化学反应(reversible terminator)。这种高通量测序芯片表面连接有一层单链引物,两端连接测序接头的单链DNA片段通过与芯片表面的引物碱基互补结合,引物扩增成为双链后,使双链变性为单链,该单链DNA的一端就被固定在芯片上,而另一端随机和附近的另外一个引物互补,也被固定住,形成“桥”(bridge)。经过反复30轮扩增后,每个单分子得到约1 000倍扩增,成为单克隆DNA簇。然后加入经过改造的DNA聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆终止子”,其3'羟基末端带有可化学切割的部分,每个循环只允许掺入单个碱基。去除其他多余的dNTP后,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。随后将这些基因化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此循环,直到每条模板序列都完全被聚合为双链。统计每轮收集到的荧光信号,就可得知模板DNA片段的序列。Solexa的读长在100~150 bp之间,适合小RNA鉴定、甲基化和表观遗传学研究。

1.3 Applied Biosystems(ABI)的SOLiD测序仪测序原理

美国ABI公司于2007年底推出了SOLiD第二代测序平台,2010年末又发布了最新产品SOLiD 5500xl测序平台。从SOLiD到如今的SOLiD 5500xl,短短3年时间,连升5级,发展速度惊人。SOLiD全称为Sequencing by Oligonucleotide Ligation and Detection,它以4色荧光标记寡核苷酸的连续连接反应为基础,而没有采用传统的边合成边测序技术。连接反应没有DNA聚合酶合成过程中常有的错配问题,而SOLiD特有的“双色球编码技术”又提供了一个纠错机制,这种设计上的优势使得SOLiD在系统准确性上大大领先于其他平台。测序之前,DNA模板进行乳化PCR扩增,和Roche 454 GS FLX的过程基本相同,只是SOLiD的微珠更小,只有1μm。3'端修饰的微珠可以沉淀在玻片上。连接测序所用的底物是8个碱基荧光探针混合物,根据序列的位置,样品DNA就可以被探针标记。DNA连接酶优先连接和模板配对的探针,并引发该位点荧光信号的产生。测序反应完成后,可通过位置的颜色信息推断出相应的碱基序列。SOLiD的读长(read)只有50~75 bp,精确度可达Q40,适于基因组重测序和SNP检测。

1.4 Helicos BioSciences公司的单分子测序仪(Single Molecule Sequencer)测序原理

美国生命科学技术公司2010年开发的单分子测序技术号称第三代测序技术,它的技术原理是模拟DNA自然复制状态下的边合成边测序,其3'端磷酸键碱基荧光标记技术专利使得它可以超长读长。测序时,先将DNA打断成大片段(3~10 kb),然后把片段粘末端变成平端,两端分别连接环状单链:单链两端分别与双链正负链连接上,得到一个类似哑铃(“套马环”)的结构,称为SMRT Bell。当引物与模板的单链环部位退火后,这个双链部位就可以结合到已固定在ZWM底部的聚合酶上。一旦向反应中加入正常的离子,DNA聚合反应开始。模板双链打开成环形,先合成正链,单链区,跟着合成负链。聚合酶每合成一圈,对于定向目标序列,就相当于2×覆盖度。合成过程中,每次进入一个碱基,原始数据会实时地产生一个脉冲峰,每两个相邻的脉冲峰之间有一定的距离,也就是有一个时间段的概念。这种时间段的差距可以显著地区分碱基的修饰状态。因此,它也被称作实时的测序,一能提供测序结果,即碱基的排列组合,二是可以提供基因修饰的信息。

单分子测序平台很适合困难基因组的测序,比如GC含量很高、AT含量很高、多碱基串联重复(如CGG重复),普通测序技术很难获得结果。这个平台对这类很难测序的区域都能平稳的测序。单分子测序结果显示这种技术覆盖度不随GC含量变化而变化,曲线平稳。而且因为读长的优势,单核酸分子的测序能够检测到低频率(低至1%)罕见突变[10]。

1.5 不同测序技术平台的优点

这些技术平台各有优点。454 GS FLX的测序片段比较长,高质量的读长能达到400 bp;Solexa测序性价比最高,不仅机器的售价比454 GS FLX和SOLiD低,而且运行成本也低,在数据量相同的情况下,成本只有454测序的1/10;SOLiD测序的准确度高,原始碱基数据的准确度大于99.94%,而在15×覆盖率时的准确度可以达到99.999%,是目前下一代测序技术中准确度最高的;HeliScope单分子测序可以忽略模板的复杂性,实现碱基修饰的检测,为第三代测序拉开了篇章。

2 NGS技术在疾病临床诊断中的应用

NGS技术已经被广泛应用于多个领域,包括细菌和病毒基因组的测序[11,12],通过全基因组重测序或目标基因测序来寻找遗传性突变[13],通过基因表达变化来[14]理解遗传机制、细胞表型特征,RNA测序(RNA sequencing, RNA-seq)[15],染色体免疫共沉淀测序(ChIP-Seq)[16]等,这些应用均已被报道[17,18]。这里我们集中于综述在人类疾病临床诊断中最新的NGS技术。

2.1 肿瘤基因组测序

肿瘤的形成实际上是基因组改变的一种疾病。肿瘤的发生发展是个复杂的过程,DNA、RNA和表观修饰水平上肿瘤基因发生的改变在肿瘤的发生和发展中起着重要的作用[19]。大多数肿瘤患者都是经过正常体细胞突变长期积累形成单个癌细胞,然后经过多级加工,使基因序列、拷贝数等发生变化,最终导致肿瘤的形成。因此,所有遗传事件都可能间接或直接导致肿瘤的发展,这也修订了我们对人类肿瘤的理解,以及加速临床诊断新方法的发现。

对肿瘤进行全面、系统的分析,是实现肿瘤分子分型和个体化治疗的基础。个体化治疗体现在病人肿瘤基因组的特定突变[20,21]。因此,通过NGS获得特定的肿瘤相关基因序列信息是临床诊断的关键所在。另外,随着相关肿瘤分子诊断项目的推出,接下来努力的方向就是不断更新和寻找肿瘤基因以及肿瘤基因组的突变位点。在2003年HGP(Human genome project)未完成之前这个工作是受到限制的,缺少正常人类基因组的序列图谱、有限的分辨技术等等。随着人类基因组图谱绘制的完成,NGS带来的高通量的的测序数据,使得研究者可以更加深入的探讨肿瘤基因组学。

尽管对癌症基因组学的完整测序还比较昂贵,但是它的影响力是增加的[22,23]。在过去几年发现的人类肿瘤基因突变的基础上,用NGS去探索新的突变位点以及个体突变已经步入临床时代。例如,Pleasance等[23]通过对恶性黑色素瘤(Malignant Melanoma )的测序发现了33 345个碱基置换,680个缺失,303个插入,51个基因重排;Lee[22]通过原发性肺癌和正常癌旁组织的测序比较发现了50 000个SNP;Shah等[24]通过对乳腺癌测序与正常基因组做比较发现了32个同义编码突变,这些都为相关肿瘤的形成机制研究奠定了基础,同时研究人员首次报道了21种乳腺癌基因组测序结果,并从中分析癌症在发生发展过程中出现的突变,解析了乳腺癌通过突变发生发展的全过程[25,26]。这些前人的实验已经证实NGS在追踪DNA损伤、突变、修复等过程中显示出强大的能力,可以完成对整个基因组系统的分析,这些研究的发现将会改变我们对肿瘤的发生发展的认知,最终会成为肿瘤诊断、预后、治疗的基础。

2.2 外显子测序

所有基因的蛋白编码区称之为全部外显子,这些只占人类基因组的1%~2%,然而却涵盖了与个体表型相关的大部分功能项变异。外显子测序技术能够更快的确定致病基因及突变位点,有助于加速筛选发现单基因疾病、癌症等复杂疾病的致病基因和易感基因等[27]。基于普通人类疾病的研究基础,结合NGS和DNA片段捕获技术选择性的对蛋白编码区进行测序,采用数字基因表达谱的信息分析手段,不仅能降低成本而且便于更高效率的去发现新的突变位点。

外显子测序已经有了许多临床诊断实例,而且这种方法的临床诊断实用性已经被越来越多的研究证实。例如,美国耶鲁大学一个研究小组发现几种不同的大脑发育异常病症是由同一个单基因WDR62的突变引起。研究者利用一种新的基因扫描技术——全外显子组测序(whole exome sequencing)技术发现了该基因突变。该研究证实了全外显子组测序技术是筛查遗传病病因的一个强有力的新工具[28]。在黑色素瘤的研究中,Berger等[29]使用RNA-Seq技术鉴定肿瘤相关转录本,发现了11个异常的黑色素瘤基因和12个通读的转录本。Lo等[30]发现巴特尔综合征(Bartter syndrome)是由SCI12A3基因的错义突变造成的,经过鉴定,这可以作为一个诊断的基因标记。Chapman等[31]人使用全基因组和全外显子组测序的组合,利用Illumina的Genome Analyzer II测序仪比较38位多发性骨髓瘤患者和几位健康个体的基因组,他们通过外显子组测序研究了近165 000个外显子,分析了大约16 500个基因,还利用全基因组测序鉴定出蛋白编码区的转位。这种互补的方法既鉴定出单个核苷酸变异,又找到了横跨编码区和非编码区的大缺陷,发现了DIS3突变、FAM46C的突变、BRAF基因突变。这些都说明NGS可以鉴定出一些对疾病很关键的新基因,发现新机制。

2.3 血清/血浆DNA的测定

血液循环中存在的游离DNA,在疾病状态下,可作为一些疾病的诊断标志,例如糖尿病、癌症、心肌梗死等等[32],检测这些游离的DNA对这些疾病的早期诊断非常重要。在临床肿瘤学和产前诊断的研究领域,血循环的游离核酸鉴定也显得尤为重要。传统的克隆和DNA测序只发现了很少的一部分基因,以及对它进行染色体的定位。NGS的出现对于检测定量血循环中的核苷酸提供了一个方法。例如在最近的报告中[33,34],采用Illumina Genome Analyzer平台检测孕妇血浆DNA分子,结果显示,如果这个孕妇染色体发生了非整倍体的变化,那么21号染色体上的基因在母源的血浆中比较多。这是针对染色体异常产前诊断的一个很好的基础。尽管NGS在非入侵型产前诊断中的应用仍然存在很多问题和限制[35],但是我们相信在未来的岁月,NGS一定会在非入侵型产前诊断中体现它的价值。

2.4 RNA测序

采用芯片技术发现RNA的表达可以作为诊断和预后的生物标记物[36,37]。在相同的选择标准下,RNA-seq相比于芯片技术可以检测出更多的显著差异表达的基因。这可能由很多因素造成,例如RNA-seq和芯片技术在检测手段、序列长度、以及芯片归一的算法等等上的不同所致。NGS针对RNA/cDNA直接测序提供了一个转录本的高通量分析方法[17],RNA-Seq可以提供精确的检测数据[38],它相比于第一代测序和芯片技术,拥有更高的分辨率,提高了转录本的发现水平,更加清晰的明确了等位基因的差别表达,选择性的剪接机制等[39]。最新的研究结果显示RNA的调节和表达有更为复杂性的机制[40,41]。这些发现都扩展了我们原来的观点,认知到基因表达的复杂性[42],提高我们对于真核生物和原核生物基因组RNA调节及其机制的理解。

3 NGS在临床诊断应用中的挑战

3.1 NGS的数据处理

NGS技术与传统的Sanger测序相比较,尽管它的高通量减少了成本,但是读取准确性以及片段的长度都不及Sanger测序,这些不足都可以通过测序的覆盖率和生物信息学的方法来克服。但在分子诊断应用中,NGS仍必须认识到其存在的诸多局限性,包括克服处理大量信息的障碍,开发检查测序质量的工具,指导序列的拼装的标准,生物学上的解释和数据的引用参考等等。

NGS实验会产生海量的短片段的读长,称之为“Reads”,这些海量的“Reads”经过3个阶段的分析就可以用于诊断生物标记物。第一个阶段是这些海量的基本读长被各自测序系统所带的仪器自动化的基本质量应用程序进行淘汰过滤,然后按照重复序列进行拼接,组装成contig,经过筛选,合格的contig进入第二个阶段。这些过了关的contig进行基因组的组装,或者是从头开始的组装,或者是参考完整的基因组、转录本、外显子进行组装。最后一个阶段则根据这些组装好的序列去理解许多人类疾病潜在的遗传机制,分析的基本方法有CNV,SNP,新的转录本,剪接变异,探测基因的功能和转录因子,甲基化修饰和组蛋白修饰等。在这个阶段中应用到了相当数量的生物信息软件,然而这些分析并没有一个统一的流程,因为没有标准,这些NGS数据可能会由于通过不同的方法得到不同的结果,因此,在临床分子诊断中NGS必须面对这一问题。

3.2 个体基因的临床有效性

伴随着基因组测序成本的显著下滑,使得越来越多的个体基因组的测序成为可能,然而,立刻出现的问题是怎样有效地把整个基因组的庞大信息整合到临床有用的信息中,包括诊断和个体化治疗。一些来自斯坦福大学的研究员[43],以Helicos BioSciences单分子测序平台进行测序,整合了一位名叫Stephen R Quake的研究对象的完整的基因组。经过医学鉴定,Quake有血管疾病和猝死的家族遗传史。研究者查询了疾病特定的突变数据、药物基因组学数据,通过鉴定基因和突变对于已知的疾病和药物反应的关系,分析出了2 600 000个SNP,和752个拷贝数的变化,证明正是这些变化增加了梗死、II型糖尿病和一些癌症的风险,特别是TMEM43基因表现出了和临床心脏梗死的高相关性,以及CYP2C19基因存在的SNP可能和氯吡格雷的耐药性有关[44]。尽管许多不明确的重要的变异被发现出来,但是许多突变特点仍然保持着临床诊断的应用基础。Bainbridge等[45]通过SOLiD测序平台,对Alexis以及她的孪生兄弟Noah进行基因组测序从而确定引起这对患有多巴反应性肌张力障碍(Dopa-Responsive Dystonia)疾病的SPR突变,并帮助制定了有效的治疗策略。当关于疾病的特殊突变、药物基因组学变的越来越全面的时候,整个基因组的测序相比于传统的诊断方法就显得尤为重要。例如,Gerlinger等[46]通过全基因组测序研究依维莫司片(everolimus)对其中一位转移性膀胱癌的女性患者有效而其他患者无效的原因,发现了两个药物靶点,即细胞生长一种作用蛋白mTORC1途径中的基因突变:NF2和TSC1。这些研究开拓了我们对肿瘤药物研究的新方法。

3.3 NGS技术临床诊断的局限性及其发展方向

目前,NGS技术还存在着单碱基的误差,因为这个技术的测序来自于DNA片段,牵扯到测序文库的构建,边合成边测序以及短片段的拼接,可能会造成假阳性率的出现。因此,在没有传统诊断的支持下NGS技术获得的信息不能直接应用于分子诊断。但是NGS技术还没有发挥出全部的潜力,仍然处于快速发展的浪潮中。伴随着技术的不断改良,成本的进一步减少,技术的局限性也将会逐渐被攻克。或许在很多年之后NGS技术会变成一个通用的临床诊断技术。但是就目前来看,从NGS技术获得的信息毫无疑问扩展了我们对许多人类疾病的新的理解,引导研究者去开发新的临床诊断工具,以及发现针对某个疾病关键基因的靶向新型药物。

NGS显著的促进了多样性的研究领域,以前许多技术条件达不到的领域现在也能开展研究。新颖的领域表现在普通生物学、生命科学,以及医学上的应用。通过简单样品的准备就能够提供SNP的分辨,使得NGS技术在分子诊断中满足了敏感性高和特异性高的需求。经过早期的研究和发展,NGS技术在临床诊断中主要集中在基因组信息,相关基因定量以及高敏感性检测中。

相信在不久的将来,NGS技术将会和预料的一样进入一个较为广阔的应用范围,包括疾病病原学、药物基因组学、分子诊断、个性化用药以及营养学。基因分析是个体化医疗的前提,基因测序技术的发展在驱动着个体化医疗的进程。等到测序技术成本的进一步减少,数据的精确度进一步增加,以及以计算机为基础的数据获得、处理、确认、分析,生物/临床的相关解释的成熟化和应用化,NGS技术将会显现出无可比拟的优越性。

[1] Metzker M L. Sequencing technologies-the next generation[J]. Nat Rev Genet, 2010, 11(1): 31-46.

[2] Wheeler D A, Srinivasan M, Egholm M, et al. The complete genome of an individual by massively parallel DNA sequencing[J]. Nature, 2008, 452(7189): 872-876.

[3] Jacquier A. The complex eukaryotic transcriptome: unexpected pervasive transcription and novel small RNAs[J]. Nat Rev Genet, 2009, 10(12): 833-844.

[4] ten Bosch J R, Grody W W. Keeping up with the next generation: massively parallel sequencing in clinical diagnostics[J]. J Mol diagn, 2008, 10(6): 484-492.

[5] Walter M J, Graubert T A, DiPersio J F, et al. Next-generation sequencing of cancer genomes: back to the future[J]. Per Med, 2009, 6(6): 653-662.

[6] Aparicio S A, Huntsman D G. Does massively parallel DNA resequencing signify the end of histopathology as we know it[J]. J Pathol, 2010, 220(2): 307-315.

[7] Kingsmore S F, Saunders C J. Deep sequencing of patient genomes for disease diagnosis: when will it become routine[J]. Sci Transl Med, 2011, 3(87): 87ps23.

[8] Oostra B A, Willemsen R. FMR1: a gene with three faces[J]. Biochim Biophys Acta, 2009, 1790 (6): 467-477.

[9] Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from single polymerase molecules[J]. Science, 2009, 323(5910): 133-138.

[10] Smith C C, Wang Q, Chin C S, et al. Validation of ITD mutations in FLT3 as a therapeutic target in human acute myeloid leukaemia[J]. Nature, 2012, 485(7397): 260-263.

[11] Harris T D, Buzby P R, Babcock H, et al. Single-molecule DNA sequencing of a viral genome[J]. Science, 2008, 320(5872): 106-109.

[12] Chaisson M J, Pevzner P A. Short read fragment assembly of bacterial genomes[J]. Genome research, 2008, 18(2): 324-330.

[13] Yi X, Liang Y, Huerta-Sanchez E, et al. Sequencing of 50 human exomes reveals adaptation to high altitude[J]. Science, 2010, 329(5987): 75-78.

[14] Pickrell J K, Marioni J C, Pai A A, et al. Understanding mechanisms underlying human gene expression variation with RNA sequencing[J]. Nature, 2010, 464(7289): 768-772.

[15] Hiller D, Jiang H, Xu W, et al. Identifiability of isoform deconvolution from junction arrays and RNA-Seq[J]. Bioinformatics, 2009, 25(23): 3056-3059.

[16] Kharchenko P V, Tolstorukov M Y, Park P J. Design and analysis of ChIP-seq experiments for DNA-binding proteins[J]. Nat Biotechnol, 2008, 26(12): 1351-1359.

[17] Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics[J]. Nat Rev Genet, 2009, 10(1): 57-63.

[18] Park P J. ChIP-seq: advantages and challenges of a maturing technology[J]. Nat Rev Genet, 2009, 10(10): 669-680.

[19] Ledford H. Big science: the cancer genome challenge[J]. Nature, 2010, 464(7291): 972-974.

[20] Gambacorti-Passerini C. Part I: Milestones in personalised medicine-imatinib[J]. Lancet Oncol, 2008, 9(6): 600.

[21] Gelmon K. Part II: Milestones in personalised medicinetrastuzumab[J]. Lancet Oncol, 2008, 9(7): 698.

[22] Lee W, Jiang Z, Liu J, et al. The mutation spectrum revealed by paired genome sequences from a lung cancer patient[J]. Nature, 2010, 465(7297): 473-477.

[23] Pleasance E D, Cheetham R K, Stephens P J, et al. A comprehensive catalogue of somatic mutations from a human cancer genome[J]. Nature, 2010, 463(7278): 191-196.

[24] Shah S P, Morin R D, Khattra J, et al. Mutational evolution in a lobular breast tumour profiled at single nucleotide resolution[J]. Nature, 2009, 461(7265): 809-813.

[25] Nik-Zainal S, Van Loo P, Wedge D C, et al. The life history of 21 breast cancers[J]. Cell, 2012, 149(5): 994-1007.

[26] Nik-Zainal S, Alexandrov L B, Wedge D C, et al. Mutational processes molding the genomes of 21 breast cancers[J]. Cell, 2012, 149(5): 979-993.

[27] Choi M, Scholl U I, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J]. Proc Nat Acad Sci U S A, 2009, 106(45): 19096-19101.

[28] Bilgüvar K, Oztürk A K, Louvi A, et al. Whole-exome sequencing identi fi es recessive WDR62 mutations in severe brain malformations[J]. Nature, 2010, 467(7312): 207-210.

[29] Berger M F, Levin J Z, Vijayendran K, et al. Integrative analysis of the melanoma transcriptome[J]. Genome Res, 2010, 20(4): 413-427.

[30] Lo Y M, Chiu R W. Next-generation sequencing of plasma/ serum DNA: an emerging research and molecular diagnostic tool[J]. Clin Chem, 2009, 55(4): 607-608.

[31] Chapman M A, Lawrence M S, Keats J J, et al. Initial genome sequencing and analysis of multiple myeloma[J]. Nature, 2011, 471(7339): 467-472.

[32] Dennis Lo Y M, Chiu R W. Prenatal diagnosis: progress through plasma nucleic acids[J]. Nat Rev Genet, 2007, 8(1): 71-77.

[33] Chiu R W, Chan K C, Gao Y, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma[J]. Proc Natl Acad Sci U S A, 2008, 105(51): 20458-20463.

[34] Fan H C, Blumenfeld Y J, Chitkara U, et al. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood[J]. Proc Natl Acad Sci U S A, 2008, 105(42): 16266-16271.

[35] Voelkerding K V, Lyon E. Digital fetal aneuploidy diagnosis by next-generation sequencing[J]. Clin Chem, 2010, 56(3): 336-338.

[36] MAQC Consortium, Shi L, Reid L H, et al. The MicroArray Quality Control (MAQC) project shows inter-and intraplatform reproducibility of gene expression measurements[J]. Nat Biotechnol, 2006, 24(9): 1151-1161.

[37] Shi L, Campbell G, Jones W D, et al. The Microarray quality control (MAQC)-II study of common practices for the development and validation of microarray-based predictive models[J]. Nat Biotechnol, 2010, 28(8): 827-838.

[38] Li B, Ruotti V, Stewart R M, et al. RNA-Seq gene expression estimation with read mapping uncertainty[J]. Bioinformatics, 2010, 26(4): 493-500.

[39] Hittinger C T, Johnston M, Tossberg J T, et al. Leveraging skewed transcript abundance by RNA-Seq to increase the genomic depth of the tree of life[J]. Proc Natl Acad Sci U S A, 2010, 107(4): 1476-1481.

[40] Guttman M, Garber M, French C, et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals[J]. Nature, 2009, 458(7235): 223-227.

[41] Li J B, Levanon E Y, Yoon J K, et al. Genome-wide identification of human RNA editing sites by parallel DNA capturing and sequencing[J]. Science, 2009, 324(5931): 1210-1213.

[42] Licatalosi D D, Darnell R B. RNA processing and its regulation: global insights into biological networks[J]. Nat Rev Genet, 2010, 11(1): 75-87.

[43] Pushkarev D, Neff N F, Quake S R. Single-molecule sequencing of an individual human genome[J]. Nat Biotechnol, 2009, 27(9): 847-850.

[44] Ashley E A, Butte A J, Wheeler M T, et al. Clinical assessment incorporating a personal genome[J]. Lancet, 2010, 375(9725): 1525-1535.

[45] Bainbridge M N, Wiszniewski W, Murdock D R, et al. Whole-genome sequencing for optimized patient management[J]. Sci Transl Med, 2011, 3(87): 87re83.

[46] Gerlinger M, Rowan A J, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing[J]. N Engl J Med, 2012, 366(10): 883-892.

Application of next-generation sequencing technologies in molecular diagnostics

WEI Jun★, ZHAO Zhijun
(Laboratory Medicine Center, General Hospital of Ningxia Medical University, Ningxia, Yinchuan 750004)

DNA sequencing is a powerful approach for decoding human diseases, including cancers. The rapid development of next-generation sequencing (NGS) greatly reduce the cost of sequencing and realize the high-throughput, which allows us to obtain the whole genome sequence, and entire genome information about those patients who are clinically diagnosed. However, the bene fi ts offered by NGS technologies come with a number of challenges, which is how to make this technology become a conventional means in the clinical diagnosis. This article reviews the principle of a few technology platform, potential applications and the challenges of NGS in the clinical diagnosis.

Next-generation sequencing; Genomics; Molecular diagnostics

国家自然科学基金(30960176);教育部春晖计划(Z2008-1-75012);宁夏自然科学基金(NZ1245)

宁夏医科大学总医院医学实验中心,宁夏,银川 750004

★通讯作者:魏军,E-mial:lydiajunwei@hotmail.com

猜你喜欢

碱基基因组测序
牛参考基因组中发现被忽视基因
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
基因测序技术研究进展
生命“字母表”迎来4名新成员
基因捕获测序诊断血癌
单细胞测序技术研究进展
基因组DNA甲基化及组蛋白甲基化