基因诊断中测序技术的应用及优缺点
2014-05-10郭奕斌
郭奕斌
中山大学中山医学院医学遗传学教研室,广州 510080
准确、快速地获取生物体的遗传信息对生命科学研究具有十分重要的意义。对于基因病,基因诊断特别是测序技术被公认是确诊该类疾病最准确、最可靠的诊断技术和金标准,它可以在基因水平甚至在单个碱基发生改变的情况下作出明确诊断,还可以在全基因组水平查出任何碱基的改变。近十几年来,测序技术取得了前所未有的进步,在基础研究和临床检测中已日益显出广阔的应用前景。从测序技术的发展历程来看,它经历了从简单到复杂,从单一到全面和多功能,从时间长、成本高、通量低、手工操作到快速、廉价、高通量、自动化,从多细胞到单分子、用量多到用量少的过程。本文重点对第一~三代测序技术的原理、优缺点及其在基因诊断中的应用进行综述,并对基因诊断和测序技术的发展趋势进行了预测和展望。
1 测序技术的研究进展及优缺点
DNA测序技术是基因诊断技术发展史上具有里程碑、划时代的技术革命,被称为是基因诊断的金标准。从 1977年 Sanger发明链末端终止法测序(Sanger sequencing)[1]开始,至今已有 30多年,在基因病特别是单基因病的基因诊断和产前/植入前诊断中广为使用。直到2007年,Roche公司[2,3]、Illumina公司[4~6]、ABI公司[7,8]发明了高通量测序技术(High-throughput sequencing),即下一代测序技术(Next generation sequencing, NGS)[9],才步入一个新的测序时代。然而,测序技术的发展并非就此止步,更新的产品——以单分子实时测序和纳米孔技术为标志的第三代测序[10]也已登上历史舞台。
1.1 双脱氧链终止法测序:第一代测序技术
该技术始于 1977年 Sanger发明的双脱氧核苷酸末端终止法以及Maxam和Gilbert发明的化学裂解法[1,11]。在过去的30年里,因测序读长(read length)长、准确性高的优点,Sanger测序技术一直占据着统治地位。
1.1.1 原理
双脱氧链终止法是利用一种 DNA聚合酶来延伸结合在待测DNA模板上的引物,直到掺入1种链终止核苷酸(ddNTP)为止。每一次测序都由一套4个单独的反应构成,每个反应含有4种脱氧核苷三磷酸(dNTPs),并混入一定量的1种不同的双脱氧核苷三磷酸(ddNTP)。由于 ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在A、T、G或C处终止。终止点由反应中相应的ddNTP而定。每一种dNTPs和ddNTPs的相对浓度都可以调整,这样可得到一组长几百至上千碱基的链终止产物。这些产物具有共同的起始点,但终止点不同,通过变性凝胶电泳可分离出大小不同的片段。将凝胶处理后再用X光片同位素放射自显影或非同位素标记进行检测[1,12],或通过高分辨率毛细管电泳分离大小不同的片段并通过荧光标记识别片段末端碱基,从而获得所测片段的碱基序列[13]。该方法在20世纪70年代是用同位素标记,手工操作,产物是用聚丙烯酰胺凝胶电泳(PAGE)分离[1,11];80年代改用荧光标记,自动测序,产物用平板电泳分离[14,15];90年代再改用毛细管电泳技术及微阵列毛细管电泳技术,使得测序的通量大为提高[13]。
化学裂解法是先对DNA末端进行放射性标记,再使用特殊的化学试剂进行降解,这些化学试剂均能对1个或者2个碱基发生专一性断裂,最后通过PAGE、放射自显影技术读取待测的DNA片段。由于该方法程序复杂、操作繁琐,后来逐渐被 Sanger法取代。
1.1.2 优点
第一代测序技术可用于已知或未知突变的检测,与其他基因检测方法如 SSCP(Single strand conformation polymorphism)、DHPLC(Denaturing highperformance liquid chromatograph)、ASA(Allele-specific amplification)、HET(Heteroduplex analysis)、DGGE(Denaturing gradinent gel electrophoresis)、TGGE(Temperature gradient gel electrophoresis)、HRM(Highresolution melting curve analysis)等相比,DNA测序常被用作标准的鉴定方法以及最终确定突变的确切位点和突变性质的手段。检测的突变类型包括错义突变、无义突变、同义突变(含 SNP)、拼接突变、小缺失、小插入、大缺失、大插入、插入伴缺失、复杂重排、重复变异等,准确率近100%。该法特别适用于单基因病的基因诊断和产前诊断。
1.1.3 缺点
第一代测序技术只能在 PCR扩增后才能测序(直接测序或克隆测序),且只能逐段测序即只能分析单个的DNA片段,通量小,无法完成全基因组层面的分析。测序成本高(据估算,用该法完成人类基因组计划,需花 30亿美元),数据分析量大,自动化程度不高或需手工操作,一些PCR产物不能被分析而需制备单克隆。另外,该法速度慢,检测时间长(据估算,用该法完成人类全基因组的测序,至少需用时3年。而使用第二代SOLiD测序技术,测定一个人的基因组只需1周左右),对于需要快速检测的植入前遗传学诊断(Preimplantation genetic diagnosis,PGD)来说,该法不太合适,至少不能作为唯一的检测方法。因为即使是现在,也无法保证测序公司一定能在24 h内给出所测片段(哪怕是数百个碱基对)的结果。
第一代测序技术,不管是Sanger的双脱氧链终止法还是Maxam和Gilbert的化学裂解法,都需要放射性同位素标记,操作繁琐且不能自动化,故无法满足大规模测序的要求。另外,毛细管微阵列DNA测序在成本与耗时方面也远远满足不了基因组学发展的需要[16,17]。
1.1.4 应用
第一代测序技术的应用非常广泛,在基因病特别是单基因病现症病人和携带者的基因诊断、高危胎儿的产前基因诊断乃至胚胎植入前基因诊断方面都是不可或缺的诊断手段,从发明至今,虽已过去30多年,但仍一直作为基因诊断的金标准。其临床应用实例不胜枚举,包括:G6PD缺乏症、地中海贫血、异常血红蛋白病、血友病等遗传性血液病,黏多糖贮积症各种类型、糖原贮积症Ⅱ型,黏脂质贮积症、神经鞘脂贮积症等溶酶体贮积症,白化病、苯酮尿症、半乳糖血症、自毁容貌综合征等遗传性酶病,成骨不全各种类型、软骨发育不全、致死性侏儒症、假性软骨发育不全、多发性骨骺发育不良、迟发性脊椎骨骺发育不良、先天性脊柱骨骺发育不良、低血磷抗维生素D佝偻病等遗传性骨病,等等。
1.2 高通量测序:第二代测序技术
基因诊断的快速发展,客观上需要对大规模基因组进行更加精细的研究,这就要求深度测序以及重复测序,而通量低、成本高、检测耗时的第一代测序技术显然不能满足这种要求。因此以高通量、低成本、自动化程度高为显著特征的第二代测序技术诞生了,它能在很短的时间内完成对上百亿个碱基对的测序,一次可对几十万到几百万条DNA分子进行序列测定,满足极短时间内对基因组进行高分辨率检测的要求[7,9,18]。高通量测序技术是对传统测序技术的一次革命性的改变,被称为NGS(Next generation sequencing),足见其划时代的进步和意义。该技术提供了一种与基因芯片技术互为补充的新的高通量工具,能对一个物种的基因组和转录组的全貌进行全面细致的分析,故又被称为深度测序(Deep sequencing)。根据发展史、影响力、测序原理和技术的不同,可分为:大规模平行签名测序(Massively parallel signature sequencing, MPSS)、聚合酶克隆测序(Polony sequencing)、454焦磷酸测序(Pyrosequencing, Roche/454)、合成测序(Sequencing-by-synthesis, SBS, Illumina/Solexa)、连接测序(Sequencing-by-ligation, ABI/SOLiD)、离子半导体测序(Ion semiconductor sequencing)、DNA纳米球测序(DNA nanoball sequencing)、基因组扩增转录同步测序(Genomic amplification with transcript sequencing, GAWTS)等[7,8,12,19]。其中,Roche公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLiD技术是第二代测序技术的代表[9]。它们都有一个共同之处:均使用反应信号的实时阅读,在测序反应进行的同时,收集反应信号,因此测序成本大幅度降低。下文以Illumina Genome AnalyzerIIx为代表介绍NGS的测序原理。
1.2.1 原理
Illumina Genome AnalyzerIIx是一种基于单分子簇(Cluster)的边合成边测序技术,是基于专有的可逆终止化学反应的原理。测序时将基因组DNA的随机片段附着到光学透明的玻璃表面(即流动槽Flow cell),这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成数以亿计的Cluster,每个Cluster是具有数千份相同模板的单分子簇。然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的边合成边测序(SBS)技术对待测的模板DNA进行测序[18,20]。
1.2.2 优点
NGS具有高通量、高准确性、高灵敏度、自动化程度高和低运行成本等突出优势,可以同时完成传统基因组学(测序和注释)和功能基因组学(基因表达及调控、基因功能、蛋白/核酸相互作用)的研究[18,20]。对还没有参考序列的物种进行从头测序,可获得该物种的参考序列[21];对有参考序列的物种,进行全基因组重测序(Resequencing),可在全基因组水平上检出突变位点,从而发现个体的分子差异[22]。该技术适用于未知物种、未知基因的检测。通过全转录组测序(Whole transcriptome resequencing, WTR),可开展可变剪接、编码序列单核苷酸多态性(cSNP)的研究,或者进行小分子RNA测序,从而发现新的microRNA分子[23,24]。与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,可检出与特定转录因子结合的 DNA区域和基因组上的甲基化位点[25,26]。
NGS技术极大地促进了胎儿游离 DNA(Cell free fetal DNA, cffDNA)的实验室研究,促进了无创性产前基因诊断的发展[27]。目前基于 NGS平台,建立胎儿21、18、13三体综合征的产前基因诊断技术已应用于临床,其他如性染色体非整倍体、双胎妊娠染色体非整倍体、胎儿染色体结构异常疾病、孟德尔单基因病以及妊娠相关疾病的研究也因NGS的出现获得了显著的进步[28,29]。
1.2.3 缺点
相对而言,工作量仍较大,费用仍较高,不适合用于序列已知的单基因病的突变检测。该技术仍需要PCR扩增环节,相对于第三代测序技术来说,通量还不够高,读长还比较短,时间还不够快,所需模板用量还比较多,故无法在单细胞、单分子水平进行检测。
值得一提的是,第二代测序结合微阵列技术已衍生出目标序列捕获测序技术(Targeted resequencing)[30]。这项技术首先利用微阵列技术合成大量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用NGS 对这些区段进行测序。目前应用最多的是人外显子组捕获测序[31]。外显子组测序比全基因组重测序更有优势,因为它不仅费用较低,数据分析计算量较小,而且与生物学表型结合更为直接。外显子组测序也称全外显子测序(Whole-exome sequencing,WES)[19],是利用序列捕获技术将全基因组外显子区域的 DNA捕捉并富集后进行高通量测序的基因组分析方法,是一种选择基因组编码序列的高效方法。其实验流程是:基因组DNA的制备及检测→构建片段文库→目标片段的富集→富集文库的扩增→文库质量的检测→高通量测序。
1.2.4 应用
第二代测序技术近年来发展很快,应用也日益广泛,其应用范围包括:(1) 基因组学(全基因组De novo测序、全基因组重测序、外显子和目标区域捕获测序);(2) 转录组学(转录组测序、数字基因表达谱测序、小RNA测序、降解组测序);(3) 表观组学(甲基化测序、RRBS测序、MeDIP测序、ChIP测序[32])。
目前,高通量测序主要应用于寻找疾病的候选基因,可用于单基因病、复杂疾病(如糖尿病、肥胖症等)甚至是癌症的致病基因或易感基因的寻找。对于疑难病症,在第一代测序技术仍检测不出的情况下,可考虑采用NGS。
Schinzel-Giedion综合征是一种导致严重智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。内梅亨大学的研究人员使用Agilent SureSelect序列捕获和SOLiD技术对4位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7~3 GB可作图的序列数据。他们将目光聚中于每位患者都携带有变异体的12个基因上,最终将候选基因缩减至 1个,并鉴定出 Schinzel-Giedion 综合征中的致病突变[18,33,34]。贝勒医学院基因组测序中心也计划对 Science杂志报道的十大科学突破的 15种疾病包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传病进行研究,以便更好地理解致病突变以及突变对疾病的影响[18,35]。
1.3 单分子DNA测序:第三代测序技术
第三代测序技术是指在单个细胞、单分子水平上对基因组进行测序的一项新技术。2007年以来,NGS平台已经大规模普及。同时,人类单倍型计划、千人基因组计划、癌症基因组计划、Meta-Hit计划等重大国际合作项目也将基因组研究日益推向高潮。然而迄今为止,使用的测序材料无一例外都是大量细胞混合的DNA样本。在微生物生态学、癌症基因组、法医学、微量诊断、遗传印记等研究中,这样的材料显然无法满足要求,而以单分子实时测序和纳米孔技术为标志的第三代测序[36~42]则为解决上述难题打开了崭新的大门。不同于NGS依赖于DNA模板PCR扩增,使 DNA模板与固体表面相结合然后边合成边测序的方法,第三代测序为单分子测序,不需要进行PCR扩增。主要包括:Helico Bioscience单分子测序技术[36,43~45];Pacific Bioscience单分子实时(Single molecule real time, SMRT)测序技术[46,47]和 Oxford Nanopore纳米孔单分子测序技术[10,37,40~42,48]3种。其中,Nanopore技术是一种很有发展潜力的无标记测序方法。第三代测序的流程如图1所示。
1.3.1 原理
Helico Bioscience单分子测序和 Pacific Bioscience的SMRT测序技术的原理:脱氧核苷酸用荧光标记,显微镜实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA链的时候,它的荧光就能同时在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被 DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样[51]。
Oxford Nanopore纳米孔单分子测序的原理:用α-溶血素构建生物纳米孔,让核酸外切酶附着在碱基将落入的孔的一侧的外表面,而让一种合成的环糊精作为传感器共价结合到纳米孔的内表面,将这个系统镶嵌在一个脂质双分子层内。为了提供既符合不同碱基检测又满足外切酶活性的物理条件,需事先将脂质双分子层两侧调为不同的盐浓度。在适合的电压下,核酸外切酶消化单链DNA,单个碱基落入孔中,并与孔内的环糊精短暂作用,从而影响流过纳米孔的原本的电流。腺嘌呤(A)与胸腺嘧啶(T)的电信号大小很接近,但T在环糊精停留的时间是其他核苷酸的 2~3倍,鸟嘌呤(G)和胞嘧啶(C)各自停留的时间也不同,所以每个碱基都因有特有的电流干扰振幅而被区分开来。另外,由于甲基化的 C在环糊精的停留时间约为正常C停留时间的两倍,所以通过纳米孔检测还可以直接读取甲基化的 C。纳米孔单分子测序的精确率可达99.9999%,而且被检测过的碱基能很快地从纳米孔清除而不会出现重复测序[52]。
1.3.2 优点
第三代测序技术具有诸多优点,具体表现在:
(1) 该技术实现了DNA聚合酶内在自身的反应速度,一秒可测10个碱基,测序速度是化学测序法的2万倍[18,51];
(2) 它实现了DNA聚合酶内在自身的延续性,一个反应就可以测非常长的序列。NGS可以测上百个碱基,而该技术可以测几千个碱基。精度非常高,可达99.9999%[18,51];
(3) 可以直接测 RNA的序列。RNA的直接测序,将大大降低体外逆转录产生的系统误差[18,51];
图1 单细胞测序流程[49,50]
(4) 直接测甲基化的 DNA序列。DNA聚合酶复制A、T、C、G的速度是不一样的,用正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间也是不同的。根据这个时间差,即可判断模板的C是否甲基化[51];
(5) 结合外显子捕获测序技术,可获得大量重要变异,节省项目成本;
(6) 可挖掘DNA突变的来源和频率,结果验证率高;
(7) 能分析癌细胞的发生、发展和演化过程;
(8) 能将正常细胞与癌细胞在遗传变异水平上区分开来;
(9) 对于基因组测序来说,由于具有读长长的特点,SMRT测序平台在基因组测序中能降低测序后Contig(片段重叠群)的数量,明显减少后续基因组拼接和注释的工作量,可节省大量的时间,比起NGS能更快获得结果。因此在鉴定细菌和新的病原体的基因组测序方面得到广泛的应用;
(10) 用于病理性突变鉴定或SNP检测时,单分子测序的分辨率具有不可比拟的优势,而且不用PCR扩增步骤,也就不会有扩增引入的碱基错误。该优势使其在特定序列的SNP检测,稀有突变及其频率测定中大显身手。在产前诊断特别是胚胎植入前诊断方面具有独到的优势;
(11) 基因组测序适用的细胞类型多,除了不同组织不同分化程度的人和小鼠细胞,如肿瘤细胞、干细胞、循环肿瘤细胞、单生殖细胞、胚胎发育细胞等,还可以对高度分化的细胞(神经、表皮等)进行单细胞测序分析。
总之,第三代测序技术的优点主要表现在:测序通量更高;测序成本更低;读取长度更长;测序时间更短;所需起始用量更少;检测精确性更高,即使变异极少也能检出[52,53]。
1.3.3 不足
第三代测序技术适用于起始用量少、需要高通量、自动化程度很高的全基因组测序,因此对于要求不高的单个基因位点的检测如单基因病等的基因诊断反而不适用,即性价比反而降低。此外,第三代测序技术虽然已经足够先进,但仍需要用到酶(聚合酶或核酸外切酶),而如何保持酶的活性与稳定性仍是一个重要的问题;Helico Bioscience的 TSMS技术和Pacific Bioscience的SMRT技术都需要荧光标记,怎样提高单分子信号灵敏度同时又不能把信号变成噪音增加荧光背景也是一个需要解决的问题;Oxford Nanopore技术虽无需标记,但仍需要致力于背景噪音的减少和 DNA移动速度的控制。另外,在DNA的固定方面如何保持DNA的延展性而不出现二聚体结构,也是有待解决和完善的地方。
1.3.4 应用
第三代测序技术由于具有测序通量更高,测序成本更低,读取长度更长,测序时间更短,所需起始用量更少,检测精确性更高,仪器和试剂相对便宜,操作相对简单,并能准确定量一个单细胞核中的基因拷贝数目等诸多优势,因而比NGS具有更广阔的应用空间。目前主要应用在:单细胞水平上变异信息的寻找、胚胎植入前的遗传学诊断、单细胞水平上组织和细胞群异质性的研究、肿瘤亚克隆演化的分析等方面[54,55]。其应用范围归纳起来包括:
(1) 基因组测序:相对NGS的优势就是能更快获得结果,因此该系统在鉴定新的病原体和细菌的基因组测序方面得到广泛的应用;
(2) 甲基化研究:5 mC和5 hmC是甲基化研究中的热点。但第一、第二代测序技术无法区分5 mC和5 hmC。美国芝加哥大学利用第三代测序技术和5 hmC选择性化学标记方法来检测5 hmC,通过聚合酶动力学提供的信息,可直接检测DNA甲基化,为表观遗传学研究打开了一条通路[56];
(3) 突变鉴定(SNP检测):单分子测序的分辨率具有不可比拟的优势,而且没有PCR扩增步骤,也就没有扩增引入的碱基错误,该优势使其在特定序列的SNP检测,稀有突变及其频率测定中大显身手。研究人员用单分子测序技术重新证明了 FLT3基因是急性髓细胞白血病(AML)的有效治疗靶标,就是凭借PacBio平均3000 bp读长能获得更多基因下游的宝贵信息,且能够检测低至1%频率的罕见突变的技术优势[57];
(4) RNA测序:根据第三代测序技术实时测序的特点,可以直接对RNA进行测序,做到对特定组织和细胞内的表达差异的精确定位。而且还能检测到微量的基因表达子或罕见的非编码RNA[58];
(5) 重复序列和 poly结构的测序:第一代和第二代测序技术对多达数百次的重复序列的测序都是无能为力或难以完成的,而用第三代测序技术则能很好胜任。如美国UC Davis医学院利用PacBio技术环形比对测序模式,对FMR1中的CGG三核苷酸重复区域进行测序,获得了超过10 kb的原始读长,即使是重复次数超过 750次的三核苷酸重复区域也能测出[59];
(6) 医学领域的应用:单分子测序技术由于能在短时间内完成人体近30亿个碱基对的测序,加上测序费用明显降低,故有望建立个人基因组信息档案,这就意味着个体的生命信息将一目了然,今后的医疗将能以个人的基因组信息作为诊断、预防和治疗的手段[60],由此可见该技术将对个体医学的发展产生巨大的影响。如加拿大某癌症研究所通过PacBio RS系统进行临床样本癌基因及癌症治疗敏感/抗性相关遗传标记的测定,已有效制定针对该病人的治疗方案[61];
(7) 其他方面的应用:读长长的优势可用来填补测序数据拼接中Scaffolds之间的缺口;由于测序时对GC没有偏好性,故可用于高 GC含量区域的测序,还能用于发夹结构、茎环结构等复杂二级结构的测序[56,62]。
在临床诊治特别是在癌症研究方面,第三代测序技术近来年日益发挥着引领的作用,中国深圳华大基因研究院的研究人员做出了许多有目共睹的贡献。例如:2012年,该院联合国内数所大学和医院的研究人员对一例典型的、JAK2阴性的ET(原发性血小板增多症,一种血癌)病人的 90个单细胞进行了全外显子测序,将其中符合质控的58个样品用于群体分析,发现该ET病人为单克隆进化,并发现了几个关键的 ET候选基因(SESN2和NTRK1等)可能参与 ET的发生、发展[63]。这一前沿研究为其他癌症的研究奠定了良好的基础,并可能因此而改变癌症的治疗策略。
肾透明细胞癌(ccRCC)是肾癌中最常见的一种,在不同癌症病人中很难找到共同突变。为了更好地理解ccRCC肿瘤内部的基因组变化情况,华大基因研究院等数家单位的研究人员从ccRCC样本中选取20个癌细胞和5个癌旁细胞进行单细胞测序。通过聚类分析和进化分析,发现该例样本为单克隆且此例肾癌并非由常见的两个突变基因VHL和PBRM1所引起,说明所鉴定的频发突变(Recurrent mutation)可能与肿瘤个体无关。研究人员还对260个体细胞突变的位点进行主成分分析(PCA),从中又发现细胞RC15、RC17和RC20与癌旁组织聚集紧密,表明这些细胞应为正常细胞而非肿瘤细胞,可见在癌症分析和诊断过程中进行个性化治疗不但重要而且很有必要[64]。2014年,华大基因研究院又联合香港中文大学、北京大学肿瘤医院/研究所对一例 T3N0M0结肠癌病人的63个肿瘤单细胞、4个正常单细胞样本进行外显子组测序。通过单细胞群体遗传学分析,发现肿瘤细胞群存在着两个克隆群体,且不同克隆具有不同的突变特征[65]。这些成果足以说明第三代测序技术在癌症诊治等方面都具有不可比拟的优势。
综上所述,第一~三代测序技术特点的比较见表1。
2 基因诊断和测序技术的未来展望
随着医学技术的不断发展,随着科研人员对疾病发生发展的分子生物学机制研究的不断深入,以及人类单倍型计划、千人基因组计划、癌症基因组计划、Meta-Hit计划等重大国际合作项目的顺利实施和相继完成,人们越来越明了基因的突变/变异与疾病的发生发展的内在关系。因此,如何发展和利用基因检测技术寻找致病基因、解码个体基因、评估患病风险、改进医疗模式,进而对个体进行基因诊断乃至基因治疗将是未来遗传病防治工作的发展趋势。凭借人体基因密码预测相关疾病的风险性和发展进程,做到早检测、早预防、早治疗,基因诊断技术在临床的应用将有更加广阔的前景。展望未来,我们可以预见:
(1) 染色体水平与基因水平的检测将结合得更加紧密,如染色体核型分析(G显带等)→光谱核型分析技术(SKY)→荧光原位杂交(FISH)→多色荧光原位杂交(M-FISH)→微阵列-比较基因组杂交技术(Array-CGH)→高精密的基因芯片→单基因的突变检测和序列分析技术,等等;致病性突变与多态性变异将能快速检出;遗传标记将揭示得更多、更全面;群体筛查的项目将日益增多。
(2) 每个人一生的生老病死有望在胚胎早期就被解读、破译,疾病的预防有望得到更早期、更有效的控制。遗传病、肿瘤的防患可提前到婚检阶段;优生、优育将更好的结合;人类寿命、生活质量有望得到进一步延长和提高;无创性产检将相当普及,PGD也将进入到一个更普及的阶段,从而从根源上解决优生的问题;
表1 三代测序技术特点的比较[52,66,67]
(3) 随着仪器成本的降低、小型化,试剂、试剂盒的大量研发,个体化、自主化检测程度将更加提高;送检样品将更微量,一口唾液、一根毛发、一滴血等都能得到有效的检测;随着基因组学、转录组学、蛋白组学、代谢组学研究成果的不断涌现,取样将变得更简单、更多样,尿液、汗液、唾液有望取代外周血用于分子诊断,可减轻患者抽血时的恐惧感;罕见病的诊、防、治有望达到与常见病相同或相近的水平;基因检测在疗效评价和用药指导方面,在个体识别、亲子鉴定、法医物证检验等方面将发挥更加举足轻重的作用;基因治疗方面将找到更多新的治疗靶点,从而促进基因治疗的迅猛发展。
(4) 测序技术从广度、深度、速度、性价比、安全性、实用性、普及性等方面都将得到进一步发展。从广度、深度来讲,未来测序技术有可能达到超高通量的水平,可进行个体间的快速鉴别诊断甚至物种间的快速鉴定。从速度来讲,未来测序技术所需的检测时间将更短、达到超高速水平,比现在快出几个数量级;成本将大大降低,性价比将大幅提升,到时测一个全基因组的价格也许有可能跟现在测一个基因的价格差不多;准确性、安全性将明显提高,误诊、漏诊率将大大降低。未来的测序设备将更加小型化、微型化,就像电脑从立式到台式到笔记本再到掌上电脑一样,携带将更加方便,而功能将更加强大。所需的样品将更少,种类将更多;高通量、自动化、低成本获得更大发展;在可预见的将来有望诞生第四代甚至第五代测序技术,届时目前三代测序技术所存在的缺点和不足如依赖酶的活性、单分子信号灵敏度不够高,背景噪音大、DNA移动速度慢、DNA延展性不够好等问题都将得到很好的解决。
[1]Sanger F, Nicklen S, Coulson AR.DNA sequencing with chain-terminating inhibitors.Proc Natl Acad Sci USA,1977, 74(12): 5463–5467.
[2]Margulies M, Egholm M, Altman WE, Attiya S, Bader JS,Bemben LA, Berka J, Braverman MS, Chen YJ, Chen ZT,Dewell SB, Du L, Fierro JM, Gomes XV, Godwin BC, He W, Helgesen S, Ho CH, Irzyk GP, Jando SC, Alenquer MLI, Jarvie TP, Jirage KB, Kim JB, Knight JR, Lanza JR,Leamon JH, Lefkowitz SM, Lei M, Li J, Lohman KL, Lu H, Makhijani VB, McDade KE, McKenna MP, Myers EW,Nickerson E, Nobile JR, Plant R, Puc BP, Ronan MT,Roth GT, Sarkis GJ, Simons JF, Simpson JW, Srinivasan M, Tartaro KR, Tomasz A, Vogt KA, Volkmer GA, Wang SH, Wang Y, Weiner MP, Yu PG, Begley RF, Rothberg JM.Genome sequencing in microfabricated high-density picolitre reactors.Nature, 2005, 437(7057): 376–380.
[3]http://www.454.com
[4]Fedurco M, Romieu A, Williams S, Lawrence I, Turcatti G.BTA, a novel reagent for DNA attachment on glass and efficient generation of solid-phase amplified DNA colonies.Nucleic Acids Res, 2006, 34(3): e22.
[5]Turcatti G, Romieu A, Fedurco M, Tairi AP.A new class of cleavable fluorescent nucleotides: synthesis and optimization as reversible terminators for DNA sequencing by synthesis.Nucleic Acids Res, 2008, 36(4): e25.
[6]http://www.solexa.com
[7]Shendure J, Porreca GJ, Reppas NB, Lin XX, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang K, Mitra RD,Church GM.Accurate multiplex polony sequencing of an evolved bacterial genome.Science, 2005, 309(5741):1728–1732.
[8]http://www.appliedbiosystems.com.cn/
[9]Shendure J, Ji H.Next-generation DNA sequencing.Nat Biotechnol, 2008, 26(10): 1135–1145.
[10]Clarke J, Wu HC, Jayasinghe L, Patel A, Reid S, Bayley H.Continuous base identification for single-molecule nanopore DNA sequencing.Nat Nanotechnol, 2009, 4(4):265–270.
[11]Maxam AM, Gilbert W.A new method for sequencing DNA.Proc Natl Acad Sci USA, 1977, 74(2): 560–564.
[12]DNA测序技术 (http://wenku.baidu.com/view/039b7ad628-ea81c758f57826.html), 2012.
[13]Huang XC, Quesada MA, Mathies RA.DNA sequencing using capillary array electrophoresis.Anal Chem, 1992,64(18): 2149–2154.
[14]聂志扬, 肖飞, 郭健.DNA 测序技术与仪器的发展.中国医疗器械信息, 2009, 15(10): 13–16.
[15]Simith LM, Fung S, Hunkapiller MW, Hunkapiller TJ, Hood LE.The synthesis of oligonucleotides containing an aliphatic amino group at the 5’ terminus: synthesis of fluorescent DNA primers for use in DNA sequence analysis.Nucleic Acids Res, 1985, 13(7): 2399–2412.
[16]陆祖宏, 吕华, 肖鹏峰, 白云飞.快速低成本全基因组DNA测序技术.中国生物医学工程学报, 2008, 27(2):182–186.
[17]刘朋虎, 林冬梅, 林占熺, 李晶.DNA 测序技术及其应用研究进展.福建农业学报, 2012, 27(10): 1130–1133.
[18]高通量测序(http://baike.so.com/doc/292278.html)
[19]Stoflet ES, Koeberl DD, Sarkar G, Sommer SS.Genomic amplification with transcript sequencing.Science, 1988,239(4839): 491–494.
[20]赵爽.土壤病原真菌的检测及土壤中真菌群落多样性的研究[学位论文].南京: 南京农业大学, 2012.
[21]Rastogi S, Meena S, Bhattacharya A, Ghosh S, Shukla RK,Sangwan NS, Lal RK, Gupta MM, Lavania UC, Gupta V,Nagegowda DA, Shasany AK.De novo sequencing and comparative analysis of holy and sweet basil transcriptomes.BMC Genomics, 2014, 15(1): 588.
[22]Moxon ER.Whole genome sequencing of pathogens: a new era in microbiology.Trends Microbiol, 1995, 3(9):335–337.
[23]王曦, 汪小我, 王立坤, 冯智星, 张学工.新一代高通量 RNA测序数据的处理与分析.生物化学与生物物理进展, 2010, 37(8): 834–846.
[24]杨晓玲, 施苏华, 唐恬.新一代测序技术的发展及应用前景.生物技术通报, 2010, (10): 76–81.
[25]Ouyang ZQ, Zhou Q, Wong WH.ChIP-Seq of transcription factors predicts absolute and differential gene expression in embryonic stem cells.Proc Natl Acad Sci USA,2009, 106(51): 21521–21526.
[26]Taylor KH, Kramer RS, Davis JW, Guo JY, Duff DJ, Xu D,Caldwell CW, Shi HD.Ultradeep bisulfite sequencing analysis of DNA methylation patterns in multiple gene promoters by 454 sequencing.Cancer Res, 2007, 67(18):8511–8518.
[27]丁辰月, 吴畏, 刘嘉茵.测序技术在无创产前筛查中的应用及进展.国际生殖健康/计划生育杂志, 2014, 33(3):201–204.
[28]Nepomnyashchaya YN, Artemov AV, Roumiantsev SA,Roumyantsev AG, Zhavoronkov A.Non-invasive prenatal diagnostics of aneuploidy using next-generation DNA sequencing technologies, and clinical considerations.Clin Chem Lab Med, 2013, 51(6): 1141–1154.
[29]Hahn S, Lapaire O, Tercanli S, Kolla V, Hösli I.Determination of fetal chromosome aberrations from fetal DNA in maternal blood: has the challenge finally been met? Expert Rev Mol Med, 2011, 13: e16.
[30]Horswell SD, Ringham HE, Shoulders CC.New technologies for delineating and characterizing the lipid exome:prospects for understanding familial combined hyperlipidemia.J Lipid Res, 2009, 50(Suppl): S370–S375.
[31]Duyk GM, Kim SW, Myers RM, Cox DR.Exon trapping:a genetic screen to identify candidate transcribed sequences in cloned mammalian genomic DNA.Proc Natl Acad Sci USA, 1990, 87(22): 8995–8999.
[32]Illumina高通量测序平台(http://www.genomics.cn/navigation/show_navigation?nid=500&tab=2346)
[33]Brunner HG.De novo mutations in dysmorphic syndromes.Curr Opin Biotechnol, 2011, 22(1): S22.
[34]Ku CS, Polychronakos C, Tan EK, Naidoo N, Pawitan Y,Roukos DH, Mort M, Cooper DN.A new paradigm emerges from the study of de novo mutations in the context of neurodevelopmental disease.Mol Psychiatry, 2013,18(2): 141–153.
[35]Parsons DW, Jones S, Zhang XS, Lin JCH, Leary RJ, Angenendt P, Mankoo P, Carter H, Siu IM, Gallia GL, Olivi A, McLendon R, Rasheed BA, Keir S, Nikolskaya T, Nikolsky Y, Busam DA, Tekleab H, Diaz LA Jr, Hartigan J,Smith DR, Strausberg RL, Marie SKN, Shinjo SMO, Yan H, Riggins GJ, Bigner DD, Karchin R, Papadopoulos N,Parmigiani G, Vogelstein B, Velculescu VE, Kinzler KW.An integrated genomic analysis of human glioblastoma Multiforme.Science, 2008, 321(5897): 1807–1812.
[36]Steinmann KE, Hart CE, Thompson JF, Milos PM.Helicos single-molecule sequencing of bacterial genomes.Methods Mol Biol, 2011, 733: 3–24.
[37]Maitra RD, Kim J, Dunbar WB.Recent advances in nanopore sequencing.Electrophoresis, 2012, 33(23): 3418–3428.
[38]杨冬燕, 杨永存, 李浩, 邓平建.新型测序技术分析与展望.卫生研究, 2013, 42(6): 1060–1062.
[39]Yourstone SM, Lundberg DS, Dangl JL, Jones CD.MTToolbox: improved amplicon sequencing using molecule tags.BMC Bioinformatics, 2014, 15(1): 284.
[40]Ying YL, Cao C, Long YT.Single molecule analysis by biological nanopore sensors.Analyst, 2014, 139(16): 3826–3835.
[41]Laszlo AH, Derrington IM, Ross BC, Brinkerhoff H, Adey A, Nova IC, Craig JM, Langford KW, Samson JM, Daza R,Doering K, Shendure J, Gundlach JH.Decoding long nanopore sequencing reads of natural DNA.Nat Biotechnol,2014, 32(8): 829–833.
[42]Gu Z, Ying YL, Yan BY, Wang HF, He PG, Long YT.Exponentially modified Gaussian relevance to the distributions of translocation events in nanopore-based single molecule detection.Chin Chem Lett, 2014, 25(7): 1029–1032.
[43]Braslavsky I, Hebert B, Kartalov E, Quake SR.Sequence information can be obtained from single DNA molecules.Proc Natl Acad Sci USA, 2003, 100(7): 3960–3964.
[44]Harris TD, Buzby PR, Babcock H, Beer E, Bowers J,Braslavsky I, Causey M, Colonell J, DiMeo J, Efcavitch JW, Giladi E, Gill J, Healy J, Jarosz M, Lapen D, Moulton K, Quake SR, Steinmann K, Thayer E, Tyurina A, Ward R,Weiss H, Xie Z.Single-molecule DNA sequencing of a viral genome.Science, 2008, 320(5872): 106–109.
[45]http://www.helicosbio.com
[46]Turner S.Harnessing nature's powerful DNA sequencing engine: single molecule real time sequencing-by- synthesis in Advances in Genome Biology and Technology meeting.Marco Island, FL, 2008.
[47]http://www.pacificbiosciences.com
[48]Rusk N.Cheap third-generation sequencing.Nature Methods, 2009, 6(4): 244.
[49]单细胞测序(http://meeting.dxy.cn/478/article/471/5524/5525/13237.html).
[50]单细胞测序(http://www.novogene.com/index.php?a=show&c=index&catid=33&id=21&m=content).
[51]第三代测序技术简介(http://blog.sciencenet.cn/home.php?mod=space&uid=320403&do=blog&id=273211).
[52]李明爽, 赵敏.第三代测序基本原理.现代生物医学进展, 2012, 12(10): 1980–1982, 1948.
[53]Wei N, Bemmels JB, Dick CW.The effects of read length,quality and quantity on microsatellite discovery and primer development: from Illumina to PacBio.Mol Ecol Resour, 2014, 14(5): 953–965.
[54]第三代测序技术(http://baike.so.com/doc/7001202.html#7001202-7224084-6).
[55]Wang Y, Waters J, Leung ML, Unruh A, Roh W, Shi XQ,Chen K, Scheet P, Vattathil S, Liang H, Multani A, Zhang H, Zhao R, Michor F, Meric-Bernstam F, Navin NE.Clonal evolution in breast cancer revealed by single nucleus genome sequencing.Nature, 2014, 512(7513): 155–160.
[56]张得芳, 马秋月, 尹佟明, 夏涛.第三代测序技术及其应用.中国生物工程杂志, 2013, 33(5): 125–131.
[57]Smith CC, Wang Q, Chin CS, Salerno S, Damon LE, Levis MJ, Perl AE, Travers KJ, Wang S, Hunt JP, Zarrinkar PP,Schadt EE, Kasarskis A, Kuriyan J, Shah NP.Validation of ITD mutations in FLT3 as a therapeutic target in human acute myeloid leukaemia.Nature, 2012, 485(7397):260–263.
[58]Kapranov P, Ozsolak F, Kim SW, Foissac S, Lipson D,Hart C, Roels S, Borel C, Antonarakis SE, Monaghan AP,John B, Milos PM.New class of gene-termini-associated human RNAs suggests a novel RNA copying mechanism.Nature, 2010, 466(7306): 642–646.
[59]Loomis EW, Eid JS, Peluso P, Yin J, Hickey L, Rank D,McCalmon S, Hagerman RJ, Tassone F, Hagerman PJ.Sequencing the unsequenceable: expanded CGG-repeat alleles of the fragile X gene.Genome Res, 2013, 23(1):121–128.
[60]朱艳慧, 贺树香, 王晓春, 胡朝晖.通往个性化医疗的新一代测序技术: Ion Torrent.生物技术通讯, 2013,24(4): 587–591.
[61]Dancey JE, Bedard PL, Onetto N, Hudson TJ.The genetic basis for cancer treatment decisions.Cell, 2012, 148(3):409–420.
[62]Zhang X, Davenport KW, Gu W, Daligault HE, Munk AC,Tashima H, Reitenga K, Green LD, Han CS.Improving genome assemblies by sequencing PCR products with PacBio.Biotechniques, 2012, 53(1): 61–62.
[63]Hou Y, Song LT, Zhu P, Zhang B, Tao Y, Xu X, Li FQ, Wu K, Liang J, Shao D, Wu HJ, Ye XF, Ye C, Wu RH, Jian M,Chen Y, Xie W, Zhang R,R Chen L, Liu X, Yao XT, Zheng HC, Yu C, Li QB, Gong ZL, Mao M, Yang X, Yang L, Li JX, Wang W, Lu ZH, Gu N, Laurie G, Bolund L, Kristiansen K, Wang J, Yang HM, Li YR, Zhang XQ, Wang J.Single-cell exome sequencing and monoclonal evolution of a JAK2-negative myeloproliferative neoplasm.Cell,2012, 148(5): 873–885.
[64]Xu X, Hou Y, Yin XY, Bao L, Tang AF, Song LT, Li FQ,Tsang S, Wu K, Wu HJ, He WM, Zeng L, Xing MJ, Wu RH, Jiang H, Liu X, Cao DD, Guo GW, Hu XD, Gui YT,Li ZS, Xie WY, Sun XJ, Shi M, Cai ZM, Wang B, Zhong MM, Li JX, Lu ZH, Gu N, Zhang XQ, Goodman L, Bolund L, Wang J, Yang HM, Kristiansen K, Dean M, Li YR,Wang J.Single-cell exome sequencing reveals single-nucleotide mutation characteristics of a kidney tumor.Cell,2012, 148(5): 886–895.
[65]Yu C, Yu J, Yao XT, Wu WKK, Lu YY, Tang SW, Li XC,Bao L, Li XX, Hou Y, Wu RH, Jian M, Chen RY, Zhang F,Xu LX, Fan F, He J, Liang QY, Wang HY, Hu XD, He MH,Zhang X, Zheng HC, Li QB, Wu HJ, Chen Y, Yang X, Zhu SD, Xu X, Yang HM, Wang J, Zhang XQ, Sung JJY, Li YR,Wang J.Discovery of biclonal origin and a novel oncogene SLC12A5 in colon cancer by single-cell sequencing.Cell Res, 2014, 24(6): 701–712.
[66]孙海汐, 王秀杰.DNA测序技术发展及其展望.(http://wenku.baidu.com/view/56322d4769eae009581bec3a.html)
[67]韦贵将, 邹秉杰, 陈之遥, 宋沁馨, 李佑志, 周国华.新一代测序技术的研究进展.现代生物医学进展, 2012,12(19): 3789–3793.