Ion Torrent PGMTM 平台在儿童遗传性疾病诊断中应用初探
2013-09-10王慧君吴柏林黄国英周文浩郭晓红
杨 琳 王慧君 吴柏林 黄国英 周文浩 郭晓红
人类基因组计划( HGP) 耗资30 亿美元,用了约10 年,完成了人类个体全基因组测序工作。随之而来的人类基因组单倍型图计划、个体基因组计划,再到千元基因组计划,基因组时代高调而来。传统的Sanger 测序技术[1]已不能满足大规模核酸测序的需求,第二代测序技术( Next generation sequencing,NGS) 最主要的特征是高通量,快速、低成本[2~4]。NGS 通过反复测序同一区域的DNA 片段,达到很高的灵敏度和准确度,同时自动化程度高,能在很短的时间内完成对上百亿碱基的测序,为基因组分析提供了新的手段。
NGS 由于其技术操作、数据质量和数据分析等方面的问题,尚未广泛应用于临床检测。本研究采用Ion Torrent PGMTM平台,基于PCR 扩增的文库构建方法,选取在儿科临床较为常见的单基因遗传性疾病,对其致病基因同时进行直接Sanger 测序和NGS 检测,对其结果进行比较分析,旨在对NGS 在临床检测中的应用进行初步探索。
1 方法
1.1 对象 复旦大学附属儿科医院( 我院) 临床诊断为肌营养不良症( DMD,2 例) 、胆汁酸合成障碍(1 例) 和甲基丙二酸血症(1 例) 的病例。本研究经我院伦理委员会批准,患儿家属签署知情同意书。
1.2 NGS 方法
1.2.1 外周血DNA 提取 外周静脉血经EDTA 抗凝,使用全血试剂盒提取DNA( Qiagen Inc.,Germantown,MD) 。使用NanoDrop ND-1000 分光光度计检测DNA 浓度及吸光度值,电泳检测DNA 降解程度。
1.2.2 PCR 扩增 DMD 基因( NM_004006.2,13 993 bp)引物为美国波士顿儿童医院吴柏林教授惠赠。HSD3B7 基因( NM _ 025193. 3,2 203 bp) 、AMACR 基 因( NM _001167595.1,2 603 bp) 和MUT 基因( NM_000255.3,3 886 bp) 采用Primer3( v. 0. 4. 0) 进行在线引物设计。使用KAPA2G Robust HotStart ReadMix 进行扩增反应。最终反应体系为25 μL,其中DNA 模板20 ng,正反向引物各1.0 μL( 浓 度 为10 μmol·L-1) ,PCR Mix 12. 5μL。采 用Touchdown PCR,参数为95℃3 min,其后14 个循环为95℃20 s、64℃20 s( 每个循环降低0.5℃) 、72℃30 s,其后25个循环为95℃20 s、57℃20 s、72℃30 s,最终72℃延长5 min。5 μL PCR 产物进行2%琼脂糖电泳,以判断特异性扩增结果。
1.2. 3 PCR 产物标准化 PCR 产物采用Sequal Prep Normalization kit ( catalog A10510-01;Invitrogen) 试剂盒进行标准化,其后将单个样本的全部PCR 产物混合,标准化过程可以保证每个PCR 产物以等量混合。
1.2.4 Ion Torrent 文库构建 PCR 产物混合后,采用Ion Shear( catalog no.4471248;Life Technologies) 进行PCR 产物酶切打断;采用Ion Xpress Plus Fragment Library Kit( catalog no.4471269; Life Technologies) 连接 街 头; 采 用Ion Xpress Barcode Adapters 1-16 Kit ( catalog no. 4471250; Life Technologies) 分别加标签,标签1 ~4 分别对应病例1 ~4。采用E-Gel 选择大小在200 bp 的片段; 采用Ion Library Quantitation Kit( catalog no.4468802; Life Technologies) 进行qPCR 方法的文库定量。
1. 2. 5 乳液PCR 和ISPs 富集 采用Ion template preparation kit ( catalog no. 4469000; Life Technologies) 和One Touch( Life Technologies) 进行乳液PCR( emulsion PCR,emPCR) ;采用Ion Xpress template kit、MyOne streptavidin C1 beads( catalog no. 4469001、650. 01; Life Technologies) 进行ISPs 富集。
1.2.6 Ion Torrent PGM 平台的序列检测 采用Ion PGM Sequencing kit( catalog no.4462923; Life Technologies) 及Ion Torrent 314 芯片( catalog no.4462923;Life Technologies) ,进行测序反应。共65 个测序循环,使用18 欧姆纯化水、标准压缩氩气驱动PGM 内液体的流动。
1.2.7 结果分析 采用Ion torrent PGMTM服务器自带分析软件对测序结果初步分析,得到整体数据量、平均测序深度和参考序列匹配程度等数据。其后生成FASTA 文件,采用NextGENe 软件( DEMO v2.3.0) 进行后续的序列数据结果分析,参考序列为NextGENe 软件自带的人类基因组序列( Human Genome 37.2) 。
1.2.8 MLPA 及Sanger 验证结果 针对基因序列检测,采用如前所述引物,使用KAPA2GTMRobust HotStart ReadMix进行扩增反应,反应体系及条件与前述相同。PCR 产物采用Applied Biosystems 3500xl 基因分析仪进行测序,结果采用MutationSurveyor( v 4.0.7 Demo) 进行数据分析。对于DMD 基因缺失/重复的检测采用MRC Holland 公司商业化试剂盒( SALSA P034、P035) ,采用MLPA 技术进行检测。
2 结果
2.1 NGS 初步结果 如图1 所示,芯片中有效区域达78.7%,其中连接有文库的为96%。除去20%的多克隆,13%的低质量文库和12%测试片段,最终有效的文库为67.1%,共578 830 个读取片段。片段平均读长为108 bp,最长读长187 bp。产生的原始测序数据总量为62.8 Mb,其中达到Q20( 与参考序列99%匹配) 为54.99 Mb。选用了人类基因组( GRCh37,hg19) 上述基因的序列为参考序列( http: //www.ncbi. nlm. nih. gov/gene) 。结果发现总计有55.8 Mb 与参考序列匹配,占总序列数的90%。其中以DMD 基因参考序列编码区比对的结果,平均测序深度为511.3 ×,AQ20 的平均测序深度为276.8 ×。
图1 Ion Torrent PGMTM服务器产生的测序的初步分析结果Fig 1 Preliminary results of sequencing by Ion Torrent PGMTM
2.2 NGS 突变检测结果( 表1) 例1: 检测到DMD 基因编码区一个已知致病突变: c.998C >A,p.333S >X; 4 个SNP ( http: //www. ncbi. nlm. nih. gov/projects/SNP/) :rs228406( c.2645A >G,p.882D >G) ; rs1801187( c.5234G>A,p. 1745R >H) ; rs1801188( c. 7728T >C,p. 2576N >N) ;rs1800280( c.8810G >A,p.2937R >Q) 。1 个意义不明变异:c.10127insT,FS。例2:检测到DMD 基因5 个外显子的缺失( g.2788933943-2790543577) ,为DMD 常见的致病缺失区段。例3:检测到HSD3B7 基因编码区2 个复合杂合突变:c.45-46delAG,FS; c.262G >G/C ,p. 88G >RG,第1个为已知致病突变位点,第2 个为未报道的位点。1 个SNP:rs9938550( c.748A >G,p. 250T >A) 。检测到AMACR基因4 个SNP: rs3195676 ( c. 25G >GA,p. 9V >VM) ;rs10941112( c. 524G >GA,p. 175G >GD) ; rs2278008( c.829G >GA,p. 277E >EK) ; rs2287939( c. 602T >TC,p.201L >LS) 。例4: 检测到MUT 基因编码区1 个已知致病突变位点: c.728-729het-insTT,FS;3 个SNP: rs2229384( c.636G >G/A,p. 212K >K) ;rs8589( c.2011A >A/G,p. 671I>V) ;rs1141321( c.1595C >CT,p. 532R >RH) 。1 个意义不明变异:c.1540G >GT,p.514Q >KQ。
2.3 MLPA 及Sanger 检测结果 例1: 采用Sanger 测序方 法,检测到DMD 基因编码区5 个变异,分别为c.2645A >G、c.5234G >A、c.7728T >C、c.8810G >A、c.998C >A,均与Ion Torrent 测序结果相符合。Ion Torrent 检测到的c.10127insT 改变,Sanger 测序未发现。例2: MLPA 验证了Ion Torrent 检测到的缺失。例3: HSD3B7 基因检测到3 个变异: c.45-46delAG、c.262G >G/C、c.748A >G,均与Ion Torrent 测序结果相符合。AMACR 基因检测到4 个SNP,分别为c.25G >GA、c.524G >GA、c.829G >GA、c.602T >TC,均与Ion Torrent PMG 测序结果相一致。例4:MUT 基因检测到3 个变异:c.728-729het-insTT、c.636G >G/A、c.2011A>A/G,与Ion Torrent 测序结果相符合。Ion Torrent 检测到的c.1595C >CT、c.1540G >GT 改变,Sanger 测序未发现。
图2 Ion Torrent PGMTM检测结果Fig 2 Results of Ion Torrent PGMTM detection
3 讨论
Ion Torrent PGMTM平台的NGS 检测,通过目的基因PCR 扩增、文库构建、乳液PCR 和测序流程,得到检测结果仅需2 ~3 d。且以目的基因组合为基础的后期数据处理,直观和快捷。Ion 314 芯片为例,如本文获得的总数据量为62.8 Mb,以DMD 基因为例,其编码区及UTR 区域全长平均测序深度为200 倍计算,每张314 芯片可以同时完成4 ~5 个样本的检测,每例样本的费用低于第一代Sanger 直接测序,与此同时,该技术所需投入的人力及耗时又有大幅度的降低,适合于临床较大规模的检测使用。
本文对4 例遗传学疾病患儿的相对应的4 个致病基因进行检测。Ion Torrent PGMTM平台共检测到18 个变异,15个在Sanger 直接测序中也检测到,即包括突变也包括SNP,即包含纯合变异也包含杂合变异,突变类型中包含插入、缺失和置换,说明该检测方法的敏感性较好。但Ion Torrent PGMTM平台检测到3 个假阳性,回顾原始图像,发现1 个为在6 个连续的T 后面提示插入了一个T。此类问题是NGS数据处理、分析过程中遇到的较为共性的问题。从原理上讲,Ion Torrent PGMTM平台根据电压变化的幅度来判断连续相同碱基的个数方面仍存在一定的问题,这需要数据处理分析的不断完善来加以避免。目前,已经可以通过软件对此类假阳性进行过滤。另外2 个假阳性发生在MUT 基因的检测中,均提示为碱基置换,考虑可能为测序深度不足造成的结果不准确,同时将部分G 和C 错读成了T,提示杂合变异,对于此类数据在今后临床应用中应予以高度注意。这类假阳性可以通过提高测序覆盖倍数进行鉴别。
本研究检测的DMD 基因突变所导致的DMD,是人类常见的X 连锁隐性遗传性疾病,国外报道DMD 的发病率为1/ 3 917 ~1/4 700 活 产 男 婴[5,6]。DMD 基 因 位 于Xp21.1-21.3,长度为2.4 Mb,是人类最大的基因之一。在DMD 基因突变类型中单一或多个外显子的缺失占60% ~70%[7,8],单一或多个外显子的重复占5% ~10%[8~10],序列改变( 点突变、小的插入或缺失、剪接异常) 在男性患者中占25% ~35%[8,11~13]。既往由于DMD 基因过大导致的直接测序时间、费用消耗巨大,许多实验室也在寻找其他突变筛查方法,包括变性高效液相色谱分析、内引物单一条件扩增技术[14,15]和高分辨率熔解曲线分析[16],但随着直接测序费用的降低,上述方法已少有使用。目前,多采用传统PCR 及Sanger 直接测序方法,但其主要不足是人力及时间消耗大,效率低。针对于DMD 基因的微重复/微缺失的检测,以往有多重PCR( mPCR)[17]、Southern 印迹[18]和FISH探针法。mPCR 只能覆盖不足1/4 的外显子;体系复杂,条件不易稳定,优化困难;通过用cDNA 探针的Southern 印迹需要1 ~2 周时间用来分析,使用放射性同位素作为示踪物,并需要较多的DNA。近年来逐渐被发展起来的MLPA[19]和染色体微阵列芯片( CMA) 技术[20,21]所取代,但也受到成本、时间的限制,且不能同时针对序列改变进行检测。而NGS 技术的诞生及发展,由于其高通量、高敏感性的优点,针对于基因序列改变、男性X 连锁的致病基因部分缺失的检测,能弥补目前现有技术的不足,为临床检测提供新的方法。本文例1 为DMD 基因的点突变所导致,例2是DMD 基因5 个外显子的缺失所导致,作为DMD 的两种常见突变形式,都可被NGS 方法所检测到。
HSD3B7 基因编码3β 羟基δ5-C27 类固醇氧化还原酶,位于16p12-p11.2,含有6 个外显子,DNA 全长3 kb,该基因的纯合或复合杂合突变可引起先天性胆汁酸合成障碍1 型( CBAS1)[22]。AMACR 基因编码α 甲基酰辅酶A 消旋酶,定位于5p13.2,含有6 个外显子,该基因突变亦可引起先天性胆汁酸合成障碍4 型( CBAS4)[23]。本文例3,男,3 个月25 d,主因“皮肤黄染3 个月”就诊,患儿生后4 d 出现黄染,大便呈黄色糊状;体检发现皮肤、巩膜中度黄染,肝肋下扪及4 cm;血生化提示高结合胆红素血症、γ-谷氨酰转肽酶及总胆汁酸正常、转氨酶升高、凝血功能障碍; 腹部B 超提示肝脏肿大,双侧肾脏损害,临床诊断为先天性胆汁酸合成障碍继发肾脏结晶。胆汁酸合成障碍占儿童胆汁淤积性疾病的1% ~2%,是一种罕见的遗传性疾病,多为常染色体隐性遗传。本例检测到HSD3B7 基因c.45-46delAG 和c.262G >G/C 的复合杂合突变,其中c.45-46delAG 为已报道的致病突变[24],c.262G >G/C 为未报道的错义突变,导致第88 位氨基酸从甘氨酸变成精氨酸。结合对患儿父母的检测结果,证实c.45-46delAG 来自患儿母亲,c.262G >G/C来自患儿父亲,诊断为CBAS1。
MUT 基因编码甲基丙二酸辅酶A 异构酶,该基因突变可引起甲基丙二酸血症,MUT 位于6p12.3,含有13 个外显子,DNA 全长35 kb[25]。本文例4,男,6 岁,主因“意识不清9 d 伴语言障碍”就诊,尿串联质谱发现甲基丙二酸,3-羟基丁酸和乙酰乙酸显著升高,临床诊断为甲基丙二酸血症。NGS 检测到c.729-730het-insTT,已有研究报道该位点的纯合突变可导致酶活性的完全丧失[26],但该患儿的遗传方式以及杂合突变是否可导致酶活性的部分丧失,有待进一步对父母进行检测及功能学的研究加以证实。
从本研究的检测结果来看,Ion Torrent PGMTM在4 个基因中检测到的15 个序列改变、1 个片断缺失( 男性,X 染色体) ,与Sanger 直接测序结果完全一致,为NGS 技术应用于临床的可靠性提供了依据。但存在3 个假阳性报告,提示其数据处理、分析仍有待改进和完善。同时也强调了对于NGS 结果进行验证的必要性。
综上所述,二代测序Ion Torrent PGMTM平台,采用PCR产物定量混合构建文库测序的方法,因其灵活可变、数据分析相对简单的优点,比较适用于临床常见遗传性疾病的检测。但由于其技术本身可能带来的假阳性问题,仍需要技术层面、数据分析层面的共同完善来加以避免。
[1]Sanger F, Air GM, Barrell BG, et al.Nucleotide sequence of bacteriophage phi X174 DNA.Nature,1977,265(5596):687-695
[2]Schuster SC.Next-generation sequencing transforms today's biology.NatMethods,2008,5(1):16-18
[3]Shendure J, Ji H.Next-generation DNA sequencing.Nat Biotechnol,2008,26(10):1135-1145
[4]Davey JW, Hohenlohe PA, Etter PD, et al.Genome-wide genetic marker discovery and genotyping using next-generation sequencing.Nat Rev Genet,2011,12(7):499-510
[5]Tangsrud SE, Halvorsen S.Child neuromuscular disease in southern Norway. The prevalence and incidence of Duchenne muscular dystrophy.Acta Paediatr Scand,1989,78(1):100-103
[6]Dooley J, Gordon KE, Dodds L, et al.Duchenne muscular dystrophy: a 30-year population-based incidence study.Clin Pediatr (Phila),2010,49(2):177-179
[7]Yan J, Feng J, Buzin CH, et al.Three-tiered noninvasive diagnosis in 96% of patients with Duchenne muscular dystrophy (DMD).Hum Mutat,2004,23(2):203-204
[8]Takeshima Y, Yagi M, Okizuka Y, et al.MUTation spectrum of the dystrophin gene in 442 Duchenne/Becker muscular dystrophy cases from one Japanese referral center.J Hum Genet,2010,55(6):379-388
[9]White S, Kalf M, Liu Q, et al.Comprehensive detection of genomic duplications and deletions in the DMD gene, by use of multiplex amplifiable probe hybridization.Am J Hum Genet,2002,71(2):365-374
[10]White SJ, Aartsma-Rus A, Flanigan KM, et al.Duplications in the DMD gene.Hum Mutat,2006,27(9):938-945
[11]Bennett RR, den Dunnen J, O'Brien KF, et al.Detection of MUTations in the dystrophin gene via automated DHPLC screening and direct sequencing.BMC Genet,2001,2:17
[12]Flanigan KM, von Niederhausern A, Dunn DM, et al.Rapid direct sequence analysis of the dystrophin gene.Am J Hum Genet,2003,72(4):931-939
[13]Hofstra RM, Mulder IM, Vossen R, et al.DGGE-based wholegene MUTation scanning of the dystrophin gene in Duchenne and Becker muscular dystrophy patients.Hum Mutat,2004,23(1):57-66
[14]Dent KM, Dunn DM, von Niederhausern AC, et al. Improved molecular diagnosis of dystrophinopathies in an unselected clinical cohort. Am J Med Genet A,2005,134(3):295-298
[15]Flanigan KM, Dunn DM, von Niederhausern A, et al.MUTational spectrum of DMD MUTations in dystrophinopathy patients: application of modern diagnostic techniques to a large cohort.Hum Mutat,2009,30(12):1657-1666
[16]Almomani R, van der Stoep N, Bakker E, et al.Rapid and cost effective detection of small MUTations in the DMD gene by high resolution melting curve analysis.Neuromuscul Disord,2009,19(6):383-390
[17]Chamberlain JS, Chamberlain JR, Fenwick RG, et al.Diagnosis of Duchenne and Becker muscular dystrophies by polymerase chain reaction. A multicenter study.JAMA,1992,267(19):2609-2615
[18]Darras BT, Koenig M, Kunkel LM, et al.Direct method for prenatal diagnosis and carrier detection in Duchenne/Becker muscular dystrophy using the entire dystrophin cDNA.Am J Med Genet,1988,29(3):713-726
[19]Gatta V, Scarciolla O, Gaspari AR, et al.Identification of deletions and duplications of the DMD gene in affected males and carrier females by multiple ligation probe amplification(MLPA).Hum Genet,2005,117(1):92-98
[20]Del GD, Yang Y, Boggs BA, et al.Molecular diagnosis of Duchenne/Becker muscular dystrophy: enhanced detection of dystrophin gene rearrangements by oligonucleotide arraycomparative genomic hybridization.Hum Mutat,2008,29(9):1100-1107
[21]Hegde MR, Chin EL, Mulle JG, et al.Microarray-based MUTation detection in the dystrophin gene.Hum Mutat,2008,29(9):1091-1099
[22]Schwarz M, Wright AC, Davis DL, et al.The bile acid synthetic gene 3beta-hydroxy-Delta(5)-C(27)-steroid oxidoreductase is MUTated in progressive intrahepatic cholestasis.J Clin Invest,2000,106(9):1175-1184
[23]Mubiru JN, Shen-Ong GL, Valente AJ, et al.Alternative spliced variants of the alpha-methylacyl-CoA racemase gene and their expression in prostate cancer.Gene,2004,327(1):89-98
[24]Cheng JB, Jacquemin E, Gerhardt M, et al.Molecular genetics of 3beta-hydroxy-Delta5-C27-steroid oxidoreductase deficiency in 16 patients with loss of bile acid synthesis and liver disease.J Clin Endocrinol Metab,2003,88(4):1833-1841
[25]Ledley FD, Crane AM, Lumetta M.Heterogeneous alleles and expression of methylmalonyl CoA MUTase in MUT methylmalonic acidemia.Am J Hum Genet,1990,46(3):539-547
[26]Worgan LC, Niles K, Tirone JC, et al.Spectrum of MUTations in MUT methylmalonic acidemia and identification of a common Hispanic mutation and haplotype.Hum Mutat,2006,27(1):31-43