线粒体全基因组测序在法医学中的应用
2015-02-26李万水
姚 岚,李万水,胡 兰, 徐 珍,*
(1.公安部物证鉴定中心 法医遗传学公安部重点实验室,北京 10 0038;2.重庆医科大学,重庆 400016)
线粒体全基因组测序在法医学中的应用
姚 岚1,2,李万水1,胡 兰1, 徐 珍1,*
(1.公安部物证鉴定中心 法医遗传学公安部重点实验室,北京 10 0038;2.重庆医科大学,重庆 400016)
线粒体DNA检测是法医DNA检验的重要手段之一。随着分子生物学和计算机技术的发展,二代测序技术的出现,使得线粒体DNA检测从传统的部分测序进入到全基因组测序时代。相对于部分测序,线粒体全基因组测序能够提供更全面的序列信息,提高线粒体DNA检测的识别率;同时也能够通过对全基因组信息的深入分析,获得样本来源信息。本文介绍了经典以及新出现的线粒体DNA测序策略,简述了各种测序策略的优缺点,在此基础上重点介绍了线粒体全基因组测序在法医遗传学、线粒体相关疾病、衰老机制等方面的研究和应用,最后探讨了线粒体全基因组序列分析在法医遗传学实践中应用的可能性以及可能面临的一些问题。
法医遗传学; 线粒体DNA;二代测序
人类线粒体DNA(mitochondrial DNA,mt DNA)位于细胞质中,是一套独立于核染色体之外的完整的遗传物质。线粒体DNA是一个双链闭合环状分子,其全长16569 bp的序列可分为编码区和控制区两个部分。其中,编码区较为保守,共37个基因编码多种RNA和蛋白质。控制区变异率较高,根据其在基因组上的位置,通常将其分为三个区域:位于线粒体DNA链16024~16365 bp的高变1区 (hypervariable regionⅠ, HVⅠ),位于73~340 bp的高变2区(hypervariable regionⅡ, HVⅡ),以及位于340~576 bp的高变3区 (hypervariable region Ⅲ, HVⅢ)。线粒体DNA具有许多独特的特点和不可替代的作用。相对于核DNA,线粒体DNA的优点在于:(1)在细胞中具有更高的拷贝数,在降解检材中特别是当核DNA无法得到完整分型时,线粒体DNA信息便显示出重要的利用价值;(2)由于经常暴露于各种氧化反应中[1],线粒体DNA的变异率比核DNA更高,由此产生的多态性能够为母系DNA比对提供依据,且部分多态性位点亦与地域人群进化相关;(3)线粒体DNA完全由母系遗传,不存在基因重组,故在母系亲属关系鉴定中发挥着无可替代的作用。过去,由于测序技术以及样本量有限等原因的限制,线粒体DNA在法医遗传学中的应用主要是对其高变1区和2区的DNA序列进行测序比对,但仅对线粒体整个基因组的一部分进行分析会因信息不完整导致线粒体DNA鉴定结果无法判断甚至出现错误,从而削弱线粒体检测的识别能力[2, 3],限制了其在法医DNA鉴定中的应用。
在分子生物学和计算机技术等相关技术飞速发展的今天,多种高新技术如多重PCR、高通量测序等技术的出现,使得在短时间内快速准确地测定线粒体全基因组序列成为可能,而且随着高通量测序成本的不断降低,线粒体全基因组序列分析已逐渐成为线粒体DNA检测的主要手段。尤其是二代测序技术的出现,使得法医工作者能够方便地获得更全面的线粒体基因组信息,在提高线粒体DNA检测识别率的同时,能够获得更多样品来源信息。二代测序通过一个检测过程就能得到目前所需的所有信息,非常适用于微量检材的检验。有实验室对线粒体全基因组测序结果进行分析,发现其能够提供除高变区外的单倍体类型,从而获得更全面的样本mtDNA单倍群信息。更全面的单倍群信息的应用可明显降低线粒体DNA异质性的假阳性率[4],同时还能够对组织特异性进行检测[5,6]。Parsons、Coble等[7, 8]提出,相对于仅对高变区进行测序分析,对线粒体的全基因组测序比对能够明显提高线粒体DNA在人群中的分辨力。除此之外,线粒体DNA本身还包含有许多其它的信息。线粒体在体内作为能量供给站,其编码的基因包括呼吸链的相关蛋白、氧化磷酸化相关蛋白、部分rRNA和tRNA等。相对于控制区,编码区的变异率较低[9],编码区的序列能够提供样本来源有关的疾病信息,如有研究发现心肌病[10]、肿瘤或动脉粥样硬化[11]等疾病与线粒体DNA序列突变有关。
1 线粒体测序
线粒体DNA测序,主要有传统的Sanger测序法,以及以DNA合成为基础的二代测序方法。Sanger测序法是以双脱氧核苷三磷酸(dideoxynucleotide triphosphate, ddNTP)终止反应为基础的测序方法。近年来由于硬件的不断更新,亦能用于线粒体的全长测序,但由于其时间和成本均较高,该方法的推广和应用受到很大限制。目前,Sanger测序法仍是唯一符合法医学验证标准的测序法[12]。二代测序,又称新一代测序(next generation sequencing, NGS),它以DNA合成为基础,在多个片段同时复制时,通过检测每条DNA链复制过程中释放的离子转化成的电信号或者DNA新链掺入时释放的荧光信号而实现高通量并行测序。二代测序法能在短时间内完成对线粒体基因组的高深度测序,相对经典Sanger测序法灵敏度更高。
1.1 测序策略
测序的策略根据测序目的以及测序平台的不同而有不同选择。根据获得线粒体DNA方法的不同可将测序分为直接测序和间接测序。直接测序是指先通过DNA提取或扩增获得足够的线粒体DNA后对其进行测序[13]。由于检材量的限制,直接提取得到的DNA量往往非常有限,通常需对线粒体DNA进行PCR扩增或探针捕获[14]进行富集后测序。对于线粒体DNA 16569 bp全基因组的扩增,需使用多对引物进行分段扩增。有文献推荐使用65对引物[15]或34个扩增片段[16]对线粒体全基因组进行分段扩增,也有报道仅使用12对相互重叠的引物也能获得良好的线粒体全基因组扩增效果[7,8]。由于法医鉴定中的检材大部分为降解检材,为了提高DNA的检出率,测序的策略应尽量采用较小的扩增片段,并且为避免扩增片段间的相互干扰,还应该减少不必要的扩增子数目。对于线粒体DNA而言,因其序列包含较多高变位点,且存在与核染色体高度同源的序列,使得线粒体测序策略的选择有一定难度。Fendt等[17]先将16 kb长的线粒体DNA扩增为A、B两个约8.5 kb长的片段,然后用48对测序引物对上述两个长片段进行测序。此方法适合于DNA质量较好的线粒体样本。Lyons等[18]利用Sanger法对人群的线粒体全基因组进行测序,采用的是将16 kb的线粒体全基因组序列在96孔板中分成8个扩增子进行扩增,然后再利用多个测序引物进行多重扩增,共将其分为135个片段来进行测序。此方法大大降低了核线粒体DNA(nuclear mitochondrial DNA, NUMT)的干扰,使得测序DNA起始用量降至50 pg~1 ng。间接测序是指先通过测序得到样品所有的DNA序列信息后,通过生物信息学的方法将线粒体DNA序列筛选出来。此方法很难进行质量控制,也极易受假阳性和核DNA的干扰。在二代测序方面,Mikkelsen等[19]用二代测序平台对10个无关个体的线粒体全基因组进行了检测,采用的是将整个线粒体DNA片段分为2个扩增子进行测序。Schonberg[20]和Templeton[21]等也是先将线粒体DNA分成2个片段进行特异扩增后,再用物理方法将其打断为适当大小的片段进行测序。此方法虽然可以减少其它非线粒体DNA的污染,但是如此大的扩增子在法医降解检材中很难扩增得到,而Templeton等在扩增片段前还利用探针捕获的方法对线粒体DNA进行富集,能够明显提高二代测序的数据质量。
1.2 线粒体DNA异质性
线粒体DNA的异质性,是指在同一个来源的线粒体基因组中,同一位置上出现两种或两种以上的分子类型。现在的研究多认为异质性的产生跟瓶颈理论[22]有关,且多发生在高代谢的组织上,如毛发等。线粒体的异质性可分为两种,一种是长度异质性(length heteroplasmy, LHP),另一种为点异质性(point heterolasmy, PHP)[4]。异质性的发生类型多种多样,包括:同一组织来源,不同细胞间;同一细胞,不同线粒体拷贝间;同一线粒体中,不同线粒体DNA分子间[23]。异质性的出现,为法医线粒体DNA鉴定带来一定挑战。但需要注意的是,异质性并非出现于线粒体基因组的必然之物。传统异质性的研究是通过Sanger法测序获得的,但通过Sanger法判断点异质性易受到引物或者异质点位置的干扰,且没有一个确定的异质性标准,灵敏度也较低;而利用二代测序的方法,能够得到整个线粒体DNA序列的异质性位点信息,并且由于是通过双向测序获得,其结果更加准确可靠。通过目前二代测序对线粒体DNA异质性的研究表明,线粒体DNA异质性的发生率要高于以往的研究结果[4],但到底是由于检测方法敏感度的增加导致的假阳性还是由于异质性的确比之前认为的更易发生,以及如何将此方面研究应用于法医学实际案例,尚需进一步深入研究。除此之外,为了避免不完整测序造成的将可能的单倍型误认为变异,现在一些线粒体DNA数据库以全基因组范围的单倍群为基础[24]。
2 线粒体全基因组测序应用研究
目前,已有多个实验室对线粒体全基因组进行深入研究,由此线粒体全基因组数据近年飞速增长,仅2014年增加约15%[25],其应用范围也越来越广泛,包括法医学中个体识别、亲属关系鉴定以及嫌疑的排除,临床医学上相关疾病的诊断、治疗及危险因素的判断等。在衰老的机制研究中,人们也普遍认为线粒体基因组变异与衰老有关。
2.1 法医学应用
早在新的测序方法出现前便有学者研究发现线粒体的全基因组测序相较于高变区的测序有更高的识别能力[8],但由于种种限制使得通过将编码区的SNP位点联合高变区测序成为全基因测序的替代[8],但这始终无法达到全基因组测序的高分辨率。新的技术出现后,许多学者便尝试将其用于法医学的研究,包括Loreille等[26]利用二代测序平台对高度降解的未知名骨骼样本进行了线粒体全基因组测序。King等[27]对2014年英国出土的怀疑为理查三世的尸骨进行了鉴定,通过Y染色体、线粒体和表观遗传SNP相关位点的联合应用确认该遗骨确为理查三世。其中线粒体就是采用DNA杂交捕获后的长片段扩增,在二代测序平台上获得全基因组数据,并得到了完美比对结果。另外,因为对于一些稀有的疑似单倍型的判断依赖于准确的人群调查,已有的数据大多仅基于非编码区的数据,而随着越来越多的认识发现线粒体全基因组的分析更全面和准确,Just等[28]便用高通量的Sanger测序法对3个民族588个美国个体进行全基因组测序,为将来的全基因组比对提供了更好的基础支持。除此之外,Bouhlal等[29]通过二代测序的方法辅以一代验证对一对同卵双胞胎进行了线粒体全基因组测序,发现了低频率的不同的异质性位点,但考虑到核DNA的干扰,且该实验也缺乏不同年龄段的参考数据,因此有待进一步研究证实。
2.2 线粒体相关疾病
由于线粒体在体内的主要功能是氧化供能,其变异极有可能导致疾病的发生。将线粒体单倍群与一些相关疾病,如白血病、Ⅱ型糖尿病[30]、老年痴呆症[31]等进行相关性研究发现线粒体全基因组的单倍型类型是疾病发生的相关因素。由于全基因组检测技术的普及,使得线粒体基因的功能研究能够进一步深入。Atilano等[32]使用了分子克隆和线粒体全基因测序的方法,确认了不同单倍群对甲基化的差别调控影响了炎症反应。另外,Zaragoza等[10]利用全测序分析的方法对母系遗传的心肌病病人进行线粒体测序,发现了更多与疾病相关的变异位点。
2.3 衰老机制
氧化应激是人体衰老的分子机制之一,当细胞出现氧化剂和抗氧化剂的不平衡时便会导致氧化应激的累积。现在认为在氧化磷酸化过程中产生的活性氧作为强氧化剂对细胞的老化有重要的作用,线粒体作为细胞内重要的产生活性氧的器官便在衰老的过程中起着重要的作用[33,34]。随着年龄增长,线粒体发生的变异也明显增多,目前也尚未明确是由于衰老导致的变异还是由变异造成的衰老,许多实验也能明显观察到随着年龄增长线粒体基因组的变异也随之增加[35]。新的技术为线粒体全基因的变异检测提供了新的解决方案,为线粒体和核DNA的联合分析提供了可能[36]。能否将线粒体全基因的变异与死亡年龄推断联系起来应用于法医实际应用中[37],有待进一步的研究。
3 展 望
线粒体全基因组测序分析能够为法医学线粒体DNA鉴定带来许多极具吸引力的新应用。虽然已有不少关于基于二代测序的线粒体全基因组分析应用的尝试,目前还没有能够广泛适用于法医学微量DNA检验的解决方案,既保证测序结果的准确性,同时兼具高度灵敏性。另外,线粒体的全基因组分析要求对线粒体DNA数据库进行进一步补充和完善,目前一些线粒体单倍型相关的数据库,如PhyloTree build 16[24],已经进行了全基因组范围的单倍型的补充,仍有许多相关的工作需进一步探索和累积。
[1] Mollnau H, Wenzel P, Oelze M, et al.Mitochondrial oxidative stress and nitrate tolerance--comparison of nitroglycerin and pentaerithrityl tetranitrate in Mn-SOD+/- mice [J].BMC Cardiovasc Disord, 2006,6:44.
[2 ] Parson W, Gusmao L, Hares DR, et al.DNA commission of the international society for forensic genetics: Revised and extended guidelines for mitochondrial DNA typing [J].Forensic Sci Int Genet, 2014,13:134-142.
[3] SWGDAM mtDNA_Interpretation_Guidelines_APPROVED_073013.pdf[J].2013.
[4] Just RS, Irwin JA, Parson W.Mitochondrial DNA heteroplasmy in the emerging field of massively parallel sequencing [J].Forensic Sci Int Ge net, 2015.http://dx.doi.org/10.1016/ j.fsigen.2015.05.003.
[5] Naue J, Ho rer S, Sanger T, et al.Evidence for frequent and tissue-specific sequence heteroplasmy in human mitochondrial DNA[J].Mitochondrion, 2015,20:82-94.
[6] Samuels DC, Li C, Li B, et al.Recurrent tissue- specific mtDNA mutations are common in humans [J].PLoS Genet.2013,9(11):e1003929.
[7] Thoma, Parsons MDC.Increasing the forensic discrimination of mitochondrial DNA testing through analysis of the entire mitochondrial DNA genome.pdf [J].Croatian Medical J.2001,42(3):304-309.
[8] Coble MD, Just RS, O’Callaghan JE, et al.Single nucleotide polymorphisms over the entire mtDNA genome that increase the power of forensic testing in Caucasians [J].Int J Legal Med, 2004,118(3):137-146.
[9] Pere ira L, Freitas F, Fernandes V, et al.The diversity present in 5140 human mitochondrial genomes [J].Am J Hum Genet,2009,84(5):628-640.
[10] Zaragoza MV, Fass J, Diegoli M, et al.Mitochondrial DNA variant d iscovery and evaluation in human Cardiomyopathies through next-generation sequencing [J].PLoS One,2010,5(8):e12295.
[11] Sobenin IA, Mitrofanov KY, Zhelankin AV, et al.Quantitative assessment of heteroplasmy of mitochondrial genome: perspectives in diagnostics and methodological pitfalls [J].Biomed Res In, 2014,2014:292017.
[12 ] Bandelt HJ, Salas A.Current next generation sequencing technology may not meet forensic standards [J].Forensic Sci Int Genet, 2012,6(1):143-145.
[13] Ye F, Samuels DC, Clark T, et al.High-throughput sequencin g in mitochondrial DNA research [J].Mitochondrion, 2014, 17:157-163.
[14] Hodges E, Xuan Z, Balija V, et al.Genome-wide in situ exon capture for selec tive resequencing [J].Nat Genet,2007,39(12):1522-1527.
[15] Parson W, Huber G, Moreno L, et al.Massively parallel sequencing of co mplete mitochondrial genomes from hair shaft samples..pdf [J].Forensic Sci Int Genetics, 2015.http://dx.doi.org/10.1016/j.fsigen.2014.11.009
[16] He Y, Wu J, Dressman DC, et al.Heteroplasmic mitochondrial DNA mutations in normal and tumour cells [J].Nature,2010,464(7288): 610-614.
[17] Fendt L, Zimmermann B, Daniaux M, et al.Sequencing strategy for t he whole mitochondrial genome resulting in high quality sequences[J].BMC Genomics, 2009,10:139.
[18] Lyons EA, Scheible MK, Sturk-Andreaggi K, et al.A highthroughput Sanger strategy for human mitochondrial genome sequencing[J].BMC Genomics, 2013,14:881.
[19] Mikkelsena M, Rockenbauera E, Wächter A, et al.A pplication of full mitochondrial genome sequencing using 454 GS FLX pyrosequencing [J].Forensic Sci Int: Genet SupplementSeries, 2009, 2(1):518-519.
[20] Schonberg A, Theunert C, Li M et al.High-throughput sequencing of complete human mtDNA genomes from the Caucasus and West Asia: high diversity and demographic inferences [J].Eur J Hum Genet, 2011,19(9):988-994.
[21] Templeton ELJ, Brotherton MP, Llamas B, et al.DNA capture and next-generation sequencing can recover whole mitochondrial genomes from highly degraded samples for human identification.pdf [J].Investigative Gene t, 2013,4:26.
[22] Rebolledo-Jaramilloa B, Sub MSWei, Stoler N, et al.Maternal age effect and severe germ-line bottleneck in the inheritance of human mitochondrial DNA [J].Proc Natl Acad Sci USA,2014,111 (43):15474-15479.
[23] Lutz-Bonengel S, Sanger T, Parson W, et al.Single lymphocytes from two healthy individuals with mitochondrial point heteroplasmy are mainly homoplasmic [J].Int J Legal Med,2008,122(3):189-197.
[24] van Oven M, Kayser M.Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation [J].Hum Mutat, 2009,30(2):e386-394.
[25] Smith DR.The past, present and future of mitochondrial genomics: have we sequenced enough mtDNAs? [J].Brief Funct Genomics, 2015.
[26] Loreille O, Koshinsky H, Fofanov VY, et al.Application of next generation sequencing technologies to the identi cation of high degraded unknown soldiers’remains [J].Forensic Sci Int Genet Supplement Series, 20 11: e540-e541.
[27] King TE, Fortes GG, Balaresque P, et al.Identification of the remains of King Richard III [J].Nat Commun, 2014,5:5631.
[28] Just RS, Scheible MK, Fast SA, et al.Full mtGenome reference data: development and cha racterization of 588 forensic-quality haplotypes representing three U.S.populations [J].Forensic Sci Int Genet, 2015,14:141-155.
[29] Bouhlal Y, Martinez S, Gong H, et al.Twin mitochondrial sequence analysis [J].Mol Genet Genomic Med, 2013,1(3):174-186.
[30] Fuku N, Park KS, Yamada Y, et al.Mitochondrial haplogroup N9a confers resistance agai nst type 2 diabetes in Asians [J].Am J Hum Genet, 2007,80(3):407-415.
[31] van der Walt JM, Dementieva YA, Martin ER et al.A nalysis of European mitochondrial haplogroups with Alzheimer disease risk[J].Neurosci Let, 2004,365(1):28-32.
[32] Atilano SR, Malik D, Chwa M, et al.Mitochon drial DNA variants can mediate methylation status of inflammation, angiogenesis and signaling genes[J].Hum Mol Gen, 2015.
[33] Kolesar JE, Safdar A, Abadi A, et al.Defects in mitochondrial DNA replication and oxidative damage in muscle of mtDNA mutator mice [J].Free Radic Biol Med, 2014,75:241-251.
[34] Zapico SC, Ubelaker DH.mtDNA m utations and their role in aging, diseases and forensic sciences [J].Aging Dis.2013,4(6):364-380.
[35] Soong NW, Hinton DR, Cortopassi G, et al.Mosaicism for a specific somatic mitochondrial DNA mutation in adult human brain [J].Nat Genet, 1992,2(4):318-323.
[36] Sevini F, Giuliani C, Vianello D, et al.mtDNA m utations in human aging and longevity: Controversies and new perspectives opened by high-throughput technologies [J].Exp Gerontol,2014,56:234-244.
[37] Zapico SC, Ubelaker DH.Applications of physiological bases of ageing to forensic sciences.Estimation of age-at-death [J].Ageing Res Rev, 2013,12(2):605-617.
引用本文格式:姚岚, 李万水, 胡兰, 等.线粒体全基因组测序在法医学中的应用 [J].刑事技术, 2015,40(5):368-372.
Whole Genome Sequencing of Mitochondria and Its Application in Forensic Science
YAO Lan1,2, LI Wanshui1, HU Lan1, XU Zhen1,*
(1.Key Laboratory of Forensic Genetics of Ministry of Public Security, Institute of Forensic Science of Ministry of Public Security, Beijing 100038, China; 2.Chongqing Medical University, Chongqing 400016, China)
Compared to nuclear DNA, mitochondrial DNA (mtDNA) has many unique characters, and plays an important role in some specifi c cases.Traditional analysis of mitochondrial DNA is to partially sequence the high variant regions of mitochondrial genome.Presently, with the development of techniques in molecular biology and bioinformatics, the next generation sequencing (NGS) enables the mitochondrial DNA analysis into whole g enome sequencing which provides more comprehensive information and raises the power of discrimination.Furthermore, whole genome analysis of mitochondrial DNA will give extra information assisting in sample source inferring, haplogroup detecting, diseases testing and among others.In this paper, we will review the classic and the newly emerging mitochondrial sequencing strategies including their advantages and disadvantages.Besides, we will give a brief introduction to the new applications of mitochondrial genome sequencing in forensic genetics, mitochondria diseases and aging research, and show the novel findings along with these practices.Finally, we will discuss the prospect of forensic application of mitochondrial whole genome sequencing, as well as the benefi ts and potential problems it may bring together.
forensic genetics; mitochondrial DNA; next generation sequencing
DF795.2
A
1008-3650(2015)05-0368-06
10.16467/j.1008-3650.2015.05.005
公安部科技强警基础工作专项项目(No.2013GABJC033)
姚 岚(1985—),女,重庆人,博士研究生,研究方向为法医遗传学。 Email: 14312423@qq.com
徐 珍,女,主检法医师,博士,研究方向为法医遗传学。 E-mail: xuzhen@cifs.cifs.gov.cn
2015-07-13