一种新型线粒体DNA深度测序方法的准确性评估*
2023-06-04朱琳林颖朱玉青黄明涛梁栋胡平许争峰张军南京医科大学生殖医学国家重点实验室南京66南京医科大学附属妇产医院南京市妇幼保健院产前诊断中心南京0004
朱琳,林颖,朱玉青,黄明涛,梁栋,胡平,许争峰,张军(.南京医科大学生殖医学国家重点实验室,南京 66;.南京医科大学附属妇产医院&南京市妇幼保健院产前诊断中心,南京 0004)
线粒体携带一套母系遗传的且独立于核基因组的线粒体基因组(mtDNA)。由于mtDNA相较于核基因组更易突变[1],且以多拷贝的形式存在于线粒体基因组中,因此其突变往往具有异质性,即突变型和野生型mtDNA共存[2]。针对异质性变异,突变型mtDNA占mtDNA总量的比例被称为异质度,致病性变异的不同异质度水平往往与线粒体疾病的临床表型相关[3],因此高灵敏度、高特异性地检测mtDNA变异,尤其是异质性变异,在临床和实验研究中极为重要。在前期研究中,本课题组开发了一套基于线粒体分离纯化的新型mtDNA深度测序方法,可实现PCR非依赖性的全线粒体基因组深度测序。然而,该方法针对人类外周血样本的检测性能尚未与目前主流的基于长片段PCR(lrPCR)的mtDNA深度测序方法相比较。为此,本研究旨在对10例孕妇外周血样本采用两种方法进行平行试验,通过分析比较所得测序结果,评估新方法的可靠性。
1 材料和方法
1.1研究对象 选取2022年1月至8月于南京市妇幼保健院产前诊断中心进行无创产前筛查的10例孕妇,孕周16~18周,年龄26~37岁,中位年龄32岁。本研究经南京市妇幼保健院医学伦理委员会批准(伦理审批号2021KY-130),所有研究对象均签署知情同意书。
1.2仪器及试剂 Lymphoprep淋巴细胞分离液、SepMate离心管(加拿大Stemcell公司),RSB裂解液[500 μL 10 mmol/L Tris-HCl(pH调至7.4),150 μL 3 mmol/L MgCl2,100 μL 10 mmol/L NaCl,加水定容至50 mL],NP40及RSB裂解液(美国Sigma-Aldrich公司),ExoV核酸外切酶(英国NEB公司),2×TD 缓冲液[2 mL 20 mmol/L Tris-HCl(pH调至7.6),20 mL 20%DMF(二甲基甲酰胺),1 mL 10 mmol/L MgCl2,加水定容至100 mL],DNA纯化试剂盒(美国Zymo公司),PCR高保真酶试剂盒、DNA回收试剂盒、Tn5转座酶试剂盒、TruePrep文库构建试剂盒(南京诺唯赞公司)。AMPure XP磁珠(德国Beckman公司),Qubit 3.0荧光计(美国Invitrogen公司),核酸自动提取仪、核酸提取纯化试剂(厦门芮宝生物医药公司), Illumina NovaSeq 6000测序仪(美国Illumina公司)。
1.3基于线粒体分离纯化的mtDNA深度测序 采集孕妇新鲜静脉血1 mL(无须空腹),室温保存于EDTA抗凝采血管中,按照Lymphoprep淋巴细胞分离液和SepMate离心管说明书操作分离外周血单个核细胞,加入15 μL含1% NP40的RSB裂解液轻轻吹打混匀,冰上裂解3 min,4 ℃、12 000×g离心5 min,吸取9.5 μL上清,加入1 μL ExoⅤ去除残留核基因,37 ℃反应30 min, 70 ℃反应30 min灭活ExoⅤ,得到纯化的mtDNA。向其中加入12.4 μL 2×TD 缓冲液和0.5 μL TTE Mix V50混匀,37 ℃温育30 min并纯化,获得片段化的mtDNA。根据TruePrep文库构建试剂盒说明书进行PCR反应加接头引物构建测序文库,PCR体系为20 μL,包括纯化后的mtDNA 6 μL,上、下游接头引物各2 μL,5×TAB 5 μL,TAE 0.5 μL,加ddH2O补足至20 μL。PCR循环参数:98 ℃预变性30 s;98 ℃变性10 s,63 ℃退火30 s,72 ℃延伸1 min,循环18次;4 ℃保存。对所得文库进行0.5×/0.3×双轮磁珠分选。Qubit 3.0荧光计定量检测文库浓度,文库浓度大于1 ng/μL为合格,合格文库在Illumina NovaSeq 6000测序仪上进行高通量测序。
1.4基于长片段PCR的mtDNA深度测序 根据核酸提取纯化试剂盒说明书提取全血DNA,以50 ng全基因组DNA为模板,使用两对引物将mtDNA全长序列分为2个约为8 500 bp 的片段分别扩增,引物序列见表1,引物序列参考相关文献[4],由上海生工公司合成。反应参数:95 ℃预变性30 s;95 ℃变性15 s,60 ℃退火15 s,72 ℃延伸8 min,循环25次;72 ℃延伸5 min;4 ℃保存。PCR产物于20 g/L琼脂糖凝胶中进行凝胶电泳并切胶回收,采用Qubit 3.0荧光计对其浓度进行定量,将2个片段各吸取5 ng进行等摩尔量混合,向其中加入2 μL 5×TTBL和1 μL TTE Mix V50,55 ℃反应10 min进行片段化,并进行第一轮1×磁珠回收。根据TruePrep文库构建试剂盒说明书进行PCR反应构建测序文库,PCR体系为20 μL,包括回收产物8 μL,上、下游接头引物各2 μL,5×TAB 4 μL,TAE 0.4 μL,加入ddH2O补足至20 μL。PCR循环参数:98 ℃预变性30 s;98 ℃变性15 s,63 ℃退火30 s,72 ℃延伸1 min,循环6次;4 ℃保存。对所得文库进行第二轮0.5×/0.3×双轮磁珠分选。采用Qubit 3.0荧光计定量检测文库浓度,文库浓度大于1 ng/μL为合格,合格文库在Illumina NovaSeq 6000测序仪上进行高通量测序。
1.5高通量测序 将以上合格文库进行等摩尔量混合,混合后的文库在Illumina NovaSeq 6000测序仪上进行测序,测序模式为150 bp双端测序法,数据量为每个样本1 G左右。使用FastQC (v0.11.9)软件对测序下机数据进行质量控制。再使用Trim Galore (v0.6.6)软件设置以下参数:“--paired -q 20 --phred33 --stringency 4 --length 20 --trim-n”对读序进行修剪。然后使用Bowtie2 (v2.4.4)软件将所有修剪过的读序与参考基因组(GRCh38人类参考基因组和NC_012920.1剑桥修正版人类线粒体全基因组)对齐,生成BAM文件,并通过Samtools (v1.7.0)软件提取线粒体基因组reads和核基因组reads。最后通过GATK标准化线粒体基因组SNP/Indel变异检测流程(GitHub-gatk-workflows/gatk4-mitochondria-pipeline)分析变异。
2 结果
2.110例样本通过两种测序方法所得的一致结果 对10例样本采用两种mtDNA深度测序方法进行平行试验,结果显示两种方法每例样本的碱基质量值(Q30)均超过85,测序深度均超过3 000×,见表2。10例样本中共有351个变异被两种方法一致检出,包括338个同质性变异以及13个异质性变异,其中有11个异质度超过5%,见图1。
注:10例样本经两种方法进行mtDNA测序,共有338个同质性变异以及13个异质性变异被两种方法共同检出。横纵坐标轴的数字为两种方法检出的变异异质度,具体计算公式:该位点在高通量测序结果中的突变序列读数÷该位点序列总读数。图1 在10例样本中两种方法一致检出的变异及其对应的异质度
表2 10例样本经两种方法测序的质控参数
2.210例样本两种测序方法所得的不一致结果 10例样本中有29个变异仅被一种方法检出(称为不一致变异)。对这29个不一致变异分析发现,有8个变异在多例样本中反复出现。其中,m.16192C>T在10例样本中有2例均在新方法中检出而传统方法未检出,而该变异在MitoMap和mtDB数据库中均有记录,其基因型频率分别为4.393%和2.2%,类似的还有m.16223C>T(表3)。相反地,共有6种变异为仅传统方法多次检出,但这些变异在MitoMap和mtDB数据库中均未见记录(表4)。
表3 新方法多次检出而传统方法未检出的变异
表4 传统方法多次检出而新方法未检出的变异
3 讨论
线粒体DNA测序在线粒体疾病的临床诊断和治疗以及科研中发挥着不可或缺的作用,而线粒体基因组的多态性和复杂性给mtDNA测序带来了挑战。笔者在前期研究中开发出一种新型mtDNA测序方法,该方法通过线粒体分离纯化来富集mtDNA,在Tn5转座酶片段化建库之前无须对初始DNA进行PCR扩增,在前期研究中也证明了该方法可以获得高度纯化的mtDNA,且不易受核基因组同源(NUMTs)序列干扰,可以实现全线粒体基因组深度测序。在此基础上,本研究进一步评估了该方法针对人类外周血样本进行mtDNA测序的准确性。结果表明,与传统基于lrPCR的测序方法相比,新方法在同质性变异以及高异质性变异检测时的能力相当,而针对低异质度变异检测时的准确性更高。本研究针对10例样本进行平行试验比较分析,该样本量规模较小,后续研究中需进一步扩大样本量规模,应用新方法以获得更多有价值的发现。
目前可以用于mtDNA测序的方法中,一代Sanger测序是单个同质性变异检测的金标准,但不能用于全线粒体基因组测序,且灵敏度低,通常不能准确地检测到异质度低于15%的变异[5],目前针对低质性变异检测尚无公认的金标准。随着NGS技术的发展,目前常用于全线粒体基因组深度测序的方法为基于lrPCR靶向富集mtDNA,但是该策略无法避免由聚合酶错误引入的额外突变和扩增偏好性以及NUMTs序列的干扰,影响异质度检测的准确性[6]。新方法通过线粒体分离纯化来富集mtDNA,无须PCR扩增,可有效避免NUMTs序列干扰,理论上可以缩短建库所需时间,且在低异质度变异检测方面存在优势。
为了证明这一观点,笔者对10例样本通过新方法与基于长片段PCR的方法进行平行试验。发现与传统方法相比,本方法中平均1例样本所需的文库构建时间为5 h,而传统方法需要10 h,因此本方法很大程度上节约了时间成本,在临床应用或大规模检测时极具优势。对两种方法所得测序结果分析发现,10例样本所有的同质性变异及高异质度变异的检出结果高度一致,证明了新方法在这方面的检出能力与传统方法相当。但是两种方法在低异质度变异检测结果上存在较大差异,主要体现在单方法且重复检出。由于目前尚无一种金标准方法对其进行验证,于是本研究将这些重复检出的不一致变异与2个目前广泛使用的人群数据库[MitoMap和Human Mitochondrial Genome Database(mtDB)数据库]进行对比,发现新方法重复检出的两种变异在2个数据库中都存在同样基因型的记录,由此推断该类型变异在人群中是真实存在的;而相反地,传统方法重复检出的变异在2个数据库中均未见记录,由此推断该类型变异在人群中不是真实存在,可能是长片段PCR建库导致的假阳性。由此得出结论,新方法针对低异质度变异检测更为准确。而出现这种假阳性可能是由于NUMTs序列的干扰,也可能是PCR偏好性导致扩增子中低比例变异的丢失,亦或者是这些变异所在区域的GC含量异常干扰PCR扩增过程导致。
多数mtDNA变异都存在组织特异性,通常骨骼肌和神经组织中异质度较高,外周血中异质度最低[7],因此外周血中的低异质度变异也要引起重视。研究表明,即使异质性水平远低于诱发线粒体疾病的临床阈值(通常约为60%~80%),该变异也会产生生物学效应[8],并且低异质度变异也可以遗传[9]。由于卵母细胞发育过程中的线粒体遗传瓶颈[10],子代的mtDNA异质度会出现随机增加或减少,当变异水平达到临床阈值时就可能会引起线粒体疾病。因此,准确了解mtDNA的异质性变异,包括外周血中异质度较低的变异,对于线粒体疾病的防控具有重要的作用。
综上所述,本研究通过使用新方法和传统基于lrPCR的mtDNA深度测序两种方法对10例样本进行平行试验,证明了相较于传统方法,新方法在同质性变异及高异质性变异检测时的能力相当,而在低异质度变异检测时的准确性更高,可以为临床和科研提供更为可靠的mtDNA序列信息。