不同浓度乙型肝炎病毒全基因组高通量测序方法的建立及其应用
2018-05-23王贤军刘云惠孟飞杨宁敏
王贤军 刘云惠 孟飞 杨宁敏
310006 杭州市第一人民医院检验科(王贤军);310030 杭州致远医学检验所有限公司(刘云惠、孟飞、杨宁敏)
乙型肝炎病毒(hepatitis B virus, HBV)是一种逆转录DNA病毒,发现变异株混合体是HBV免疫预防的关键[1-2]。目前,传统Sanger测序只能检测到宿主体内特定病毒株序列片段,对基因全长及大量的低频突变检测存在局限性,不能真实反映病毒在宿主体内的情况[3]。高通量测序可以在一次测序中对数十万到数百万条的HBV序列进行深度测序[4-5],可检测出病毒低频率突变。但由于血液中宿主核酸量大,干扰因素多,高通量测序前的文库构建成为HBV等病毒全基因组测序亟待解决的问题。尤其是针对低浓度的血液样品,需要探索建立一种切实可行的建库方式。本研究分别采用病毒核酸直接建库及病毒扩增子建库的方法,对高、中、低拷贝的HBV病毒血液进行高通量测序,从覆盖度、深度及宿主内单核苷酸变异分析(intra-host single nucleotide variations,iSNVs)对HBV基因组进行分析。
1 材料与方法
1.1病例选择入选2016年3~12月杭州市第一人民医院住院部收治的HBV感染患者18例为研究对象。本研究经杭州市第一人民医院伦理委员会批准。所有患者均签署知情同意书。
1.2病毒基因组提取将18份血液分别分离血浆大于500 μl,使用干净的EP管分装后,4 ℃,10 000 xg离心15 min,收集上清200 μl。按照PureLinkTMViral RNA/DNA Mini Kit(美国,Thermo Fisher Scientific公司)要求提取HBV DNA。最后,用25 μl RNAase-free水洗脱DNA后置于-20 ℃保存。
1.3病毒浓度测定及高通量测序样本选择采用乙型肝炎病毒核酸定量检测试剂盒(PCR荧光探针法)(中国,深圳市普瑞康生物技术有限公司),以提取的病毒核酸为模板,对HBV病毒DNA样本进行定量(拷贝/ml)。所有操作均按照试剂盒说明进行。根据HBV DNA定量的结果,选择3个不同拷贝数样品作为高通量测序对象:A.低拷贝数(2.67×103拷贝/ml)样品;B.中等拷贝数(4.95×105拷贝/ml)样品;C.高拷贝数(1.83×107拷贝/ml)样品。
1.4巢式PCR扩增引物设计及HBV基因组扩增由生工生物工程(上海)股份有限公司合成巢式PCR扩增引物,以3个不同浓度HBV核酸为模板,以AR1(Forward)5′-ACAGTGGGGGAAAGC-3′,P3(Reverse)5′-CTCGCTCGCCCAAATTTTTCACCTCTGCCTAATCA-3′为第一段第一轮扩增引物;以AF1(Forward)5′-GTCTGCGGCGTTTTATC-3′,P4(Revers-e)5′-CTGGTTCGGCCCAAAAAGTTG CATGGTGCTGG3′为第二段第一轮扩增引物进行PCR扩增。待第一轮PCR扩增结束后,分别以第一轮PCR产物为模板,以AR2(Forward)5′-AGA AACGGRCTGAGGC-3′,P3(Reverse)5′-CTCGCTCGCCCAAATTTTTCACCTCTGCCTAAT CA-3′为第一段第二轮扩增引物;以AF2(Forward)5′-TGCCCGTTTGTCCTCTA-3′,P4(Reverse)5′-CTGGTTCGGCCCAAAAAGTTGCATGGTGCTGG-3′为第二段第二轮扩增引物进行第二轮PCR扩增。巢式PCR扩增程序为:94 ℃预变性4 min;94 ℃变性30 s,58 ℃退火30 s,72 ℃延伸2.5 min,35(第一轮)/20(第二轮)个循环;72 ℃延伸5 min。反应均使用LA Taq聚合酶(5U/μl)PCR套装(日本,TaKaRa公司)。PCR产物经1.5%琼脂糖凝胶电泳检测后,送往生工生物工程(上海)股份有限公司进行Sanger测序,验证2段HBV基因片段正确性。
1.5文库的制备和高通量测序病毒核酸直接建库组:A、B、C三个不同浓度的核酸经Qubit2.0定量后,直接按照Nextera XT DNA Library Preparation Kit试剂盒(美国,Illumina公司)说明进行文库构建。
病毒扩增子建库组:巢式PCR扩增分别进行两段第一轮PCR扩增,扩增产物分别使用磁珠纯化,再进行第二轮PCR扩增后,磁珠纯化且用Qubit2.0测定浓度,等摩尔混合,再次使用Qubit2.0定量,作为扩增子测序建库DNA样本。按照Nextera XT DNA Library Preparation Kit试剂盒(美国,Illumina公司)操作进行文库构建。两组文库构建完后,再次用Qubit2.0测定浓度,使用Aligent2000(美国,Agilent Technologies公司)检测待测序文库的质量。对混合样本使用Illumina MiSeq测序平台进行高通量测序。
注:X轴表示HBV基因组中的核苷酸位置,Y轴表示读取的位点深度图1 HBV参考基因组上的数据的覆盖和位点深度Note: X-axis represents nucleotide position in the HBV genome; Y-axis represents the site-depth of reads.Fig.1 The coverage and site-depth of reads on HBV reference genome
1.6数据分析对FASTQ格式的原始数据进行过滤处理。为了降低突变的错误率,过滤掉起始的10个碱基,并截断了每个> Q20读数的末端30个碱基。使用Bowtie2软件将其余的正确配对的数据与HBV B型参考基因组(GenBank序列号AB981583)进行匹配。使用映射算法中的默认参数调用iSNVs。
2 结果
2.1巢式PCR扩增结果经过两轮PCR后,第一段和第二段的产物分别为2 092 bp和1 320 bp。Sanger测序的结果表明,PCR产物的序列属于HBV全基因组。由此可见,不同浓度的HBV样品可以采用本研究中使用的巢式PCR扩增HBV全基因组。
2.2病毒核酸直接建库对高通量测序的影响病毒核酸直接建库组,经过高通量测序后,获得原始数据。过滤掉低质量数据后,获得平均177万的数据用于下一步的生物信息学分析,其中样品A有1.6 M数据,样品B有1.7 M数据,样品C有2.0 M数据。将数据中人类基因组数据剔除,剩余数据匹配到病毒数据库。结果显示,匹配到HBV基因组的数据量很低,在高拷贝数样品C和中间拷贝数样品B中仅分别匹配10个数据和4个数据,而低拷贝数样品A没有数据匹配到HBV基因组。这表明,病毒核酸直接建库不能应用到高通量测序中,尤其是病毒含量低的样本,因人类基因组数据干扰过大,使得测序后有效数据量极少。
2.3巢式PCR扩增子建库对高通量测序的影响巢式PCR扩增子建库组,将高通量测序的原始数据经过过滤低质量数据处理后,获得每个样品平均6 034个待分析数据,范围从5 395至6 806。处理后的双末端读数与HBV基因组的参考序列比对,3个样品匹配率都接近80%。而且每个样品都具有相近的量级,说明本次高通量测序覆盖程度和深度良好,见表1。根据3个样品的测序覆盖度和深度图可以看出:HBV基因在nt1 823~nt1 841位置的测序深度不足,这是由于HBV基因组结构在此位置存在缺口;测序结果在nt500~nt750的位置也具有较低的深度,这是因为该片段DNA在相邻扩增子之间序列重叠造成,见图1。这种两组较低测序深度是不可避免的。因此,不同拷贝数的样品通过巢式PCR扩增子建库,经过高通量测序,能够获得均匀性数据且数据偏差低。
表1 扩增子高通量测序结果
Tab.1The results of amplicon-sequencing
2.4巢式PCR扩增子建库测序iSNVs分析基于与Bowtie2比对的结果,用SAMTOOLS 软件对iSNVs进行比对。由表2可知,3个样品均识别出了iSNVs,平均突变深度为64。对27个iSNVs进行了深入研究,突变频率最低为0.02,最高为0.8。在特殊情况下,参考碱基突变为低频率的两个不同碱基。结果发现27个iSNVs中有15个发生在逆转录(reverse transcription, RT)区域,有13个突变频率≤20%的iSNVs,表明低频突变在大多数HBV患者中广泛流行。RT区的突变出现在所有低拷贝数和中等拷贝数样品中,而在高拷贝数样品中几乎没有突变。
3 讨论
HBV是已知感染人类最小的DNA病毒,基因组仅有3.2 kb左右。HBV基因组是部分双链结构,存在有2处缺口[6],导致了HBV全长基因组扩增困难。1995年Gunther等[7]设计出避免延伸跨越缺口区的引物,解决了一步法扩增出HBV基因全长的问题,但对低拷贝的样本灵敏度不高。为了解决灵敏度不高的问题,陆续有研究[8-10]提出采用巢式PCR法扩增HBV基因组,并成功扩增了低拷贝数HBV基因组样本。前期,本研究尝试采用一步法扩增低拷贝HBV样本基因组,结果7个低拷贝样本中有6个扩增失败。此次采用两步巢式PCR成功扩增了高、中、低拷贝数的HBV基因组全长,并比较了扩增子建库和病毒核酸直接建库对高通量测序结果的影响。
表2 3个样品中检测到的iSNVs情况
结果发现,相比病毒核酸直接建库测序,扩增子建库测序在数据量需求方面具有巨大的优势。在本研究中,病毒核酸直接建库测序剔除了176万个有效读段数据,只有几个读数可以匹配到HBV基因组。然而,扩增子建库测序可以匹配到HBV的整个基因组。病毒核酸直接建库测序可用数据量低,推测可能是样本在HBV核酸提取过程中人类基因组污染造成,或者是样本出现了溶血现象。在本研究中,尽管3个血浆样本中HBV基因组的拷贝数差异很大,但巢式PCR测序产生的读数几乎没有差异。此外,巢式PCR扩增建库增加了HBV的拷贝数从而增加了测序的有效读数量。对于低拷贝数样本,尤其是低质量病毒样本,高通量测序时应优先选择巢式PCR与高通量测序相结合的测序方法。这种方法不仅能够获得较好的数量产量,还能够检测到传统测序或直接测序无法获得的低频碱基突变情况。
长期使用核苷(酸)类似物治疗进行抗病毒治疗会导致病毒基因组变异。基因组变异对抗病毒治疗的效果的影响尚不清楚,但已有报道指出病毒基因组变异可加速疾病的发展进程[11]。本研究中,虽然未发现已知与核苷(酸)类似物治疗相关的突变位点,但3个样本中发现的27个iSNVs中的15个RT编码区,提示使用核苷(酸)类似物治疗HBV感染时要重视RT区域的突变。本研究发现HBV基因组RT区的所有突变均出现在低拷贝数和中等拷贝数样品中,而在高拷贝数样品中几乎未发现。前期也有研究报道,HBV含量低的样本(<105拷贝/ml)中核心蛋白(HBc)突变频率高于HBV含量高的样本(> 105拷贝/ml)[12]。HIV-1感染的研究中也发现类似的现象,HIV-1病毒含量低(<103拷贝/ml)的样本中基因组含有较多的抗性突变[13]。本研究表明HBV基因组的突变更容易发生在低拷贝样本,RT区域的基因突变可能在HBV感染和治疗中起着重要作用。
综上所述,本研究建立了一种方便、经济有效的方法来揭示不同浓度HBV基因组和突变的完整情况,为研究HBV突变变异、基因蛋白功能、抗HBV细胞因子、乙型肝炎病患个体化检测治疗等提供了丰富的理论和技术支持。后期的研究应该对低频突变更加重视,特别是低拷贝数样本中的低频突变。
利益冲突:无
参考文献
[1] Locarnini S, Zoulim F. Molecular genetics of HBV infection[J]. Antivir Ther, 2010, 15 (Suppl 3):3-14. DOI: 10.1080/10584580802096531.
[2] Castelain S, Descamps V, Brochot E, et al. High association of T1858-G1896 precore mutations with impaired base pairing and high hepatitis B virus DNA levels in HBeAg-negative chronically infected patients[J]. Arch Virol, 2017,162(7):1913-1920. DOI: 10.1007/s00705-017-3312-6.
[3] 张书凤, 华文浩, 何艳群, 等. 乙型肝炎病毒基因型耐药检测和临床因素分析[J]. 国际检验医学杂志, 2016,37(17):2376-2378. DOI:10.3969/j.issn.1673-4130.2016.17.007.
[4] Szpara ML, Parsons L, Enquist LW. Sequence variability in clinical and laboratory isolates of herpes simplex virus 1 reveals new mutations[J]. J Virol, 2010, 84(10):5303-5313.DOI: 10.1128/JVI.00312-10.
[5] Barzon L, Lavezzo E, Costanzi G, et al. Next-generation sequencing technologies in diagnostic virology[J]. 2013, 58(2):346-350. DOI:10.1016/j.jcv.2013.03.003.
[6] Feitelson M. HBV Genome Structure and Expression[M]. Molecular Components of Hepatitis B Virus. Springer US, 1985:132-143.
[7] Gunther S, Li BC, Miska S, et al. A novel method for efficient amplification of whole hepatitis B virus genomes permits rapid functional analysis and reveals deletion mutants in immunosuppressed patients[J]. J Virol, 1995,69(9):5437-5444.
[8] Taha SE, El-Hady SA, Ahmed TM,et al. Detection of occult HBV infection by nested PCR assay among chronic hepatitis C patients with and without hepatocellular carcinoma [J]. Egyptian Journal of Medical Human Genetics, 2013, 14(4):353-360.DOI:10. 1016/j.ejmhg. 2013.06.001.
[9] 张天英, 陈清瑞, 杨炳春, 等. 高灵敏度巢式PCR方法扩增HBV全长基因组[J]. 厦门大学学报(自然科学版), 2011,50(5):947-950.
[10] Vincenti D, Solmone M, Garbuglia AR, et al. A sensitive direct sequencing assay based on nested PCR for the detection of HBV polymerase and surface glycoprotein mutations[J]. J Virol Methods, 2009,159(1):53-57.DOI:10.1016/j.jviromet.2009.02.027.
[11] 王慧, 高春芳. 乙型肝炎病毒基因变异与肝癌的相关性研究[J].中华肝脏病杂志, 2013, 21(10):788-792. DOI: 10.3760/cma.j.issn.1007-3418.2013.10.020.
[12] Sendi H, Mehrab-Mohseni M, Shahraz S, et al. CTL escape mutations of core protein are more frequent in strains of HBeAg negative patients with low levels of HBV DNA[J]. J Clin Virol, 2009,46(3):259-264. DOI: 10.1016/j.jcv.2009.08.002.
[13] Prosperi M C, Mackie N, Di Giambenedetto S, et al. Detection of drug resistance mutations at low plasma HIV-1 RNA load in a European multicentre cohort study[J]. J Antimicrob Chemother, 2011, 66(8):1886-1896. DOI: 10.1093/jac/dkr171.