APP下载

全基因组测序在结核分枝杆菌研究中的应用

2020-01-08张洁任怡宣潘丽萍张宗德

中国防痨杂志 2020年7期
关键词:谱系流行病学分型

张洁 任怡宣 潘丽萍 张宗德

在全球范围内,结核病是导致死亡的十大原因之一,据估计每年新增的结核病患者超过1000万例[1]。越来越多的新发及复发结核病患者对一线抗结核药品利福平和异烟肼产生了耐药性(即耐多药结核病)[1]。在过去的几十年中,分子生物学方法已经被广泛应用于结核病的诊断和结核分枝杆菌(Mycobacteriumtuberculosis,MTB)的耐药性分析。基因分型技术为许多低发病率国家的结核病分子流行病学研究提供了重要的帮助,有助于发现疫情[2]。随着生物信息的发展,测序技术的日益成熟,且成本逐渐降低。以基因组DNA为基础、计算机技术为辅助的全基因组测序技术已经广泛应用于对MTB的研究中,并迅速从实验室研究转向临床和公共卫生应用, 为解决MTB的传播和耐药问题提供了很大的帮助。

一、全基因组测序在结核病流行病学研究中的优势

高收入且结核病低流行国家的结核病监测系统中,重要的一个环节是接触者追踪,针对的对象是接触传染性结核病的人群,以便确定应接受预防性治疗的接触者,并减少进一步的传播[3]。但是流行病学调查耗费时间长,劳动强度大,患者之间通过短期或临时接触而产生的流行病学联系不容易被发现。而分子流行病学整合了现有的流行病学数据和分子分型结果,在结核病传播链的研究中起到了极其重要的作用。

在过去的20年里,分子分型方法极大地提高了大家对结核病流行病学的认识。目前有3种主要的基因分型方法:即IS6110限制性片段长度多态性(restrictionfragment length polymorphism,RFLP)分型法、间隔区寡核苷酸分型(Spoligotyping)和多位点数目可变串联重复序列 (variable number of tandem repeats,VNTR)分型。这些常规的基因分型方法在评估同源性方面价值有限。全基因组测序(whole-genome sequencing,WGS)方法是利用DNA测序平台重新构建生物体基因组的完整DNA序列。瑞士Stucki等[4]在一项全国性的研究中,对520例结核病患者分离出来的标本进行了标准分子分型(Spoligotyping和VNTR分型),鉴定出来的35个传播簇中的18个被WGS证明大于12个单核苷酸多态性(singlenucleotide polymorphisms,SNPs),这表明常规的基因分型方法可能会高估MTB在瑞士这种发病率较低的国家的传播[4]。而也有研究认为当使用常规基因分型工具时,外源性再感染而引起的结核病由于与第一次疾病发作间期出现的菌株基因型相似,可能会被错误地归类为复发。这些错误分类低估了MTB在高发病率环境中的传播[5]。由于不同的MTB菌株SNPs发生相同突变的可能性很小,因此,基于鉴定SNPs的WGS基因分型较其他分子分型方法具有更高的分辨率。

二、 WGS在MTB研究中的应用

(一)WGS在MTB谱系或亚种鉴定(菌株分型)中的应用

有研究认为,MTB最有可能起源于非洲,而在全球的传播主要受人类活动的推动,即人类的探索、迁徙、贸易和战争等活动均可推动MTB在全球的传播[6-7]。人感染的MTB具有高度的克隆性,根据SNP的差异和缺失可以将MTB复合群分为7个主要的适应人类的系统发育谱系,即第1谱系至第7谱系。而东亚地区占主导地位的是第2谱系,其中“北京家族”菌株是在全球传播和流行最为广泛的菌株之一[8]。WGS证实了东格陵兰及加拿大魁北克省努纳维克分离的MTB菌株大多来自第4谱系(欧美系)[9-10],越南的研究表明,长期潜伏性感染的MTB第1谱系以及最近引进传播的“北京家族”和第4谱系菌株,导致了该地区结核病传播的复杂性[11]。上海的结果研究表明,虽然我国结核病患者数多,但MTB的遗传多样性却不大,我国MTB 99.4%属于第2谱系和第4谱系的3个子谱系[12]。

(二) WGS在结核病发病模式及疫情控制中的应用

结核病患者发病主要有两种途径,一种是既往感染过,之后经过较长时间的潜伏而发病,称为内源性复燃[13];另一种为近期传播导致的结核病。MTB产生耐药可能是两种机制造成的:一是治疗不足引发的获得性耐药;二是感染耐药MTB(原发耐药)。WGS可以通过比较不同患者分离出来的菌株基因型是否相同以及同一患者前后两次发病时分离出来的菌株基因型是否相同从而判断结核病发病原因及耐药原因。而区分患者的发病模式对结核病控制策略的制定具有非常重要的意义,如果一个地区由于近期传播导致的结核病患者比例较高,说明结核病正在传播,应该将主动迅速发现传染源、切断传播途径作为防治工作的重点;而如果大部分患者是由于内源性复燃引起的,证明结核病的传播发生在过去,应该将对患者进行规范化治疗和管理作为防治工作的重心,可以对既往感染者中的高危人群进行筛查和采取预防性干预措施[13]。

结核病高负担国家的结核病暴发调查往往仅限于调查家庭成员和其他密切接触者,而在结核病发病率较低的国家,结核病控制的目是制止结核病的传播,因此,除了结核病的早期诊断和治疗外,调查结核病暴发情况也是非常重要的[14]。越来越多的研究表明WGS在MTB疫情控制方面发挥着重要的作用[15]。在一项对伦敦广泛耐药结核病(XDR-TB)暴发的调查中,采用WGS后证实了患者之间的关联性,并指导了对早期患者的治疗[16]。使用WGS进行全国疫情调查被越来越多的国家使用,WGS也被应用于国际跨境疫情的调查[17]。

在缺乏广泛的流行病学数据的情况下,基于WGS的系统发育树可以用来识别可能的传染源、超级传播者和确定传播方向。上海的一项研究表明,大约1/3的耐多药结核病患者归因于最近的传播,与传统的基因分型方法相比,WGS目前在区分临床MTB分离株基因型方面具有许多优势,并且可以有效地研究MTB分离株的传播动力学。WGS可提供更明确的证据,证明耐药突变是沿传输链出现和固定的[18]。

(三)WGS在MTB耐药性及其预测中的应用

据WHO报道,2017年全世界有55.8万例结核病患者对一线抗结核药品利福平耐药,其中82%的患者为耐多药结核病患者;而这些耐多药结核病患者中,大约有8.5%为XDR-TB[1]。基于培养的传统技术方法仍然是耐药结核病诊断和药物敏感性试验(简称“药敏试验”)的参考标准,但是这些方法耗时长,并且对实验室的生物安全要求较高。近几年,在全球以GeneXpert MTB/RIF技术为代表的快速分子学方法检测MTB及利福平耐药已经普及。WGS技术已经鉴定出与MTB耐药相关的许多突变,其中一些突变与适应性相关,而另一些突变与额外的代偿性突变有关,这些突变可能增加适应性并能进行传播[19]。

WGS完整地描述了MTB耐药株的基因组特征,填补了我们对经典抗结核药品和新的抗结核药品是如何起作用的认识上的空白,并确定了使MTB能够逃避这些药物影响的特定突变。一些耐药基因的存在是众所周知的,例如,rpoB和rpoC基因突变导致利福平耐药、KatG和inhA基因的突变导致异烟肼耐药,dfrA-thyA双缺失与对氨基水杨酸耐药性相关[20-21]。WGS确认外排泵导致的药物外流是MTB对氯法齐明和贝达喹啉的耐药机制,这一方法仍然是鉴定正在开发的抗结核药物的作用机制的主要途径[22]。WGS还揭示了药物联合化疗如何能够有效地防止结核病治疗期间出现耐药。Trauner等[23]使用WGS 证明了多种活性药物的联合作用下,能阻止暂时性突变体在菌株种群内的固定而避免成为耐药优势菌;使用的药物越少,耐药性就越有可能产生并固定下来。

一些将基因组数据和其他功能数据结合起来的SNP数据库已经建立,MTB耐药株相关基因突变的一些开拓性数据库也在不断完善[24],基于软件和网络的工具,如MTB复合群综合分析服务器(the comprehensive analysis server for theMycobacteriumtuberculosiscomplex,CASTB)[25],能够从WGS数据网络中推断菌株的耐药性。有研究比较了这些工具在预测耐药性方面的敏感度和特异度,发现上述工具对一线抗结核药品有很好的效果;但对于二线药物则不太理想[26-27]。数据集和数据库的创建需要实施“大数据”分析方法(例如机器学习方法)[28],非参数机器学习方法,如分类树(CTs)和梯度提升树(GBTs)以全基因组关联(GWAS)为基础,从复杂数据集中提取信息,通过精密的计算和分析,在预测耐药性和发现新的基因突变方面将发挥重要作用。

(四) WGS在MTB微进化研究中的应用

临床上从同一患者体内分离出来的MTB样本中同时存在敏感菌株和耐药菌株的情况越来越引起重视,这种由于敏感和耐药菌株共感染或敏感菌株部分亚群通过微进化而发生的耐药突变称之为异质性耐药[29]。结核感染中的微进化现象比较复杂,宿主体内多个MTB亚克隆同时存在和发生微进化导致的异质性耐药,必将影响患者的治疗方案和监测,并使得推断传播链的工作复杂化[30-31]。WGS不仅可以区分患者是否为混合感染,还可以用来掌握MTB的耐药性形成过程,从而对MTB的变异程度进行更详尽的分析, 还能够在传输链中观察到变异性, 从而提高我们对MTB感染动力学的理解[32]。及时发现异质性耐药现象,有利于及时调整治疗方案并进行有效的临床治疗。

三、WGS技术面临的挑战

虽然WGS技术在MTB的传播检测中敏感度较高,但是用WGS构建传播网络的细节是很困难的。传播网映射高度依赖于采样范围、对疫情的全面抽样,以及宿主内环境的多样性。不同患者的菌株基因成簇,但却没有其他任何直接的流行病学联系,说明这种传播很大程度上是在社区环境中的偶然接触引起的[33]。传播网络的系统发育重建特别具有挑战性,因为菌株之间关系非常密切,但是MTB的进化速度很慢[24]。

WGS的操作流程还需统一化、标准化。工作流程的所有步骤,从DNA提取到测序、数据分析和报告,都应该标准化,并有良好的文档记录,还应该建立一个外部质量评估方案。2016年,美国食品和药物管理局发布了基于测序的传染病诊断指南草案,WHO和欧洲疾病预防控制中心等机构正在采取措施,实现MTB WGS的国际标准化[34-35]。

WGS用于MTB的检测结果及数据共享目前仍没有国际标准。报告应具有足够的灵活性,以解决最终用户对基因组数据解释的差异,并允许针对特定地区的治疗准则和格式要求进行定制。报告单的设计要避免使用缩写,重要信息使用加底色、粗体和其他方式标记,必要时纳入简要说明解释关键结果[36-37]。

WGS起源于一项基础科研技术,现在慢慢成为现代临床微生物学实验室的一部分,有望快速、更好地防控和诊断结核病,并对结核病暴发疫情进行详细、实时的流行病学研究。

猜你喜欢

谱系流行病学分型
神族谱系
昆明市院前急救患者流行病学的调查
儿童医院临床分离多重耐药菌的流行病学分析
CT在早期预测新型冠状病毒肺炎不同临床分型的应用
《春秋》公羊学胡毋生师授谱系补证
王锡良陶瓷世家谱系
健康体检常见慢性病及指标异常流行病学分析
新型冠状病毒及其流行病学特征认识
陕西现当代文学的谱系与基因
针刀治疗不同分型腰椎间盘突出症的研究进展