APP下载

宏基因组高通量测序技术的临床应用:现状、挑战与前景

2024-01-03刁振丽李金明

协和医学杂志 2023年5期
关键词:病原体宿主基因组

刁振丽,李金明

1北京医院 国家老年医学中心 国家卫生健康委临床检验中心 中国医学科学院老年医学研究院,北京 1007302国家卫生健康委临床检验中心/北京协和医学院/中国医学科学院,北京 100730

当前,新型冠状病毒感染仍在全球流行,猴痘、埃博拉等一系列突发传染性疾病正在严重危害全球公众健康[1]。如何及时准确地实现对新发、突发或罕见病原体的检测是临床微生物学领域面临的严峻挑战。传统微生物学诊断技术主要包括分离培养、免疫学检测及微生物核酸(DNA或RNA)检测,然而受时效性、准确性及有限病原体检测范围的限制,传统微生物学检测技术难以满足临床复杂多变的病原体检测需求。宏基因组高通量测序(metagenomic next-generation sequencing,mNGS)技术是对标本中全部核酸进行高通量测序,并通过生物信息学分析以识别标本中病原体的检测方法[2]。近年来,mNGS技术凭借不依赖传统微生物培养、病原体覆盖广及无须预先假设存在的病原体等优势,已成功应用于多种类型临床感染性疾病的病原体诊断,新发、突发传染病的调查,耐药基因检测以及宿主免疫应答分析等领域。本文将概述mNGS检测国内外临床应用现状,并对该领域未来发展所面临的挑战与前景进行论述。

1 mNGS临床应用现状

1.1 诊断感染性疾病

在感染性疾病诊断领域,mNGS侧重于对病原体基因组的识别和分析[3]。近年来,众多独立医学实验室已广泛开展基于高通量测序的病原体检测并应用于不同类型感染性疾病(神经系统感染、呼吸系统感染、血流感染等)的病原体诊断[4]。广泛的病原体谱和无菌脑脊液标本使mNGS最先用于临床神经系统感染的诊断。mNGS诊断脑脊液标本中病原体的灵敏度为73%~92%,特异度为96%~99%[5]。在诊断神经系统感染时,mNGS与常规微生物学检测(即培养、免疫学检测等)的阳性符合率为80%,阴性符合率高达98%[6]。与脑脊液等无菌标本不同,呼吸道、泌尿生殖道等表面存在大量正常菌群定植,增加了mNGS检测的挑战性。mNGS检测肺泡灌洗液标本中病原体的灵敏度为95.18%,特异度为91.30%[7]。由于方法学和比较“金标准”的不同,各研究中mNGS诊断下呼吸道感染的性能存在较大差异,灵敏度为47.9%~100%,特异度为41.7%~100%[8]。因血液流经全身,不同感染部位也可将足量的病原体核酸释放入血液用于感染性疾病的检测,通过检测血液中的微生物细胞游离DNA(microbial cell-free DNA,mcfDNA)不仅可诊断血流感染也可用于难以取样或深部部位的感染(如心内膜炎、侵袭性真菌感染等),扩大了mNGS的检测范围[9]。第一个商业化的定量mNGS方法(Karius实验)检测350例疑似脓毒症患者的灵敏度为92.9%,特异度为62.7%[10]。能够检测来自全身的mcfDNA是mNGS的优势,但鉴定出病原体后如何结合临床特征判断病灶位置是实际应用中面临的难题。血液中也常会检测到来自皮肤、口腔、肠道等部位的微生物,且载量较低,需设置合理的阈值过滤掉低载量的微生物[11]。

1.2 发现未知病原体

mNGS广泛的病原体检测谱和发现未知病原体的能力使其成为新发、突发传染病的有效检测工具。2019年12月初,湖北武汉出现了一种不明原因的重症肺炎,宏基因组RNA测序在5 d内就鉴定并分析出了新型冠状病毒的基因组,而2003年SARS的鉴定耗时5月余,2013年H7N9的鉴定耗时1月余[12]。宏基因组Nanopore测序已成功应用于埃博拉病毒、寨卡病毒和新型冠状病毒等新发、突发疾病病原体的实时分析,可监测流行病学信息、识别病毒突变类型等[13]。

1.3 检测耐药基因

mNGS检测获得的微生物基因组信息不仅可用于物种鉴定,还可进一步分析其耐药基因。在临床实践中,为快速从物种组成复杂的临床标本中获得耐药基因信息,通常不进行基因组的从头组装,而直接使用Bowtie2或BWA等比对软件将reads比对到耐药基因参考数据库,或将reads拆分为k-mers后比对到参考数据库[14]。mNGS检测耐药基因的性能受多方面因素的影响,如病原体种类、抗生素类型、测序类型(DNA或RNA测序)等。mNGS预测下呼吸感染患者耐药基因的准确度为78%~87%,通过结合CRISPR/Cas9 靶向富集策略可将低丰度的耐药基因富集2500倍[15-16]。mNGS预测耐药基因的准确度尚需进一步评估,但随着靶向富集技术的发展和生物信息学分析流程的完善,准确检出耐药基因将不再是限制mNGS的主要瓶颈,而耐药基因的结果解读将是面临的重要挑战。在临床应用中,当标本来源于正常菌群定植或污染的部位时,耐药基因需从复杂多样的物种组成中明确来源菌种,此外检测到的耐药基因型与表型可能不一致[17],因此,当mNGS检测到可能存在相应的耐药基因时,需通过相应的抗生素敏感试验确认后,指导临床选择相应的治疗药物。

1.4 分析宿主转录组

最新的mNGS研究结合微生物物种鉴定和宿主转录组信息建立机器分类模型,进一步提高了mNGS诊断感染性疾病的性能。通过整合mNGS检测到的病原体信息、微生物组多样性和宿主转录组等多方位信息诊断下呼吸道感染患者的阴性预测值高达100%[18]。诊断由人体免疫失调引起的脓毒症感染是整合宿主-微生物mNGS分析的另一重要应用场景。利用mNGS检测血浆标本获得的宿主和微生物信息开发的集成脓毒症诊断模型可鉴定出99%临床诊断为脓毒症的患者[19]。联合mNGS检测结核分枝杆菌的高特异性和宿主转录组分类模型的高敏感性,诊断结核性脑膜炎的灵敏度高达88.9%,特异度高达86.7%[20]。充分挖掘单一mNGS检测获得的病原体、微生物组和宿主转录组信息以提高mNGS诊断感染性疾病的准确性是重要的发展方向。

2 mNGS面临的挑战

mNGS检测流程复杂,包括核酸提取、文库制备、上机测序、生物信息学分析和结果报告等,检测过程中每一步骤引入的变异均会影响检测结果的准确性。mNGS检测的影响因素众多且在不断变化中,需随时更新调整,因此mNGS不适用于体外诊断产品,现有的mNGS方法均属于实验室自建检测(laboratory-developed tests,LDTs)[21]。

2.1 核酸提取

核酸提取方法的选择依赖于待检样本类型。不同试剂盒对不同类型病原体的提取效率差异较大。例如,某些试剂盒对革兰阳性细菌或真菌等厚壁微生物的提取效率较差,采用DNA+RNA共同提取方法较单独提取RNA通常会产生较低的RNA病毒基因组覆盖率等[22-23]。珠磨法破壁能够提高厚壁微生物的提取效率,但随着珠磨频率的增加或时间的延长,存在基因组过度碎片化的风险[24]。因此,必须对选取的病原体核酸提取试剂盒进行充分的性能确认或验证,以明确所选试剂盒对不同类型微生物的提取效率。

2.2 去除宿主DNA

感染性标本(如痰液、肺泡灌洗液等)往往含有大量人类白细胞,导致测序结果中绝大部分核酸(90%,甚至>99%)为人源序列,从而降低了样本中低浓度病原体的检测敏感性[25]。为增加mNGS的检测敏感性,节约测序资源,实验室通常采用去除宿主核酸策略以富集微生物核酸,如采用渗透裂解或表面活性剂(如皂苷)等选择性裂解宿主细胞,然后用核酸酶分解宿主DNA[25]。然而,增加去除宿主DNA步骤延长了样本周转时间,增加了引入试剂中假阳性微生物的风险,可能导致检测偏倚。用于裂解细胞的化学试剂(如皂苷等),不仅可破坏宿主细胞,还可在一定程度上溶解微生物的细胞壁,特别是细胞壁较薄或无细胞壁的微生物,如病毒、革兰阴性菌等[4]。当用核酸酶处理宿主DNA时,这些释放出的微生物DNA也会不可避免地被分解,若该微生物浓度较低则易产生假阴性结果。无论采用何种方式去除宿主DNA,在考虑微生物富集效率的同时不应忽视造成的特定种类微生物漏检或引入外源性假阳性微生物的风险,因此,实验室在选择应用去宿主环节时需对所选方法进行充分的性能确认。

2.3 文库制备和测序

mNGS文库制备包括 DNA 片段化、末端修复、添加A尾、接头连接和PCR扩增富集(适用时)。对于低微生物量/浓度的临床标本,在接头连接后需进行文库扩增,一般12~16个循环[26]。文库扩增时会引入扩增偏倚,建议尽量不增加接头连接后扩增循环的次数[26]。我国各实验室在mNGS检测中应用最广泛的是illumina测序平台和华大测序平台,其中SE50是最常用的测序模式[4]。illumina和华大等短读长测序平台具有测序通量高且错误率低的优势,是目前临床mNGS检测的首选测序平台,但其存在操作繁琐、测序时间长且测序价格高等缺点[27]。长读长测序平台(如Oxford Nanopore MinION)的长读长、实时分析优势提供了mNGS用于耐药基因检测和病原体快速诊断的重要方向,但其具有较高的错误率(1%~10%)且测序通量较低[13]。测序深度的选择取决于mNGS检测的预期用途和成本预算。例如,若mNGS检测目的为耐药基因分析,则需比鉴定病原体更高的测序深度(10~100倍)[28]。因组织标本比体液标本中存在更多的人源核酸,相应微生物占比较少,在检测组织标本时实验室可通过增加测序深度提高微生物数据量[29]。由于临床标本中病毒载量普遍较低,用于诊断病毒感染的测序深度不应低于10 M[26]。在临床标本常见的人源细胞背景下(105cells/mL),20 M reads是推荐的测序数据量[30]。

2.4 生物信息学分析

mNGS的生物信息学分析流程主要包括数据质控、去除低质量的序列、去除人源序列和微生物序列注释等[3]。下机数据经拆分后可首先采用FASTQC或 MultiQC进行样本测序数据的质量评估,然后使用Trimmomatic、fastp、Cutadapt等软件进行数据质量过滤,包括过滤测序接头、低质量序列、低复杂度序列、重复序列等[31]。质控后的测序数据常采用 BWA(Burrows-Wheeler Alignment)、Bowtie、SNAP等工具,与人源参考基因组数据库(包括人基因组、转录组、线粒体、核糖体等)比对过滤人源核酸序列从而获得高质量的微生物序列。临床宏基因组物种分类通常基于reads比对的方式直接将微生物序列与参考基因组数据库中的序列进行比对分析,通过比对获得已知物种或功能基因序列的丰度,常用软件包括BWA、Kraken/Kraken 2等。数据库的选择对物种分类结果具有显著影响。全面的公共数据库“大而全”,但其存在大量错误注释、物种信息完整度差异大等问题,当比对到错误注释的序列后会产生假阳性结果;而精简的数据库可能遗漏新发现或罕见的微生物,导致假阴性结果[31]。因此,实验室需从公开数据库中挑选、整理、分类基因组序列,并进一步整理成本实验室微生物及人源序列比对数据库。理想的微生物参考数据库应涵盖相关微生物的全部遗传多样性信息,并避免含人源序列、低质量或错误注释的基因组序列[32]。

2.5 阈值的建立和结果解读

mNGS检测需在开展方法学性能确认阶段建立阳性阈值,以从测序结果中排除“湿实验”过程中各种来源的污染微生物和“干实验”中由于基因组同源导致错误比对的假阳性微生物等。在设置阳性阈值时可考虑如下度量标准:检测到的微生物特异性reads 数、标准化的每百万条reads中比对到该微生物的reads数(RPM值)、覆盖非重叠基因组区域的数目、以及外部无模板对照样本或内参的reads数等[21]。将mNGS用于感染性疾病诊断的主要挑战是区别上述判断为阳性的微生物是来自正常菌群、污染微生物或病原体。实验室应减少假阳性微生物核酸的引入,通过设置规范的工作分区、严格无菌操作、进行频繁且广泛的清洁、使用无菌处理的耗材等方式避免污染的引入[26]。另一方面,实验室应监测污染来源,通过日常设置阴性质控品(如健康人血浆、人工模拟体液等)及无模板对照(如样本收集/储存介质、核酸提取、文库构建试剂的缓冲液、无菌水等)长期监测实验室污染微生物的种类、丰度等信息,建立实验室环境及试剂常见背景微生物数据库,并保持动态监测与定期更新[33]。目前尚无统一的mNGS结果报告标准,在结果解读前,首先需对mNGS的测序质量、内参的回收量、阴性质控和无模板对照等情况进行评估[32]。对超过阈值的微生物需进一步判断为定植微生物、条件致病微生物还是致病微生物。mNGS结果解读时需要具有分子生物学、临床医学、临床微生物学和生物信息学等专业人员组成的跨学科团队,结合标本的类型及来源、患者的临床表现、抗生素治疗史及治疗反应、其他微生物学检测结果等综合分析该微生物的致病性,作出合理的病原学诊断决策[21]。必要时,可采用培养、血清学检测、荧光PCR、PCR-Sanger测序等传统技术确认mNGS的结果。如怀疑存在物种错误注释时,可使用 BLAST 软件手动复核[32]。

2.6 质量控制

在开展临床服务前,需对mNGS检测系统(包含人、机、料、法、环等)进行充分的性能确认。mNGS分析性能指标应包括但不限于精密度、准确度、灵敏度、特异度(包括抗干扰能力)和稳定性等[26]。实验室应建立室内质量控制的标准作业程序,设置弱阳性质控品、阴性质控品和无模板对照样本等[26],建立日常检测质量控制标准及关键点,明确该方法的分析性能指标以及检测的局限性。此外,实验室应定期参加室间质量评价/能力验证或实验室间比对,发现检测过程中存在的问题并积极完善,以保证检测结果的准确性[4]。

3 小结与展望

近年来mNGS技术在国内外高速发展,并受到广泛关注。其在提高感染性疾病(特别是急危重症和疑难病例)诊断水平方面发挥了重要作用,但检测方法缺乏标准化、人员认知和能力不足以及仪器试剂成本高昂是临床推广面临的主要障碍[1]。首先,标准化检测是推广mNGS用于临床诊断的基石,随着各种新技术、新方法的出现,迫切需要更多的方法学标准化研究以规范从临床适应证、样本采集、检测至结果报告的mNGS全流程。其次,培养熟练掌握标准操作流程、具备一定生信分析技能、拥有临床微生物学和临床医学背景知识的复合型人才,提高人员的知识储备和综合能力是目前临床开展mNGS检测的迫切需求。此外,各实验室开展宏基因组DNA或RNA测序的价格较高,一定程度上限制了mNGS的广泛应用[34]。然而,mNGS能够在一次测试中鉴定出所有潜在的病原体,可能比一系列的传统微生物学检测更具成本效益。因此,迫切需要大规模、前瞻性临床研究和经济学数据评估mNGS在改善感染性疾病患者临床管理方面的具体价值[8]。

充分整合mNGS获得的病原体信息、转录组信息和耐药基因信息等有助于综合提高对感染性疾病患者的临床管理水平,是mNGS的重要发展方向。相信未来大规模、前瞻性临床研究可更好地回答mNGS是否能以更低的费用改善感染性疾病患者临床管理这一问题。

作者贡献:刁振丽负责资料收集和论文撰写;李金明负责选题设计并审阅定稿。

利益冲突:所有作者均声明不存在利益冲突

猜你喜欢

病原体宿主基因组
牛参考基因组中发现被忽视基因
野生脊椎动物与病原体
病原体与自然宿主和人的生态关系
龟鳖类不可能是新冠病毒的中间宿主
伊犁地区蝴蝶兰软腐病病原体的分离与鉴定
病原体与抗生素的发现
表现为扁平苔藓样的慢性移植物抗宿主病一例
人乳头瘤病毒感染与宿主免疫机制
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组