纳米孔测序技术及其在病原学诊断中的应用进展
2023-11-24庄子孟雨桐刘润旸焦馨怡芦娟尹军张文杨世兴沈权
庄子, 孟雨桐, 刘润旸, 焦馨怡, 芦娟, 尹军, 张文, 杨世兴, 沈权
(1. 江苏大学医学院, 江苏 镇江 212013; 2. 南京海关卫生检疫处, 江苏 南京 210001)
基因测序技术起始于20世纪70年代,至今经历了几代的技术变革。第一代是1977年Sanger等[1]发明的基于双脱氧法为核心技术的Sanger测序,该方法具有测序精度高的特点,人类基因组计划即是以此方法为基础完成的[2],目前仍在广泛使用。在后基因组时代,一代测序通量低、平均测序成本高,已经无法满足生命科学对于基因序列获取的需求。2005年,罗氏公司推出第一台二代测序仪罗氏454,随后Illumina公司推出的Solexa技术和ABI公司推出的SOLID技术等较为成熟的测序技术相继出现[3]。二代测序技术是对传统测序技术的根本性变革,采用边合成边测序的原理,一次运行即可得到几百万条核酸分子序列。虽然二代测序技术相比于传统测序方法在测序通量和测序成本上有巨大的进步,但是其读长长度短,序列组装复杂,无法检测基因拷贝数变化和基因组结构性变异等缺点同样很明显[4]。近年来,基于单分子读取原理的不需要PCR扩增的第三代测序(third-generation sequencing,TGS)技术逐渐兴起。2014年,由牛津纳米孔科技(Oxford Nanopore Technologies,ONT)公司所研发的纳米孔测序仪得到了测序领域的广泛关注[5]。与其他传统测序技术相比,纳米孔测序不需要酶和荧光基团等标记,无需PCR扩增避免了扩增引入的错误,操作简单稳定,测序成本也更低,真正意义上实现了实时快速测序。此外,纳米孔测序也用于蛋白质一级结构的分析,相较于质谱技术大幅度提高了蛋白质测序的灵敏度,已经在疫情防控、病毒快速检测、疾病早期诊断等领域发挥越来越重要的作用[6]。
1 纳米孔测序的基本原理
DNA测序的本质就是识别A、G、C、T这4种碱基,传统测序技术所选用的方法主要是将4种不同的碱基转化为溶液pH值或者荧光信号,然后通过转化放大后的信号对碱基进行区分。而纳米孔测序技术则是将4种碱基转换为电信号,然后对电信号进行收集、整理、转化与数据输出。主要测序流程:将人工合成的多聚物膜浸没在离子溶液中,膜上布满了由解旋酶和蛋白孔两部分组成的跨膜通道蛋白-纳米孔,在膜两侧施加不同电压形成电压差,驱动待测链在马达蛋白的牵引下经解螺旋后以单链形式穿过纳米孔。碱基在通过纳米孔的恒定的电场时会引起电流的变化,使用计算机软件识别并推断出碱基类型,从而完成了DNA或RNA的测序[7](图1)。
图1 纳米孔测序原理示意图
2 纳米孔材料介绍
为了能够使体积极小的碱基顺利精确地通过纳米孔完成测序,纳米孔材料的选择就变得尤为重要。当下纳米孔材料主要分为两类:生物纳米孔和固态纳米孔。
2.1 生物纳米孔
生物纳米孔是由某种蛋白质分子镶嵌在磷脂膜上组成的天然纳米孔材料,可以进行灵活的生物化学修饰,目前以下3种生物纳米孔比较常见:
2.1.1 α-溶血素纳米孔 α-溶血素是由金黄色葡萄球菌所分泌的一种致病因子,可以插入纯净的双分子层脂膜中形成蘑菇状七聚体,组装成跨膜蛋白。α-溶血素纳米孔永久开通不关闭,耐强酸、强碱,高温和高电压下也比较稳定,是目前应用最为广泛的生物纳米孔材料[8]。
2.1.2 耻垢分枝杆菌孔蛋白A(Mycobacterium smegmatis porin A, MspA)纳米孔 MspA是耻垢分枝杆菌外膜的一种主要组成成分,能够同时从4~6个核苷酸中读取信息。相较于α-溶血素纳米孔,MspA纳米孔可以减缓DNA穿过纳米孔的速度,提高DNA单碱基的检测灵敏度,更有利于对单碱基的测定[9]。另外,MspA在极端的实验条件下(pH值0~14,100 ℃保持30 min)仍然能维持通道活性,显示其具有高度稳定、耐用的特性[10]。
2.1.3 噬菌体phi29纳米孔 噬菌体phi29纳米孔通道孔径为3.6 nm[11],可以允许双链DNA通过,同时较大的孔径也可以使其更容易通过插入或结合化学基团进行通道修饰来增强传感效应,以及实现大生物分子的检测[12]。
2.2 固态纳米孔
固态纳米孔主要是在氧化硅、石墨烯等固态材质上通过离子束刻蚀等技术制备出的纳米孔,因其尺寸可调、可靠性高、易修改等优点而越来越受到人们的关注,被广泛应用于DNA测序、蛋白质检测和能量转换等研究领域[13],其中比较常见用于DNA检测的固态纳米孔是氮化硅纳米孔和石墨烯纳米孔。虽然固态纳米孔非常稳定且具有良好的导电性[14],但是由于其厚度以及疏水作用等问题,所以在检测精度和准确度方面仍有一定缺陷。
虽然固态纳米孔材料仍尚未完善,但是相较于生物纳米孔准确率不高以及测序成本居高不下等缺点,固态纳米孔凭借其优良的物理性能以及价格低廉的常规半导体材料,在提高准确性的同时也极大地降低了测序成本;另外,固态纳米孔可以重复使用,通过大规模加工的方式可进一步降低单次测序的成本[15]。美国国立卫生研究院估计,在未来完成个人基因组测序的成本将不超过1 000美元,正在发展中的固态纳米孔测序技术给人们带来了希望[16]。
3 纳米孔测序仪(平台)介绍
截至目前所研发出的纳米孔测序仪种类众多,但都是基于纳米孔芯片来搭建的平台,不同的测序仪平台适用于不同需求,选择合适的测序仪能够有效提高实验效率。常见的纳米孔测序仪大致可以分为以下几类:
3.1 小型测序设备—MinION
便携性与实用性是MinION设备的主要特色,结合耗时仅为10 min的建库试剂盒,该设备可以在实验室、野外甚至太空环境进行实时测序(图2)。该设备可以容纳一个测序芯片,每个芯片理论上最大产出可达到50 Gb,是由ONT公司推出的第一款测序产品,也是目前测序平台中最成熟、使用最为广泛的一款[17]。
图2 MinION测序仪
MinION的建库方式大致可分为3种,分别是建库便捷、耗时较短的1D库,读长更长的2D库,以及可以对模板链和互补链同时进行测序的1D2库,其中以1D2库使用较为广泛[18]。MinION凭借其便携实用的特点以及低廉的价格(1 000美元),在新型冠状病毒检测与溯源、猴痘病毒基因组检测等新发传染病检测领域得到了广泛应用[19-20]。
3.2 中型测序设备—GridION MK1
通量较高的中型测序设备GridION可并行运行5张MinION芯片,理论最大产出可达到250 Gb,另外芯片之间独立运行,实时数据流传输,并可进行机载实时分析,可视为MinION的扩展版本。该测序仪对场地和实验条件要求较低,一般适用于中小型实验室。
3.3 大型测序设备—PromethION
最多可以容纳48张可独立寻址的高容量PromethION测序芯片,单张测序芯片内部最高通量达290 Gb,最新推出的PromethION 48可用于测序的通道数量多达144 000个,最大数据量可达14 Tb。该平台主要用于开展较大基因组或超群体规模测序项目。目前已经有多项使用PromethION开展的大型项目,例如人类X染色体、10万人的结构变异分析等项目[21-22]。
3.4 微型测序设备—Flongle
拥有MinION和GridION的转换器,可在一次性使用的测序芯片上进行快速、小型的测试,目前多用于微生物测序等数据量较小的检测或实验。
3.5 便携式集成化测序设备—MinION MK1C
于2020年1月最新上市的MinION MK1C(图2)重量仅为420 g,将MinION和Flongle实时、快速、便携式测序的优点与强大的GPU计算和高分辨率显示屏相结合,无论是短读长还是超长读长(最长>2 Mb)都可以进行读取,可以直接插入USB插口,通过一台配置简单的电脑即可完成测序[23],适用于全基因组测序、靶向测序、全转录组测序,在保证高产出的同时也维持了较低的成本。
4 纳米孔测序的特点
相比于其他测序平台,纳米孔测序作为一种新型测序技术在成本、速度、读长和准确率等诸多方面有着不同的特点,其优势十分显著,主要可以概括为以下几点(表1)。
表1 不同测序平台原理及优缺点比较
4.1 超长读长
相比较于一代测序(适用于少量样本小规模检测)和二代测序(罗氏454测序平台读长为230~400个碱基,Illumina测序平台大约读长为300个碱基,SOLiD测序平台读长为25~35个碱基)[24],纳米孔测序在读长方面有着巨大优势,能够直接测定2 Mb以上的读长。在纳米孔测序中,理论上读长长度可以等于输入片段长度,读长长度仅仅受限于所测单链DNA的长度限制[25]。长读长可以提供更完整、更连续的基因组组装,在具有大型结构变异和高水平重复区域的基因组中优势显著,例如长序列可以很容易地将甲基化分为不同的等位基因,从而通过靶向测序探索特异性的表观遗传变化[26];检测和分析细菌、病毒等病原体基因重组等结构变异,为分析病原体变异导致的耐药性等提供依据。同时相比于其他测序方法,纳米孔测序的超长读长可以推动采用液体活检的分子核型发展,不仅可以作为临床环境中癌症监测的工具,而且可以扩展到其他基于液体活检的领域,如无创产前诊断[27]。
4.2 直接测序
纳米孔测序可以直接测序原始DNA和RNA,这不仅节省了时间和成本,还意味着碱基修饰的信息(例如5mC,m6A)会被完整地保留并且包含在测序运行产生的原始信号信息中随时进行分析[28]。此外纳米孔测序技术的文库制备工作流程也更简单,通常仅需要10 min甚至更快。因为存在表观修饰的碱基激发的电流强度是不同的,所以在纳米孔测序中,DNA序列和修饰均可使用原始信号信息进行检测,能够直接读取出甲基化的胞嘧啶,检测的准确率更是高达92%~98%[29]。
4.3 简单便携
MinION的尺寸只有一支笔的长度,重量大约100 g,长度仅10 cm,可使用高速USB 3.0插入电脑,以其极小的体积彻底颠覆了人们对测序仪的印象,被称为“U盘测序仪”[30]。MinION的应用可以不局限于实验室环境,是首次用于外太空的DNA测序设备,尤其是在非洲等不发达地区使用更便携。
4.4 快速实时测序
相比于其他传统测序,纳米孔测序真正意义上做到了动态实时测序,支持在几分钟内就获得病原体鉴定等时间关键型应用的检测结果。用户可以在测序早期了解样本的质量和状态,也可以在获得足够的数据后停止测序。同时纳米孔测序技术所需的时长也是远远短于其他测序方法,在设备齐全的情况下,从样本和文库的制备到最终的测序分析总用时不超过40 min,这个优点在实验条件恶劣的情况下同样适用。在2019年爆发的非洲口蹄疫病毒(foot-and-mouth disease virus,FMDV)疫情中,德国科学家首次在移动手提箱实验室中利用纳米孔测序法建立了FMDV血清分型的快速测序方案,整个程序大致包括RNA提取、逆转录、第二链合成、测序和数据分析,可在5 h内完成,并且不依赖生物信息学家的参与[31]。
4.5 费用低
纳米孔测序技术的低费用体现在三个方面:首先是启动费用低,1990年完成的人类基因组计划耗资数十亿美元,后续的其他测序技术的启动费用也需要数十万人民币,而纳米孔测序技术的启动费用仅为1万元左右,使人类千元基因组计划的实施真正成为了可能[32];其次是可以按需测序,根据不同的实验条件选择相应的纳米孔测序仪以及所需的芯片数量;最后是对工作环境要求低,例如体积极小的MinION等设备可以在各种实验条件下测序,对洁净度、温度、湿度等条件没有特别要求。
4.6 可进行蛋白质测序
除了能够进行核酸测序外,纳米孔测序仪也被用于蛋白质的氨基酸序列测定。该方法的原理与核酸测序类似,解旋酶拖动连接了多肽的DNA分子使其缓慢通过纳米孔,从而通过读取电信号表征得出多肽的氨基酸序列。相较于质谱分析等方法,基于纳米孔的蛋白质测序技术显著提升了测序的灵敏度,随着技术的不断发展,磷脂膜纳米孔测序、基于表面增强拉曼光谱效应的纳米孔测序等方法的出现为蛋白质测序提供了新思路[33],将在以重要蛋白质为标志物的医学诊断中发挥重要作用。
5 在病原学检测中的应用
随着纳米孔测序技术的不断发展与成熟,纳米孔测序在病原学的实验室以及临床研究中,如疫情监测、宏基因组学研究、病原体检测等方面开始扮演重要的角色。
5.1 在新冠疫情中的应用
自2019年12月新型冠状病毒(SARS-CoV-2)疫情暴发以来,如何充分快速地了解SARS-CoV-2的基因组序列以及如何完成对于疫情的监控成为了首要难题。在接下来的解决过程中,基因测序技术有着举足轻重的地位。英国《柳叶刀》杂志更是在社论中指出,疫情之下,基因测序水平是卫生系统的核心能力。而在众多测序技术中,纳米孔测序技术更是以其直接实时测序、超长读长、快捷方便等优点成为众多研究人员的首选[34]。
SARS-CoV-2的诊断通常依赖于PCR核酸检测,但是该方法显示出较高的假阴性率和低敏感性(阳性检出率仅为30%~50%),从而导致临床高度疑似SARS-CoV-2感染患者或低病毒潜伏的“假阴性”现象频发,此外,PCR核酸检测无法同时检测其他秋冬季高发、症状与SARS-CoV-2感染相似的呼吸道病毒,给疫情防控和患者分流管理带来了挑战[35]。武汉大学刘天罡团队开发了纳米孔靶向测序(nanopore targeted sequencing,NTS)检测方法,该方法结合了病毒靶向扩增和纳米孔测序长读长、实时数据输出的优势,首次实现测序后4 h内高敏感性、高准确性同时检测SARS-CoV-2和其他10大类、40余种呼吸道病毒,其最低检测限高于目前广泛使用的qPCR方法的100倍。同时该方法不仅能够对SARS-CoV-2基因组变异情况进行检测以及监控,而且还可以检测其他10类呼吸道病毒,包括乙型流感病毒和丙型流感病毒等[19]。另外纳米孔测序平台对实验室的场地、设施要求不高,对实验场所的洁净度、温度、湿度等条件没有特别要求,因此NTS也适合不同级别的医院使用。
此外,中国科学家基于纳米孔测序技术对临床样本中的SARS-CoV-2基因组序列进行测序,通过测序、同步绘制参考基因组序列和实时分析输出数据,可在数分钟内在基因组水平确认SARS-CoV-2感染[36],再一次彰显了纳米孔测序技术快速便捷的优势。
5.2 在其他新发传染病中的应用
除了最近的新型冠状病毒疫情之外,在2015年于非洲几内亚爆发的埃博拉病毒疫情中纳米孔测序技术同样得到应用。欧洲移动实验室项目的团队就将纳米孔测序仪应用到了西非埃博拉疫情防控的第一线,该团队利用MinION测序仪在48 h内获得了14名患者的埃博拉病毒基因组[37]。在2020年于内蒙古地区突发的一起饲养野猪疫情中,实验人员采用纳米孔测序技术在4 min内实时检测出了非洲猪瘟病毒的特异性序列[38],这些信息能够帮助医生诊断疾病并快速绘制系统发育树,从而确定感染的源头,进而有效控制疫情。
在最近爆发的猴痘病毒(monkeypox virus,MPXV)疫情中,纳米孔测序技术同样起到了关键作用,得益于纳米孔测序技术快速、便携等优点,第一条MPXV基因组的测序和组装即是采用纳米孔测序平台完成的。到目前为止,大多数的MPXV基因组的测序均是采用该测序平台完成[20,39]。
5.3 在病原体检测及分型中的应用
对于临床样品的病原体检测来说,快速而又准确地得到鉴定结果尤为重要。然而在常见的感染性疾病的样品中病原体(特别是病毒)的载量通常很低,并且可能存在基因突变,常规检测方法容易产生假阴性。纳米孔测序技术凭借其诸多优点已经成为病原微生物快速检测最有前景的高通量测序技术[40]。
有报道称MinION能够在15 h内从咽拭子样本中同时检出人呼吸道腺病毒7型和甲型流感病毒H3N2型的多种基因序列,表明MinION具备快速检测多种病原体并进行分型的可行性[41]。在2019年2月于河北省发生的一起腺病毒疫情中,MinION测序分别在14 min和22 min内检测到混合样本和单个样本中的7型腺病毒序列,通过系统发育分析发现该毒株与北京一株毒株具有共同遗传来源[17]。
5.4 在宏基因组研究中的应用
宏基因组学是在微生物基因组学上发展起来的一种研究微生物多样性、获取新基因的一种新方法,自1998年由Handelsman提出宏基因组的概念之后,至今已有20多年的历史,其研究方法也逐渐成熟。宏基因组学的研究目的主要是进行流行病学诊断、发现新物种、筛选重要微生物菌种以及溯源病原菌等,但是目前成本较高,耗时较长,生物信息学分析难度较大[42]。
宏基因组学研究对于测序平台的读长要求很高,传统的测序技术很难满足它的读长需求,这个问题通过纳米孔测序技术可以得到很好的解决[43]。目前,在宏基因组研究中取得进展最快的是16S rRNA测序,存在于原核生物基因组中的16S rRNA被广泛应用于原核生物的分类研究[44],16S rRNA基因中不同的高变区在一定程度上代表着不同微生物间的进化差异。MinION技术具有超长的读长且允许设计的引物覆盖整个16S基因,对病原体的鉴定具有更高的分类分辨率。除此之外,纳米孔测序技术还可以对环境水样中的DNA和RNA病毒进行测序,用于快速现场分析以及检测环境病毒[45]。
6 结论与展望
纳米孔测序技术近年来发展迅猛,相比于其他测序技术,其凭借着超长读长、实时监测、简单便携等特点开始被广泛应用于各个领域。但是目前纳米孔测序技术也不尽完美,诸如分子运动时产生的波动对结果准确性的影响,脂质双分子层的不稳定性,DNA穿越速度过快等问题依然存在。不过纳米孔测序技术真正的魅力在于其巨大的潜力以及广泛的应用前景,随着超精度碱基识别模式软件等分析工具的出现以及化学试剂的更新,其测序的准确度和通量也在逐步提升,其中在原始读长、共有序列、变异识别、碱基修饰等方面的准确率可达99%以上[46]。不难预见,纳米孔测序技术将成为下一代常规测序仪器,并在各个领域的应用更加广泛,为生命科学的发展提供更大的推进力。