罕见病实验室诊断技术的进展
2021-03-09王增阁
张 仪, 王增阁, 王 剑
(上海交通大学医学院附属上海儿童医学中心遗传分子诊断科,上海 200127)
罕见病又称“孤儿病”,是单病种发病率很低、极少见的疾病。此类疾病临床表型异质性大,在诊疗过程中易漏诊、误诊,加之治疗方法有限,不仅影响患儿的生存质量,亦使其家庭背负巨大的经济负担[1]。因此,罕见病的有效诊治是医学领域中亟待解决的一个问题。目前,国际上已确认约7 000种罕见病,患者总数约占人类疾病患者总数的10%[2-3]。随着罕见病诊断技术的进步,不断有新的病种被识别。我国人口基数大,使得罕见病并不“罕见”,然而多数临床医生未接受过系统的遗传学培训,限制了罕见病诊断技术以及治疗方法的有效运用[4]。
早发现、早诊断、早干预是控制罕见病病情发展的重要措施,而许多罕见病缺少规范化临床实验室诊断标准,规范化诊断技术是提高罕见病诊治效率的重要环节。本文就罕见病实验室诊断技术作一综述,旨在概括性分析各项技术的优缺点,帮助临床医生系统了解罕见病诊断技术的发展历程及趋势,理解和选择用于不同疾病的诊断技术。
1 细胞遗传学技术
1.1 染色体核型分析
染色体核型分析作为细胞遗传学检测的常用方法,自20世纪60年代问世至今,一直是临床检测染色体数目或结构异常的常规技术,以G显带核型分析为主,分辨率为5~7 Mb,是从细胞水平分析遗传物质,多用于检测三倍体、节段非整倍体及大范围染色体结构异常等,可检测染色体平衡易位及倒位。临床上常用于不孕不育症、超声提示异常、有致畸因素接触史、流产史或有家族史等患者的产前诊断,常见的染色体疾病如21-三体综合征、Klinefelter综合征、Tuner综合征、染色体易位等均可采用此技术进行诊断。染色体核型分析实验操作较为简便,可直观体现细胞遗传物质的全景,但分辨率较低、实验周期较长,且结果分析对专业性要求高。近年来,随着生物信息学技术的发展,CytoGPS等工具能够帮助收集、整合核型数据,提高数据的实用性,使下游的数据分析更为方便[5-6]。
1.2 荧光标记原位杂交(fluorescence in situ hybridization,FISH)
FISH是将探针标记上荧光素来检测DNA序列的一种杂交方法,能够分析染色体数目,帮助解析染色体(质)空间结构,研究染色质结构变异,包括易位、缺失、重复等。此方法具有简便易行、定位准确、灵敏度高及特异性高等优势,在临床诊疗中主要用于产前诊断和植入前诊断,检测细胞或组织样本是否存在染色体或基因异常,为各种遗传病的诊断、分型和预后提供有力依据[7-8]。FISH的分辨率高于染色体核型分析,在人类中期染色体上的分辨率水平为1~3 Mb,但检测位点有限,只能通过制备特异性探针检测已知位点。但即使多色荧光原位杂交(multiple-fluorescence in situ hybridization,M-FISH)的出现弥补了位点上的不足[5],也不能完全克服FISH的局限性。随着FISH技术的发展与完善,其分辨率得到改善,灵敏度不断提高,DNA纤维荧光原位杂交、比较基因组原位杂交(comparative genomic hybridization,CGH)、三维荧光原位杂交(three-dimensional fluorescence in situ hybridization,3D-FISH)等技术的出现和推广,相信未来FISH技术在罕见病实验室诊断方面的应用也会有所突破[9]。
1.3 染色体微阵列分析(chromosomal microarray analysis,CMA)
CMA是通过扫描全基因组检测染色体数目或结构异常的一项技术,又被称为 “分子核型”,可检测各种拷贝数变异(copy number variation,CNV)、单亲二倍体、杂合性缺失及嵌合体等染色体异常,并可对染色体的非平衡性变化进行准确的检测和定位[10]。由于CMA可更直观、准确地描述异常基因片段的来源,因此被认为是罕见病CNV检测的金标准[11]。CMA目前已广泛应用于胚胎植入前诊断、产前诊断、新生儿筛查及血液病诊断等领域,针对多发畸形、孤独症、智力障碍、神经肌肉疾病、先天性心脏病及先天性代谢性疾病等进行诊断。CMA具有高通量的特点,既能全面扫描基因组,又兼具极高的分辨率,可检出>1 kb的基因组CNV,因此可用于传统技术不能解决的疑难复杂疾病的诊断[12]。CMA也具有一定的局限性:(1)不能检测染色体平衡易位及倒位;(2)针对同一样本,不同检测平台得出的结果存在一定的差异;(3)常会出现一些临床意义不明的CNV,导致结果难以判读。尽管如此,大量的研究结果仍显示出CMA在罕见病诊断,尤其是产前诊断中的巨大优势[12]。近年来,CMA逐渐向集成化、小型化发展,芯片实验室的开发将CMA检测步骤集成在小型化平台上,无标记检测技术还将进一步简化未来的CMA设备[13]。
1.4 单分子光学图谱技术
单分子光学图谱技术可针对单个DNA分子描绘出有序的全基因组限制性内切酶酶切位点图谱,在分析髙复杂区重复序列和基因组结构变异等方面有极大优势。该技术通过内切酶对基因组DNA进行原位切割并标记荧光,切割后DNA片段的顺序保持不变,经超长单分子高分辨率荧光成像生成酶切位点分布图。将此技术与高通量测序技术结合,能够保持测序数据的序列顺序,克服读长短产生的误差,可辅助基因组精确组装[14]。单分子光学图谱技术还能用于致病性结构变异的检测,包括基因组内的DNA片段插入、缺失、重复、倒位、易位及DNA拷贝数变化等。美国BioNano公司推出的光学图谱平台用于临床检测的有效性已得到验证,该技术能够成功鉴定出经典结构变异疾病——杜氏肌营养不良症的各种结构变异,有望取代肩肱肌营养不良症的分子诊断“金标准”——Southern印记杂交技术[15-16]。该技术能够提供全基因组范围内的结构变异及其顺序,能够检测倒位和平衡易位等大小为kb级别的平衡变异,具有很高的灵敏度,但该技术无法检测到微小片段的缺失或插入。目前,该技术的样本处理、检测及数据分析流程正在不断被优化,相信单分子光学图谱技术的临床应用未来可期。
2 分子遗传学技术
2.1 基因组水平
2.1.1 聚合酶链反应(polymerase chain reaction,PCR)相关技术 PCR通过对特定DNA分子进行指数级扩增的方式,引领诊断技术真正迈入“分子时代”。实时荧光定量PCR在基因位点分型、拷贝数变异检测等方面有一定的应用价值,但由于其通量较低(单次只能对几个目标位点或区域进行检测),限制了其在罕见病诊断上的应用。另外,还有一些基于PCR的衍生技术,如限制性片段长度多态分析(restriction fragment length polymorphism,RFLP)及高分辨率熔解曲线(high resolution melting,HRM)等,可检测罕见病基因点突变类型[17];PCR结合Southern印迹杂交技术可用于检测三核苷酸重复序列突变(如脆性X综合征及脊髓小脑共济失调)[18]。
2.1.2 第1代测序(Sanger测序) 20世纪70年代,Sanger测序的问世标志着测序时代的开始。此技术基于双脱氧链终止法原理,具有高度准确及快速简捷的特性 。在技术上,Sanger测序能从单个碱基水平进行分析,弥补了细胞遗传学技术分辨率较低的问题。在适用范围上,对于临床上诊断较明确的单基因疾病,能得到更直接、准确的结果,如ATP7B基因突变导致肝豆状核变病[19]、TYR及OCA2基因突变导致白化病[20]等。迄今为止,Sanger测序仍是测序的“金标准”,在人类基因组计划中起到了关键性作用。相对于其他基因检测技术,Sanger测序的准确性更高,在基因小突变检测及验证方面具有很高的应用价值。但Sanger测序不适用于没有明确候选基因或候选基因数量较多的情况。
2.1.3 第2代测序(next-generation sequencing,NGS) NGS实现了大规模平行测序,可对全基因组进行序列分析[21],主要包括全基因组测序(whole genome sequencing,WGS)、全外显子组测序(whole exome sequencing,WES)与目标捕获测序。总体而言,NGS具有通量大、精度高及数据丰富等优势,使得研究人员能够精准定位其感兴趣的基因。WANG等[22]通过WES首次报道了HFM1双等位基因突变可导致人类隐性原发性卵巢功能不全。SCHOLL等[23]对醛固酮增多症和高血压患者进行WES,发现至少1个CLCN2突变与醛固酮增多症存在关联。在NGS未出现之前,鉴定新致病基因主要是依靠家系遗传连锁分析,不仅需要大家系、多个样本参与,而且周期较长,定位不准确[24],而WES只需对少数家系成员进行测序分析即可鉴定。如何对海量的数据进行准确解读是NGS面临的重大问题,需要依靠专业的遗传学与生物信息学分析团队来得到可靠的分析结果。随着测序费用的不断降低,生物信息的快速更迭,使结果的分析更加全面、更加精确。目前,NGS已成为罕见病基因诊断的主要方法,其不仅能检测几个碱基的基因小突变,也能分析基因组CNV。但由于NGS的读长一般只有150 bp左右,导致其无法准确检测三碱基重复疾病和具有同源性基因疾病的相关基因,如CYP21A2基因、SMN1基因等。
2.1.4 第3代测序 第3代测序即单分子测序,无需PCR扩增即可实现对单个DNA分子的测序。目前,第3代测序技术主要有2种,即单分子实时测序技术(Single-Molecule Real-Time sequencing technology,SMRT)和纳米孔测序技术,前者通过检测不同碱基标记的荧光信号进行测序,后者则通过检测不同碱基通过纳米孔的电信号进行测序[25]。第3代测序克服了NGS的许多不足,不仅发挥了单分子测序的优势,并且具有超长读长,SMRT平均读长可达10 kb,纳米孔测序技术可达5 kb;测序速度快且无需前期扩增,有效避免了扩增引入的系统偏向性;能够用于检测高度杂合的基因组、大的结构变异等[26-27]。MERKER等[28]利用第3代测序技术检测到PRKAR1A基因的结构变异,从而诊断出1例Carney综合征。尽管有诸多优势,但第3代测序错误率较高,SMRT可达到15%[29],虽然是随机性错误,可通过多次测序克服,但其在临床诊断中的应用仍有限。随着技术进步,第3代测序必定向长读长、低错误率发展,从而高效诊断罕见病。
2.1.5 多重连接探针扩增技术(multiplex ligation-dependent probe amplification,MLPA) MLPA是近年来发展起来的一项DNA定性分析和相对定量分析技术。其原理是针对目标基因设计多对杂交探针,在完成杂交连接等一系列反应后,将目标基因的拷贝数等比例转化为可供扩增的杂交探针的数目,多用于检测人类基因组序列中的微缺失和微重复,识别DNA甲基化状态,检测单核苷酸多态性和点突变,量化mRNA,可用于诊断脊髓性肌肉萎缩症、假肥大型进行性肌营养不良症及Prader-Willi/Angelman综合征等疾病的诊断[30]。MLPA操作简便、灵敏度高、特异性强、重复性好,但对杂质极其敏感,当存在罕见的多态性或点突变时,可能会减少探针信号,因此需要结合其他技术进行检测。MLPA对非整倍体异常的检测效能与经典染色体核型分析一致,能快速检测出染色体非平衡结构异常及经典方法不能检测到的微小CNV,但MLPA无法检测低水平嵌合、女性三倍体和平衡染色体异常,如倒位和易位等[31]。
2.2 转录组水平
NGS可对转录组进行测序,即RNA测序。RNA测序可检测样本中全部RNA的变异和表达水平,包括mRNA、微小RNA(microRNA,miRNA)、长链非编码RNA(long noncoding RNA,lncRNA)等,不仅可诊断某些致病机制涉及特定RNA的罕见病,还可帮助识别剪接位点变异所致蛋白质转录水平异常导致的罕见病。CUMMINGS等[32]利用RNA测序从遗传学角度诊断罕见肌肉疾病,检测骨骼肌样本RNA,表明RNA测序能够有效鉴别位于外显子区或深内含子区的有害剪接位点变异,总体诊断率可达35%。RNA测序在外周血RNA分析中的应用可提高临床诊断率,并减少意义不明变异对罕见病诊断的干扰;结合SpliceAI等预测软件进行剪接分析,可确定诊断级别的重要剪接异常,并阐明一些意义不明变异所产生的功能学效应[33]。RNA测序的临床应用面临着RNA易降解、组织样本获得困难、对照获得困难及生物信息学分析等诸多问题,但若这些问题能得到有效解决,RNA测序将可能成为罕见病诊断的重要方法。
3 蛋白质组学技术
蛋白质组学技术可分为蛋白质分离、蛋白质鉴定、蛋白质定量和蛋白质生物信息学分析。经典方法如色谱分析等可通过检测蛋白质水平等来辅助诊断疾病,但通量有限,无法满足临床需求。
蛋白质芯片、质谱等技术的出现,实现了对蛋白质表达水平、转录后修饰等的高通量检测,在疾病蛋白质组学及药物开发等领域被广泛应用[34]。蛋白质芯片主要分为:(1)分析蛋白质芯片,通过抗体捕获蛋白质来检测其表达水平及结合亲和力;(2)功能蛋白质芯片,分析蛋白质与蛋白质、核酸、药物等之间的相互作用;(3)反相蛋白质芯片,将待测组织细胞裂解物固定于芯片,进行定量分析及磷酸化水平、细胞信号转导等的检测[34]。质谱技术通过检测不同质荷比的离子及绘制图谱来分析蛋白质的性质,结合同位素标记法可进行准确定量。目前,临床常用的质谱方法包括液相色谱-串联质谱、基质辅助激光解吸电离飞行时间质谱等[34]。ROYAL等[35]应用质谱分析成功诊断出1例免疫荧光法检测免疫球蛋白阴性的单克隆免疫球蛋白沉积病(monoclonal immunoglobulin deposition disease,MIDD)。VU等[36]应用液相色谱-串联质谱成功检测到Tay-Sachs病患者神经干细胞的GM2神经节苷脂沉积[36]。GUO等[37]建立了一种基于二维纳米超高效液相色谱和质谱分析的方法,可从弗里德希氏共济失调患者血小板中检测到frataxin蛋白水平下调,该方法可用于疾病的辅助诊断或干预效果的判断。蛋白质水平检测是罕见病诊断的重要组成部分,蛋白质组学分析结果可能与疾病表型直接相关。
此外,X射线晶体学、核磁共振波谱等技术可以解析蛋白质的三维结构,从蛋白质性质上为罕见病诊断提供依据。但由于蛋白质翻译后的修饰及氨基酸残基之间相互作用等因素的影响,蛋白质水平检测的复杂程度远高于基因水平检测。这要求在发展核酸水平诊断技术的同时,也要注重蛋白质水平诊断平台的开发。
4 代谢组学分析
代谢组学分析可通过系统化研究小分子(相对分子质量<1 500 000)代谢产物,进行定性或定量分析,提示疾病发生过程中隐藏的生化机制,帮助筛查、诊断罕见病。代谢组学诊断方法主要包括靶向和非靶向2种,前者仅检测目标代谢产物相对于对照样本的变化情况,而后者全面比较分析样本和对照样本代谢成分的显著差异,并通过生物信息学和数据库联系对应生化通路。主要技术包括核磁共振波谱、质谱法、色谱法以及色谱-质谱联用技术。代谢组学检测已在临床上用于新生儿遗传代谢病的筛查。GRAHAM等[38]评估、整合了WGS数据和液相色谱-质谱非靶向代谢组学数据,确定了引起先天性代谢病的变异及其优先级,提示代谢组学检测对于罕见病,尤其是遗传代谢病的筛查、诊断具有重要意义。代谢水平的变化可实时揭示机体生理病理状态,代谢组学所反映的异常指标可能是疾病表型最为直接的证据。但代谢组学分析对检测人员相关专业技术和经验有很强的依赖性,生物体代谢物组成的复杂性及水平差异给分析方法的通量、精确定量、检测灵敏度和检测范围带来了巨大的挑战,因此代谢组学要在罕见病实验室诊断上充分发挥作用还有很长一段路要走。目前,学者们愈发倾向于通过集成多组学技术,将基因组学、转录组学、蛋白质组学和代谢组学结合起来,以克服单组学技术的不足,并将其更加全面、准确地应用于包括罕见病诊断在内的生物医学研究中,这为罕见病的实验室诊断提供了新思路[39]。
5 生化检测
生化指标检测也可辅助诊断罕见病,如血清铜蓝蛋白<80 mg/L是诊断Wilson病的有力证据[19];经典型21-羟化酶缺陷症患者血浆17-羟孕酮水平通常超过100 μg/L,是重要的诊断指标[40]。另外,酶活性测定也可结合临床症状对疾病进行诊断,如酸性α-糖苷酶活性测定法是诊断Ⅱ型糖原累积病的金标准[41]。值得注意的是,代谢物的生化检测虽能为一些罕见遗传代谢病的诊治提供思路,但由于某些标志物特异性不高,其对于疾病诊断的意义仍有待进一步的研究结果加以证实。
6 人工智能(artificial intelligence,AI)技术
目前,将AI技术与罕见病实验室诊断相结合是一个热门话题。AI技术可将多维度和规模化的大数据转化为临床可用的知识,在NGS的变异分析方面有着可观的应用前景,能够帮助分析变异可能产生的临床效应,进行变异分类,并且能够预测剪接位点变异,因此可作为高通量测序技术的数据分析方法[42-43]。美国Genomenon公司开发的Mastermind软件可识别任何临床背景下包含给定变异的所有研究,并依据临床相关性排序,提供全面的基因变异谱,从而缩短工作周期、提高诊断效率[42]。美国Illumina公司开发的SpliceAI软件可以预测基因组剪接位点的位置,并分析高通量测序技术数据,有效识别可造成异常剪接事件的非编码基因变异[43]。此外,人脸识别是一项关键的AI技术,能够通过辨别特殊面容帮助诊断罕见病。美国数字医疗公司开发的Face2Gene系统可通过照片识别疾病相关的面部特征,从而辅助识别罕见病[44]。因此,充分发挥AI技术的优势,尤其是其在实验室数据分析方面的高效利用,将会大幅提升罕见病实验室诊断平台的工作效率。
7 总结
罕见病的表型及遗传学异质性,使其易被漏诊和误诊,错过最佳干预时期。因此,提高罕见病的实验室诊断效率是目前优化罕见病诊治流程中极为重要的环节之一。随着科技的进步,针对罕见病的诊断技术已有了极大的发展,相关技术的优缺点见表1。经典的细胞遗传学和分子遗传学技术仍扮演着不可替代的重要角色,而单分子光谱技术、高通量测序、多组学分析、AI技术等新技术的推广和应用,可弥补已有方法的不足。
续表1
目前,随着“精准医疗”时代的到来,各类前沿的检测技术逐步被应用于临床。临床一线工作者需根据患者不同的临床特征择优选取诊断方法,将前沿技术与传统方法交替组合使用,才能更高效、更准确地诊断疾病。相信随着罕见病诊断技术的不断迭代,尤其是与妇产科学、生殖医学、遗传学及AI技术的相互渗透,人类会将生物分子与疾病之间的关系阐述得越来越透彻。届时,一定会有更为准确、简便的实验室诊断技术被开发出来,用以造福全人类。