高通量全基因组检测防控遗传性出生缺陷新进展
2021-01-02金帆
金帆
二十一世纪临床遗传学最显著的进展无疑是高通量全基因组检测技术在遗传性疾病诊断中的大规模应用和推广[1]。以比较基因组杂交芯片(array comparative genomic hybridization,a-CGH)和单核苷酸多态芯片(single nucleotide polymorphism array,SNP array)为代表性的染色体芯片(chromosome array,CMA)[2]以及基于新一代 DNA 测序技术(next generation sequencing,NGS)的染色体拷贝数变异测序(chromosomal copy number variation sequencing,CNV-seq)[3]均可以诊断各类常染色体非整倍体及不平衡的染色体结构重排。这些方法不仅没有染色体核型分析对受检材料活性的苛刻要求和制备分析的繁杂过程,而且能够精准检测核型分析无法检出的各类染色体微缺失、微重复综合征,其中SNP array和高深度CNV-seq还可用于以杂合性缺失(loss of heterozygosity,LOH)为特征的单亲二倍体的检测。高通量全基因组检测技术具有快速、自动化等优点,已经成为筛查智力低下、生长迟缓、结构畸形等出生缺陷儿遗传学病因的重要方法。因检测不再依赖细胞增殖活性,故各类流产、引产或病故患儿组织均可用于检测,各类染色体微小片段缺失和重复构成的致病性拷贝数变异(copy number variation,CNV)不断被发现,多种长期原因不明的出生缺陷被确认为染色体微缺失、微重复或单亲二倍体基因印记性疾病[4]。我国许多产前诊断中心已将SNP array和CNV-seq作为胎儿遗传学诊断的常规选项,欧美部分发达国家已将SNP-array作为胎儿细胞遗传学诊断金标准。
基因病是指一类因致病基因DNA单个碱基变异、一个或数个碱基缺失或插入导致的疾病。单基因病种类众多,目前已知有4 000余种,部分单基因病的致病基因非常庞大,如进行性肌营养不良致病基因DMD全长可达百万碱基对;部分单基因病的发生可由不同基因突变所引起,如遗传性多囊肾候选致病基因有PKD1、PKD2、PKHD等。传统经典的DNA测序采用双脱氧核苷酸末端终止法,又称Sanger四色荧光链终止法测序,虽然准确性高,但单次DNA测序长度通常在150碱基对以内,测速慢,筛查确定单基因病突变效率低,曾长期制约单基因病的DNA突变确定及其再生育防止。
NGS又称高通量测序技术,包括模板制备、序列检测和数据分析等过程。NGS包括多个技术平台,如大规模平行测序、焦磷酸测序、合成测序、链接测序、离子半导体测序、DNA纳米球测序、基因组扩增转录子测序等。各技术平台测序原理尽管各有不同,但其共同点是能同步进行几十至几百万条短DNA分子大规模平行测序,获得海量的序列信息,并利用强大的生物信息学工具进行分析。通过疾病相关基因DNA片段单核苷酸变异、插入缺失、CNV等分析,既可经目标序列捕获测序快速完成临床诊断,明确单基因病致病基因全外显子和(或)全序列的突变检测[5];又可依据临床症状,实施症候群所有疾病候选基因(基因套餐)[6]、全外显子组(外显子组测序,whole exome sequencing,WES)[7-8],乃至全基因组DNA(全基因组测序,whole genome sequencing,WGS)[9]的突变检测,筛出致病突变,经传统测序确定,反向完成疾病的临床诊断。NGS的应用大幅降低了单基因病家系突变筛查的难度,使多种单基因病的精准基因的诊断和产前诊断技术得以快速普及。
多基因病是由多个基因与环境因素交互作用后发病的。上世纪八九十年代,人们曾试图使用Sanger测序等传统方法分析糖尿病等遗传度较高的多基因病的遗传因素,但均未获得确切结论。但自大规模组学技术涉入该领域工作后,人们发现部分多基因病实为表现度较低或外显不全的单基因病,部分为染色体微缺失、微重复,或某些染色体片段LOH。这些具有明确染色体拷贝数和DNA序列改变的患者可采用SNP-array或DNA突变检测完成诊断和产前诊断,从而降低此类遗传学出生缺陷儿的再出生风险。NGS结合功能基因组分析还揭示了多种常见疾病的致病相关基因,阐明了这些基因相互作用导致缺陷儿出生的遗传学基础,为相关遗传病的产前诊断提供了可能[4]。
建立在体外受精-胚胎移植(in-vitro fertilization and embryo-transfer,IVF-ET)技术之上的植入前遗传学检测(preimplantation genetic testing,PGT)可将遗传学检测提前到胚胎植入子宫内膜前,可预防遗传性疾病妊娠的发生。但受限于植入前胚胎活检材料的有限性(1~数个细胞),PGT-非正倍体筛查(PGT for aneuploidy screening,PGT-A)和 PGT-染色体结构重排检测(PGT for structural rearrangement,PGT-SR)长期依赖荧光原位杂交技术(fluorescence in situ hybridization,FISH),后者一次只能检测数个位点,提供极其有限的染色体异常信息,使胚胎宫内移植后着床率偏低。现活检材料先行全基因组扩增(whole genomic amplification,WGA),后续行CMA或CNV-seq全染色体组检测,显著改变了PGT-A和PGT-SR治疗周期的临床结局[10]。
PGT活检材料仅含一个或数个靶基因模板,因此等位基因脱扣(allele drop-out,ADO)一直是影响单基因病PGD(PGT for monogenic disorder,PGT-M)成功的技术瓶颈。现通过家系突变基因连锁SNP单倍体型分析,活检材料经WGA后,应用NGS完成10~20个以上SNP位点的同步检测分析,可将PGT-M的诊断准确率提高到99.5%以上。加上WGA产物的同步CNV-seq拷贝数分析,同时剔除染色体检测异常胚胎,PGT-M检测胚胎移植后妊娠率、健康婴儿出生率均有大幅提升。应用NGS检测第5天囊胚腔液或胚胎培养液的游离DNA,进行微创/无创PGD成功的报道[11]也已发表。
探索开展母亲外周血中胎儿源性细胞或DNA的非宫内侵入性胎儿遗传学诊断技术是产前诊断工作者数十余年来不懈的追求。如今应用NGS检测血清中游离DNA,分析胎儿源性占比,已可非常高效地检测21-三体综合征,对13、18-三体综合征也有很好的检出率。由此无创产前诊断技术(non-invasive prenatal testing,NIPT)进入临床应用阶段[12]。按国家卫健委的技术规范,目前NIPT仍为局限于胎儿13、18、21-三体综合征筛查的产前筛查技术。但实际应用中,NIPT检测其他染色体非整倍体和部分不平衡结构异常也有许多成功的报道。通过测序密度调整,可以筛查所有染色体数目异常、常见染色体不平衡结构异常和数种微缺失综合征的NIPT-plus试剂盒已经开发,并正在临床推广验证。目前NIPT/NIPT-plus仍然不能替代产前宫内侵入性诊断,但比较传统的母亲血清生化二联/三联染色体非整倍体筛查,NIPT/NIPT-plus的筛查效率是极为高效的,相信通过进一步的技术完善和成本降低,最终将会取代母亲血清生化筛查。
虽然NIPT应用于单基因病的诊断已见报道,但此项技术对家系突变明确、后代出生患儿高风险家系是否必要存有很大责疑。不过,将其应用于单基因病产前(胎儿)筛查的前景却是现实可行的。目前已有部分生物基因公司正在开发适用于部分地区相对高发单基因病的产前筛查NIPT试剂盒,若开发成功,则产前胎儿筛查仅限染色体非整倍体的历史将宣告结束,取而代之的将是产前非整倍体和单基因病筛查技术的同步开展[13]。
相对于目前仍处于技术探索阶段的单基因病NIPT技术,通过基因套餐、WES或WGS筛查夫妇单基因病突变携带,发现同一常染色体隐性疾病基因突变携带的夫妇或X-连锁隐性基因突变携带的女性[14],后续产前或着床前单基因病基因诊断[15],已成为目前国内外部分产前诊断中心和辅助生殖中心推荐的孕前或产前检测项目,目前该技术实际已具临床应用的可行性。
任何技术的发展均具有两面性,以SNP-array和NGS为代表的现代基因组学诊断技术在快速推进出生缺陷遗传学病因诊断及再出生防止工作进步的同时,也产生了许多新的问题和挑战。首先是检出CNV和基因DNA变异的致病性和良性变异的确认。人类能够真正阅读自己整个基因组碱基序列还不到20年,我们对如宇宙一样浩瀚的基因组DNA信息的认识才刚刚开始,已经报道并在各基因网站登记的许多致病性/非致病性的位点仍需要进一步验证,对不断增加的意义未明的变异/突变位点的解读已成为目前进行临床遗传学诊断的重大难题,亟需大规模数据整合、人群调查、功能验证,以提供同时反映基因外显率、表现度、表型差异等影响因素的综合信息,以更有效地指导和实施临床诊断和再出生预防。在大规模基因组学技术推广应用的今天,仍有部分遗传性疾病无法检出明确的致病基因,结合以基因修饰、基因表达调节为目标的表观基因组学和功能基因组学,最终阐明疾病的基因组学改变,是遗传学工作者的另一重大科学任务。
目前NIPT才起步不久,无创PGD仍处于幼儿期,由于两者检测的胎儿/胚胎游离DNA来源于绒毛/胚胎退行脱落凋亡的细胞,此类细胞为非正倍体嵌合细胞的可能性会显著高于正常生长的胎儿/胚胎细胞,其检测假阳性的风险可能增高。同时NIPT诊断范围和诊断致病性仍然局限[15],进一步积累数据,调整测序密度和深度,实现NIPT的全染色体组检测无疑将成为产前诊断的真正革命。
上世纪80年代提出,90年代开始实施的人类基因组计划,联合了美国、英国、日本、德国和中国的科学家,历时15年,耗资30亿美元,完成了人类第一张基因组DNA序列的草图[16]。2007年,人们用了200万美金,完成了DNA双螺旋发现者之一Waston博士的全基因组测序。今天,如果你想完成这样一次自身全基因组检测可能只需1万元人民币左右,快至数周即可收到检测报告。北大三院课题组依据极体活检,已经成功完成一个卵母细胞的全基因测序工作[17],这标志着人类已能够从卵子和受精胚胎诞生之日起,就了解自己的遗传物质的组成,不仅能防止遗传性疾病的发生,而且可用于迟发性、成年性疾病的易感性分析,进行个体基因型和表现型的选择。全基因组检测技术在伦理学方面的挑战同样是巨大的,建立和完善相应的法律规范显然也是出生缺陷儿遗传学诊断和再出生防治的任务之一[18]。
(本文由浙江省医学会推荐)