芯片捕获二代测序技术在新生儿疾病筛查中的应用*
2022-05-06王欣孙云王彦云洪冬洋管贤伟蒋涛许争峰
王欣,孙云,王彦云,洪冬洋,管贤伟,蒋涛,许争峰
(南京医科大学附属妇产医院&南京市妇幼保健院遗传医学中心,南京 210004)
新生儿疾病筛查指在新生儿期对某些危害严重的遗传代谢性疾病、先天性疾病进行群体筛查,以早期诊断和治疗,从而避免或减轻疾病带来的危害[1]。传统的生化筛查受限于检测方法,检测病种有限,且假阳性率较高,甚至存在漏筛[2-3]。随着测序技术的发展,基于基因检测的新生儿疾病筛查方法价值凸显[4]。本研究初步设计169种常见且危害严重的新生儿疾病组合,利用芯片捕获二代测序技术对150例干血滤纸片样本进行检测,以期为临床开展基因筛查积累经验。
1 对象和方法
1.1研究对象 由南京医科大学附属妇产医院遗传医学中心新生儿筛查室随机收集2021年1月至8月南京地区出生的新生儿干血滤纸片样本共150例,其中串联质谱技术初筛阳性样本98例,初筛阴性样本52例。本研究通过南京医科大学附属妇产医院医学伦理委员会审核批准(No.2021KY-071),所有新生儿家属均签署知情同意书。
1.2主要仪器及试剂 NanoDrop分光光度计(美国Thermo Scientific公司),Covaris LE220超声破碎仪(美国Covaris公司),Agilent 2100 生物分析仪(美国Agilent公司),MGISEQ-2000高通量测序仪(深圳华大智造科技公司),ABI Prism 3500XL高通量基因分析仪(美国Thermo Fisher公司)。QIAamp血液DNA提取试剂盒(批号:51185,北京天根生化科技公司),高保真DNA聚合酶(Phanta Max Master Mix)、打断酶(VAHTS Universal Plus Fragmentation Module) 购自南京诺唯赞公司,PCR纯化试剂盒(美国Invitrogen公司)。
1.3方法
1.3.1DNA提取 按照QIAamp血液DNA提取试剂盒说明书提取干血斑中基因组DNA,NanoDrop分光光度计测量DNA样本浓度。用于后续实验的DNA浓度≥1.6 ng/μL,剩余DNA样本置于-20 ℃保存。
1.3.2基因筛查Panel设计 新生儿疾病筛查病种的选择严格参照世界卫生组织(WHO)新筛病种准入标准[5],包括:(1)疾病危害严重,早期症状可能不明显;(2)有一定发病率,不及时干预预后不良;(3)筛查疾病可治疗;(4)适合大规模开展。Panel涵盖临床常见遗传病共169种,包括耳聋24种(氨基糖苷类药物诱导性耳聋、常染色体隐性耳聋等)、氨基酸代谢病21种(苯丙氨酸羟化酶缺乏症、四氢生物蝶呤缺乏症等)、有机酸代谢病18种(甲基丙二酸血症、3-甲基巴豆酰辅酶A羧化酶缺乏症等)、糖代谢病16种(糖原累积病、半乳糖血症等)、脂质代谢障碍11种(短链酰基辅酶A脱氢酶缺乏症、中链酰基辅酶A脱氢酶缺乏症等)、溶酶体贮积症13种(法布雷病、尼曼-匹克病A/B型等)、血液系统疾病8种(α地中海贫血、β地中海贫血等)、骨骼神经系统疾病12种(杜氏肌营养不良、脊髓型肌萎缩症等)、内分泌系统疾病13种(11-β-羟化酶缺乏性先天性肾上腺皮质增生症、17-α羟化酶缺乏性先天性肾上腺皮质增生症等)、免疫缺陷病10种(常染色体隐性重症联合免疫缺陷、X连锁淋巴增殖综合征等)、其他代谢病13种(肝豆状核变性、家族性高胆固醇血症1型等)以及其他遗传病10种(Gitelman综合征、Leber遗传性视神经病变等),对应的致病基因共计172个。
1.3.3芯片捕获二代测序 利用二代测序技术对致病基因的所有编码区进行捕获测序。利用打断酶将提取质控合格的基因组DNA均一化后打断成100~500 bp 的DNA小片段。通过磁珠双选分离200~250 bp的DNA片段,双选后进行接头连接和产物纯化,对纯化后的产物进行扩增和纯化,经TE回溶后完成DNA文库构建。文库经BMG进行片段浓度检测,质控合格后,可用于杂交。利用定制的IDT xGen 探针对目标区域序列进行捕获,将杂交文库进行pooling、定量;然后将pooling文库进行单链环化和滚环复制,环化后的文库在制得 DNA纳米球后,利用MGISEQ-2000高通量基因测序仪进行测序,测序类型为PE100+10,测序完成后,得到原始测序数据。核基因组有效测序深度≥100×,线粒体基因有效测序深度≥300×,目标区域的20×覆盖度≥95%。
1.3.4生物信息学分析 利用Illumina bcl2fastq软件将原始高通量测序数据从Bcl格式转换为Fastq格式。在过滤低质量读数后,测序读数与NCBI人类参考基因组(hg19/GRCh37)对齐。健康人群中变异位点的频率来自dbSNP(http://www.ncbi.nlm.nih.gov/snp)、1000基因组计划(1000 Genome Project)(http://browser.1000genomes.org)和外显子组聚合联盟(Exome Aggregation Consortium, ExAC) (http://exac.broadinstitute.org/)。根据美国医学遗传学学会 (American College of Medical Genetics, ACMG)[6]的指南和基于支持致病性的证据水平的文献[7-9]搜索解释变异。通过 OMIM (http://www.omim.org)、ClinVar (http://www.ncbi.nlm.nih.gov/clinvar) 和 Human Gene变异数据库 (http://www.hgmd.org)等数据库确定致病基因和致病位点并将其与疾病相关联。SIFT (http://sift.jcvi.org)、Variant Taster (http://www.varianttaster.org)、PolyPhen-2(http://genetics.bwh.harvard.edu/pph2)和PROVEAN( http://provean.jcvi.org/index.php)等软件用于预测受变异影响的生物学功能。
1.3.5Sanger测序验证 采用特定引物扩增DNA目标区域,利用Phanta Max Master Mix高保真DNA聚合酶进行扩增反应。PCR结束后取5 μL PCR产物和1 μL 6×DNA loading buffer混匀,经20 g/L琼脂糖凝胶电泳,验证PCR产物大小及质量(条带单一,无引物二聚体)。利用PCR纯化试剂盒纯化PCR产物,采用ABI Prism 3500XL高通量基因分析仪进行测序和分析。
2 结果
2.1可疑患者检出情况 150例样本中共检出4例可疑患病,阳性率为2.67%(4/150),涉及疾病分别为氨基糖苷类药物诱导性耳聋1例,常染色体隐性遗传耳聋1例,α地中海贫血1例,高脯氨酸血症Ⅰ型1例,患者具体临床情况见表1,Sanger验证结果见图1。其中,高脯氨酸血症Ⅰ型病例的串联质谱筛查结果为脯氨酸(Proline):482.08 μmol/L (参考区间:86~330 μmol/L),该例患儿家长拒绝召回复查。
表1 可疑患者情况
注:箭头标注变异所在位置或起始位置及碱基。
2.2致病基因携带情况 共检出88例致病基因携带者,致病基因携带率为58.67%(88/150),在致病基因携带者中,携带有1个致病基因变异的样本数高达40.7%(61/150),最多可见携带有4个不同的致病基因变异,占0.7%(1/150)。对于已检出可能患有某疾病的4例可疑患者,发现仍携带其他基因的致病变异(表2)。排除可疑患者后,携带频率最高的为耳聋基因GJB2和SLC26A4,其次分别是PAH、SLC22A5、DUOX2、SLC12A3、USH2A、ACADS基因(表3)。其余58例未检测出致病基因变异。
表2 致病基因携带数
续表
表3 致病基因携带情况
2.3与传统生化筛查(串联质谱技术)检出率对比 在病种相同情况下,基因筛查150例中筛查出可疑阳性1例并确诊,初筛阳性率为0.66%,阳性预测值为100%。当扩展至169个遗传病病种时,可疑阳性4例,并通过Sanger测序法明确诊断,即初筛阳性率为20%,阳性预测值为100%。
3 讨论
本研究通过对150例回顾性样本检测,最终检出4例可疑阳性患者(常染色体隐性遗传耳聋1例,α地中海贫血1例,高脯氨酸血症Ⅰ型1例及氨基糖苷类药物诱导性耳聋1例);检出88例致病基因携带者。携带频率最高的致病基因为GJB2和SLC26A4,其次是PAH、SLC22A5、DUOX2、SLC12A3、USH2A及ACADS,致病基因携带率与临床患病率一致。筛查病种从传统生化筛查约40种遗传代谢病拓展至169种,筛查病种的拓展能够尽早发现患儿并及时给予干预,也为罕见病的流行病学研究提供了有效信息,为临床诊断与治疗提供研究群体及实验依据。
国内基于串联质谱技术的传统生化筛查初筛阳性率约为1.88%~4.02%,阳性预测值约为1.05%~2.68%[10-11]。在本研究的150例样本中,传统筛查初筛阳性样本(指标高于筛查截断值)共98例,最终仅确诊1例高脯氨酸血症患儿,阳性预测值为1.02%。在病种相同的情况下,150例样本基因筛查的初筛阳性率为0.66%,阳性预测值高达100%。传统生化筛查易受多因素影响,初筛假阳性率较高[12],召回人数众多造成筛查成本增加,且产妇及家属易产生不必要的心理负担。而基因筛查基于遗传学基础明确基因变异信息,能够从源头上排除假阳性,有效降低筛查假阳性率,提高阳性预测值,同时,减少不必要的召回,进而缩短诊断周期。考虑到本研究样本数量有限,仍需进一步累积样本量对该初步结论进行深入验证。
笔者对基因筛查的临床应用尚有几点思考。(1)对于检测方法的选择。本研究采用的是芯片捕获二代测序方法,除该方法外,还有多重PCR富集二代测序法、外显子组测序法以及全基因组测序等可供选择[13]。多重PCR富集二代测序成本较低[14],但受限于多重PCR扩增技术,将上百个基因的全部编码区进行多重PCR扩增较为困难,更适用于热点突变的检测,而热点突变的检测容易造成致病位点的遗漏。外显子测序与全基因组测序检测位点较为全面,但成本过高,操作复杂,检测周期长,且对于意义未明突变位点的解读较为复杂[15],不适用于新生儿筛查项目。因此,笔者认为芯片捕获二代测序方法成本低廉,操作较简单,检测周期适中[16],更适用于新生儿筛查。(2)筛查方案的选择,即基因筛查作为一线筛查方案还是二阶筛查。二阶筛查是针对传统筛查检出的初筛阳性样本,利用原血片进行基因筛查。许多疾病尚缺乏生化筛查的标志物,如地中海贫血、耳聋等,因此具有较多病种的漏筛风险。作为一线筛查,目前的基因筛查项目仅判读已报道的致病变异及可疑致病变异。在临床表型不明确的前提下,对意义未明变异位点致病性的解读较为复杂。因此,将基因筛查与传统生化筛查相结合,在基因型和表型2个层面进行评估,则可在提高检出率的同时也可避免临床风险,目前可能是更合适的临床方案。(3)已有研究报道的基因筛查项目纳入病种不尽相同[17-18],与疾病存在地域或人种的差异以及部分疾病的发病率、干预效果未知等有关。发病率是根据临床诊断的患者数及该地区婴儿出生数统计获得,往往会低估发病率。本研究中,150例样本中有2例囊性纤维化致病基因携带者,提示许多尚未有流行病学报道的疾病在我国有一定的发病率。随着研究的深入,基因筛查病种组合也会随之调整和完善,进而完善相应疾病的流行病学信息。(4)新生儿基因筛查还应注意伦理学问题,尤其是对于筛查阳性家庭成员的遗传咨询、心理疏导也很重要。
新生儿基因筛查是出生缺陷防治领域的崭新课题,国内外零星报道均处于研究阶段,尚未真正转化应用于临床。本研究仅为初步探索,纳入样本较少,研究结果较为受限,但已可初步反映出基因筛查的重要临床价值和应用前景,有待进一步深入积累和探索。