基于高通量测序的拷贝数变异检测技术在产前诊断中的临床应用*
2022-08-11吕康琪陈大洋阚丽娟综述张秀明审校
吕康琪,陈大洋,阚丽娟,熊 丹 综述,张秀明△ 审校
1.新乡医学院,河南新乡 453000;2.深圳市罗湖医院集团医学检验实验室/深圳大学第三附属医院检验科,广东深圳 518001
我国是出生缺陷高发国家之一,出生缺陷发生率高达5.6%,每年新增出生缺陷患儿约900 000例,出生时临床可见缺陷患儿数高达250 000例,这一严重现象给家庭和社会都带来了巨大压力[1]。其中80%以上的出生缺陷由染色体畸变引起,在染色体结构变异中最主要的变异类型是拷贝数变异(CNV)[2]。CNV是指染色体上DNA片段大小范围从1 kb到几个Mb的亚显微水平的基因组变异,包括缺失和重复两种类型[3]。由CNV导致的疾病目前没有有效的治疗方法,及时进行产前诊断是防治出生缺陷的重要手段。传统的产前诊断方法,如染色体核型分析、超声检查等因通量低、分辨率低、检测周期长等原因无法满足临床需求[4]。近几年,基于下一代测序(NGS)技术的CNV-seq为CNV的检测提供了新手段,美国妇产科医师学会(ACOG)已推荐CNV-seq作为胎儿结构异常时诊断评估的一线检测方法[5]。
1 检测方法
CNV-seq采用NGS技术对标本DNA进行低深度全基因组测序,再通过生物信息分析受检标本中是否存在CNV[6]。目前,序列深度法检测CNV是临床上广泛使用的检测手段,该方法根据CNV重复或缺失变异产生的测序深度信号来进行统计分析,若拷贝数发生重复变异,会显示较高的读取深度,若发生缺失,则出现较低的读取深度[7],见图1。序列深度法的检测流程主要有5步,(1)数据比对:将质量合格的下机序列映射到人类参考基因组上进行比对;(2)窗口划分:为基因组测序统计检验设定统计单位[8];(3)GC含量矫正:在DNA双链结构中,GC碱基对含3个氢键,高GC区域结构更加稳定,DNA不容易被打断,此稳定结构会影响测序片段深度变化而造成结果假阳性,为了使窗口深度更均一,需要对GC含量进行矫正[8];(4)断点分割:通过统计学方法分析序列深度,发现异常序列深度的窗口,对变异断点进行合并,找出变异区域;(5)可视化:通过展示条带分布与染色体核型标准图对全基因组的序列分布进行可视化。
图1 序列深度法检测CNV时缺失和重复的深度信号
由于CNV-seq技术局限、基因组自身特征、遗传复杂性等因素可能会造成CNV测序结果的假阳性,因此需要对检测出的CNV片段进行过滤[9]。过滤的具体原因包括以下几点,(1)染色体N区:技术局限导致染色体N区遗传信息无法检测,造成序列深度较低,可能引起假阳性;(2)染色体着丝粒附近:染色体着丝粒由高度重复DNA序列组成,影响序列深度异常变化,可能引起假阳性[10];(3)低于检测阈值数据:CNV-seq主要针对100 kb以上CNV造成的疾病,而对于<100 kb的CNV需要过滤。基于低深度测序技术原理,CNV-seq检测不能排除多倍体、单亲二倍体、染色体平衡易位、倒位、环状、低比例嵌合体等原因造成的疾病,但其具有通量高,成本低,DNA需求量低,操作简便,可检测低至5%的染色体非整倍体嵌合等优点,提高了变异检出率和临床适用性[2]。
2 致病性CNV解读考虑因素
需要注意的是检出的CNV并不都意味着异常或有临床意义。目前临床基因组资源中心(ClinGen)数据库收录的具有明确致病性的CNV共有2 817个,仅占据全基因组CNV的一小部分。应用CNV-seq技术可以检测到大量变异,但真正具有致病性的十分罕见,大部分变异因解读信息有限,只能被定义为临床意义未明,因此需要更多的研究确定其临床意义。为了明确实验室对CNV结果的评价分类并促进解读结果的一致性,国际上2019年美国医学遗传学与基因组学学会(ACMG)和ClinGin联合发表了CNV解读和报告指南[11],国内专家在2020年发表了《产前遗传学诊断拷贝数变异和纯合区域的数据分析解读及报告规范化共识》[12]。ACMG指南实现了CNV致病性的量化分类,将CNV分为5类:致病性、可能致病、临床意义未明、可能良性、良性。《产前遗传学诊断拷贝数变异和纯合区域的数据分析解读及报告规范化共识》对CNV的数据分析流程、报告标准和报告内容进行了规范[12]。尽管国内外都出台了相关指南和专家共识,但具体细节仍存在差异,特别是在解读报告的透明性、一致性上,各个临床实验室间差别较大。因此,对CNV的解读需考虑以下几个因素。
2.1CNV包含的基因 分析CNV涉及区域内的基因是解读CNV最常考虑的因素。首先应对CNV涉及的基因组构成进行讨论。考虑CNV中是否包含独特的、富含基因的序列或重复元件,分析CNV的重复或缺失片段是否包含蛋白质编码基因或其他已知功能的重要元件,若包含则CNV会对蛋白编码产生影响,造成临床表型异常,引起致病性[13];若仅涉及部分基因的拷贝数增加或缺失,则会造成基因断裂或编码序列改变,而涉及内含子序列的变异会对基因功能产生影响,使致病风险增加[14]。然而,若检测到的CNV未包含明确致病性基因而无法判断其临床意义时,应查询数据库或检索PubMed对基因进行评估。其次,应对CNV涉及的基因数量进行讨论,若包含的基因数量过多,则致病风险增加,如当拷贝数缺失区域包含35个及以上蛋白编码基因时,该CNV定义为可能致病;若包含基因数量少,则致病风险降低;需要明确的是,如果该变异区域包含的基因数量很少,但含有明确致病性基因,此CNV则被定义为致病性[15]。
2.2数据库 可用于解读CNV的数据库主要分为3大类:第1类为疾病人群变异数据库,主要收集临床表型、明确致病性基因等,包括ClinGen、DECIPHER、在线人类孟德尔遗传(OMIM)、HGMD数据库等;第2类为健康人群变异数据库,主要收集变异在自然人群中的分布频率、族群信息等,包括基因组变异体数据库(DGV)、gnomAD数据库等;第3类主要收集基因组学注释信息,包括基因内含子、外显子、5′端或3′端重要元件等,主要是UCSC、GeneBank数据库。
2.3文献查询 可以通过检索是否有相似CNV或变异区域所涉及基因的文献报道,帮助临床分析,为CNV解读提供新思路。常用的检索平台是PubMed、Web of Science、中国知网、万方数据知识服务平台等。
2.4家族遗传 在许多情况下,若检测到临床意义未明的CNV时,对父母进行基因组测序是十分必要的。当变异来自表型健康父母时,该变异致病性可能较低,若变异为新发,则致病性可能较高。在特殊情况时,可能还需要其他的家族标本(如兄弟姐妹)来确定特定的CNV是否与家族中的染色体变异相关。遗传异质性和遗传外显率也是影响基因型和表型关系的重要因素。低外显率是指外显率为5%~10%,这种基因组变异的临床表现很难被精准预测,且外显率会受到多种因素的影响,如种族、家族史、额外的CNV等[16]。
3 CNV-seq在产前诊断领域的应用现状
3.1CNV-seq与染色体核型分析的联合应用 20世纪70年代以来,传统的染色体核型分析是评估高危孕妇胎儿染色体异常的“金标准”。此技术可以检测胎儿染色体数目异常、染色体非整倍体、倒位、平衡或非平衡易位等结构异常[17]。染色体核型分析技术的分辨率为5~10 Mb,<5 Mb的异常很难被准确检出,而CNV-seq不能检出平衡易位、罗氏易位等结构异常,因此染色体核型分析与CNV-seq联合检测可以克服两种技术中存在的缺陷,为产前提供更可靠更全面的遗传诊断[18]。魏友华等[19]采用以上两种方法对905例羊水标本进行检测,均发现70例染色体数目异常、9例染色体嵌合体异常、7例染色体非平衡性结构异常,染色体核型分析额外检测到由罗氏异位引起的染色体数目异常,CNV-seq额外检测到10例明确致病性的染色体微缺失/微重复,两者联合应用将染色体异常阳性率从11.27%提升至12.38%。彭亚琴等[20]对164例孕妇进行检测,核型分析检出24例染色体核型异常,CNV-seq检出29例已知致病性和可疑致病性CNV,使致病性CNV检出率提高了3.05%,但CNV-seq未能检出3例染色体核型分析诊断为平衡易位、罗氏异位的异常。上述研究表明,核型分析和CNV-seq联合应用可以显著提高染色体异常检出率,有利于临床产前咨询评估,可为孕妇是否继续妊娠提供更加全面客观的依据。
3.2CNV-seq与染色体微阵列分析技术(CMA)的对比应用 CMA是一种已成熟运用于临床的高分辨率全基因组CNV分析技术,ACMG推荐CMA作为胎儿染色体异常时诊断评估的辅助手段[21],但该技术存在培养周期长、成本高、通量低、探针更新停滞等问题[22]。MA等[23]对67例嵌合体孕妇进行CNV-seq和CMA检测,CNV-seq的检出率为6%~92%,CMA的检出率为20%~72%。WANG等[24]对1 023例孕妇进行检测,CMA检出121例染色体异常(11.8%),CNV-seq不仅检测到了上述所有异常,并且额外检出了17例染色体异常。以上研究证明,CNV-seq较CMA对嵌合体有更高的分辨率和灵敏度。据上述研究分析原因发现,CMA未检出异常的原因是平台靶区探针覆盖不足或探针覆盖不到。
3.3CNV-seq在不同临床指征中的应用
3.3.1CNV-seq在超声结果异常中的应用 超声诊断是临床应用最广泛、最常见、公认无损伤性、可反复进行的医学成像技术,也是胎儿生长发育情况的重要判定指标之一[25]。对超声结果异常的病例进行CNV-seq检测,不仅可以帮助产前确定变异类型,而且有利于分析遗传原因。张秀群等[26]对137例超声检查提示胎儿结构异常的孕妇进行CNV-seq检测,发现有15例异常,其中8例为已知致病性CNV,超声结果分别是6例提示颈项透明层(NT)增厚或侧脑室增宽,1例提示胎儿尺骨缺如、左肾缺如、心室内多发强光斑,1例提示胎儿生长发育受限。CNV-seq不仅可以在超声结构异常病例中分析遗传变异,还可以在超声发现软指标的病例中探索病因,帮助临床深入分析病例特征,提升诊断价值。胎儿超声软指标多见于NT增厚,针对NT增厚,已有研究对临床病例进行了CNV-seq检测,发现在NT增厚的139例病例中检出45例CNV,除了33例是>5 Mb的染色体异常,余下的12例均是染色体微缺失/微重复[27]。
3.3.2CNV-seq在高龄孕妇中的应用 随着三孩政策放开,高龄(≥35岁)孕产妇的数量明显增加,研究表明胎儿染色体异常的发生率与孕妇年龄密切相关,因此为高龄孕妇提供产前诊断是减少出生缺陷儿的有效手段[28]。王游声等[29]对孕妇年龄和染色体异常的相关性进行了研究,发现在35岁以上的7个年龄组中,从38岁起随着孕妇年龄增长,染色体异常率逐渐升高。一项研究发现,31例引产孕妇中单纯因高龄而发现胎儿异常导致引产的病例有10例,占32.26%,因此相对而言,高龄孕妇更容易生育异常胎儿[30]。以上研究证明,高龄与染色体异常密切相关,可以通过CNV-seq技术检测染色体异常,从而降低出生缺陷的发生率,有助于我国出生缺陷的防治。
3.3.3CNV-seq在无创产前检测(NIPT)高风险中的应用 NIPT指通过检测母体血浆中游离DNA片段而判断胎儿是否存在染色体非整倍体异常或其他遗传性疾病,主要用于筛查21、18、13三体综合征[31]。有研究对563例NIPT筛查为三体综合征的孕妇进行CNV-seq检测,发现489例孕妇羊水检出CNV,分析74例出现假阳性结果的原因是由于母体CNV的干扰,因此若NIPT提示高风险时,仍需要进行CNV-seq检测确认,排除母体干扰[32]。另有研究对45 773例孕妇进行NIPT筛查,314例检出性染色体非整倍体,经羊膜穿刺术验证,58例病例检出CNV,结果仍有很高的假阳性率[33]。以上研究说明,对于NIPT高风险的孕妇,可以进行CNV-seq检测验证。NIPT只是一种筛查测试,因此可能出现假阳性或假阴性的情况。2016年我国国家卫生健康委员会发布了《孕妇外周血胎儿游离DNA产前筛查与诊断技术规范》,明确指出对于NIPT高风险人群,应转诊至产前遗传咨询医师处进行检测和咨询[34]。
4 小 结
在过去的几年,我国有效防治出生缺陷的方法是进行产前诊断,而CNV-seq为产前诊断提供了新途径。在CNV-seq的检测原理方面,序列深度法已获得临床认同;在临床应用方面,该技术不仅实现了与其他传统技术的联合运用,而且也被应用到不同指征病例中,实现了优势互补,提升了我国产前诊断领域的检测能力,提高了检测效率;在解读方面,从包含的基因、数据库、文献查询和家族遗传这4个方面进行总结,然而由于明确致病性的基因或区域数量有限,很多检测结果无法给出具有临床意义的解释,且CNV结果解读流程复杂、专业性强,尽管国内外已出台了相关指南和专家共识,但具体细节仍存在差异,特别是在解读报告的透明性、一致性和标准化方面,各个临床实验室之间差别较大。因此,CNV-seq结果解读仍存在很多问题,需要进一步探索CNV致病性评估,推动CNV-seq在产前诊断领域的发展。