高通量靶向Panel测序新型突变对癫痫遗传多样性的临床价值*
2020-02-27孙立邓哲治孟祥福姚婕曾汉兵彭刘亮刘玲陈剑明李龙毓黄海威邓杏飞
孙立,邓哲治,孟祥福,姚婕,曾汉兵,彭刘亮,刘玲,陈剑明,李龙毓,黄海威△,邓杏飞△
1广东国盛医学科技有限公司(广东广州 510530); 2中山大学附属第一医院神经科(广东广州 510080)
癫痫是一种最常见的脑部疾病,以神经元过度同步化放电导致大脑反复性、发作性和短暂性神经系统异常为特征,在全球影响着超过7 000万人。据统计,超过75%的癫痫患者没有得到有效的治疗,特别是在低收入及中等收入国家中。因为癫痫本身的复杂性和遗传多样性,全面的、基于遗传的研究和见解较为有限。在本次研究中,我们通过自主设计的基因Panel对癫痫相关的600多个基因将近8 000个位点进行高通量测序,目的在于发掘以前文献忽略的乃至没有报道过的新型癫痫致病性或遗传易感性位点,揭示癫痫的遗传多样性。基因Panel靶向测序相比于全外显子组测序和全基因组测序,测序深度更高,对疾病相关的易感性、致病性以及精准用药的位点和区域更有针对性,可以更好地反映癫痫的遗传多样性。
1 资料与方法
1.1 一般资料 本研究纳入2016年10月至2019年5月由合作机构送至广东国盛医学科技有限公司检测的癫痫病例,其年龄、性别和病史信息均从患者的临床资料中获得。入选病例的诊断参考中国抗癫痫协会2015年修订的《临床诊疗指南-癫痫病分册》,按照ILAE 1989癫痫和癫痫综合症分类方法并结合临床信息进行分类:原发性癫痫是指除了可能的遗传易感性之外,没有其他潜在的病因的,除了癫痫发作外,没有结构性脑部病变和其他神经系统症状的;继发性癫痫则是指癫痫发作是由一个或多个可辨认的结构性脑部病变引起的[1]。本研究169个病例中原发性癫痫69例,继发性癫痫100例,两组一般资料见表1。
病例的纳入标准为临床医生确切诊断为癫痫,或者脑电图和MRI核磁共振结果明确且临床医生可做出癫痫分类的病例。根据2014年ILAE提出的癫痫临床实用定义,癫痫的诊断应满足:(1)2次相隔超过24 h的非诱发性和非反射性的癫痫发作;或者(2)一次非诱发或非反射性的癫痫发作,且未来10年再发风险>60%;或者(3)诊断为某种癫痫综合征[2]。
本研究排除在外的病例包括:(1)临床上没有作出癫痫诊断的患者(如怀疑是癫痫发作的,或者只出现过一次癫痫发作的);(2)临床信息不足以作出原发性及继发性癫痫分类的病例。所有病例样本为干血片或者5 mL EDTA抗凝全血样本,使用国盛医学自主开发的核酸提取试剂盒提取基因组DNA。
表1 两组患者的一般情况 例
1.2 方法
1.2.1 高通量测序 使用美国Thermo Fisher的Ion Torrent高通量测序平台,并采用AmpliSeq扩增子法进行癫痫Panel靶向测序。癫痫Panel为国盛医学自主设计,覆盖癫痫相关近600个基因,共8 000个左右癫痫致病、癫痫易感及癫痫精准用药位点。所有样本的测序reads质量使用FastQC工具进行质量控制。测序结果使用Thermo Fisher的内置数据分析平台进行基因组比对,使用标准生物信息数据分析流程进行位点比对后处理和注释。
1.2.2 差异比较 经过注释的Panel测序数据通过与千人基因组328个样本的数据集进行比较,按照:(1)千人基因组对照数据集——全癫痫患者(原发+继发);(2)千人基因组对照数据集——原发癫痫;(3)千人基因组对照数据集——继发癫痫的分组查找差异。
1.3 统计学方法 (1)先根据两组对比数据的表现性分布,进行哈代-温伯格平衡(指在理想状态下,各等位基因的频率和等位基因的基因型频率在遗传中是稳定不变的,即保持着基因平衡)检验,计算出哈温平衡P值(HWE_P.value),将HWE_P>0.05的突变列为符合哈温平衡的可信位点;(2)根据两组对比数据的表现性分布,进行2检验,计算出P值,将P<0.05列为组内差异有统计学意义的位点;(3)根据具有该突变病例的比例从高到低排列所有突变位点,筛选出突变病例比例>10%的结果。结果与HGMD、ClinVar数据库比较,确定为新型突变。
2 结果
2.1 高通量测序结果 入组的癫痫患者中发现新型突变13个;在原发性癫痫组中发现11个新型突变,其中4个为原发性癫痫患者特有位点;在继发性癫痫组中发现18个新型突变,8个为继发性癫痫患者特有位点。3组对比数据的基因分布情况见表2。高通量测序质控数据统计见表3。
表2 3组的基因分布情况
表3 高通量测序质控数据统计
2.2 全癫痫患者共同新型突变的特点分析 所有癫痫患者组发现的共同新型突变既有SPATA5、SCN1A这种癫痫致病基因,也有导致精神发育迟缓及脑病的癫痫易感性基因。相对于千人基因组对照数据集,全癫痫患者(原发+继发)样本中突变频率在10%以上的新型突变有13个,见表4。3组对比数据中共同的突变位点为SPATA5、SYNGAP1、SLC25A22、SCN1A、SLC19A3共5个基因。
表4 所有169例癫痫患者(原发+继发性)组新型移码突变 例(%)
注:黑色加粗的突变为数据库已有的突变
2.3 原发性癫痫特有新型突变的特点分析 原发性癫痫特有的新型突变中LGI1是癫痫致病基因,其余均为导致神经性退化疾病、脑病(encephalopathy)和共济失调的遗传易感性基因。相对于千人基因组对照数据集,原发癫痫样本中突变频率在10%以上的突变有11个,其中区别于全癫痫患者组和继发癫痫组的为NDUFV1、LGI1、AMT、POLG 4个基因的4个突变位点,见表5。
表5 69例原发性癫痫患者组新型移码突变 例(%)
注:黑色加粗的突变为数据库已有的突变
2.4 继发癫痫特有的新型突变的特点分析 继发癫痫特有的新型突变主要为导致痉挛截瘫、共济失调、脑病及肌张力障碍等癫痫遗传易感性基因。相对于千人基因组对照数据,继发癫痫样本中突变频率在10%以上的突变有20个,其中区别于癫痫患者组和原发性癫痫组的为ZFYVE26、RUBCN、SACS、NOTCH3、RYR1、ATP1A3及AMER1的7个突变位点,见表6。
表6 100例继发性癫痫患者组新型移码突变 例(%)
注:黑色加粗的突变为数据库已有的突变
3 讨论
癫痫的形成实质上是一个健康正常的大脑向一个自发产生并反复出现癫痫发作的大脑转换的过程[3-4]。这个过程很大程度上归因于一个神经元网络中激发性活动和抑制性活动的失衡。在失衡的情况下,癫痫性神经元网络以一种过度的、超同步的、周期振荡的方式工作,并且一旦持续发生,它会破坏正常的神经元信号处理,甚至可以破坏其他正常的神经元网络[3]。近期的癫痫遗传性研究较多以全面性和局灶性癫痫分类为基础:大部分全面性癫痫都被认为有遗传性基础,而大部分局灶型癫痫则伴随着脑部结构性异常[5-8]。癫痫的遗传学基础是多样的:既有常染色体显性的罕见癫痫致病突变,也有经历了获得性脑部损伤,即二次打击后发展成癫痫的遗传易感性位点。常染色体显性的罕见癫痫遗传性致病突变通常发生在三十几个不同的基因当中[9-10]。这些基因主要包括编码离子通道、神经元受体、转录因子及蛋白酶的基因。虽已经有大量报道,但单基因遗传性癫痫只占所有遗传性癫痫的5%~10%[11-12]。传统的观点认为基因变异主要导致全面性癫痫,特别是原发性全面性癫痫及发育型癫痫性脑病[13]。但是局灶性癫痫也具有遗传基础,有证据表明具有癫痫家族史的人拥有更高的局灶性癫痫获得风险[13-14]。因此,无论是导致全面性癫痫的罕见突变,还是导致局灶性获得性癫痫的常见遗传易感位点,在癫痫的获得和发展中很可能都起着相当的作用[15]。
本研究通过3组数据对比,在全癫痫患者、原发性癫痫患者和继发性癫痫患者组中发现了现有数据库没有收录的癫痫相关新型移码突变,展示了高通量Panel靶向测序在癫痫遗传性研究中的重要作用。所有新型突变都经过哈温平衡检验和2检验,为符合哈温平衡的可信位点且组内差异有统计学意义。由结果可以看出:
3.1 所有癫痫患者组发现的共同新型突变既有SPATA5、SCN1A这种癫痫致病基因,也有导致精神发育迟缓及脑病的癫痫遗传易感性基因 SPATA5编码的蛋白是广泛参与膜融合、DNA复制、微管切断分离和蛋白质降解过程的ATPase酶,Tanaka等[16]在10个家庭14个有癫痫、听力损失和精神发育迟缓综合征的儿童中发现该基因的纯和或者复合杂合突变,且该基因的遗传方式为常染色体隐性遗传。SYNGAP1编码的为Ras GTPase激活蛋白,该基因的突变会导致常染色体显性的精神发育迟缓。SLC25A22编码的为一种线粒体的谷氨酸载体,该基因的变异被认为会导致常染色体隐性的癫痫性脑病。SCN1A编码的为钠离子电压门控通道Alpha子单元,该基因为常染色体显性遗传的癫痫致病基因。SLC19A3编码的为维生素B1跨膜转运蛋白,该基因的突变可能导致常染色体隐性的生物素或者维生素B1应答的2型脑病。SPATA5、SCN1A这种癫痫致病基因在所有169例癫痫患者中的发生比例分别为24.85%和18.93%,且遗传方式既有常染色体显性遗传AD,也有常染色体隐性遗传AR。这显示出无论是原发性癫痫还是继发性癫痫患者中都可有癫痫致病的单基因遗传位点,与以往癫痫致病突变主要集中在原发性癫痫患者的观点有所不同。而遗传易感性在这一组中主要表现为精神发育迟缓的遗传病。
3.2 原发性癫痫特有的新型突变中LGI1是癫痫致病基因 在169例病例中发生原发性癫痫特有的新型突变比例为13%,其余均为导致神经性退化疾病、脑病(encephalopathy)和共济失调的遗传易感性基因,在所有病例中的发生比例为10%~14.5%。文献报道的原发性癫痫与很多基因多态性相关性较高,包括GABBR1、SLC2A1、EIG家族、CLCN2等,且主要为原发性癫痫的遗传易感性基因。NDUFV1基因编码NADH:泛醌氧化还原酶Ⅰ型复合物的蛋白,该基因的变异主要导致常染色体隐性遗传的线粒体Ⅰ型复合物缺乏,与肌病、脑肌病变与如帕金森和Leigh氏综合征等神经性退化性疾病相关。LGI1基因表达的富含亮氨酸重复序列的蛋白可能参与调控了电压门控钾离子通道,与神经元细胞调控和生存相关。该基因的变异会导致常染色体显性遗传的外侧额叶癫痫。AMT基因编码甘氨酸剪切系统的4个组成部分之一,这个基因的突变可能导致常染色体隐性遗传的甘氨酸脑病变。POLG基因编码DNA聚合酶gamma催化子单元,该基因的变异会导致线粒体DNA枯竭综合征、线粒体常染色体隐性共济失调综合征、进行性眼外肌麻痹。POLG基因编码的蛋白为线粒体DNA复制和修复的重要DNA聚合酶催化单元,该移码突变NM_001126131:3671delinsAT的位置为POLG蛋白的DNA聚合酶区域[17]。因此可以推断该新型移码突变很可能是致病性突变,引起线粒体常染色体隐性共济失调综合症等遗传疾病。Marcián等[18]讨论过共济失调及癫痫的关系,认为共济失调可能源于癫痫或者是抗癫痫药物治疗不良反应的体现,但是共济失调是否会使癫痫恶化仍有待研究。
3.3 继发癫痫特有的新型突变主要为导致痉挛截瘫、共济失调、脑病及肌张力障碍等癫痫遗传易感性基因 继发性癫痫特有的新型突变在所有病例中的发生比例为10%~15%。继发性癫痫的病因较复杂,可发于脑部器质性或者代谢性疾病。以往的文献较少进行继发性癫痫的遗传研究,吕冰清等[19]研究了183例儿童继发性癫痫病因,发现遗传性疾病占了全部病例的38.3%,以神经皮肤综合征、家族性癫痫和遗传代谢病占比最高。
ZFYVE26基因编码一个包含FYVE锌指结合域的蛋白,该蛋白可以通过和磷脂质互作与细胞膜脂质蛋白相结合。该基因的突变会导致常染色体隐性痉挛性截瘫15型。SACS基因编码sacsin蛋白,主要在大脑等神经系统表达,该蛋白可以与泛素-蛋白酶系统合作和召集如Hsp70等分子伴侣,保护大脑不受突变的ataxin-1等共济失调症蛋白伤害。该基因的突变主要导致Charlevoix-Saguenay型痉挛性共济失调。NOTCH3基因编码的是一个归属于NOTCH受体家族的跨细胞膜蛋白,该受体家族形成的信号通路在神经发育过程中起着重要的作用。该基因的突变会导致常染色体显性遗传性伴皮质下梗死和白质脑病的脑动脉病和侧面脑脊膜膨出综合征。RYR1基因编码骨骼肌肉兰尼碱受体,为肌浆内质网的钙离子释放通道。该基因的突变主要导致恶性体温过高易感性、中央核心区疾病及带有外部眼肌瘫痪的微核心肌病。ATP1A3基因编码钠离子钾离子离子泵腺甙三磷酸酶alpha-3催化子单元,在基底核、海马体和小脑中特异性表达。该基因的变异会导致如2型儿童多发性替代性半身不遂、CAPOS综合征和肌张力障碍。AMER1基因编码的是抗原提呈细胞(APC)细胞膜召集蛋白1,该蛋白可以与CTNNB1、APC、AXIN1、AXIN2等基因的蛋白互作并上调转录活性。该基因的变异主要导致X-连锁显性遗传的带有颅内硬化的条纹状骨病。
因为癫痫临床信息的有限性,本研究以1989年ILAE的分类为基础进行数据分组比较展示癫痫相关现有数据库没有收录的新型移码突变,而没有采用更贴近目前主流癫痫分类方法的2017年ILAE分类[20],因此得到的对比结果与国外类似研究的可比性不强。但是以1989年ILAE的分类为基础进行数据分组,可以对原发性和继发性癫痫的遗传性进行比较,弥补了以往文献对这两种癫痫分类,特别是继发性癫痫的遗传性研究的不足。
综上所述,高通量靶向Panel测序检测到了不同癫痫类型的新型移码突变,有效地揭示了包含致病性突变和遗传易感性突变在内的遗传多样性。