采用Amplicon文库构建法对地中海贫血的基因检测
2016-12-02孙玉婷范冬梅叶倩平杨琳艳梁志坤杨学习
孙玉婷 范冬梅 叶倩平 杨琳艳 梁志坤 杨学习★
·论著·
采用Amplicon文库构建法对地中海贫血的基因检测
孙玉婷1范冬梅2叶倩平1杨琳艳1梁志坤1杨学习2★
目的进一步完善现有地中海贫血的检测方法并且建立一种新的基于高通量测序的基因诊断方法,研究α/β地中海贫血基因的突变类型及分布情况。方法采用Amplicon文库构建法,基于高通量测序平台,对219例地中海贫血患者全血样本进行上机测序与数据分析。结果在219例地中海贫血患者中,共计检测出14种突变类型,包括CD122、CD125、CD142 3种非缺失型α⁃地贫突变及IVS⁃II⁃654、CD41⁃42、CD17等11种常见β⁃地贫突变型别。此外,通过生物信息学软件作图分析,筛查出⁃⁃SEA、⁃α3.7、⁃α4.23种缺失型α⁃地贫。结论本研究进一步完善了基于高通量测序的基因诊断方法,建立了一套Amplicon文库构建法,能准确、有效地用于诊断α/β地中海贫血基因的缺失与突变类型,对人群筛查,优生优育的遗传咨询,防止该病重症患儿的出生等具有重要意义。
地中海贫血;基因检测;Amplicon文库构建;β⁃突变;α⁃缺失
地中海贫血(thalassem ia,简称“地贫”)是一种世界范围内常见的单基因遗传性血液疾病,由珠蛋白基因的缺失或突变所导致珠蛋白肽链合成障碍,造成血红蛋白中的α⁃链珠蛋白与β⁃链珠蛋白合成比例失衡、红细胞寿命减短的一种慢性进行性溶血性贫血[1]。
临床上主要分为α⁃链珠蛋白地中海贫血及β⁃链珠蛋白地中海贫血2大类,其对应的基因分别位于16号染色体短臂(16p13.3)与11号染色体短臂(11p1.2)[2]。
在我国,长江以南的大部分省区均为地贫的高发区。人群中α⁃地贫及β⁃地贫基因携带率分别为2.64%,2%~3%[3⁃4]。其中α⁃地贫以广西、广东、江西、四川等地区多见,发病率分别高达14.95%、4.11%、2.60%、1.92%[3]。β⁃地贫以广西地区为常见,发病率达至6.43%[5],而个别地区如香港、云南也有高达6%[4]。
由于地贫仍缺乏有效治疗方法,通过人群筛查实施产前诊断以阻止重症患儿出生及进行新生儿筛查以早期诊断、早期治疗是目前最有效的预防措施。现阶段血液学表型分析是地贫基因携带者筛查的指标,主要包括红细胞指标[如红细胞(red blood cell,RBC)计数、血红蛋白(hemoglobin,HGB)、红细胞比容(hematocrit,HCT)、红细胞平均体积(mean corpuscular volume,MCV)和平均红细胞血红蛋白含量(mean corpuscular hemoglobin con⁃centration,MCH)等]的测定和血红蛋白分析(包括异常血红蛋白检测、HbA2和HbF定量测定),但此方法存在其他不能排除的原因,如缺铁性贫血(小细胞低色素症)和某些异常Hb(HbA2升高),也不能发现静止型地中海贫血(如⁃α3.7/、⁃α4.2/和αWSα/杂合子等),故地贫基因携带者的确诊仍有赖于基于DNA分析的基因分型。PCR技术是目前用于分子诊断的基础方法,但此技术操作繁琐、过程耗时,对操作者技术水平要求高,难以进行大批样本的筛查。本研究建立了一套Amplicon文库构建法,通过高通量测序平台对地贫基因进行筛查与诊断,旨在为地贫的快速诊断提供一种具有参考价值的,灵敏、简便的基因检测方法。
1 材料与方法
1.1 研究对象
2014年7月至2015年7月收集来自福建医科大学附属协和医院及中山大学附属第一医院体检、产检及就诊的地贫筛查病例,对确诊的共计219例地贫患者外周全血样本进行本研究方法的基因检测。其中女性125名,男性94名,年龄在0~86岁,平均年龄为26岁。
1.2 仪器与试剂
干式恒温器(杭州奥盛仪器有限公司);Veri⁃ti®96⁃Well Thermal Cycler(Life Technologies公司,美国);Qubit®3.0荧光计(Life Technologies公司,美国);DA8600测序仪(中山大学达安基因股份有限公司);DNA提取试剂盒:DNeasy Blood &Tissue Kit(50)(Qiagen公司,德国);文库构建试剂盒:Ion Plus Fragment Library Kit与接头试剂盒:Ion Plus Fragment Library Adapters(Life Tech⁃nologies公司,美国);PCR试剂:Hi⁃Fi Hotstart Ready M ix(KAPA BIOSYSTEMS公司,美国);E⁃Gel预制琼脂糖凝胶电泳系统:E⁃Gel iBase and E⁃Gel Safe Imager Combo Kit(Invitrogen公司,美国)。
1.3 方法
1.3.1 DNA的提取
按照DNA提取试剂盒说明书要求提取基因组DNA,得到的DNA溶液要求OD260/280为1.6~1.8之间。DNA溶液可置于(⁃20±5)℃保存。
1.3.2 文库构建和定量
采用文库构建试剂盒进行文库构建。关键步骤包括对提取的DNA分别进行α/β⁃地贫PCR,将PCR产物混合后加入打断试剂置于37℃孵育,再加入stop buffer终止反应,接着加入切口修复酶对DNA片段进行末端修复。使用接头试剂盒,加入P1接头与特异性接头进行连接反应,然后用DNA纯化磁珠进行纯化。
采用E⁃Gel预制琼脂糖凝胶电泳系统选择性回收330 bp大小的目的片段,然后用PCR试剂进行扩增,最后用DNA纯化磁珠对产物进行纯化得到可用于测序的文库DNA。
使用Qubit®3.0荧光计进行文库定量。文库根据Qubit浓度等量混合,再用Qubit®3.0荧光计进行定量,根据以下公式把混合文库稀释到100 pM:稀释倍数=(文库浓度×107)/(660×330)。
1.3.3 模板制备
乳液PCR将文库DNA包被在一个油滴分子里面进行扩增,扩增前一个油滴分子含有一个
DNA分子,扩增结束后油滴分子破裂,油滴里面的ISP磁珠便携带有成千上万个文库DNA。
1.3.4 上机测序
通过乳液PCR扩增的文库模板,经过富集回收,上样至高通量测序芯片。芯片微孔中固定的DNA链每延伸一个碱基,就会释放一个质子,导致局部pH变化,离子传感器检测pH变化,并将化学信号转换成数字信号,从而可以实时判读碱基,最终获得每个DNA片段的碱基序列。
1.3.5 基因型检测
选择Coverage Analysis和VariantCaller插件,选择参考序列hg19和目标区域chr16:215000⁃236000与chr11:5246400⁃5248600作为参考分析该区域的覆盖度和测序深度及突变情况。Cover⁃age Analysis插件运行结束后会出现一个覆盖率(On Target Rare)和测序深度(Sequencing Depth)的文件,样品覆盖率在95%以上,DNA测序深度在500*以上认为测序结果可信;Variant Caller插件运行结束,每个样品都生成一个即.xls格式的位点突变信息表格,下载下来,看是否检测出hotspot位点,记录每个样品的突变情况。对于有突变的样本,可根据表格中的突变频率(Fre⁃quency)判断为纯合突变还是杂合突变,Frequen⁃cy值在40%~60%即为杂合突变,90%~100%则是纯合突变。
运用生物信息学软件分析针对chr16:215000⁃236000区域每个位点覆盖度情况,作图分析缺失型α⁃地贫的型别。若在chr16:221913⁃221936和chr16:223631⁃223612范围内有检测峰,且其他位置没有检测峰,则是α⁃地贫正常;若在chr16:219303⁃219327和chr16:225173⁃225148范围内有检测峰,且其他位置没有检测峰,则是4.2纯合缺失型;若在chr16:221913⁃221936和chr16:227726⁃227702范围内有检测峰,且其他位置没有检测峰,则是3.7纯合缺失型;若在chr16:235908⁃235888和chr16:215284⁃215308范围内有检测峰,且其他位置没有检测峰,则是Sea纯合缺失型。若除了缺失型对应位置有检测峰,在chr16:221913⁃221936和chr16:223631⁃223612范围内也有检测峰,则是杂合缺失型。
将上述1.3.1中对219例地贫患者外周全血样本提取所得的DNA另外进行一代测序(金标准测序),以进一步验证本实验结果的准确性。
2 结果
表1 219例α/β⁃地贫基因突变类型和构成比Table 1 Mutation typesofα/β⁃thalassem ia gene and composition ratio in 219 cases
2.1 α/β⁃地贫基因的检测结果
219例地贫患者全血样本中,共检出14种突变基因类型,包括CD122、CD125及CD142 3种α⁃地贫突变,11种β⁃地贫突变,分别为IVS⁃II⁃654、CD41⁃42、CD17、⁃28、CD27/28、CD71⁃72、CD14⁃15、CD26、Initiation codon、IVS⁃I⁃1、CD43。其中,突变类型为IVS⁃II⁃654杂合共检出39例,比例最高,占17.81%,其次为CD41⁃42杂合、CD122杂合、CD17杂合、CD142杂合,所占比例依次为10.50%、8.68%、5.94%、5.48%,具体信息见表1。运用生物信息学软件分析,共检出5种缺失型α⁃地贫。其
中,缺失类型为⁃⁃SEA杂合所占比例最高,为22.83%,共检出50例,⁃α3.7杂合缺失及⁃⁃SEA/⁃α3.7复合缺失,分别检出10例、6例,所占比例为4.57%、2.74%,具体信息见表2。另外,检出12种复合型突变与缺失类型,具体信息见表3。经金标准测序验证,219例地贫患者DNA样本的检测结果,其α/ β⁃地贫基因缺失或突变的型别与本研究所检出各例患者的地贫基因突变类型一一对应,符合率达100%。
表2 219例α⁃地贫基因缺失类型和构成比Table 2 Deletion typesofα⁃thalassemia gene and composition ratio in 219 cases
表3 219例α/β⁃地贫基因复合型突变/缺失类型和构成比Table 3 Compoundmutation/deletion types ofα/β thalassemia gene and composition ratio in 219 casesz
2.2 α⁃地贫缺失类型的作图分析
运用生物信息学软件分析针对chr16:215000~236000区域每个位点的覆盖度,并作图分析缺失型α⁃地贫的型别,在219例地贫患者全血样本中检出5种缺失型α⁃地贫,依次包括3.7(纯合/杂合)缺失、4.2杂合缺失、Sea(纯合/杂合)缺失、3.7&Sea杂合缺失和4.2&Sea杂合缺失,具体峰图见图1~8。
3 讨论
地贫是我国常见的一种遗传性血红蛋白疾病,由珠蛋白基因的缺失或突变引起珠蛋白肽链合成障碍所致。常见类型有α⁃地贫与β⁃地贫2种。
基因缺失是α⁃地贫最常见的突变类型。目前已鉴定的α⁃地贫缺失类型至少有36种,东南亚缺失型(⁃⁃SEA)、右侧缺失(⁃α3.7)和左侧缺失(⁃α4.2)是我国最常见的3种缺失类型[6],国内Barts水肿胎儿的基因型主要为(⁃⁃SEA/⁃⁃SEA)[7]。已发现非缺失型α⁃地贫基因点突变类型至少有68多种[8]。
β⁃地贫绝大多数由β⁃珠蛋白基因不同类型的点突变所致,少数是由基因缺失所引起[7]。目前,全世界已发现200多种β⁃珠蛋白基因的突变类型,在我国已报道有49种,其中南方地区报道的有47种[9⁃10]。β⁃地贫的基因突变有着明显的地域性或群体特异性,在我国最常见的是CD41⁃42、CD17、⁃28、CD26、IVS⁃II⁃654和CD71⁃72(+A),此6种突变类型占全部突变类型的95%以上[11]。
本研究采用Amplicon文库构建法,通过高通量测序技术对219例地贫患者进行基因检测。共
检出14种α/β⁃地贫突变基因类型,5种α⁃地贫缺失型基因类型,12种复合型α/β⁃地贫突变/缺失基因类型,且经金标准测序验证,检测结果均符合对应突变型别。其中,IVS⁃II⁃654杂合共检出39例,所占比例为17.81%,其次为CD41⁃42杂合、CD122杂合、CD17杂合、CD142杂合,所占比例依次为10.50%、8.68%、5.94%、5.48%。与资料所显示的华南地区以CD41⁃42最常见及广东、福建、湖北、香港和台湾等地以IVS⁃II⁃654、CD41⁃42最为多见符合[4]。
运用生物信息学软件分析,检测出⁃⁃SEA杂合共50例(22.83%),⁃α3.7杂合10例(4.57%)及⁃⁃SEA/⁃α3.7复合缺失6例(2.74%)。与文献所报道的我国南方地区最常见的α⁃地贫基因型为⁃⁃SEA,其次是⁃α3.7、⁃α4.2符合,其基因突变趋势也相似[12]。
随着分子生物学的日渐成熟及基因诊断的广泛应用,当前对α⁃地贫缺失类型检测的方法主要有:Southern杂交、实时荧光定量PCR结合溶解曲线分析(DC)和PCR体外基因扩增等[3,6,8,13]。用于β⁃地贫点突变基因诊断的技术主要有:PCR⁃反向斑点杂交法(PCR⁃flow though reverse dot blot,PCR⁃RDB)、限制性片段长度多态性分析(restric⁃tion fragment length polymorphism,RFLP)、高分辨溶解曲线分析系统、基因芯片法等[11,14⁃15]。目前临床实验室普遍采用跨越断裂点聚合酶链反应(Gap⁃PCR)技术检测α⁃地贫缺失类型。其基本原理是设计在α⁃链珠蛋白突变基因断裂点两侧的引物在正常情况下由于扩增区域太长而无法扩增,而缺失型基因扩增区域因缩短而能扩增。该方法简单实用[14],能很好地区分正常、杂合子和纯合子[6],但由于α⁃链珠蛋白基因的高度同源和高G+C含量,使得目的产物难以扩增。另外,由于PCR技术本身的高敏感性,样品容易受污染而得到假性结果[3]。非缺失型α⁃地贫突变和β⁃地贫点突变的常规检测方法为PCR⁃反向斑点杂交法(PCR⁃RDB)技术。其基本条件是固定在膜上的多种特异性探针于同一条件下与PCR产物进行杂交。该方法可同时检测几种点突变,具有快速、简便、灵敏度高和特异性强的特点,但操作繁琐、难以进行大批量检测[11],且易受各种试验因素、条件的影响,其稳定性和重复性有待提高[14]。
本研究采用Amplicon文库构建法,基于高通量测序平台技术进行地贫基因诊断,相较于传统常规运用的血液学表型分析,能有效避免后者所存在的漏诊、误诊现象。对比于目前普遍使用的基因检测方法(如Gap⁃PCR和PCR⁃RDB等),其共同点为同样涉及一个分别针对α/β⁃链珠蛋白基因进行PCR体外扩增的过程,其最大的不同之处是关于α/β⁃地贫基因缺失及突变的检测,前者能够同时完成,且保证准确率,后者却需分别进行,存在一定的局限性。现将该方法的优势归纳如下:
同时针对α⁃地贫基因缺失类型与α/β⁃地贫基因突变类型进行检测,操作简便化,能较大程度地避免样本污染,也不易受各试验条件因素的影响;效率高,从试验操作到结果分析的整个流程耗时短;适用于大批量的临床样本检测,稳定性高,重复性好,准确度强;所需样本量少,且对人体造成危害的可能性极低;能一次性检测多种突变位点及缺失类型,并可发现新的突变类型,具有较高的临床与科研价值。由本次检测结果可看出,此方法能迅速、有效、准确地检测出常见的⁃⁃SEA、⁃α3.7、⁃α4.23种缺失型及CD122、CD125、CD142 3种点突变类型和我国常见的多种β⁃地贫基因突变位点。
因此,本研究所建立的Amplicon文库构建法,基于高通量测序平台技术的基因检测为地贫的诊断提供了快速可靠的参考依据,对指导优生优育,防止中、重型地贫患儿出生,提高人口素质等具有重要意义。
[1]李长钢.地中海贫血临床诊治中存在的问题[J].临床儿科杂志,2009,27(8):714-717.
[2]王燕燕,李晓辉,徐西华.地中海贫血诊治进展与我国现状[J].中国实用儿科杂志,2013,28(6):473-476.
[3]肖维威,徐湘民,徐铃.中国人缺失型α⁃地中海贫血的分子基础及产前基因诊断[N].第一军大学学报,1998,18(1):68-72.
[4]周玉球,徐湘民.中国人β地中海贫血的分子基础及产前诊断[J].国外医学:遗传学分册,1995,18(3):132-137.
[5]Xiong F,Sun M,Zhang X,etal.Molecular epidemio⁃logical survey of haemoglobinopathies in the Guangxi Zhuang Autonomous Region of southern China[J]. ClinicalGenetics,2010,78(2):139-148.[6]郭柳薇.地中海贫血基因检测的研究进展[J].医学综述,2006,12(24):1478-1480.
[7]张春丽,张宁.1665例2~14岁儿童地中海贫血筛查分析[J].中国妇幼保健,2012,27(5):706-707.
[8]郭柳薇.分子生物学检测在α⁃地中海贫血中的应用[J].分子诊断与治疗杂志,2015,7(4):281-285.
[9]徐湘民,张新华,陈荔丽.地中海贫血预防控制操作指南[M].北京:人民军医出版社,2011,3(1):20.
[10]Xu XM,Zhou YQ,Luo GX,et al.The prevalence and spectrum of alpha and beta thalassaem ia in Guang⁃dong Province:implications for the future health bur⁃den and population screening[J].J Clin Pathol,2004,57(5):517-522.
[11]唐娟,张崇林,蒋群芳.β⁃地中海贫血基因诊断技术进展及无创产前诊断的研究[J].中国优生与遗传杂志,2015,23(12):5-6.
[12]陆雪梅.4830例地中海贫血基因突变类型、人群分布及产前基因诊断结果分析[D].广西:广西医科大学,2012.
[13]黄金芬.地中海贫血的产前诊断研究进展[J].中国优生与遗传杂志,2015,23(12):123-125.
[14]代宏剑,温柏平.地中海贫血的实验室诊断进展[J].国际检验医学杂志,2011,32(2):251-252.
[15]黄王莹.β⁃地中海贫血基因诊断及临床应用[J].现代预防医学,2015,42(17):3258-3260.
Gene diagnostic of thalassem ia by the method of constructing am p licon libraries
SUN Yuting1,FAN Dongmei2,YEQianping1,YANG Linyan1,LIANG Zhikun1,YANG Xuexi2★
(1.Guangzhou DaruiBiotechnology Co.,Ltd.,Guangzhou,Guangdong,China,510665;2.Schoolof Laboratory Medicine and Biotechnology,Southren Medical University,Guangzhou,Guangdong,China,510515)
Objective To further improve the existing diagnosticmethods of thalassem ia,establish a new method for gene diagnosis base on next generation sequencing and research the mutation type and distribution of alpha/beta thalassem ia gene.Methods 219 cases of the whole blood samples w ith thalassem ia have been sequenced and analyzed using themethod of constructing amplicon libraries,which is based on next generation sequencing platform.Results There were total of 14 mutation types detected, including 3 non⁃deletion of CD122,CD125 and CD142 in alpha thalassem ia,11 kinds of common mutation of IVS⁃II⁃654,CD41⁃42,CD17 and other in beta thalassem ia in these 219 cases of the thalassem ia patients.In addition,through graphing analysis by Bioinformatics software,3 type of alpha deletion of⁃⁃SEA,⁃α3.7and⁃α4.2have been screened out.Conclusion This study have further improved the gene diagnosticmethod base on next generation sequencing technology and set up amethod of constructing amplicon libraries that can be used for diagnosing the deletion andmutation types of alpha/beta thalassemia gene accurately and effectively.It has a great significance in population screening,genetic counseling of prenatal and postnatal care,disease preventing for newborn w ith severemediterranean anemia,etc.
Thalassemia;Genetic diagnostic;Constructing amplicon libraries;Betamutation;A lpha deletion
广东省科技计划项目(503169728081);广州市科技计划项目健康医疗协同创新重大专项(201508020259)
1.广州市达瑞生物技术股份有限公司,广东,广州510665 2.南方医科大学检验与生物技术学院,广东,广州510515
★通讯作者:杨学习,E⁃mail:yxxzb@sohu.com