SNP分子标记在蜜蜂中的应用
2020-01-13陈孝梅李永胜蔺哲广吉挺
陈孝梅 李永胜 蔺哲广 吉挺
(1 扬州大学动物科学与技术学院,扬州 225009;2 安徽黄山市畜牧技术推广中心,黄山 245000)
1 SNP的概念
单核苷酸多态性(Single Nucleotide Polymorphism,SNP),指由染色体基因组中单个核苷酸的突变而引起的DNA的多态性,包括单碱基的颠换、转换、插入和缺失等形式[1]。一般而言,上述形式中最少一种等位基因在群体中的频率不小于1%[2],但在某种特殊情况下(如cDNA)也可以小于1%[3]。SNP在基因组内可以划分为两种形式:一是遍布于基因组的大量单碱基变异,二是基因编码区的功能性突变,由于分布在基因编码区(coding region),故称其为cSNP。SNP在单个基因或整个基因组的分布是不均匀的[4],在非编码序列中发生的频率要高于编码序列,而且非同义突变(导致氨基酸序列发生改变的碱基突变)发生的频率要比其他方式突变的频率低得多。一般情况下,SNP多发生在非编码区[5]。
2 SNP的特点
2.1 遗传稳定性高
SNP是基于单核苷酸的突变,点突变率通常为10-9,遗传稳定性远大于微卫星等重复序列标记[6]。
2.2 位点丰富且分布广泛
SNP几乎遍布整个基因组,而不同基因组之间、同一基因组不同染色体之间及编码区与非编码区之间的SNP分布频率都不同。据估计人类基因组大约平均每1000bp就会出现一个SNP,这样在整个基因组的分布就多达300万个[7]。玉米1号染色体中每104个碱基就出现一个SNP[8]。在大豆基因中,SNP标记的平均密度约为272bp出现一个SNP[9]。Nasu[10]等分析了三个粳稻品种、两个籼稻品种和一个野生稻之间SNP发生的频率,发现每232个碱基存在一个SNP。Kanazin[11]等分析五个大麦品系的54个基因时,发现大麦的38个基因中存在112个SNP。晏励民[12]等收集了强抗病幼虫个体(6只)和易感病幼虫个体(6只),经SNP测序,获得位于mRNA的与蜜蜂抗白垩病相关的SNP位点696个,与蜜蜂易感白垩病相关的SNP位点102个,最终共筛选出71个与蜜蜂幼虫抗白垩病性状相关的SNP位点。在其他哺乳动物中SNP的频率为每500~1000bp出现一次[13]。
2.3 具有代表性
某些位于基因内部的SNP有可能直接影响蛋白质的结构或表达水平,从而使生物体发生变异或病变,因此,它们可能代表疾病遗传机理中的重要因素。
2.4 检测快速,易实现自动化分析
SNP标记与RFLP、SSR等传统的分子标记方法差异很大。在开发检测技术上,过去一般是建立在凝胶电泳基础上对多个个体进行分析的方法[14],操作步骤繁琐,效率相对较低,成本也较高。Quinton[15]表示SNP通常是一种双等位基因的遗传变异,在检测时无需测量片段的长度,只利用“+/-”或“全或无”分析的方式,经测序直接进行序列比对来发现差异,因此SNP在技术上有着较大的优势,加上近年来各种新兴技术的问世,提高了自动化检测水平。
3 SNP的检测方法及分析
SNP有多种检测方法,学者按不同分类标准将其分为不同的类型。董文甫[16]等认为SNP的检测方法大致可归结为两类:一类是引物延伸,另一类是异源双链DNA的识别,有时两者相互连用。曲娟娟[17]等认为SNP分析技术按其研究对象主要分为两大类:寻找未知的SNP或确定某一未知SNP与某遗传性状的关系;对不同群体已知SNP遗传多样性检测或对已知致病基因进行诊断。张必弦[18]等将SNP标记的研究方法分为四大类:利用基因测序(Sequencing)的研究、利用化学方法的研究、利用电泳方法的研究和利用杂交方法的研究。许家磊[19]等认为根据是否需要凝胶电泳和自动化程度的高低,大致可以把SNP的检测方法分为两大类,即基于凝胶电泳的SNP检测方法和高通量、自动化程度较高的SNP检测方法。
具体的检测方法,目前常用的有:直接测序法、DNA芯片、单链构象多态性(SSCP)和变性梯度凝胶电泳(DGGE)。
3.1 直接测序法
直接测序法是最容易实施的SNP检测方法。首先,利用DNA测序技术获得目的片段的碱基序列,然后利用生物信息学软件进行序列间比对,直观地寻找SNP,检出率高达100%。用此方法还可获得SNP分型时所需要的重要信息,如SNP的类型和准确的位置。但该法也存在缺点,即不能从序列误差中鉴别出杂合子个体,但可以通过设计重复试验和确认试验来解决此类问题[20]。通过该技术,在人类的全基因组中检测到47172个SNP,为人类高密度SNP图谱的建立奠定了基础[21]。
3.2 DNA芯片
DNA芯片,是用标记的探针与特定的DNA样品杂交,然后通过检测杂交信号的强弱判断样品中靶分子的数量[22]。该方法实现了快速、高效、并行的多态性信息分析,是基于固态介质进行分子杂交和原位荧光检测的一种高通量的SNP分析方法[23]。基因芯片技术已广泛应用在SNP检测和多态性分析等领域,但其大规模应用和发展中也存在诸多不足,如检测分析范围较窄、多态性差和灵敏度等[24]。
3.3 单链构象多态性(SSCP)
单链构象多态性是指单链DNA由于碱基序列不同而引起空间构象差异,这种差异会导致相同或相近长度单链DNA电泳迁移率的不同,从而可以通过非变性聚丙烯酰胺凝胶电泳进行有效检测[19]。该技术主要是用内切酶对DNA样品进行变性处理,经过非变性PAGE电泳,由于单链DNA链内的碱基会互作从而发生卷曲,形成较为稳定的空间构象,而DNA碱基序列差异会使DNA卷曲的分子构象发生变化。因此,DNA序列在电泳中所受阻力不同,导致的电泳速度也不同,从而可鉴定出碱基差异的序列[18]。Orita[25]等进一步将SSCP用于PCR扩增产物的基因突变检测,通过PCR结合SSCP使得分析的灵敏度得到了很大程度的提高。目前,PCR-SSCP技术被广泛应用于分子生物学的各个领域,被认为是一种SNP的经典检测方法[26]。
3.4 变性梯度凝胶电泳(DGGE)
变性梯度凝胶电泳是Fisher和Lerman[27]在1979年提出的用于检测DNA突变的一种电泳技术。通过设置变性剂浓度梯度,单碱基突变的DNA因解链行为不同导致迁移率不同,从而达到分离目的[28]。DGGE能够检测长达1kb的DNA片段,如果SNPS恰好出现在发生部分解旋的DNA区域内,其检出率可达100%,尤其是100~500bp长度的片段[29]。因此,DGGE已被广泛应用于SNP的检测。但该方法只能对突变进行粗略检测,一般不能确定突变的位置和类型,最终还是要依赖于DNA测序[30]。
4 SNP在蜜蜂中的应用
近年来,SNP标记已广泛应用于动植物的研究中,对动植物遗传育种、种质资源管理、物种进化等领域作出了巨大贡献,已成为生命科学研究领域不可或缺的工具[31-33]。
SNP标记技术在蜜蜂中的应用近年间也已取得一定的进展。石元元[34]以中华蜜蜂为实验材料,利用SNP技术判定了103只工蜂的126990个位点的基因型,筛选出3000个候选SNPs位点,最后选取1535个SNPs标记构建了东方蜜蜂的第一张遗传图谱,该图谱包含了1535个遗传标记和16个连锁群,其总的遗传距离是3942.7cm,最大连锁群的长度是574.5cm(包含180个标记),每个标记的平均遗传距离是2.6cm。Simões[35]等和Evans[36]等用基因芯片对发育期的蜂王和工蜂进行研究,蜂王中上调表达的基因多数与机体的生理代谢相关,而工蜂中上调表达的基因则与工蜂的形态特征及行为特征密切相关。Ament[37]等用基因芯片技术在哺育蜂和采集蜂的脑部发现大量有关能量代谢的差异表达基因,采集蜂脑部和腹部的胰岛素生长因子信号表达水平显著高于哺育蜂,可能通过抑制与胰岛素相关的代谢途径,推迟蜜蜂采集行为的时间。潘娇[38]等用蜜蜂幼虫中新检测的1722条基因和175条与王浆分泌可能紧密相关的基因,设计和制备了蜜蜂基因芯片,分别与王浆高产蜜蜂及王浆低产蜜蜂中的哺育蜂的头部cDNA进行杂交,初步筛选出369条差异表达的基因,并获得潜在作为王浆高产性状相关的分子标记的10个候选基因。Kim[39]等鉴定出的SNP标记AmD9成功区分了近亲交配的蜜蜂品系,可以直接用于基因分型和育种应用。Kadri[40]对30个巴西非洲化蜜蜂群的360只工蜂进行了高覆盖率的重复测序,产生了高密度数据集,每个读取点的平均读取深度为20.25,该数据是非洲化蜜蜂可用的最大基因组资源,能够对此生物入侵者的种群动态、进化和遗传进行高分辨率的研究。Parejo[41]等表示一个低密度的SNP小组可以成为授粉媒介的保护管理工作的一个精确且具有成本效益的工具。
5 展望
作为第三代分子标记技术,SNP已广泛用于蜜蜂的遗传图谱、形态和行为特征、基因分型、种群动态及进化等方面。随着基因组计划的逐步深入、SNP检测分析技术的快速发展、高通量测序成本的降低,相信SNP标记技术会为蜜蜂的基因、遗传、进化及保种等领域做出更大的贡献。