SNPs技术的研究进展及应用
2010-04-13李卫真张永云
王 强,李卫真 ,张永云
(1.云南农业大学动物科学技术学院,云南 昆明 650201;2.云南农业大学农科专业基础实验教学中心,云南 昆明 650201)
1 SNP技术研究进展
由于单核苷酸多型性在医药上的重要性,美国国家卫生研究院(NIH)提供约三千万美元的经费给序列定序中心,进行搜寻并定位人类单核苷酸多型性(SNPs)的计划,定位一百万个人类的SNPs。由各大药厂等组成的单核苷酸多型性协会(TSC)也出资寻找定位出约三十万个人类的SNPs。现有的人类SNPs总数约为2421261个,这个数字还会继续增加。至于其他物种的SNPs就不是那么热门,目前还不超过700笔。这是因为其他物种的基因体相关定序计划(如基因体解序、EST解序、SNP寻找及定位)本来就比人类基因体相关的定序计划少和慢,毕竟人类基因体相关的定序计划对我们来说才是最重要最有用的。在台湾地区,以基因体研发为主轴的赛亚基因科技公司,已于2002年7月完成了亚洲人种的单一核苷酸多型性(SNP)数据库初稿,接下来的目标将针对肝炎、哮喘、乳癌、Ⅱ型糖尿病等亚洲地区的多发性疾病,积极进行相关的基因体研究,包括临床基因体学、微卫星基因定型分析、SNP定型分析、高效能定序、基因微数组及生物信息多项中心等。
化学家Lieber和遗传学家Housman的梦幻组合创造了一项简单的新技术,即应用原子压力显微镜(AFM)观察SNP。首先设计一个寡核苷酸探针能与你要找的基因组区域严格匹配,将此探针与一大分子如链霉抗生物素偶联,让此探针与DNA片段进行杂交。如果探针杂交成功,那么用AFM进行观察就能发现杂交阳性位点。此方法相比传统方法的一个明显优点就是能够对单倍体基因组进行检测。当数个探针同时在数百Kb的距离上进行搜索,再加上自动分析,那么SNP的相关性研究恐怕就能大大地向前迈进一步了。
2 SNP技术的概述
SNPs即单核苷酸多态性(SNPs)是指基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,包括单个碱基的转换、颠换、插入和缺失等。从理论上来看每一个SNPs位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2∶1。一般而言,SNP是指变异频率大于1%的单核苷酸变异。
在遗传学分析中,SNPs作为一类遗传标记得以广泛应用,主要源于这几个特点∶
2.1 密度高 SNPs在人类基因组的平均密度估计为10000bp,在整个基因组的分布达3×106个,遗传距离为2~3cm,密度比微卫星标记更高,可以在任何一个待研究基因的内部或附近提供一系列标记。
2.2 富有代表性 某些位于基因内部的SNPs有可能直接影响蛋白质结构或表达水平,因此,它们可能代表疾病遗传机理中的某些作用因素。
2.3 遗传稳定性 与微卫星等重复序列多态性标记相比,SNPs具有更高的遗传稳定性。
2.4 易实现分析的自动化 SNPs标记在人群中只有两种等位型,故也称为双等位标记。这样在检测时只需一个“+/-”或“全/无”的方式,而无需像检测限制性片段长度多态性、微卫星那样对片段的长度作出测量,这使得基于SNP的检测分析方法易实现自动化。
用目前的方法每年可以检测出上千个基因中的SNP,而其成本会随着技术和手段的不断成熟而大大降低,同时检出率也不断提高。由于具有以上特点,SNPs已成为继RFLP(限制性片段长度多态性)、微卫星多态标记后的第三代分子遗传标记。
3 SNP检测方法
人们对SNPs的研究方法进行了许多探索和改进。SNPs分析技术按其研究对象主要分为两大类:(1)对未知SNPs进行分析,即寻找未知的SNP或确定某一未知SNPs与某种遗传病的关系。检测未知SNPs有许多种方法可以使用,如温度梯度凝胶电泳(TGGE)、变性梯度凝胶电泳(DGGE)、单链构象多态性(SSCP)、变性的高效液相色谱检测(DHPLC)、限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)等,但这些方法只能发现含有SNPs的DNA链,不能确知突变的位置和碱基类别,要想做到这一点,必须对那些含有SNPs的DNA链进行测序。(2)对已知SNPs进行分析,即对不同群体的SNPs遗传多样性进行检测或在临床上对已知致病基因的遗传病进行基因诊断。筛查已知SNPs的方法有等位基因特异寡核苷酸片段分析(ASO)、突变错配扩增检验(MAMA)、基因芯片技术(gene chips)等。各种SNPs的检测方法区别很大,但迄今为止还没有任何一种方法是万能的,在实际应用时要根据研究目的、实验室设备与技术条件等进行选择。每种SNPs的检测方法都由两部分组成,即区分SNPs特异位点的原理和数据的检测分析手段。
传统SNP检测方法包括DNA测序、限制性片段长度多态性(RFLP)、单链构象多态性、变性梯度凝胶电泳、阵列杂交分析、同源杂交、直接测序法等。新兴的方法包括TaqMan探针技术、基因芯片技术等。其中基因芯片技术具有高通量、简便快捷、平行化和成本低廉等优点,且芯片技术的高密度探针矩阵可为大规模SNP分型提供一个高效检测途径。芯片技术平台包括微球微点阵,纤维薄膜微点、玻璃片基微点阵芯片等,其探针密度跨越范围从几百至上百万不等,其中GoldenGateTM所使用的微球芯片密度可达100万,Affymetrix SNP芯片密度近200万,可见芯片技术的探针密度可无限扩增。而高通量的大规模SNPs筛选,其瓶颈之处在于DNA的制备方法与制备技术,而非杂交平台的选择。
4 SNP技术的应用
SNP标记已应用于牛、猪、羊等家畜的遗传学研究中。在牛的遗传研究中,SNP标记主要应用于数量性状座位的定位。在牛的生长、肉质、产奶等数量性状的研究中,SNP技术取得了一些明显的成就。SNP在制作高密度的遗传图谱上也有着极大的应用价值。QTL信息在育种上的高效应用则要求图谱间距精确到几厘米,这样才能识别出QTL变异的碱基,高密度SNPs遗传图谱的出现使育种工作者能够更精确地进行标记辅助选择和品种资源、品种纯度的鉴定。目前,在牛的生长发育、瘦肉率、肉质、产仔率等性状方面,SNP研究取得了较为明显的进步。
SNP作为第三代遗传标记,在复杂疾病的基因定位、关联分析、个体疾病易感性分析与药物基因组学等的研究中发挥着越来越重要的作用。
4.1 致病基因定位 SNP是一种可以早期检测的突变,可用于疾病的连锁分析。人大约有300万个SNP,且分布于全基因组,已知或未知致病基因附近都可能找到众多的SNP位点。因此,SNP可以作为致病基因的遗传标记。
4.2 易感基因的检出 不同个体或群体对疾病的易感性有着很大的不同。在全基因组范围内比较易感和非易感人群之间的SNP图谱,有可能获得易感人群基因组的结果特点,并通过关联分析或连锁不平衡分析指导寻找易感基因。
4.3 在药物基因组学中的应用 通过检测SNP的遗传多态性标记,揭示人群中不同个体对不同药物的敏感性差异的根本原因,从而对医生针对性的用药和药物的开发提供指导依据。
5 SNP的展望
SNP虽然列于基因体学的范畴内,但若能结合多重学科,将可发展个体化医学,也就是针对个人基因特质的医药方式。除了人类基因组的DNA序列数据以外,尚需药物遗传学、临床药理学、毒理学、生物信息学、蛋白质体学等的参与。蛋白质体学的研究目标是确定所有的机体内蛋白质与蛋白质间的相互关系,可望对个体化医学的发展作出重大贡献;而决定个体间蛋白质差异的基因就在于SNP。大规模的SNP分型需要准确可靠的检测方法作为技术支持,所以在未来的SNP发展中,建立一种快速、准确、可靠且成本低廉的方法是SNP分型的发展方向,例如一些商用的检测试剂盒已经出现。随着SNP技术的不断成熟,将会对疾病诊断、治疗和预防带来革命性的进步。
[1]Yoshiura K,Kinoshita A,Ishida T,et al.A SNP in the ABCC11 gene is the determinantofhuman earwax type[J].Nature Genet,2006,(38):324-330.
[2]Brookes A J.The essence of SNPs[J].Gene,1999,234(2):177-186.
[3]Olivier M,Chuang L M,Chang M S,et al.High throughput genotyping of single nucleotide polymorphisms using new biplex invader technology[J].Nucleic Acids Res.,2002:30-33.
[4]Woolley A T,Guillemette C,Cheung C L,et al.Direct haplotyping of kilobase-size DNA using carbon nanotube probes[J].Nature Biotechnol,2000,(18):760-763.
[5]Marsh S,Kwok P,McLeod H L.SNP databases and pharmacogenetics:great start,but a long way to go[J].Hum.Mutat,2002,(20):174-179.