SNP的检测方法及其在农作物遗传育种中的应用
2014-04-08麻艳超郭振清周丽艳东方阳王建设
麻艳超,郭振清,周丽艳,陈 普,陆 鸣,东方阳*,王建设
(1 河北科技师范学院生命科技学院,河北 秦皇岛,066004;2 国家蔬菜工程技术研究中心)
Single Nucleotide Polymorphism(SNP,单核苷酸多态性)是指由于单个核苷酸的变异而引起基因组水平上的DNA序列多态性。在大部分有机体基因组中,SNP是存在最普遍和稳定的遗传多样性类型[1]。人类的基因组中,任何2个同源染色体间,估计每1 000个碱基对中存在1个SNP多态位点[2];在玉米基因3’非编码区,平均每48个碱基对中存在1个SNP多态位点,而在3’编码区平均每130个碱基对中存在1个SNP多态位点[3,4]。在同一物种的不同品种中,同样存在大量SNP,如拟南芥Columbia和Landsberg两种生态型中,每3 300 bp中存在1个SNP;线虫CB4586和N2基因组中,每1 000 bp中就有1个SNP位点[5~7]。因此,相较于传统分子标记技术,如RFLP(Restriction fragment length polymorphism, 限制性长度多态性),AFLP(Amplified restriction fragment polymorphism, 扩增片段长度多态性)和SSR(Simple sequence repeat, 简单重复序列)等,SNP自1996年作为新的术语出现后,很快发展成为第3代分子标记技术[8~11]。
目前,有关SNP检测方法研究比较多,本研究侧重综述常用的单碱基多态性检测技术及其在农作物遗传育种中的应用。
1 SNP的分类
SNP是指在基因组水平上由于单个核苷酸发生插入、缺失、转换和颠换变异所引起的DNA序列的多样性[12],其多态性频率大于1%,但在实际研究中,也常把位于cDNA、频率低于1%的单核苷酸变异称为SNP[13]。
在生物体基因组内,基因编码区和非编码区均分布着大量的SNP,因此,将SNP分为2种类型:一种是基因编码区内(coding region)的SNP[14],称为cSNP;另一种是基因组非编码区的SNP。cSNP又分为2类,一类是同义cSNP(Synonymous cSNP),其引起的基因编码序列的改变不会影响蛋白质氨基酸序列的改变,突变碱基产生同义突变;另一类是非同义cSNP (nonsynonymous cSNP ),其引起的基因编码序列的改变会导致蛋白质氨基酸序列的改变,通常会引起表达蛋白的多态性变异,从而影响蛋白功能[15,16]。位于非编码区的SNP又分为基因周边SNP(peripheral SNP,pSNP)和基因间SNP(intronic SNP, iSNP)。
2 SNP常用检测方法
2.1 直接测序法
直接测序法是最直接、最容易实施的检测SNP的方法[17,18]。首先,PCR扩增出目的产物,通过测序获得目的基因片段序列,再利用生物信息学软件进行序列比对,就可直接检测出是否存在SNP,其检出率达到100%。同时还可以获得SNP类型和突变基因座位点。随着DNA测序自动化和成本的降低,直接测序法在SNP检测和分型中的使用越来越广泛。
2.2 基于限制性酶切位点检测方法
2.2.1酶切扩增多态性序列 酶切扩增多态性序列简称CAPS(Cleaved amplified polymorphic sequence analysis),又称为PCR-RFLP,是广泛应用的传统分子标记技术。该方法在RFLP[19]基础上,利用PCR扩增目的区间产物。若扩增区间存在因单碱基差异而造成酶切位点有无的差异,用相应的酶切扩增产物,再用电泳检测,根据电泳分离结果,即可检测SNP位点的差异[20]。但是,该方法无法检测不涉及到酶切位点改变的SNP。
2.2.2衍生的酶切扩增多态性序列 dCAPS 衍生的酶切扩增多态性序列简称dCAPS(Derived cleaved amplified polymorphic sequence analysis)。是以CAPS为基础,在进行PCR扩增产物时,通过在引物中引入1个或少量错配碱基创造酶切位点,之后再进行相应酶切反应,根据电泳产物分离结果,检测SNP的有无[21]。由于这2种方法对实验技术要求不高,且操作简单,在遗传学研究中被广泛应用。
2.3 基于PCR的检测方法
2.3.1扩增阻遏突变系统 扩增阻遏突变系统简称ARMS(Amplification Refractory Mutation System),又称为等位基因特异性PCR[22,23](Allele-Specific PCR,AS-PCR),其原理是,根据等位基因分别设计2个上游引物,将等位基因的特异碱基位于引物3′-末端,分别与同一个下游引物构成PCR体系。由于TaqDNA聚合酶缺乏3′-5′外切校正活性,只有当引物3′末端与模板严格互补的上游引物才能得到PCR扩增产物,反之,则无PCR产物。因此根据电泳检测产物的有无,即可鉴定单碱基的多态性。这种方法适用于已知多态位点等位基因的检测。
在AS-PCR基础上,科研工作者又对此方法进行了优化改进,Cha等在设计等位基因特异性引物时,有靠近SNP位点的3个碱基中增加了1个错配碱基[24,25];Drenkard等[26]通过优化2次PCR的循环数提高检测结果,并开发SNAPER程序软件为每个SNP等位位点设计16种类型特异性引物,这种改进显著提高了SNP等位位点的检测效率。
2.3.2单碱基引物延伸法(Single nucleotide primer extension) 单碱基延伸技术又称为微测序(Minisequencing)[27]或模板介导染料终止剂掺入( Template-directed dye-terminator incorporation,TDI)分析[28],其原理是在位于待测SNP位点上游的1个碱基处设计1条引物,加入不同荧光标记的ddNTPs进行扩增,当加入的ddNTP与SNP等位基因互补时,延伸才可以继续,之后可以通过检测延伸碱基发出的荧光判断SNP的类型。
2.4 单链构象多态性 SSCP
单链构象多态性技术简称SSCP(Single strand conformation polymorphism)[29],是基于DNA构象差别检测突变的方法,由于长度相同的单链DNA片段,若碱基序列不同,在碱基相互间作用力下形成不同的构象,利用非变性聚丙烯酰胺凝胶电泳即可检测。该方法灵敏、快捷,但对电泳条件要求较高[30]。
2.5 高分辨溶解曲线分析
高分辨溶解曲线分析简称HRM(High Resolution Melting),是根据PCR产物的熔解曲线分析核苷酸差异的[31]。其原理在PCR中加入荧光染料,饱和荧光染料(如LC Green)与PCR产物结合,在DNA解链过程中,荧光染料会释放信号,根据信号绘制熔解曲线,若序列中一个碱基发生突变,熔解曲线发生变化,即可检测出SNP多态性[32,33]。该方法应用较广,对控温的均一性要求较高。
2.6 基因芯片技术(gene chips)
基因芯片(gene chips)又称DNA芯片(DNA chips), 或生物芯片(biological chips),其原理是用制备带荧光标记的待测样品与固定在芯片上的阵列探针杂交,或者用制备无荧光标记的待测样品与固定在芯片上的微阵列探针杂交,之后进行染色,根据杂交信号强弱的差异进行检测[34]。为加快杂交反应速度,美国Nanogene公司研制了Nanochip电子微阵列[35, 36],通过在杂交位点引入电场而使杂交和冲洗过程的速度大大增加。基因芯片是利用核酸杂交原理建立的一种高度集成化、微型化和自动化的检测技术,已在基因多态性分析方面广泛应用。
3 SNP在作物遗传育种中的应用
3.1 农艺性状基因关联分析
基因组多数SNP的变异与植物基因功能密切相关,通过关联分析可以挖掘出功能型位点变异,并对作物遗传育种有重要的指导意义[37, 38]。吴德志[39]通过对188株西藏野生大麦材料的关联分析表明,与bPb-489标记紧密连锁的HvCBF4基因可能与大麦的耐盐性相关。Konishi等[40]发现水稻的qSH1基因5′调节区1个SNP的变异落粒性相关。王仲平[41]首次利用改进了的Ecotilling酶切检测技术,发现了一个新的水稻光周期敏感的重要基因Hd6等位基因。玉米基因组中含有丰富的SNP,通过SNP与耐旱性状进行关联分析,可以找到与玉米耐旱相关的代谢和农艺性状候选基因及其变异位点,苏志平[42]通过关联分析,发现在干旱胁迫下,dbf1基因中的多态性位点366与ASI和单穗粒质量显著关联,位点452与单穗粒质量和结实株数百分率存在显著关联。刘昌林[43]利用来源于美国杂交种P78599的5份高抗粗缩病自交系(R18,P138,X178,金黄59和齐318)和全基因组41 101个SNP,筛选到9个包含与抗病性显著相关的SNP衍生片段。
3.2 遗传图谱的构建
SNP具有多态性丰富、在作物基因组中分布密度大等优点,在重要作物遗传图谱构建上已显示出其特有的优势和广泛应用前景。Bhattramkki 等以高分辨率的B73×Mo17为作图群体材料,绘制了玉米EST遗传图谱,整个基因组中分布了超高密度的SNPs,促进了基于连锁不平衡的关联图谱的构建[44]。韩志国等[45]根据SNP将FIF1基因定位于四倍体棉花遗传图谱上。李博等[46]利用41 101个SNP标记对159份我国玉米自交系进行全基因组分析,检测到7个与穗位高显著相关SNP,并将收集的137个穗位高QTL整合至IBM2 2008 Neighbors玉米遗传图谱上。Wim等[47]筛选出甜瓜EST-SNP标记,建立了葫芦科作物中第1个包含SNP标记的遗传图谱。
3.3 基因克隆及定位
由于SNP分布广的特点,在与农作物基因克隆中,以SNP为基础的AS-PCR,CAPS,dCAPS等分子标记已成为一种非常重要的研究手段。潘存红等[48]通过BLAST比对籼稻品种93-11与粳稻日本晴,利用SNP多态性位点克隆出水稻卷叶基因。卫波等[49]完成了小麦抗旱相关基因的SNP标记和定位。韩志国等[45]克隆了陆地棉TM-1和海岛棉7124中的FIF1基因。Yang等[50]利用3个番茄品种,将46个SNP定位在染色体的特定区域,并证明2个SNP与果实颜色基因座紧密连锁。李博等[46]结合分析的7个与穗位高显著相关的SNP位点信息,获得了2个候选基因。
3.4 种质鉴定及亲缘关系分析
SNP在分子育种品质鉴定和资源分类中有非常重要的利用价值。Brunner等[51]利用SNP开发了基于PCR的大麦家系叶锈病抗病性状标记,用于鉴定优良种质。赵婷婷[52]利用SNP分子标记技术筛选抗病基因Cf-9的单碱基突变位点,获得含有番茄抗叶霉病基因Cf-9的番茄材料,为培育新抗病品种提供物质基础。宋伟等[53]根据多态性水平、染色体位置等信息从公共数据库上筛选了48个玉米核心SNP位点,并通过基因分型分析,找到了42个可以用来区分105份自交系材料的SNP位点。兰青阔建立了基于CLA6位点的黄瓜杂交种纯度鉴定方法,并用该方法检测出黄瓜杂交种优一种子的纯度[54]。
SNP标记还可用于种间亲缘关系分析,Germano等[55]利用直接测序法对云杉种间SNP进行分析,鉴定出3个近缘种间的多态性。孙清明等[56]利用自主开发的SNP和EST-SSR等2种分子标记技术,鉴定出御金球为1份全新荔枝种质,并且首次完成了对荔枝新种质御金球的亲本来源鉴定。Kota等[57]分析了大麦7个基因型180个EST位点,发现了72个可应用于亲缘关系中研究的SNP。
4 结 论
基因组SNP具有数量多、分布广的特点,使之成为第3代分子标记技术。在农作物及其他物种研究中,具有强大的开发与利用潜能。目前,SNP已在作物农艺性状基因关联分析、遗传图谱的构建、作物基因克隆与定位、种质资源鉴定以及亲缘关系分析中发挥着重要的作用。今后对于SNP进一步的开发研究,必将在生命科学领域和农作物遗传育种中发挥更大的作用。
[1] Cho R J,Mindrinos M,Richards D R,et al.Genome-wide mapping with biallelic markers in Arabidopsis thaliana[J].Nat Genet,1999,23:203-207.
[2] Cooper D N,Smith B A,Cooke H J,et al.An estimate of unique DNA sequence heterozygosity in the human genome[J].Hum Genet,1985,69:201-205.
[3] Tenaillon M I,Sawkins M C,Long A D,et al.Patterns of DNA sequence polymorphism along chromosome 1 of maize (ZeamayssspmaysL)[J].Proceedings of the National Academy of Sciences,2001,98(16):9 161-9 166.
[4] Rafalski A.Applications of single nucleotide polymorphisms in crop genetics[J].Curr Opin Plant Biol,2002,5:94-100.
[5] Jakubowski J,Kornfeld K.A local,high-density,single-nucleotide polymorphism map used to clone Caenorhabditis eleganscdf-1[J].Genetics,1999,153(2):743-752.
[6] Koch R,Luenen H G,Horst M,et al.Single nucleotide polymorphisms in wild isolates of Caenorhabditis elegans[J].Genome Res,2000,11:1 690-1 696.
[7] Swan K A,Curtis D E,McKusick K B,et al.High-throughput gene mapping in Caenorhabditis elegans[J].Genome Res,2002,7:1 100-1 105.
[8] Gupta P K,Roy J K,Prasad M.Single nucleotide polymorphisms: a new paradigm for molecular marker technology and DNA polymorphism detection with emphasis on their use in plants[J].Currret Science,2001,80:524-535.
[9] Hayashi K,Hashmioto N,Daigen M.A development of PCR-based SNP markers for rice blast resistance genes at the Piz locus[J].Theor Appl Genet,2004,108:1 212-1 220.
[10] Gut I G.Automation in genotyping of single nucleotide polymorphisms[J].Human mutation,2001,17(6):475-492.
[11] Kwok P Y.Methods for genotyping single nucleotide polymorphisms[J].Annual review of genomics and humam genetics,2001,2(1):235-258.
[12] Wang D G,Fan J B,Siao C J,et al.Large-scale identification,mapping,and genotyping of single-nucleotide polymorphisms in the human genome[J].Science,1998,280:1 077-1 082.
[13] Brooker A J.The essence of SNPs[J].Gene,1999,234:177-186.
[14] Collins F S,Guyer M S,Chakravarti A.Variations on a theme: Cataloging human DNA sequence variation[J].Science,1997,278:1 580-1 581.
[15] Tao H,Cox D R,Frazer K A.Allele-specificKRT1 expression is a complex trait[J].PLoS Genet,2006,2:93.
[16] Kaessmann H,Heissig F,Von Haeseler A,et al.DNA sequence variation in a non-coding region of low recombination on the human X chromosome[J].Nature genetics,1999,22(1):78-81.
[17] Gaut B S,Clegg M T.Nucleotide polymorphism in theAsh1 locus of pearl millet[J].Genetics,1993,135:1 091-1 097.
[18] Rieder M J,Taylor S L,Tobe V O,et al.Automating the identification of DNA variations using quality-based fluorescence re-sequencing: analysis of the human mitochondrial genome[J].Nucleic acids research,1998,26(4):967-973.
[19] Botsein D,White R L,Skolnich M,et al.Construction of a genetic linkage map of man using restriction fragment length polymorphisms[J].Am J Hum Genet,1980,32:314-331.
[20] Konieczny A,Ausubel F M.A procedure for mapping Arabidopsis mutations using codominant ecotype-specific markers[J].Plant J,1993,4:403-410.
[21] Neff M M,Neff J D,Chory J,et al.dCAPS,a simple technique for the genetic analysis of single nucleotide polymorphisms: experimental applications in Arabidopsis thaliana genetics[J].The Plant Journal,1998,14(3):387-392.
[22] New C R,Graham A,Heptinstall L E,et al.Analysis of any point mutation in DNA, the amplification refractory mutation system(ARMS)[J].Nucleic Acids Res,1989,17: 2 503-2 515.
[23] Tuano G,Kidd K K.Direct haplotyping of chromosomal segments from multiple heterozygotes via allele-specific PCR amplification[J].Nucleic Acids Res,1989,17(20):8 392.
[24] Cha R S,Zarbl H,Keohavong P,et al.Mismatch amplification mutation assay (MAMA):application to the chras gene[J].PCR Methods Appl,1992,2:14-20.
[25] Kwok S,Chang S Y,Sninsky J J,et al.A guide to the design and use of mismatched and degenerate primers[J].PCR Methods Appl,1994,3(4):S39-S47.
[26] Drenkard E,Richter B G,Rozen S,et al.Ausubel FM: A simple procedure for the analysis of single nucleotide polymorphisms facilitates map-based cloning in Arabidopsis[J].Plant Physiol,2000,124:1 483-1 492.
[27] Pastinen T,Kurg A,Metspalu A,et al.A specific tool for DNA analysis and diagnostics on oligonucleotide arrays[J].Genome Res,1997,7(6):606-614.
[28] Chen X,Zehnbauer B,Gnirke A,et al.Fluorescence energy transfer detection as a homogeneous DNA diagnostic method[J].Proc Natl Acad Sci USA,1997,94:10 756-10 761.
[29] Hayashi K.PCR-SSCP:A simple and sensitive method for detection of mutations in the genomic DNA[J].Herhedity,2000,85(4):346-355.
[30] 黄建安.茶树分子遗传图谱构建及多酚氧化酶基因的SNP[D].长沙:湖南农业大学,2004.
[31] Liew M,Pryor R,Palais R,et al.Genotyping of single-nucleotide polymorphisms by high-resolution melting of small amplicons[J].Clinical Chemistry,2004,50(7):11-56.
[32] Zhou L,Myers A N,Vandersteen J G,et al.Closed-tube genotyping with unlabeled oligonucleotide probes and a saturating DNA dye[J].Clin Chem,2004,50(8):1 328-1 335.
[33] Vossen R H,Aten E,Roose A,et al.High-resolution melting analysis(HRMA): more than just sequence variant screening[J].Hummutat,2009,30(6):860-866.
[34] Pastinen T,Kurg A,Metspalu A,et al.A specific tool for DNA analysis and diagnostics on oligonucleotide arrays[J].Genome Res,1997,7:606-614.
[35] SosnowskiR G,Tu E,ButlerW F,et al.Rapid determination of single base mismatch mutations in DNA hybrids by direct electric field control[J].Proc Natl Acad Sci USA,1997,94:1 119-1 123.
[36] Edman C F,Raymond D E,Wu D J,et al.Electric field directed nucleic acid hybridization on microchips[J].Nucleic Acids Res,1997,25:4 907-4 914.
[37] ZHU C S,GORE M,BUCKLER E S,et a1.Status and prospects of association mapping in plants[J].The plant genome,2008,1:5-20.
[38] 陈吉宝,赵丽英,褚学英,等.植物中单核苷酸多态性的分布及其应用[J].安徽农业科学,2009,37(31):15 153-15 166.
[39] 吴德志.西藏野生大麦耐盐种质的发掘及其耐盐机制研究[D].杭州: 浙江大学,2011.
[40] Konishi S,Izawa T,Lin S Y,et al.An SNP caused loss of seed shattering during rice domestication [J].Science,2006,312:1 392-1 396.
[41] 王仲平.水稻SSSL数据库的构建与抽穗Hd6的等位基因分析[D].广州:华南农业大学,2012.
[42] 苏治平.耐旱候选基因与玉米相关性状的关联分析[D].北京:作物科学研究所,2009.
[43] 刘昌林.玉米抗粗缩病全基因组关联与连锁分析[D].北京:作物科学研究所,2013.
[44] Bhattramakki D,Dolan M,Hanafey M,et al.Insertion-deletion polymorphisms in 3′ regions of maize genes occur frequently and can be used as highly informative genetic markers[J].Plant Mol Bio,2002,48:537-547.
[45] 韩志国,郭旺珍,张天真.一个FIF1基因的SNP及定位研究[J].作物学报,2007,33(2):256-261.
[46] 李博,张焕欣,杨小艳,等.玉米穗位高全基因组关联分析及其候选基因预测[J].作物杂志,2013(2): 27-31.
[47] Wim D,Cristina E,Cristina R,et al.A set of EST-SNPs for map saturation and cultivar identification in melon[J].BMC Plant Biology,2009,9:90.
[48] 潘存红,王子斌,马玉银,等.InDel和SNP标记在水稻图位克隆中的应用[J].中国水稻科学,2007,21:447- 453.
[49] 卫波,景蕊莲,王成社,等.用等位基因特异PCR检测普通小麦(TriticumaestivumL.)的单核苷酸多态性[J].中国农业科学,2006,39(7):1 313-1 320.
[50] Yang W C,Bai X D,Kabelka E,et al.A covery of single nucleotide polymorphisms in Lycopersicon esculentum by computer aided analysis of expressed sequence tags[J].Molecular Breeding,2004,14:2 134.
[51] Brunner S,Keller B,Feuillet C.A large rearrangement involving genes and low-copy DNA interrupts the microcollinearity between rice and barley at the Rph7 locus[J].Genetics,2003,164:673-683.
[52] 赵婷婷.番茄抗叶霉病基因Cf-9的SNP分子标记筛选及种质资源鉴定[D].哈尔滨:东北农业大学,2012.
[53] 宋伟,王凤格,田红丽.利用核心SNP位点鉴别玉米自交系的研究[J].玉米科学,2013,21(4): 28-32.
[54] 兰青阔,张桂华,王永,等.基于SNP标记的黄瓜杂交种纯度鉴定方法[J].中国蔬菜,2012(6):58-63.
[55] Germano J,Klein A S.Species specific nuclear and chloroplast single nucleotide polym orphisms to distinguish Picea glauca, P. mariana and P. rubens[J].Theor Appl Genet,1999,99:37- 49.
[56] 孙清明,李永忠,向旭,等.利用SNP和EST-SSR分子标记鉴定荔枝新种品质御金球[J].分子植物育种,2013,11(3):403-414.
[57] Kota R,Varshney R K,Thiel T,et al.Generation and comparison of EST-derived SSRs and SNPs in barley(Hordeum uulgare L.)[J].Hered itas,2001,135:145 -151.