SNP分子标记及其在作物品种鉴定中的应用
2024-05-04田海燕张海娜王永强周永萍张莹璐
田海燕,张海娜,王永强,周永萍,张莹璐
(河北省农林科学院棉花研究所/农业农村部黄淮海半干旱区棉花生物学与遗传育种重点实验室,国家棉花改良中心河北分中心,石家庄 050051)
0 引言
作物优良品种的选育和推广是实现农业高产优质的前提和基础,是保障中国粮食安全的重要环节。品种鉴定是优良品种选育和推广的重要保障,是品种审定和种子市场监管的主要内容,在新品种培育、种子生产、加工及经营等过程中具有重要意义[1]。
检测方法是对品种进行精准鉴定的关键。传统的田间表型鉴定,试验周期长、易受环境影响,并且随着育种亲本遗传基础的日益狭窄,新品种之间相似度增加,不易区分,难以满足快速、准确鉴定品种的需求[2]。20世纪后期,分子标记技术实现了从DNA水平对品种进行鉴定,从而区分亲缘关系较近的品种,与传统的田间表型鉴定相比,分子标记技术具有鉴定效率高、周期短、结果准确等诸多优点[3-4]。以RFLP为代表的第1代分子标记和以RAPD、AFLP、SSR等为代表的第2代分子标记在品种鉴定中发挥了重要作用。随着分子标记技术的不断深入研究,第3 代分子标记SNP逐渐应用于品种鉴定领域,有效弥补了第1、2 代分子标记在实际应用过程中存在的试验可重复性差、数据整合困难、检测通量低等缺陷[5]。近年来,SNP分子标记在玉米[6]、水稻[7]、小麦[8]、棉花[9]、大豆[10]等农作物种子的真实性鉴定、纯度检测、指纹数据库构建、亲缘关系分类等方面得到了广泛应用。本文主要从SNP 分子标记的特点、检测方法及在主要农作物品种鉴定中的应用等方面展开阐述,以期为后续利用SNP标记开展品种鉴定工作提供参考。
1 SNP分子标记技术及其特点
单 核 苷 酸 多 态 性 (Single Nucleotide Polymorphism, SNP),由美国学者Lander 于1996 年首次提出[11],是指基因组DNA序列上单个碱基的变异所引起的DNA序列多态性,由单个核苷酸的颠换、转换、缺失和插入产生,其中转换和颠换两种突变形式占绝大部分,插入和缺失两种突变形式几乎可以不计[12]。作为第3代分子标记,SNP标记具有以下突出特点:
一是高密度性,在动植物基因组中普遍存在。SNP 标记在动植物基因组中分布广泛,且数量巨大。在人类基因组中,SNP 的平均密度约为1 个SNP/1000bp;在水稻基因组中,SNP标记的平均密度约为1个SNP/154bp;在玉米基因组中,SNP标记的平均密度约为1个SNP/57 bp。在基因组的非编码区,SNP标记出现的概率更高,可以在任何一个目的基因的内部或附近找到[13]。二是突变率低,一般仅为10-9,能够在生物体基因组中稳定遗传,相比SSR等多态性标记遗传稳定性更高[14]。三是通常为二等位多态性,在进行基因组筛查时,对于检测结果只需进行是与非的判断即可,而不用分析片段的长度,操作简便,检测效率高,易于实现自动化和不同来源数据的整合和标准化[12,15]。四是具有较强的代表性,当SNP分子标记位于基因编码区时,可能会直接影响蛋白质结构或表达水平,因此有可能为性状遗传研究提供一定的参考依据[16]。
2 SNP分子标记的检测
SNP 分子标记的检测方法很多,分类方法也有多种,但总的来说早期检测主要是以凝胶电泳为基础,包括单链构象多态性、酶切扩增多态性序列、变性梯度凝胶电泳、等位基因特异性PCR 等,这些传统方法技术简便,成本低,适用于已知SNP的判断,且仅适用于少量样本的检测[17]。随着分子生物技术的发展,研究人员对SNP 的检测方法不断进行探索和改进,快速、准确、高通量、自动化程度较高的检测方法逐步应用并成为主要检测手段,包括变性高效液相色谱法、高分辨率溶解曲线、质谱检测法、DNA 测序、基因芯片、竞争性等位基因特异性PCR、靶向测序基因型检测等[18-19],下面着重介绍几种在农作物研究中常用的高通量检测方法。
2.1 高分辨率熔解曲线
高分辨率熔解曲线(High Resolution Melting,HRM)是在PCR 基础上通过实时监测DNA 双链溶解曲线变化来检测突变的方法。其原理是将用荧光染料标记的PCR产物在一定的温度范围内进行变性,荧光染料从解链的DNA分子脱落,荧光信号下降。存在突变的异源双链DNA 变性温度低于同源双链DNA,会提前解链,通过实时监测DNA在溶解过程中荧光信号强度随时间变化的曲线即可鉴定是否存在SNP。由于SNP位点的碱基类型和数目对溶解曲线峰形的影响不同,因此HRM 技术可以有效区分不同的SNP 位点和基因型[17]。该技术具有高通量、低成本、操作简单、结果准确、不受检测位点限制等优点,在作物研究中得到较为广泛的应用。冯俊彦等[20]利用简化基因组测序技术开发出基于HRM 技术的甘薯特异SNP 分子标记,并将其中的34 对Hrm-bat 引物应用于52 份甘薯种质材料的亲缘关系分析,所有引物在全部参试材料间的平均多态性达到59.35%,证明了这些分子标记在甘薯种质材料间具有丰富的遗传多态性,可用于遗传多样性研究。另外HRM技术还应用于作物突变体鉴定[21]、分子标记辅助选择[22-23]等方面。该方法在基因型相对不多、样品量极大时具有显著优势。HRM技术的不足之处为不能完全替代测序,只能通过对熔解曲线不同的代表性样品的测序而大大减少测序的工作量[24]。另外,由于不同DNA分子间的SNP所导致的Tm值差异细微,这对检测设备提出了较高的要求,要求荧光检测设备灵敏度高,而且控温准确、精确[25]。
2.2 竞争性等位基因特异性PCR
竞争性等位基因特异性PCR( Kompetitive Allele Specific PCR,KASP)是一种基于荧光检测的基因分型技术,能够在复杂的基因组DNA 中对特定位点上的SNP和插入缺失序列进行精准的双等位基因检测。检测体系包括DNA模板、2个通用荧光探针、2个通用淬灭探针、2 个与目标位点特异结合的引物(5'末端添加通用标签序列)以及共同的反向引物。在PCR 扩增中,首先等位基因特异引物识别特定等位基因模板,完成等位基因识别,之后扩增产物中出现携带通用标签序列的模板,携带荧光的探针通过与通用标签序列互补的DNA 链结合而添加到PCR 产物中,最终实现PCR 产物的荧光检测分析[26]。由于KASP 技术不需要针对每个SNP 位点设计荧光探针,只需合成2 个带有不同颜色的荧光基团和双链通用探针,大幅降低了试验成本;还可同时满足低、中、高通量基因分型的要求,具有通量高、成本低、准确、灵活的特点,已成功应用于超过100 多个物种的亲缘关系研究[27]、种质鉴定[28]、分子标记辅助育种[29]、遗传图谱构建与基因定位[30]、品种纯度检测[31]等方面。但相较于基因芯片、靶向测序基因型检测等更高通量的检测方法,KASP同HRM 技术一样更适合于基因型相对不多,样品量极大的检测。
2.3 基因芯片
基因芯片是基于碱基互补配对原则的核苷酸序列杂交。首先将设计合成好的核苷酸探针用特殊的方法高密度地覆盖在经过处理的固相载体上,然后将待测样本经过荧光染料标记(一般用Cy3和Cy5标记)后与芯片上的探针在适宜条件下杂交,如果待测样本的序列与探针序列完全互补,发出的荧光信号就会很强,反之,荧光信号就会很弱,杂交结束后通过芯片扫描仪检测荧光信号,并将荧光信号转化为数字信号后进行分析[5,32]。基因芯片是一种高集成、高通量、微型化和自动化的SNP 检测方法[33],只需一次杂交就可以实现成千上万个位点的筛查,是作物遗传多样性[34]、群体结构[35]、QTL 定位[36]等研究的有效技术手段。相比其他检测方法,基因芯片技术适合于育种工作中对大量群体样本进行基因型鉴定,以及超高通量的标记检测,如高精度的GWAS 分析等。但缺点是定制和检测服务的费用相对较高。
2.4 测序法
测序法是检测出SNP 信息量最多且最直接的方法。通过测序,可直接获得目的片段的碱基序列,序列间比对后可直观有效地获得SNP,检出率高达100%,同时还可以确定SNP的准确位置以及发生的类型,是最准确的检测方法。第二代测序技术的出现,与第一代测序技术相比,向高通量、低成本方向迈进了一大步,同时也推动了测序技术在基因分型检测上的发展[37]。基于简化基因组测序的基因分型测序技术(Genotyping By Sequencing,GBS),在作物亲缘关系和遗传多样性分析、遗传图谱构建和基因定位等方面有较为广泛的应用。赖国荣等[38]以玉米自交系X178 和NX531 为亲本,构建了150 个株系的重组自交系群体,基于GBS 技术获得基因型纯合的多态性SNP 位点,得到7278 个重组bin 标记,构建了总长为2569 cM的高密度遗传图谱,标记间平均遗传距离为0.35 cM,通过对重组自交系群体籽粒脂肪含量、赖氨酸含量、蛋白质含量和淀粉含量4 个营养品质性状进行QTL定位,共检测到20 个QTL,验证了高密度遗传图谱的可靠性。测序法进行基因分型具有精准度高,突变位点信息量大的优势,但是对于具有复杂和重复基因组的植物,测序和基因分型大量个体仍需要较高的成本。另外测序产生的数据庞大而复杂,在数据分析方面对科研人员提出了较高的要求,需要进一步寻找快速和准确的数学算法和数据处理技术以提高数据分析的效率和质量。
2.5 靶向测序基因型检测
靶向测序基因型检测(Genotyping By Target Sequencing,GBTS)是近年发展起来的一种标记检测技术,是从基因组DNA中挑选特定的靶向位点进行测序和基因型检测,由基于多重PCR 的GenoPlexs 体系和基于液相探针杂交的GenoBaits两个技术体系组成,可广泛用于资源评价、基因定位和克隆、遗传图谱构建、分子标记辅助选择、品种权保护等领域[39]。目前在小麦[40]、玉米[41]、棉花[42]、大豆[43]、油菜[44]、蚕豆[45]、花生[46]等作物中均研制出基于GBTS 的液相芯片,并得到初步应用。如CHEN等[47]利用浙江大学研制的棉花40K液相芯片,采用GBTS 技术对612 份棉花材料进行基因分型,种群聚类分析将612 份材料划分为4 类,对5种环境下的5 个纤维品质性状进行了GWAS 分析,共检测到42个与目标性状相关的SNP位点,可为将来开展棉花品质育种提供更精确的分子标记。GBTS技术是一种自动化、智能化和高通量的检测方法。基于GBTS 的液相芯片与固相芯片相比具有较强的灵活性,可随时升级添加标记位点,而且不受检测样本量的限制,成本低于常规固相芯片,但不足的是无法达到固相芯片所能实现的标记的超高密度,不适合高精度的GWAS分析[48]。
综上,SNP的检测方法很多,但各种方法适用类型及对试验条件要求等各不相同,应根据研究目标、试验条件等综合考虑选择合适的方法,也可几种方法一并使用,以达到最佳检测效果。
3 SNP分子标记在作物品种鉴定中的应用
3.1 在品种真实性鉴定和纯度检测中的应用
快速、精准地对品种进行真实性和纯度鉴定,是保护种业知识产权和消费者权益的基础和前提。建立快速、准确、高通量的检测技术是生产中亟待解决的实际问题,与传统的表型鉴定相比,分子水平上的真实性和纯度鉴定除了具有周期短、结果准确、可大规模操作等诸多优点外,尤其适用于亲缘关系较近的资源和品种的鉴定。SNP标记以其高密度、遗传稳定、易于实现自动化分析等优势成为当今品种鉴定的重要技术选择。近年来,在小麦、玉米、水稻等主要粮食作物真实性和纯度鉴定上得到广泛应用。刘丽华等[49]利用wheat 90K SNP 芯片对380 份小麦品种进行全基因组扫描、分析和评价,筛选出高质量、高分辨率、单拷贝和均匀分布的候选SNP标记384个,并进一步获得14个核心SNP 的KASP 标记组合一套,提出了“核心位点+扩展位点”的高通量鉴定模式。李乐等[50]发明了一套用于小麦品种纯度检测的包含21 个高质量和高多态性的SNP 标记组合及其应用方法,为小麦品种纯度的精准检测提供了可靠技术支持。郑向华等[51]利用3000 份水稻种质资源信息,通过SNP-index 的方法筛选得到4084个籼粳特异SNP位点,采用大规模简单随机取样等统计分析方法对籼粳特异位点进行数据降维处理后,精简至40个SNP位点,并验证了40-SNP对品种鉴定的可靠性。徐建龙等[52]发明了用于水稻种质资源和品种鉴定的SNP标记组合,包含70个核心SNP位点和130 个扩展SNP 位点,可为水稻品种和种质资源身份鉴别、纯度鉴定及品种确权提供强有力的技术支撑。YU 等[53]开发了基于水稻全基因组SNP 信息的芯片RICE6K,该芯片包含了籼粳稻亚种间和籼粳稻亚种内品种间的多态性信息,可用于水稻品种的纯度和真实性鉴定。JOSIA 等[54]使用92 个KASP-SNP 标记对26个玉米自交系进行了遗传纯度评价,结果表明67%的自交系是遗传纯系,剩余杂合度<5%,33%的自交系杂合度>5%,需要进一步纯化,证明了SNP标记是遗传纯度评价的一种有效、可靠标记。李雪等[55]分析比较了SNP芯片和SSR荧光毛细管电泳两种方法在玉米品种真实性鉴定中的应用,结果显示两种标记都具备较高的品种区分能力,而且SNP 标记在数据整合共享、位点通量等方面展现了较强的优势。除了在主要粮食作物中的应用,SNP标记还应用在棉花、大豆以及其他蔬菜、水果、豆类等作物品种的真实性和纯度鉴定中,更多应用情况详见表1。随着各类作物品种审定数量逐渐增多,同质化问题凸显,对品种真实性鉴定和纯度检测均提出了更高的要求。试验结果证实,SNP 标记在品种真实性和纯度鉴定中结果准确可靠,与传统的SSR标记相比,在不同的应用场景,SNP标记可以灵活实现低、中、高通量的检测,而且检测方法更加自动化,可满足新形势下品种鉴定需求,有良好的研究潜力和应用前景。
3.2 在亲缘关系分析与分类中的应用
亲缘关系分析与分类是作物种质资源研究的重要内容,应用分子标记技术在DNA水平上进行亲缘关系分析,可以对作物的遗传物质进行大范围评价比较,能更全面地反应其遗传多样性,为亲缘关系分析与分类提供分子水平的客观依据。鉴于上述SNP 标记的优点,其在亲缘关系分析和分类以及种质资源遗传多样性研究中具有较大的应用潜力。在主要粮食作物品种上,白彦明等[56]利用小麦660K SNP芯片对北方小麦原始骨干亲本蚂蚱麦、小白麦及其衍生品种(系)进行全基因组扫描,分析其遗传多样性,结果表明蚂蚱麦和小白麦衍生系的遗传多样性较低,需引入新的种质资源,增加优异基因扩宽遗传基础。KASSA 等[57]通过扫描小麦90K SNP芯片,获得多态性标记28798个,评估了196个加拿大春小麦品种(系)的遗传多样性,将196份材料分为八类,为加拿大春小麦遗传育种研究提供了基础数据和技术支持。高嵩等[58]利用6973 个SNP 位点对来自7个类群的205份自交系材料进行群体遗传结构和遗传多样性分析,205份自交系被划分为7个杂种优势群,划群结果和系谱来源具有较好的一致性,分析结果为玉米强优势杂交种的选育奠定了基础。朴日花等[59]利用SNP分子标记对54份香型粳稻和8份非香稻资源进行遗传多样性分析,62 份材料共分为3 个类群,相似系数为0.82,大多数材料并没有按地理来源明显分开,表明材料间的遗传距离很近,地域间资源交流广泛,研究结果可为北方香型粳稻种质资源研究及育种亲本选配提供参考。此外,SNP 标记还被用于其他作物的亲缘关系分析、分类中,详细应用信息见表1。利用分子标记开展作物亲缘关系分析研究的报道较多,早期所用标记多为AFLP、SSR等2代分子标记,标记数量相对较少,难以覆盖全基因组,近年来,随着SNP 标记技术的发展,基因芯片、GBS、GBTS 等高通量检测技术的应用,为作物亲缘关系分析与分类提供了更广阔的研究和应用空间。
4 展望
在中国新《种子法》实施、种业知识产权保护进入新时代的大背景下,检测需求也不断发生变化,对检测方法、检测成本、标记鉴别效率、数据分析等均提出了更高的要求。未来,SNP 标记在作物品种鉴定上的发展方向应为:(1)高效低成本检测方法的进一步研发与应用。目前,SNP 标记的开发及高通量检测技术的成本仍然相对较高,在一定程度上限制了其应用,随着SNP 技术的进一步成熟,高通量、高准确率、低成本的检测方法是研究的重要方向。(2)提高标记鉴别效率。针对不同作物,进一步筛选核心SNP 标记,达到使用少量标记鉴别大量品种的目的。(3)数据处理系统的进步。虽然SNP数据非常丰富,但其中也包括了大量冗余信息,海量数据的处理和分析使得研究人员很难快速准确的获得有用信息,需要进一步研究快速、准确、易于操作的数据处理系统以提高数据分析的效率和质量。随着各方面研究的进一步发展和完善,检测成本的逐步下降,SNP 标记必将在作物品种鉴定领域发挥更大的作用。