利用SNP分子标记构建50份糯玉米自交系DNA指纹库
2020-07-10孙小淋沈雪芳
韩 晴,孙小淋,卢 媛,田 东,施 标,沈雪芳*
(1上海市农业科学院作物育种栽培研究所,CIMMYT:中国特用玉米研究中心,上海 201403;2上海市农业科学院生态环境保护研究所,上海201403)
糯玉米(ZeamaysL.var.ceratinaKulesh)是玉米属的一种类型,起源于中国[1],富含支链淀粉、赖氨酸、蛋白质等营养物质,具有良好的适口性且营养丰富,深受广大消费者和食品加工企业的欢迎。近年来,通过国家审定的糯玉米品种数量越来越多,其种植面积不断增加,同时也出现套牌侵权、伪劣假种等现象,严重影响种业健康持续发展[2]。
早期的品种鉴别主要依靠形态学方法,这种方法易受人为和环境的影响。随着分子生物学的发展,出现了分子标记技术如RFLP、AFLP、SSR等,该技术不受环境影响,鉴别周期短,被广泛应用于品种鉴定、遗传多样性分析、DNA指纹库构建等。王凤格等[3]利用40对核心SSR引物分析了328个玉米品种的遗传多样性,发现育成的品种遗传多样性指数在不同年份间变化不大。卢媛等[4]利用29对SSR标记对87份糯玉米自交系进行遗传多样性分析,并将其划分为4大类群,各个类群包含种质不同。常利芳等[5]利用40对SSR标记对56份超甜玉米和88份普甜玉米进行聚类分析,共筛选出14个超甜玉米和19个普甜玉米两个亚群体种质,这两个亚群核心种质保留了原始群体的遗传多样性和表型变异,能够代表原始甜玉米材料群体。但采用SSR等分子标记技术构建玉米品种DNA指纹库普遍存在检测位点数量少、标记数量有限和位点突变率高等缺点。SNP标记作为继AFLP、SSR标记后的第三代分子标记,具有分布广泛、呈二态性、通量高、遗传稳定性强和易于自动化分析等优点,已被国际植物新品种权保护联盟(UPOV)推荐用于DNA指纹数据库的构建[6]。目前,SNP标记已应用于油菜[7]、甘蓝[8]、海岛棉[9]等作物指纹库的构建和作物的分子标记辅助育种中[10],但SNP标记在糯玉米DNA指纹库中的应用很少。本研究利用SNP标记对糯玉米自交系进行基因型分析,并利用核心SNP标记构建糯玉米自交系的DNA指纹库,同时对糯玉米自交系类群进行聚类分析,以期为糯玉米品种确权、遗传多样性分析和育种者权益保护提供理论基础。
1 材料与方法
1.1 试验材料
供试材料为50份糯玉米自交系,由上海市农业科学院玉米遗传育种课题组提供。编号为1—50,品系名称、系谱来源及籽粒性状见表1。
表1 50份供试糯玉米自交系
1.2 DNA提取
将50份自交系种植在人工气候培养箱中,生长到两叶一心时取幼苗叶片。每个品系取5株,混合,采用植物基因组DNA提取试剂盒(离心柱型,TIANGEN DP320)提取幼苗DNA,具体流程参照试剂盒说明书。用1%琼脂糖凝胶电泳对提取样品DNA质量进行检测,要求主带明显、单一,保证DNA的A260/A280值在1.8—2.2。样品DNA置于-20℃保存备用。
1.3 基因分型
利用Illumina公司研发的包含56 110个SNP标记(Illumina,San Diego,California,U.S.A)对供试材料进行基因型分析,按照芯片操作手册进行DNA处理、DNA与芯片杂交、洗脱、单碱基延伸等步骤,将原始数据导入GenomeStudio 软件(V2 011.1,Illumina,Inc.)进行SNP 分型。
用tassel 5.0软件对试验材料基因型进行统计,包括样品的缺失率、杂合率以及SNP的最小等位基因频率(Minor Allele Frequency,MAF),选出位点检出率大于95%、最小等位基因频率大于0.01、杂合率小于0.05的共42 406个SNP标记用于后续分析。利用位点筛选工具LociScan_V1.0对位点进行梯度筛选。
1.4 聚类分析
用tassel 5.0软件计算各品系之间的遗传距离和遗传相似度,利用NTSYSpc 2.1软件和UPGMA算法进行聚类分析[11]。
2 结果与分析
2.1 SNP标记的分析
利用筛选得到的42 406个SNP标记对50份糯玉米自交系进行SNP分型。99%的位点检出率大于95%,94%的位点检出率超过97%(图1)。说明该芯片对糯玉米自交系SNP位点具有较高的分型效率。42 406个SNP位点在50份糯玉米自交系的杂合率为2%—9%,平均4%,说明自交系纯合度较高;SNP缺失率为0—13%,平均1%,说明SNP芯片质量好;最小等位基因频率(MAF)为0.05—0.55,平均0.40;多态性信息含量(PIC)在0.12—0.46,平均0.38。基因多样性指数变化范围为0.15—0.65,平均0.44。
2.2 DNA指纹库的构建
分别选用8个不同的数量位点,即7 000、8 000、9 000、 10 000、25 000、30 000、35 000、40 000,统计分析位点的识别率。发现这些位点MAF在0.41及以上,杂合率在0.05及以下,PIC在0.31及以上。随着位点数的增加,识别率也越来越高。当达到10 000位点时,识别率为95%;当达到25 000位点时,识别率为98%,以后趋于平缓(表2)。25 000位点时的杂合率0.03,MAF为0.42,PIC均值0.35,98%的糯玉米材料可以被有效区分开。因此,最终选择25 000个核心SNP位点组合构建50个糯玉米品种DNA指纹库(本文未列出)。
表2 SNP核心位点的筛选
2.3 聚类分析
50份自交系两两之间的相似系数在0.38—0.93。18SW-中(编号38)与B红(编号41)、19SW-恒(编号4)与19SW-35(编号5)之间相似系数最大,为0.925,二者之间有6 875个位点的差异。说明18SW-93(编号23)与18SW-OP(编号28)之间亲缘关系要远;18SW-中(编号38)与B红(编号41)、19SW-恒(编号4)与19SW-35(编号5)之间亲缘关系要近。在玉米育种实践中,应尽量避免将亲缘关系近的自交系配组。
在相似系数0.65处,50份糯玉米自交系划分为4大类群。第Ⅰ大群包括19SW-玉、19SW-万、19SW-张、19SW-18、18SW-52等12个糯玉米自交系;第Ⅱ大群包括19SW-恒、19SW-35、19SW-恒6、19SW-苏科、18SW-江恒等11个糯玉米自交系;第Ⅲ大群包括19SW-红、19SW-48、19SW-75、18SW-H、18SW-OP等14个糯玉米自交系;第Ⅳ大群包括19SW-玉、19SW-31、18SW-甜糯、18SW-彩甜糯、申-3等13个糯玉米自交系。聚类结果与各类群的籽粒颜色表现和系谱来源均一致,如第一大类群籽粒颜色均为白色,组合父本为‘万糯2000’;第二大类群籽粒颜色均为紫白色,组合父本为‘恒♀-2’;第三大类群籽粒颜色均为红色,组合父本为‘红w’;第四大类群籽粒颜色均为五彩色,组合父本为‘w93’。
3 讨论与结论
SNP分子标记技术被国际植物品种权保护联盟指定为构建DNA指纹数据库的标记方法之一,具有与功能基因关联度高、自动化程度高、样品检测通量高等优点。现在已经被广泛用于玉米DNA指纹库的构建、遗传距离和遗传相似度的分析[12]。
目前,在玉米研究中应用比较多的SNP标记有600K、50K、5K、3K、1K等,SNP标记在基因组中密度高且分布均匀,是最具发展潜力的建库标记之一[13-14]。本研究采用的Illumina公司开发的包含56 110个SNP标记属于高密度SNP标记。通过软件计算得出所选SNP标记的PIC均值为0.35,按照PIC>0.5为高度多态性;0.25 通过设置8个不同数量位点梯度筛选核心标记,可节约检测成本,提高品种鉴别的准确度。梯度筛选分析表明,当数量位点为7 000时,供试材料的识别率就可达85%,对于亲缘关系较远的品种,可选择7 000个SNP位点结合定点测序的方法进行鉴定;当数量位点达到25 000时,供试材料间的识别率高达98%,对亲缘关系较近的品种,需要结合高通量测序技术进行区分。本研究筛选SNP核心位点组合,可为糯玉米自交系指纹库构建、遗传多样性分析和种质资源评价等研究提供参考依据。 聚类结果表明,50份糯玉米自交系被划分为四大类群。通过系谱分析和农艺性状比较,发现聚类结果与系谱来源较一致。如品系18SW-中与18SW-56籽粒颜色都是红色,穗型都是筒锥型,株型一致;品系18SW-中与18SW-56的父本是同一个父本,都是‘红w’。说明SNP标记技术能够根据亲缘关系远近,准确划分糯玉米自交系。