基于GBS技术构建四倍体杂交冰草超高密度遗传连锁图谱
2021-12-08杨东升于肖夏李佳奇李景伟吴国芳卢倩倩
杨东升,于 卓,于肖夏,李佳奇,李景伟,吴国芳,卢倩倩
(内蒙古农业大学农学院,内蒙古呼和浩特 010019)
冰草属(Agropyron)为小麦族多年生及禾本科草本植物,主要分布于欧亚大陆的温带和温寒带草原区,共有10个种,其中中国有5个种。细胞遗传学分析表明,冰草属有二倍体(2n=2x=14,PP)、四倍体(2n=4x=28,PPPP)和六倍体(2n=6x=42,PPPPPP)3个染色体倍数水平,自然界中以二倍体种和四倍体种占多数,六倍体种较为少见[1]。该属植物根系较发达,具沙套,抗旱、抗寒性强,适应性广,是我国北方天然草地改良和人工草地建植的优质饲草[2],同时也是小麦、黑麦等麦类作物抗逆性远缘杂交改良的宝贵基因资源[3-4]。目前有关冰草的形态学、细胞学、分子生物学等方面已有研究[5-7],但关于冰草高密度和超高密度遗传作图方面的研究报道较少。Zhang等[8]以冰草Z2098×Z1842的113个F1分离单株为作图群体,利用特定长度扩增片段测序技术(specific length amplified fragment sequencing,SLAF-seq)[9]开发SNP标记,首次构建了含 1 032个SNP标记、平均图距为1.5 cM的二倍体冰草高密度分子遗传连锁图谱,其覆盖基因组长度为907.8 cM。本课题组前期将产于内蒙古草原抗寒抗旱性强的二倍体野生蒙古冰草(A.mongolicumKeng,2n=2x=14,PP)与引自美国的优质高产的二倍体栽培品种航道冰草(A.cristatumcv. Fairway,2n=2x=14,PP)进行人工授粉杂交,成功获得种间杂种F1植株,进而用秋水仙碱溶液对F1种子进行染色体加倍,最终得到了遗传稳定的四倍体杂交冰草[10]。为构建四倍体杂交冰草的高密度分子遗传连锁图谱,通过人工套袋自交获得了四倍体杂交冰草F2代的347个分离单株,以此为作图群体,利用AFLP(amplified fragment length polymorphism)和SSR(simple sequence repeats)第一代分子标记技术,首次构建了含766个分子标记(581个AFLP和185个SSR)、平均图距为3.82 cM的四倍体杂交冰草高密度遗传连锁图谱,其覆盖基因组长度 2 574.3 cM[11]。
为构建超高密度(平均图距<0.5 cM)四倍体杂交冰草的分子遗传连锁图谱,本研究以四倍体杂交冰草F2代的115个分离单株及其亲本蒙古冰草、航道冰草为遗传作图材料,利用基因分型技术(genotyping-by-sequencing,GBS)技术[12],构建首个超高密度的四倍体杂交冰草遗传连锁图谱,以期为深入开展冰草产量、品质及抗旱、抗寒等重要性状的QTL精细定位、功能基因图位克隆和分子标记辅助育种研究奠定基础。
1 材料与方法
1.1 供试材料及试验地概况
试验材料为四倍体杂交冰草F2代的115个分离的无性系单株及其二倍体亲本蒙古冰草(♀)和航道冰草(♂),种植于呼和浩特市内蒙古农业大学农场的多年生牧草材料圃内,株距25 cm,行距45 cm。该试验地位于111°42′ E、45°57′ N,海拔1 063 m,年降水量约400 mm无霜期约145 d,土质为沙壤土,pH值在7.8~8.2之间,肥力中等,具灌水条件。生长期内,视生长状况适时适量灌水施肥。
1.2 冰草基因组DNA的提取及其质量检测
于2019年5月10日冰草拔节初期,分别剪取四倍体杂交冰草的115个F2分离单株及其亲本的幼嫩叶片约1 g,装入自封袋并迅速放入冰盒中带回实验室。每个材料准确称取0.15 g,剪碎后混匀,置研钵中加适量液态氮充分研磨成细粉状后,用北京TIANGEN公司生产的植物基因组试剂盒提取DNA,具体方法按照说明书的方法 进行。
用1.2%的琼脂糖凝胶电泳检测DNA的纯度,用超微量分光光度计(NanoDrop ND-2000,USA)测定DNA的浓度,将符合试验要求的各样品DNA稀释至80 ng·μL-1,置于-40 ℃冰箱内保存备用。
1.3 GBS文库的构建与测序
供试材料基因组DNA测序采用GBS方法,由北京安诺优达基因科技有限公司完成。具体步骤如下:
(1)用多种限制性内切酶对四倍体杂交冰草F2群体分离单株及其亲本的基因组DNA进行酶切,根据酶切试验结果选出最适合的限制性内切酶进行DNA酶切。在内切酶两端分别加上P1和P2接头,其中P1接头含有PCR扩增所需的引物序列、Illumina测序引物结合位点序列和区分不同样品的短标签序列,混合不同接头的样品,然后进行PCR扩增。
(2)对质量检测合格的DNA样品,用GBS建库方式构建长度范围在300~500 bp之间的pair-end文库。
(3)对PCR产物进行纯化,并对构建好的文库进行质检,用Illumina HiSeq PE150平台进行高通量测序。
1.4 SNP标签的筛选与过滤
对各样品中的标签(Tag)进行比对和归类,按照每类Tag的深度信息由大到小排序,获得所有个体的Tag频数表及杂合位点信息。综合考虑个体间的Tag频数表信息,寻找个体之间单碱基差异信息并进行筛选和过滤SNP标记,要求Tag完整度>80%,杂合率<5%,等位基因型频率>5%。最后过滤掉偏分离(P<0.05)的SNP标记,保留多态性好、高质量的SNP标记,用于构建冰草超高密度遗传连锁图谱。
1.5 SNP分子遗传连锁图谱的构建
采用遗传作图软件Join Map 4.0,参考李佳奇等[13]的方法构建四倍体杂交冰草超高密度分子遗传连锁图谱,略作修改。具体步骤如下:
(1)打开软件,执行New Project命令新建一个文件,点击Load Date命令导入数据。
(2)运行LOD Grouping(tree)命令,生成树状图,选择14个LOD≥5.0的连锁群,打开图谱分组命令(create groups for mapping),获得标记不同的连锁群。
(3)先用Calculate Map命令构建出各个连锁群SNP图谱,然后用Map Chart 2.3绘制出含14个连锁群的超高密度(平均图距<0.5 cM)分子遗传连锁图谱。
2 结果与分析
2.1 冰草GBS测序数据分析结果
对四倍体杂交冰草F2代115个单株及其亲本的基因组DNA测序结果见表1。共获得 3 989 607 400 reads和584 895 503 397 bases,reads质量值≥30的碱基(Q30,可识别碱基的正确率为99.9%)平均占比为94.14%,GC碱基含量平均占比为43.13%。说明测序质量和文库构建质量均较高,满足后续试验要求。
表1 GBS测序结果统计Table 1 Statistics of GBS sequencing results
2.2 冰草的基因分型与SNP过滤
各样品的基因分型数据见表2。共鉴定出 98 695个高可信度的多态性SNP标记,其中有 34 105个SNP标记具有多态性。在34 105个候选标记中,过滤掉F2分离群体的低覆盖率序列(覆盖率<80%),剩余13 164个标记。经偏分离过滤后,最终得到5 035个可用于遗传作图的高质量SNP标记。
表2 不同基因分离类型的SNP标记数Table 2 Number of SNP markers in different types of gene segregation patterns
2.3 四倍体杂交冰草超高密度遗传连锁图谱的构建
按照软件Join Map 4.0操作程序,将GBS测序分析获得的5 035个高质量SNP标记分成14个连锁群(LG1~LG14),构建出一张超高密度四倍体杂交冰草分子遗传连锁图谱(图1)。统计发现(表3),该图谱覆盖基因组长度2 148.621 cM,各连锁群的长度范围在68.959~280.309 cM之间,平均长度为153.473 cM,以连锁群LG12最长,LG6最短。5 035个SNP标记不均匀分布在LG1~LG14连锁群上,每个连锁群的SNP标记数目在152~767之间,其中LG9的标记数目最多,LG5的标记数目最少,平均标记数目约为360个;各连锁群标记间的平均间距在0.120~1.304 cM之间,图谱SNP标记平均间距为0.427 cM,为目前所报道的冰草超高密度分子遗传连锁 图谱。
表3 四倍体杂交冰草遗传连锁图谱特征Table 3 Basic characteristics of genetic map of tetraploid hybrid crested wheatgrass
另外,从图1中的连锁群LG6和LG7看出,在同一位点上有多个标记,称为共位点标记,这种现象在植物超高密度遗传连锁图谱上常有出现[14-15],其实际应用价值尚待深入研究。
图1 四倍体杂交冰草超高密度遗传连锁图谱Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
续图1 四倍体杂交冰草超高密度遗传连锁图谱Continued Fig.1 Ultra-high density genetic linkage map of tetraploid hybrid crested wheatgrass
3 讨 论
3.1 遗传作图群体的选择
选择合适的作图群体是构建植物遗传连锁图谱的重要基础,而亲本的选配会直接影响作图群体的分离程度及构建图谱的难易程度,所以尽可能选择亲缘关系较远的品种作亲本,通常利用F2、BC(backcross)、DH(doubled haploid)、RIL(recombinant inbred lines)或NIL(near isogenic lines)群体来构建遗传连锁图谱[16]。其中,F2群体是由2个高度纯合的亲本杂交产生的F1代进行自交后得到的分离群体,具有成本低、时间短、遗传信息量大的优点,是目前应用较广泛的遗传作图群体,如谷子[17]、棉花[18]、芝麻[19]、菠菜[20]和高丹草[21]。
本研究以蒙古冰草×航道冰草杂交后经套袋自交获得的四倍体杂交冰草F2代115个单株为材料,获得了5 035个高质量的SNP标记,表明该作图群体的基因组DNA中含有丰富的SNP多态性标记。原因可能是亲本材料分别为内蒙古草原的野生蒙古冰草和美国的航道冰草,它们生长的自然环境条件、形态特征和生物学特性等差异很大[22],其种间杂交F2代的性状分离明显而引起的,同时亦说明F2代性状分离越明显的材料越适合进行植物的遗传作图研究。
3.2 GBS技术与SNP标记的开发应用
构建高质量的超高密度分子遗传连锁图谱是植物产量、品质、抗性等重要性状QTL精细定位及分子标记辅助选择等研究的基础[23-24],标记数目越多、密度越大,遗传作图就越精确、实用。GBS技术是在第二代测序技术的基础上,高效开发的植物基因组SNP分子标记新技术,目前已成功应用于小麦[25]、玉米[26]、水稻[27]等多种重要作物的SNP标记开发及高密度分子遗传图谱的构建中。该项技术的最大优点在于构建遗传图谱过程中不受参考基因组的限制[28],无参考基因组的植物亦可进行基因分型和大规模地开发SNP标记。而用传统的RFLP[29]、AFLP[30]及SSR[31]等分子标记构建的植物遗传连锁图谱,往往因标记数目有限而出现较大的连锁空隙或较多的连锁断点,且这些方法在基于凝胶电泳统计条带时易造成人工误差。另外,这些方法作图耗时、成本高,且需要选择大群体[32],难以满足后续QTL精细定位等研究的需求[33]。用GBS技术开发的新型SNP标记可以弥补这些传统分子标记的不足。
冰草还未有全基因组测序数据,为无参考基因组植物。本研究利用GBS技术对四倍体杂交冰草F2分离群体及其亲本蒙古冰草和航道冰草基因组DNA首次进行测序分析,成功地获得了3 989 607 400 reads,经过完整度和偏分离过滤及SNP基因分型共得到5 035个高质量的SNP标记,进而利用Join Map 4.0作图软件首次构建了四倍体冰草超高密度遗传连锁图谱,其含有14个连锁群,覆盖基因组长度为2 148.621 cM,标记间的平均间距为0.427 cM,是目前饲草中分子标记数目最多、密度最高的遗传连锁图谱,因此,通过GBS技术大规模开发的SNP标记,能有效增加冰草各连锁群的标记数目,提高遗传连锁图谱的整体密度和饱和度,这为冰草的图谱构建提供了最新方法,也为后续从正向遗传学角度深入开展冰草品质、抗寒、抗旱等优异性状基因的图位克隆及其功能研究奠定了坚实基础。