APP下载

基于表型性状及SNP标记的豆瓣菜种质资源遗传多样性分析

2021-03-14李双梅朱红莲柯卫东

中国蔬菜 2021年2期
关键词:大叶种质基因组

季 群 李双梅 朱红莲 柯卫东

(武汉市农业科学院蔬菜研究所,湖北武汉 430207)

豆瓣菜(Nasturtium officinaleR.Br.,2n=2x=32)为十字花科多年生双子叶水生草本植物,在欧洲、亚洲及北美均有分布。豆瓣菜作为栽培蔬菜,在我国广东、广西、福建等地有较大面积种植,在长江中下游地区有少量种植;作为野生植物,在我国主要分布于黑龙江、山西、河北、山东、河南、四川、陕西、安徽、江苏、广东、广西、贵州、云南和西藏等地(中国科学院中国植物志编辑委员会,1987)。

国内外对于豆瓣菜亲缘关系的分类研究不多,主要是按照形态学特征和传统分子标记方法对其进行分类。Jafari 和Hassandokht(2012)利用农艺性状对伊朗的24 个野生豆瓣菜群体进行遗传多样性分析,结果将豆瓣菜分为4 组,每组具有不同的形态特征;赵博等(2007)利用79 个RAPD 引物和34 个ISSR 引物对国家种质武汉水生蔬菜资源圃的8 份豆瓣菜资源进行了亲缘关系分析,2 种分子标记均可以将8 份资源划分为3 个不同的类群。目前国家种质武汉水生蔬菜资源圃保存有19 份二倍体豆瓣菜资源,明确这19 份资源的遗传多样性和亲缘关系是将其应用于豆瓣菜育种和种质改良的基础。

基因组工具如分子标记,可以阐明种质的遗传背景,最终用于育种。传统的种质资源分类都是在形态学或农艺性状水平上,通过具有多态性的外观特征进行遗传标记。但形态性状数量少、多态性差、易受环境条件影响(Sharma et al.,2015)。RAPD分子标记最大的缺陷是不稳定、重复性差,自然可信度也较差(Gichuki et al.,2003)。尽管AFLP、SSR、ISSR 等分子标记较RAPD 具有稳定、重复性好等优点,但提供的数据量有限,不适用于大样本量的群体分析,不能完全真实反映物种的遗传多样性(Zhang et al.,2004;Moulin et al.,2012;Yang et al.,2015)。随着高通量测序技术的发展,即使没有参考基因组,简化基因组测序(specific length amplified fragment sequencing,SLAF-seq)可以获得基因组中数以百万计的单核苷酸多态性(single nucleotide polymorphism,SNP),并以此为遗传标记对物种的遗传多样性进行分析,研究群体的遗传结构及其变化规律,探讨生物的进化过程(Chong et al.,2016;Su et al.,2017)。

本试验拟利用表型性状及SLAF-seq 技术对19份豆瓣菜群体的表型及基因组变异进行分析,初步确定豆瓣菜种质资源的遗传多样性和亲缘关系,为豆瓣菜遗传育种和种质保存提供理论基础。

1 材料与方法

1.1 试验材料和DNA 提取

参试19 份豆瓣菜种质中,以色列豆瓣菜、江西大叶豆瓣菜、英国大叶豆瓣菜、美国豆瓣菜和广西豆瓣菜均从当地市场购买种子获得,其余种质均为从国内外不同地区野外收集所得,所有种质均种植于国家种质武汉水生蔬菜资源圃(表1)。

表1 参试豆瓣菜种质名称及来源

采集样品叶片,液氮速冻后于-80 ℃保存。采用CTAB 法提取叶片DNA,NanoDrop-2000 检测DNA 浓度,DNA 稀释终浓度为30 ng·μL-1,用1%琼脂糖电泳检测DNA 的完整性。

1.2 表型性状调查及分析

采用连续两年定点调查的方法。参试材料分别于2016 年和2017 年定植于塑料大棚2 m×3 m 水泥池中,在产品器官采收期对所有豆瓣菜种质的表型性状进行调查和统计,随机选取5 株具有代表性的植株进行调查。调查性状包括株高、茎粗、顶端小叶长、顶端小叶宽、叶柄长等5 个数量性状和叶色、茎色、顶端小叶形状3 个质量性状。对质量性状直接进行统计;利用Excel 软件计算数量性状的平均值(X)、标准差(σ)和变异系数(CV)。应用SPSS 软件按离差平方和(Ward)法对表型性状进行聚类分析。

1.3 高通量测序及数据处理

由于豆瓣菜目前尚无参考基因组序列,但其近缘物种甘蓝(Brassica oleraceaL.)、芥菜〔Brassica juncea(L.)Czemajew〕、白菜(Brassica rapaL.)已有参考基因组序列信息发布,因此根据豆瓣菜基因组大小以及GC 含量等信息,最终选取白菜基因组作为参考基因组进行酶切预测。白菜基因组(https://www.ncbi.nlm.nih.gov/genome/?term=Brassica+rapa)大小为284.13 Mb,GC 含量为35.83%。

采用限制性内切酶RsaⅠ和HaeⅢ进行酶切,以水稻日本晴DNA 作为对照来评估酶切的准确性和有效性。对得到的酶切片段进行3′端加A 处理、连接Dual-index 测序接头、PCR 扩增、混样、切胶选取目的片断,酶切片段长度在364~464 bp 的序列定义为SLAF 标签。文库质检合格后用Illumina HiSeqTM2500 进行测序。测序产生的reads 来源于相同限制性内切酶作用于样品后产生的长度相同的酶切片断,对各样品的reads 按照序列相似性进行聚类,同一SLAF 标签在不同样品间的序列相似性高于不同SLAF 标签间的相似性,因此聚类在一起的reads 来源于同一SLAF 标签,同一SLAF 标签在不同样品间序列存在差异,即可定义为多态性SLAF 标签。以每个SLAF 标签中深度最高序列作为参考序列,并利用GATK(Mckenna et al.,2010)和SAMTOOLS(Li et al.,2009)两种方法开发多态性SLAF 标签中的SNP,两种方法同时获得的SNP 质量较高,作为最终可靠的SNP 标记。

1.4 测序数据分析

对分析过滤后的高质量数据进一步进行数据挖掘和深入分析,将19 份豆瓣菜资源最终获得的群体SNP 根据完整度>0.5、MAF >0.05 进行筛选,获得高一致性的群体SNP。基于筛选得到的SNP 位点,运用数学统计学方法,对19 份豆瓣菜资源进行群体遗传结构和亲缘关系分析。基于最大似然法,利用admixture 软件分析样品的群体结构,分别假设样品的分群数(K 值)为1~10,对每个K 值进行5 次模拟计算,并根据种质的最大隶属概率将它们分配到相应的组(Alexander et al.,2009)。基于开发的SNP 位点,通过MEGA6(Saitou &Nei,1987;Tamura et al.,2011)软件的邻接算法和cluster(Dunteman,1989;de Hoon et al.,2004)软件分别构建样品的群体进化树并进行主成分分析。

2 结果与分析

2.1 豆瓣菜种质资源质量性状的遗传多样性

对19 份豆瓣菜资源的3 个质量性状进行多样性分析得出:豆瓣菜叶色有绿色和深绿色2 种(图1),二者分别占73.7%和26.3%;茎色有绿色、深绿色和褐绿色3 种(图2),绿色占89.4%,深绿色和褐绿色各占5.3%;89.5%的资源顶端小叶为卵圆形,10.5%为近圆形(图1)。

2.2 豆瓣菜种质资源数量性状的遗传多样性

豆瓣菜不同资源间变异系数较低且相差不大,介于7.69%~16.45%之间(表2)。

表2 豆瓣菜种质资源数量性状的遗传多样性分析结果

顶端小叶长最短的2 份资源分别为济南野生豆瓣菜(3.07 cm)和以色列豆瓣菜(3.35 cm),顶端小叶宽最窄的2 份资源分别为济南野生豆瓣菜(2.88 cm)和以色列豆瓣菜(3.17 cm),说明济南野生豆瓣菜叶片最小,以色列豆瓣菜次之;以色列豆瓣菜株高最矮(23.55 cm);茎粗最小的3 份资源分别为八里村野生豆瓣菜(0.47 cm)、江西大叶豆瓣菜(0.47 cm)和以色列豆瓣菜(0.49 cm);以色列豆瓣菜叶柄最短(6.23 cm),其次是江西大叶豆瓣菜(7.08 cm)。说明参试的19 份资源中以色列豆瓣菜植株最矮,叶柄最短,茎秆较细,叶片较小。

顶端小叶长最长的2 份豆瓣菜资源分别为仰光-2 豆瓣菜(4.98 cm)、英国大叶豆瓣菜(4.78 cm),顶端小叶宽最大的3 份资源分别为仰光-2 豆瓣菜(4.10 cm)、太原豆瓣菜(4.10 cm)和英国大叶豆瓣菜(4.00 cm),说明仰光-2 豆瓣菜叶片最大,英国大叶豆瓣菜次之;株高最高的2 份资源分别为河北邯郸豆瓣菜(40.25 cm)和仰光-2 豆瓣菜(37.00 cm);茎粗最大的3 份资源分别为玉龙雪山豆瓣菜(0.62 cm)、河北邯郸豆瓣菜(0.58 cm)和大庙场野生豆瓣菜(0.56 cm);叶柄最长的2 份资源分别为大庙场野生豆瓣菜(11.70 cm)和玉龙雪山豆瓣菜(10.92 cm)。说明仰光-2 豆瓣菜叶片最大,且植株较高,玉龙雪山豆瓣菜和大庙场野生豆瓣菜茎秆较粗、叶柄较长。

2.3 豆瓣菜种质资源表型性状聚类分析

利用SPSS 21 软件对豆瓣菜种质资源的8 个性状进行聚类(图3),可以将供试材料分为2 类。类群Ⅰ包括1(以色列豆瓣菜)、14(河北邯郸豆瓣菜)、18(美国豆瓣菜)、19(广西豆瓣菜)4 份资源,这类资源叶色均为深绿色,茎色为褐绿色、深绿色或绿色,顶端小叶形状为卵圆形或近圆形,这些性状与其他资源存在明显差异。类群Ⅱ有15份资源,包括2(五马河野生豆瓣菜)、3(大庙场野生豆瓣菜)、4(仰光-1 豆瓣菜)、5(倒天河野生豆瓣菜)、6(江西大叶豆瓣菜)、7(英国大叶豆瓣菜)、8(花溪河野生豆瓣菜)、9(仰光-2 豆瓣菜)、10(龙泉野生豆瓣菜)、11(济南野生豆瓣菜)、12(乌庆河野生豆瓣菜)、13(云南豆瓣菜)、15(玉龙雪山豆瓣菜)、16(太原豆瓣菜)、17(八里村野生豆瓣菜),这一类型资源叶色和茎色均为绿色,顶端小叶形状均为卵圆形。19 份豆瓣菜资源的表型性状聚类结果与它们的收集地及资源类型(地方品种或野生资源)均不相关。

2.4 建库评估

通过对白菜参考基因组进行电子酶切方案预测,确定用于豆瓣菜的限制性内切酶组合为RsaⅠ+HaeⅢ,酶切片段长度在364~464 bp 的序列定义为SLAF 标签,共预测到104 107 个SLAF 标签。为了确定酶切方案实施的有效性,本试验同时将水稻日本晴的测序数据与其参考基因组进行比对,结果显示水稻双端比对效率为92.69%,酶切效率为86.83%,表明酶切反应正常,SLAF 建库成功。

2.5 测序数据统计与评估

经Illumina HiSeqTM2500 测序平台测序,共获得49.21 Mb 的读长数据,各样品所获得的读长数目在186 719~3 119 305 范围内。其中,江西大叶豆瓣菜获得的数据量最大,为3 119 305 个读长,对照水稻的数据量最小,为186 719 个读长。测序质量值Q30 的范围在88.69%~90.37%之间,仰光-1 豆瓣菜的Q30 值最高,对照水稻的Q30值最低,均值为89.81%,说明测序碱基错误率低,所获数据合格。测序获得的GC 含量范围在39.69%~44.28%之间,对照水稻的GC 含量最高,济南野生豆瓣菜GC 含量最低,均值为40.41%,豆瓣菜资源的GC 含量普遍不高,达到测序要求。

2.6 SLAF 标签与SNP 标记开发

共开发355 141 个SLAF 标签,样品的平均测序深度为23.78×,对355 141 个SLAF 标签进行分型,最终得到3 种类型的SLAF 标签:多态性标签、非多态性标签、重复性标签,其中多态性的SLAF 标签有33 386 个,多态性的SLAF 标签称为Marker,利用得到的33 386 个多态性的SLAF 标签进一步进行SNP 位点的开发,最终共获得102 704个SNP 标记。

2.7 群体结构和系统发育分析

根据完整度>0.5、MAF >0.05,对上述所有的SNP 标记进行过滤,共得到37 827 个高一致性群体SNP。基于过滤后的SNP,采用admixture 软件分析样品的群体结构,分别假设样品的分群数(K值)为1~10,进行聚类。并对聚类结果进行交叉验证,根据交叉验证错误率的谷值确定最优分群数为1,说明19 份豆瓣菜资源只能分为一组,很可能来源于同一个原始祖先。K 值为1~4 的聚类情况及各个K 值对应的交叉验证错误率见图4。

基于过滤后的SNP,采用MEGA6 软件的neighbor-joining 算法,构建样品的群体进化树。聚类分析明显地将19 份豆瓣菜资源分为一组,与用admixture 软件分析的结果一致,所有资源的遗传多样性指数π 值为0.010 7。其中,11(济南野生豆瓣菜)、14(河北邯郸豆瓣菜)、1(以色列豆瓣菜)、18(美国豆瓣菜)、19(广西豆瓣菜)等5 份豆瓣菜资源的亲缘关系较近(亚组Ⅰ),2(五马河野生豆瓣菜)、3(大庙场野生豆瓣菜)、4(仰光-1 豆瓣菜)、5(倒天河野生豆瓣菜)、6(江西大叶豆瓣菜)、7(英国大叶豆瓣菜)、8(花溪河野生豆瓣菜)、9(仰光-2 豆瓣菜)、10(龙泉野生豆瓣菜)、12(乌庆河野生豆瓣菜)、13(云南豆瓣菜)、15(玉龙雪山豆瓣菜)、16(太原豆瓣菜)、17(八里村野生豆瓣菜)等14 份豆瓣菜资源亲缘关系较近(亚组Ⅱ),进化树见图5。19 份资源基于SNP 的聚类结果与收集地及资源类型(地方品种或野生资源)亦不相关,与表型性状聚类结果相一致。PCA 分析结果显示(图6),参试豆瓣菜样品均是一些零散的点,说明参试的19 份豆瓣菜资源均为一个组,其结果与群体结构和系统发育分析结果相一致。

以色列豆瓣菜、江西大叶豆瓣菜、英国大叶豆瓣菜、美国豆瓣菜和广西豆瓣菜属于地方品种,遗传多样性指数π 值为0.012 1;其余14 份资源属于野生资源,π 值为0.012 2;地方品种和野生资源之间的遗传分化指数Fst 为0.030 2。

3 讨论与结论

通过对19 份豆瓣菜资源进行表型性状分析,发现3 个质量性状变异不明显,豆瓣菜叶色和茎色主要为绿色,顶端小叶主要为卵圆形。5 个数量性状的变异系数均较低(7.69%~16.45%),说明保存于国家种质武汉水生蔬菜资源圃中的豆瓣菜种质资源各数量性状的变异范围较窄,低于豌豆和甘蓝型油菜种质资源数量性状的变异范围(万述伟 等,2017;雷伟侠 等,2019)。但在较窄的变异范围内仍存在具有优良性状的资源,可对目标性状进行改良。如仰光-2 豆瓣菜叶片最大,且植株较高;大庙场野生豆瓣菜和玉龙雪山豆瓣菜茎秆较粗、叶柄较长。

基于8 个表型性状的聚类分析,将19 份豆瓣菜资源划分为2 类,第Ⅰ类包括以色列豆瓣菜、河北邯郸豆瓣菜、美国豆瓣菜和广西豆瓣菜4 份资源,第Ⅱ类包括剩余的15 份资源。而基于SNP 的聚类分析结果与表型性状分类结果类似,以色列豆瓣菜、济南野生豆瓣菜、河北邯郸豆瓣菜、美国豆瓣菜和广西豆瓣菜等5 份资源亲缘关系较近(亚组Ⅰ),剩余的14 份资源亲缘关系较近(亚组Ⅱ),且群体结构分析以及PCA 分析均将19 份种质资源全部分为一组,说明19 份种质资源虽然表型上存在变异,但遗传基础狭窄,遗传多样性不高,群体内部分化较小。

本试验利用37 827 个SNP 对不同豆瓣菜种质资源的遗传结构进行了精确研究,群体结构、系统进化树及PCA 分析均显示19 份豆瓣菜资源属于同一组。赵博等(2007)以本试验中的6 个豆瓣菜品种以及河内小叶豆瓣菜和广东小叶豆瓣菜为研究对象,利用79 个RAPD 引物和34 个ISSR 引物对这8 个品种的基因组DNA 进行扩增,并根据所得条带进行聚类分析,2 种标记都可以较好地将8 个品种按亲缘关系远近划分为3 个不同的类群。本试验结果与之不一致,可能是因为本试验采用的是SNP分子标记,标记数量远高于赵博等(2007)利用的RAPD 和ISSR 标记数量,由于RAPD 和ISSR 标记数量有限,不能完全真实反映物种的遗传多样性。赵博等(2007)的试验结果中,2 种分子标记虽然将8 个豆瓣菜品种分为3 个类群,但在同一个类群中同时存在国外豆瓣菜与国内豆瓣菜资源,二者不能很好地区分开,与本试验结果一致。本试验中19 份豆瓣菜资源的聚类结果与它们的地理位置并不相关,可能与不同地理位置种质资源之间的交换有关(Liu et al.,2012)。本试验中地方品种的遗传多样性指数π 值为0.012 1,野生资源为0.012 2,两组的π 值基本相同,且地方品种和野生资源之间的遗传分化指数Fst 为0.030 2。前人研究表明,水稻、大豆等作物野生资源的遗传多样性高于栽培品种(Guo et al.,2010;Huang et al.,2012);Wright(1931)认为Fst 为0~0.05 时,群体间遗传分化很小,可以不考虑。本试验中豆瓣菜地方品种与野生资源聚为一组,不能很好地区分开,表明在我国云南、贵州、山西等地野外地区发现的大面积疑似野生豆瓣菜与栽培品种农艺性状相似,碱基差异也较小,这些野外分布的豆瓣菜可能不是野生资源,而是由栽培品种逃逸形成。

豆瓣菜起源于地中海沿岸,14 世纪初英国和法国均有栽培,后传入美国、南非、澳大利亚和新西兰,1780 年前后传入日本,20 世纪初由海道传入中国(中国农业科学院蔬菜研究所,1982;孔庆东,2004)。本试验中1 份材料来自以色列,2 份来自缅甸,1 份来自美国,1 份来自英国,剩余14份来自中国不同省份,虽然材料来自世界各地,但19 份豆瓣菜资源属于同一组,所有材料之间亲缘关系较近,遗传背景差异不大,很可能来源于同一个栽培类型。

猜你喜欢

大叶种质基因组
华南地区最大农作物种质资源保护库建成
华南地区最大农作物种质资源保护库建成
“植物界大熊猫”完整基因组图谱首次发布
吉林省省级作物种质资源保护单位名单(第一批)
山东省省级农作物种质资源保护单位名单(第一批)
牛参考基因组中发现被忽视基因
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
咏松
“大叶”莲雾在广西南宁的引种表现及栽培要点