甘蓝型油菜品质相关性状全基因组关联分析
2020-05-18陈聪刘忠松
陈聪,刘忠松
(湖南农业大学农学院,湖南 长沙 410128)
低芥酸、零芥酸是油菜育种的长期目标,也是评价油菜品质的重要指标。菜籽饼粕中硫代葡萄糖苷含量也是“双低”油菜育种的重要目标[1]。菜籽饼粕因富含蛋白质等营养物质,具有较高的饲用价值,因而受到许多研究人员的重视。但硫代葡萄糖苷经动物食用后,在胃肠条件下会水解生成硫氰酸盐等有毒物质[2],从而引起食欲不振等健康问题,影响动物的正常发育。
王继变等[3]通过构建甘蓝型油菜 DH群体(doubled haploid,双单倍群体),QTL(quantitative trait locus,数量性状基因座)分析发现,控制芥酸含量的QTL位点位于A2、A7、A9和C1上,控制油酸合成的QTL位点位于A9和C7上。QIU等[4]与ECKE等[5]通过构建甘蓝型油菜DH群体与QTL分析,均发现在A8与C3的相同位置上存在控制芥酸合成的 QTL。荐红举等[6]通过 QTL定位甘蓝型油菜种子硫代葡萄糖苷含量QTL,结合高密度SNP遗传图谱,检测到5个QTL,分布在A3、A9、C2染色体上。王金芳[7]通过构建DH作图群体,定位到2个控制油酸合成的QTL,分布在A5与A9染色体上,分别能解释75.9%、3%~5%的表型变异。
全基因组关联分析(genome whole association study,GWAS),也称为连锁不平衡作图(linkage disequilibrium mapping),是近10年来鉴定控制农作物复杂数量性状基因座的重要方法,已广泛应用于谷子[8]、小麦[9]、玉米[10]、油菜[11]等农作物。目前,在油菜领域内,GWAS已成功应用于含油量[12]、开花时间[13]、株高[14]、角果长度[15]、种子萌发与活力[16]等重要性状的研究。
本研究以 104份甘蓝型自交系群体为研究材料,对芥酸、油酸、硫代葡萄糖苷含量等品质性状进行分析考察,采用 ddRADseq测序技术,运用GWAS方法将性状与 SNP标记关联,以寻找与性状显著关联的标记,为高品质“双低”甘蓝型油菜品种的培育提供依据。
1 材料与方法
1.1 材料
以甘蓝型油菜高代自交系群体为关联分析群体,总共104份材料,其中黄籽材料44份,黑籽材料 60份。简化基因组测序中用到的参考基因组为法国冬油菜Dammar v4.1。
1.2 方法
1.2.1 田间试验设计与性状考察
2017年9月下旬,将104份甘蓝型油菜自交系播种于湖南农业大学耘园基地。每份材料种植1个小区,每个小区5行,行距40 cm。10月中下旬间苗,每行定苗10~12株,株距20 ~ 30 cm,其他管理同大田常规管理。
油菜成熟后每个小区收获3份单株自交种子,采用近红外光谱法测定芥酸、油酸、硫代葡萄糖苷含量,每份材料用近红外仪Foss NIR systems 5000扫描3次,取其平均值。利用SPSS 22.0对所得数据进行统计分析与相关性分析。
1.2.2 简化基因组测序分型与群体结构分析
由武汉基诺赛克科技有限公司采用基于新一代测序平台 Illumina HiSeq的 ddRADseq (double digested restriction–site associated DNA Sequencing )技术进行简化基因组测序。基因组DNA经检测合格后,用限制性内切酶SacⅠ和MseⅠ进行双酶切,经PCR扩增、纯化,筛选插入长度在300 ~ 400 bp的片段进行测序[17],原始测序读长为Paired–end 150 bp。对于下机的原始数据(raw reads),用 Cutadapt与Trimmomatic进行数据质控,然后将得到的clean data比对到参考基因组(Darmor v4.1)[18]上,进行变异检测(包含 SNP与 InDel),得到原始的包含变异信息的vcf格式文件。利用 Plink1.9[19]对标记进行筛选,过滤掉缺失率(missing rate)大于20%的标记,同时剔除次要等位基因频率(MAF)小于5%的标记。
采用 Admixture1.3.0[20]计算甘蓝型油菜群体结构Q,通过CV error值(cross–validation error rate, 交叉验证错误率)判断最佳分群数。使用 Plink1.9(–indep–pairwise 50 5 0.5)过滤掉邻近连锁较强的SNP,用于群体结构分析。获得的Q矩阵采用Excel作CV error值,获得趋势图,用R语言作群体结构图。利用Tassel 5.2.40对自交系群体104份油菜自交系进行亲缘关系评估,得到亲缘关系矩阵,依据YU等[21]的定义,当计算结果出现亲缘关系值为负数时,则定义为0。
1.2.3 全基因组关联分析
运用Tassel 5.2.40进行关联分析,采用混合线性模型,对群体结构与亲缘关系进行校正。关联分析完成后,用R语言CMplot包绘制Q–Q图与Manhattan图,以P=0.01/N(N为关联分析时用到的标记的总数)为阈值,筛选与性状显著关联的位点。
2 结果与分析
2.1 品质性状的统计分析
运用近红外仪测定了104份材料的芥酸、油酸、硫代葡萄糖苷含量,相关性分析结果(表1)表明:芥酸含量与硫代葡萄糖苷含量之间呈极显著正相关,相关系数为0.349(P=0.008 4);油酸与芥酸、硫代葡萄糖苷含量之间呈极显著负相关,相关系数分别为–0.894 (P=0.006 3)、–0.428(P=0.005 2)。在 104份材料中,芥酸含量变化范围为0.00% ~ 46.99%,平均值为6.04%,变异系数高达214.94%;油酸含量平均值为63.32%,变化范围为8.27% ~ 93.16%,变异系数为 30.89%;硫代葡萄糖苷含量平均值为27.45 μmol/g,变化范围为 3.56 ~ 60.16 μmol/g,变异系数为36.46%,说明供试材料变异较丰富。
表1 供试材料3个品质性状的平均值及变异系数Table 1 The mean value and coefficient of variation of three quality traits
2.2 基因分型与群体结构分析
2.2.1 简化基因组测序结果
基于ddRADseq技术,对104份材料进行了简化基因组测序,大部分测序位点碱基质量分值都在Q30以上,将获得的clean reads序列与参考基因组(法国冬油菜 Dammar v4.1)进行比对,每份材料的平均reads数为1 917 862,平均覆盖度为2.48%,平均覆盖深度为11.14 倍。简化基因组测序获得了2 106 617个 SNP标记,经过滤获得28 127个高质量的SNP标记。
2.2.2 群体结构与亲缘关系
运用Admixture1.3.0计算群体的遗传结构,根据连锁不平衡强度,筛选4 778个均匀分布在染色体上的SNP标记,对K值从1到10进行模拟运算,得到CV error值(图1)。当K=4时,CV error值最小。将104份甘蓝型自交系群体划分为4个亚群,分群情况见图2。P1亚群包含15个甘蓝型油菜品系;P2亚群包含28个甘蓝型油菜品系;P3亚群包含38个甘蓝型油菜品系;P4亚群包含23个甘蓝型油菜品系。
图1 不同K值的CV errorFig.1 CV error with different K value
图2 104份甘蓝型油菜自交系群体结构Fig.2 Population structure of 104 Brassica napus
2.3 全基因组关联分析
采用混合线性模型(mixed linear model, MLM),运用Tassel 5.2.40对104份自交系群体材料种子中的芥酸、油酸和硫代葡萄糖苷含量进行 GWAS 分析(图3),检测到与芥酸、油酸、硫代葡萄糖苷含量显著关联的 SNP位点数分别为 42、61、27。与芥酸含量显著关联的 SNP位点在 A08、C02、C03、C05与C08染色体上均有分布,其中C03染色体上分布的SNP位点最多,为19个,单个SNP对表型的解释率为 4.85%~24.45%;与油酸含量显著关联的SNP位点分布在A05、A08、C03、C05、C07与C08染色体上,其中C03染色体分布最多,存在29个位点,单个 SNP对表型的解释率为 1.31%~30.62%;关联分析检测到与硫代葡萄糖苷含量显著关联的SNP标记最少,为27个,分布在A02、A09、C02、C05、C06与C09染色体上,单个标记对表型的解释率为1.62% ~ 25.92%。
图3 3个品质性状全基因组关联分析Fig.3 The genome-wide association analysis of three quality traits
3 结论与讨论
通过分析104份甘蓝型油菜自交系的芥酸、油酸与硫代葡萄糖苷含量3个品质性状,发现性状的变异系数均在30%以上;相关性分析表明,芥酸含量与硫代葡萄糖苷含量呈极显著正相关,油酸含量与芥酸、硫代葡萄糖苷含量呈极显著负相关,这与王健胜等[22]的研究结果一致;因此,在甘蓝型油菜品种选育中,可考虑以高芥酸与高硫代葡萄糖苷含量,高油酸与低芥酸、低硫代葡萄糖苷含量的材料作为育种亲本。
前人[23]在进行全基因组关联分析时发现,群体内部的亲缘关系矩阵与群体结构会导致较高假阳性结果的出现;因此,需采用群体结构矩阵Q与亲缘关系矩阵作为协方差矩阵,对关联分析进行校正。本研究中,通过群体结构分析,可将104份材料分为 4个亚群。采用混合线性模型分析性状与标记之间的关联程度,发现与芥酸、油酸、硫代葡萄糖苷含量显著关联的SNP位点数分别为42、61、27。
本研究通过GWAS检测到与芥酸、油酸含量显著关联的位点主要集中在A08、C03染色体上,与硫代葡萄糖苷含量显著关联的位点主要分布在A02、A09、C09染色体上。叶桑等[24]通过对重组自交系群体(RIL)构建高密度的遗传连锁图谱,发现在A05、A08与C03染色体上存在多种脂肪酸含量的QTL“富集区域”。LI等[25]通过关联分析,检测到A08与 C03染色体上存在 2个控制芥酸含量的基因。李施蒙[26]利用SNP芯片对520份甘蓝型油菜的油酸含量进行关联分析,结果发现主要在A08、C03染色体上检测到与油酸含量显著关联的位点。本研究中检测到与油酸显著关联的位点主要集中在A08、C03上,这表明在A08、C03染色体上确实存在控制油酸含量的基因位点,可作为改良油菜籽中脂肪酸组成的重要区段。