APP下载

芝麻产量相关性状全基因组关联分析

2023-12-22崔向华隗正阳杜振伟周霞丽刘焱石明权阚跃峰张少泽崔承齐梅鸿献

江苏农业科学 2023年21期
关键词:产量性状芝麻

崔向华 隗正阳 杜振伟 周霞丽 刘焱 石明权 阚跃峰 张少泽 崔承齐 梅鸿献

摘要:以294份遗传多样性丰富的芝麻种质资源为试验材料,于2014年调查驻马店市、商丘市、南阳市3个地点的株高、始蒴高度、单株蒴数、蒴粒数、千粒质量、单株产量等6个产量相关性状,结合33 027个SNP标记,使用混合线性模型进行全基因组关联分析,对重复检测到的显著SNP位点两侧99 kb区域内挖掘所有功能注释基因,根据注释信息找寻与目标性状相关的基因,并进行功能富集分析。结果表明,6个性状存在广泛变异,3个环境下变异系数表现为单株产量和单株蒴数>始蒴高度>蒴粒数>千粒质量>株高。6个性状均呈现正态分布,广义遗传力为44.07%~85.49%。经关联分析共检测到171个显著关联位点,表型变异解释率为5.46%~11.56%。在驻马店和商丘共同检测到6个与蒴粒数显著关联的位点,在其侧翼各99 kb区域内共挖掘到118个功能注释基因,其中SIN_1012613基因与拟南芥CKI1(AT2G47430)是同源基因,该基因可能通过调控雌配子的发育来决定芝麻蒴粒数。本研究结果有助于解析芝麻产量相关性状的遗传机制,为芝麻产量的遗传改良奠定理论基础。

关键词:芝麻;产量性状;全基因组关联分析;SNP标记;功能注释基因;广义遗传力;候选基因预测

中图分类号:S565.303.2文献标志码:A

文章编号:1002-1302(2023)21-0106-07

芝麻(Sesamum indicum L.,2n=26)属胡麻科胡麻属,主产地为亚洲和非洲,是我国重要的油料作物之一[1]。芝麻具有较高的经济价值,以芝麻籽加工的芝麻油和芝麻酱,具有独特的风味和丰富的营养物质,受到消费者青睐[2]。同时芝麻也具有药用价值,芝麻含有的木酚素具有降低人体胆固醇的作用[3],其富含的芝麻酚、芝麻醇、维生素E等是天然抗氧化物质[4]。近年来,人们对芝麻需求量的增加与中国芝麻种植面積不断萎缩的矛盾凸显,芝麻进口量逐年增加[5],因此,需要通过选育更高产的芝麻品种来缓解国内芝麻供给不足的现状。优异的产量性状是提升芝麻产量的关键,明确其遗传机制,鉴定和定位控制产量性状的染色体位点,对于挖掘高产基因、培育高产品种均具有重要意义。

全基因组关联分析(GWAS)以自然群体长期重组交换保留下的连锁不平衡为基础,相较于经典双亲连锁作图,具有无需构建分离群体、研究周期短、定位精度高等优点[6]。近些年,随着基因组测序成本的降低,全基因组关联分析应用到作物遗传育种研究中的例子越来越普遍,已成为研究作物数量性状的重要方法[7]。目前,全基因组关联分析已经在玉米[8]、小麦[9]、水稻[10]、大豆[11]、油菜[12]等作物中得到大量应用。随着芝麻高质量参考基因组的公布[13],全基因组关联分析也逐渐被应用到芝麻复杂农艺性状的遗传基础解析中。Tesfaye等在2个环境中对300份芝麻种质资源进行全基因组关联分析,共鉴定到21个与7个产量相关性状相关联的显著标记[14]。Wei等对705份芝麻种质资源进行重测序,并首次对56个农艺性状进行全面的全基因组关联分析[15]。Dossa等以400份芝麻材料为群体,对其抗旱相关性状进行全基因组关联分析,检测到10个稳定数量性状基因座(QTL)位点解释表型变异40%以上[16]。崔承齐等将由363份种质资源组成的群体作为研究对象,借助全基因组单核苷酸多态性(SNP)标记对8个产量相关性状进行关联分析,结果检测到10个重复关联位点[17]。

相较于主要作物,芝麻遗传育种研究相对滞后,挖掘更多产量相关性状的优异等位基因仍尤为必要。本研究以294份芝麻种质资源为关联群体,结合基于SLAF-seq(specific locus amplified fragment sequencing) 技术开发的高质量SNP标记和该群体3个种植点的表型数据,对株高、始蒴高度、单株蒴数、蒴粒数、千粒质量和单株产量等性状进行全基因组关联分析,旨在挖掘显著关联位点,为目标性状的基因克隆和功能验证奠定基础,最终通过分子设计育种提高芝麻产量。

1 材料与方法

1.1 试验材料

关联分析群体由294份收集于各地的种质资源组成,由河南省农业科学院芝麻研究中心提供。分别于2014年在商丘市、南阳市和驻马店市试验基地种植,田间试验设计2个重复,行长划定为3 m,行距划定为0.4 m,3对真叶时定株距为0.17 m,试验区采取常规田间管理。

1.2 表型测定

终花期每个重复随机选取10株长势一致的健康植株,统计株高(PH)、始蒴高度(FCH)和单株蒴数(CN)并挂牌标记;成熟期每株收获成熟、均匀蒴果30个,晒干,统计蒴粒数(SN)和千粒质量(SW);之后将标记植株整株收获,晾干,收取全部籽粒并称质量,获得单株产量(SY)[17]。

1.3 表型数据分析

利用IBM SPSS Statistics v19.0 软件对表型数据进行统计分析和方差分析。使用R语言lme4包计算3个环境中性状的最优线性无偏估计值(BLUP),使用corrplot包进行相关性分析。使用ICiMapping软件ANOVA功能进行广义遗传力估算,计算公式参照Knapp等的研究[18]。

1.4 基因型鉴定和分析

采用SLAF-seq技术对群体材料进行简化测序,然后利用BWA软件将过滤后的数据比对到改良后的中芝13参考基因组上[19],再采用SAMTOOLS软件检测群体SNP,经VCFtools软件初步过滤后,去除缺失率大于10%或最小等位基因频率小于0.01的SNP,最终获得33 027个高质量SNP用于全基因组关联分析。

1.5 全基因组关联分析

利用TASSEL 5.0软件分别对3个环境下6个性状进行全基因组关联分析,以P=0.000 1为阈值,判定SNP标记与目标性状关联的显著性。使用R语言qqman包绘制曼哈顿图。

2 结果与分析

2.1 表型数据的描述统计

对关联群体在3个不同环境下6个产量相关性状(单株产量、单株蒴数、蒴粒数、千粒质量、株高、始蒴高度)表型数据进行统计分析(表1)。通过表型数据发现这6个性状具有广泛的变异,变异系数分布为9.41%~30.54%,表明材料间性状差异较大,具有丰富的遗传变异。同时,3个环境下各性状变异系数具有相同的表现,即单株产量和单株蒴数>始蒴高度>蒴粒数>千粒质量>株高,表明单株产量较其他性状更容易受到环境因素影响,而株高则与之相反。从各性状频数分布直方图(图1)来看,6个性状基本符合正态分布,符合数量性状特点。对产量相关性状的BLUP值进行相关性分析,得出相关系数(表2)。结果表明,株高与始蒴高度、单株蒴数、单株产量呈极显著正相关(P<0.01);单株产量与单株蒴数极显著正相关;单株蒴数与蒴粒数、千粒质量呈极显著负相关;蒴粒数和千粒质量呈极显著负相关;单株蒴数与单株产量的相关性最高 (相关系数0.67)。

方差分析结果(表3)显示,这6个性状的基因型效应、环境效应及二者互作效应均达到极显著水平(P<0.01)。由表1可知,各性状的广义遗传力为44.07%~85.49%,其中单株产量的广义遗传力最低,株高的广义遗传力最高,说明单株产量更容易受到环境因素影响。

2.2 产量相关性状的全基因组关联分析

基于混合线性模型(MLM)对关联群体的单株产量、株高、单株蒴数、蒴粒数、千粒质量、始蒴高度等6个性状进行GWAS分析,以P<0.000 1为显著性阈值,共检测到171个显著关联位点(图2)。其中,与株高关联的位点共16个,分布在1号、11号和12号染色体上,解释表型变异的有6.62%~10.02%,其中1号染色体上的关联位点最多,达到11个;与始蒴高度关联的位点共26个,解释表型变异的有6.62%~11.12%,分布在1号、2号、3号、4号、5号和6号染色体上;与单株蒴数关联的位点共计34个,解释表型变异的有6.54%~9.93%;与蒴粒数关联的位点共55个,解释表型变异的有5.46%~10.52%;与千粒质量关联的位点共26个,解释表型变异的有6.51%~11.56%;与单株产量关联的位点共14个,解释表型变异的有6.57%~8.97%。其中,共有6个与蒴粒数关联的位点在驻马店和商丘2个环境中均能重复被检测到(表4)。

2.3 候选基因预测

为保证结果的可靠性,只对重复检测到的关联位点进行候选基因筛选。参考前期研究,LD衰减距离约为99 kb[17],在6个重复检测到的位点侧翼各99 kb区间内共找到153个基因,其中118个基因具有功能注释。GO功能富集分析结果显示,这些基因富集到43个功能类别下,涉及植物的细胞组分、生物学过程和分子功能(图3)。其中,细胞(cell)、细胞组分(cell part)、细胞进程(cellular process)、细胞器(organelle)、代谢过程(metabolic process)這5个功能类别下富集的基因占比较多(图3)。根据功能注释结果筛选到1个可能与蒴粒数相关的候选基因SIN_1012613,该基因与拟南芥CKI1(AT2G47430)基因同源,CKI1基因在拟南芥中编码组氨酸激酶蛋白,该蛋白通过调控雌配子发育来决定种子的形成。

3 讨论与结论

芝麻产量构成因素较多且复杂,各因素之间相互联系。本研究通过对产量相关性状BLUP值进行相关性分析发现,各性状之间存在复杂的相关性,株高与始蒴高度、单株蒴数和单株产量极显著正相关,单株产量与单株蒴数的相关系数最高,为0.67。说明选育高产品种首先应关注株高和单株蒴数,且单株蒴数是影响产量最密切的因素,这与前人研究结果相似。唐雪辉等利用通径分析发现,单株蒴数是构成芝麻产量的第一因素,直接通径系数为0.830 9[20]。吕伟等利用逐步回归分析和通径分析发现,单株蒴数、千粒质量和蒴粒数3个性状的优良表现对芝麻单株产量起到促进作用[21]。刘红艳等以15份芝麻种质资源为试验材料,对产量和品质性状进行典型相关分析,认为选育丰产型品种应考虑株型、千粒质量、单株蒴果数和蒴粒数[22]。同时,在本研究中各环境下单株蒴数与蒴粒数、千粒质量呈极显著负相关关系,蒴粒数和千粒质量呈极显著负相关关系。综上,各性状相互配合、相互影响,因此培育高产品种应综合考虑多个性状表现。

全基因组关联分析利用覆盖整个基因组的分子标记,鉴定目标性状表型和基因型之间的关联。准确的表型数据对GWAS研究十分重要[23]。本研究共检测到171个与产量相关性状显著关联的位点,但大多只在单个环境中被检测到,仅有6个与蒴粒数关联的显著位点在驻马店和商丘2个环境中重复检测到,原因可能是产量相关性状属复杂的数量性状,易受环境影响,需要依靠多年多点的试验和更加高效准确的表型采集技术来获得良好的表型数据。然而,目前作物表型数据仍然依靠人工采集,效率低,难以避免主观误差,且作物生长发育过程存在人工无法获取和采集的表型信息。鉴于此,多尺度、高通量、规模化的植物表型组学研究快速发展[24],通过使用数字成像、近红外光谱等技术,会更加高效、准确地获得植物表型数据,推动GWAS研究进一步发展。

数量性状遗传基础复杂,本研究在6个与蒴粒数显著关联的位点区间内共发现153个基因,其中118个具有功能注释。这些基因中SIN_1012613位于6号染色体上,是拟南芥CKI1(cytokinin independent 1)的同源基因,CKI1在拟南芥中编码组氨酸激酶蛋白(histidine kinase protein)。有研究表明,该蛋白可能通过调控胚囊中央细胞的命运分化和发育过程来决定种子的形成[25]。Deng等通过获得纯合CKI1突变体拟南芥,发现CKI1的功能缺失会导致雌配子发育缺陷、结实率低等问题[26]。由此推测,芝麻SIN_1012613基因可能具有相似功能,即通过调控雌配子的发育来决定芝麻蒴粒数。本研究同时在关联区间内检测到MYB、bZIP、NAC等与植物生长代谢调控相关的转录因子,这些转录因子可能通过影响植物生长发育间接控制蒴粒数。然而,后续仍需要借助基因编辑、遗传转化等方法进行功能验证。

参考文献:

[1]刘红艳. 芝麻细胞核雄性不育的遗传特性、生理生化及分子标记研究[D]. 北京:中国农业科学院,2013.

[2]许方涛,崔向华,盛 晨,等. 芝麻不同组织中矿物质元素分布特征及相关性分析[J]. 中国油料作物学报,2023,45(5):1028-1033.

[3]Hirata F,Fujita K,Ishikura Y,et al. Hypocholesterolemic effect of sesame lignan in humans[J]. Atherosclerosis,1996,122(1):135-136.

[4]刘 坤,齐 静,刘梦兰,等. 芝麻GRF基因家族全基因组鉴定分析[J]. 分子植物育种,2020,18(22):7323-7333.

[5]周 瑢,许方涛,盛 晨,等. 芝麻含油量及脂肪酸含量QTL分析[J]. 中国油料作物学报,2021,43(6):1042-1051.

[6]熊雪航,段海洋,李文龙,等. 玉米穗长全基因组关联分析[J/OL]. 分子植物育种:1-16.(2022-06-30)[2023-08-25]. http://kns.cnki.net/kcms/detail/46.1068.S.20220630.1359.004.html.

[7]杨 飞,张征锋,南 波,等. 水稻产量相关性状的全基因组关联分析及候选基因筛选[J]. 作物学报,2022,48(7):1813-1821.

[8]Palaisa K,Morgante M,Tingey S,et al. Long-range patterns of diversity and linkage disequilibrium surrounding the maize Y1 gene are indicative of an asymmetric selective sweep[J]. Proceedings of the National Academy of Sciences of the United States of America,2004,101(26):9885-9890.

[9]Neumann K,Kobiljski B,Denc[DD(-1*2/3][HT6]ˇ[DD)]i[KG-*5]c[DD(-1*2/3][HT6]'[DD)] S,et al. Genome-wide association mapping:a case study in bread wheat (Triticum aestivum L.)[J]. Molecular Breeding,2011,27(1):37-58.

[10]Huang X H,Wei X H,Sang T,et al. Genome-wide association studies of 14 agronomic traits in rice landraces[J]. Nature Genetics,2010,42(11):961-967.

[11]Zhou Z K,Jiang Y,Wang Z,et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nature Biotechnology,2015,33(4):408-414.

[12]Wei L J,Jian H J,Lu K,et al. Genome-wide association analysis and differential expression analysis of resistance to Sclerotinia stem rot in Brassica napus[J]. Plant Biotechnology Journal,2016,14(6):1368-1380.

[13]Wang L H,Yu S,Tong C B,et al. Genome sequencing of the high oil crop sesame provides insight into oil biosynthesis[J]. Genome Biology,2014,15(2):R39.

[14]Tesfaye T,Tesfaye K,Keneni G,et al. Genome-wide association study for yield-related traits in sesame (Sesamum Indicum)[J]. Plant Breeding,2022,141(2):246-256.

[15]Wei X,Liu K Y,Zhang Y X,et al. Genetic discovery for oil production and quality in sesame[J]. Nature Communications,2015,6:8609.

[16]Dossa K,Li D H,Zhou R,et al. The genetic basis of drought tolerance in the high oil crop Sesamum indicum[J]. Plant Biotechnology Journal,2019,17(9):1788-1803.

[17]崔承齊,刘艳阳,江晓林,等. 芝麻产量相关性状的多位点全基因组关联分析及候选基因预测[J]. 中国农业科学,2022,55(1):219-232.

[18]Knapp S J,Stroup W W,Ross W M.Exact confidence intervals for heritability on a progeny mean Basis[J]. Crop Science,1985,25(1):192-194.

[19]Mei H X,Liu Y Y,Cui C Q,et al. QTL mapping of yield-related traits in sesame[J]. Molecular Breeding,2021,41(7):43.

[20]唐雪輝,贺建文,谭顺林,等. 芝麻主要农艺性状与产量相关性及通径分析[J]. 安徽农业科学,2010,38(26):14293-14294.

[21]吕 伟,韩俊梅,文 飞,等. 西北地区芝麻单株产量与农艺性状的相关性与通径分析[J]. 种子,2020,39(4):91-94.

[22]刘红艳,赵应忠.芝麻产量性状与品质性状的典型相关分析[J]. 中国油料作物学报,2006,28(2):129-133.

[23]韩 贝,王旭文,李保奇,等. 陆地棉种质资源抗旱性状的关联分析[J]. 作物学报,2021,47(3):438-450.

[24]徐凌翔,陈佳玮,丁国辉,等. 室内植物表型平台及性状鉴定研究进展和展望[J]. 智慧农业,2020,2(1):23-42.

[25]Yuan L,Liu Z N,Song X Y,et al. The CKI1 histidine kinase specifies the female gametic precursor of the endosperm[J]. Developmental Cell,2016,37(1):34-46.

[26]Deng Y,Dong H L,Mu J Y,et al. Arabidopsis histidine kinase CKI1 acts upstream of histidine phosphotransfer proteins to regulate female gametophyte development and vegetative growth[J]. The Plant Cell,2010,22(4):1232-1248.

收稿日期:2023-04-11

基金项目:国家特色油料产业技术体系建设专项(编号:CARS-14-1-01、CARS-14-2-16);河南省重大科技专项(编号:201300110600);河南省中央引导地方科技发展资金 (编号:Z20221343038);河南省农业科学院科技创新团队项目(编号:2023TD31);河南省农业科学院基础性科研工作项目(编号:2023JC13)。

作者简介:崔向华(1973—),男,河南驻马店人,副研究员,从事芝麻遗传育种及高产栽培技术研究。E-mail:xianghuacui1973@163.com。

通信作者:梅鸿献,博士,副研究员,从事芝麻种质资源与遗传育种研究。E-mail:meihx2003@126.com。

猜你喜欢

产量性状芝麻
香喷喷的芝麻
一品芝麻狐 第四回
一品芝麻狐 第二回
一品芝麻狐 第五回
一品芝麻狐 第三回
一品芝麻狐 第一回
大豆品种对比试验总结
不同氮磷钾配比控释肥对糯玉米产量性状及经济效益的影响
玉米种植密度对产量影响的研究
海岛棉染色体片段代换系BC4F4产量及纤维品质主成分分析