亚麻主要产量相关性状的SSR关联分析
2022-11-03伊六喜贾海滨斯钦巴特尔高凤云贾霄云
伊六喜,邬 阳,曹 彦,贾海滨,斯钦巴特尔,高凤云,周 宇,贾霄云
(1.内蒙古农业大学 农学院,内蒙古 呼和浩特 010018;2.乌兰察布市农林科学研究院,内蒙古 集宁 012000;3.内蒙古自治区农牧业科学院,内蒙古 呼和浩特 010031)
亚麻(LinumusitatissimumL.)是我国特色油料作物,一般分为油用亚麻(胡麻)和纤维亚麻[1]。主要分布于我国华北、西北地区。亚麻对不同自然环境的适应能力较强,适合种植于我国北方地区干旱寒冷的生态区域。亚麻籽富含亚麻酸、木酚素、亚麻胶、膳食纤维等丰富的营养成分,有益于人体健康,可以制成多种保健食品[2]。
亚麻种质产量相关性状的表型鉴定及其关联的SSR标记的挖掘,对亚麻高产育种具有重要意义。近年来,众多学者以亚麻种质资源为研究对象,通过表型鉴定分析了亚麻产量相关性状的遗传变异。欧巧明等[3]对336 份油用亚麻种质资源的6个主要农艺性状进行鉴定与评价,筛选出10份株高适中,单株分茎、分枝能力强,单株果数多,单株生产力高的品种。王利民等[4]应用主基因+多基因混合遗传分离分析方法,研究了单株产量、单株果数、千粒质量和每果粒数4个性状的遗传效应,结果表明,单株产量、单株果数、千粒质量的遗传效应相同。陈英[5]对 341 份亚麻种质资源的 11 个数量性状进行多元统计分析,发现亚麻分枝数的变异系数最大,成熟日数的变异系数最小。李秋芝等[6]通过亚麻核心种质农艺性状的遗传多样性分析,筛选出20份表现型较理想的资源材料。邓欣等[7]对535份亚麻材料的表型进行鉴定与评价,结果表明,亚麻种子产量与分枝数、分枝习性、单株茎质量、蒴果数、茎粗、分茎数、全生育日数、千粒质量呈正相关,与工艺长度、出麻率及开花日数呈负相关。
开发亚麻产量相关性状紧密连锁的遗传标记,对亚麻育种缩短周期、提高效率以及精准选育具有重要意义。产量相关性状易受环境影响,属于数量性状。关联分析是快速、准确定位目标性状基因的重要方法,是开发实用性分子标记的主要手段。Cloutier等[8]用30份EST-SSR引物对23份亚麻种质进行了遗传多样性分析。Wu等[9]采用简化基因组测序技术,在亚麻中开发出1 574个SSR标记。 Choudhary等[10]利用22个SSR标记的270个多态性位点与130份亚麻种质的26个表型性状进行关联分析,获得了95个显著关联位点。这些结果对亚麻种质SSR标记研究提供基础。
内蒙古自治区农牧业科学院胡麻课题组前期研究中通过对401份亚麻种质的表型和SRAP标记的评价,构建了229份亚麻核心种质的自然群体,在此基础上,本研究利用30对SSR引物对该核心群体进行基因型检测,旨在挖掘产量相关性状紧密关联的SSR标记,为亚麻遗传改良提供理论基础。
1 材料和方法
1.1 试验材料
供试材料为229份亚麻核心种质,其中110份为国内种质,分别来自6个亚麻主产区(内蒙古占10%、甘肃占18%、河北占6%、山西占6%、宁夏占5%、新疆占3%),119份为国外种质,分别来自9个国家(美国占9%、荷兰占8%、匈牙利占8%、加拿大占7%、法国占5%、巴基斯坦占5%、阿根廷占3%、伊朗占3%、俄罗斯占3%)。
1.2 产量相关性状的测定与分析
229份亚麻种质分别种植于内蒙古呼和浩特市(Hohhot,HS)、集宁区(Jining,JN)、锡林郭勒盟太仆寺旗(Ximeng,XM)、新疆伊犁州(Xinjiang,XJ)4 个亚麻主产区,田间播种均采用随机区组设计, 3次重复,每份种质材料种植3行,行长 2. 0 m,行距0. 20 m,每行种子180粒。4个地区的地理位置、物候条件、播种和收获时期见表1。苗期,取2.00 g新鲜嫩叶于-80 ℃冰箱保存备用。亚麻生理成熟后,试验小区随机取样 20 株,参照《亚麻种质资源描述规范和数据标准》[11],测定株高、工艺长度、单株果数、每果粒数、单株粒质量、种子千粒质量、分枝数等性状。
表1 4个种植区的地理位置、气候条件Tab.1 Geographical location and climatic conditions of the 4 growing areas
1.3 亚麻SSR-PCR扩增
样品基因组DNA提取参照Stewart等[12]提出的CTAB法,检测合格之后于-20 ℃保存备用。利用本课题组前期筛选获得的30对SSR引物(表2),送上海生工生物工程技术服务有限公司合成,PCR 反应体系和扩增程序与伊六喜等[13]优化程序一致。扩增产物用6%非变性聚丙烯酰胺凝胶电泳分离,恒功率70 W电泳1.5 h,采用银染法显色[14]。DNA Marker(1500)条带为对照标记种质之间基因型差异条带,标记为“0”或“1”,组成一个“1”和“0”的数据矩阵[15]。用POPGEN 1.32计算有效等位基因数、引物多态性信息含量[16];用TASSEL 5.0对表型数据和SSR分子标记数据进行广义线性模型(General linear model,GLM)和混合线性模型(MLM)的关联分析,得出P值、表型变异解释率、关联位点以及表型效应值数据。
表2 30对引物序列 Tab.2 Primer sequences of 30 pairs
2 结果与分析
2.1 亚麻产量相关性状的统计分析
7个产量相关性状的统计分析结果表明,在4个环境下,株高平均值为(56.80±6.22)cm,其中呼和浩特地区平均值最大,为(58.40±5.67)cm;工艺长度平均值为(20.93±6.53)cm,其中新疆地区的平均值最大,为(22.30±6.90)cm;分枝数平均值为(4.63±1.03)个,其中集宁地区的平均值最大,为(5.00±1.25)个;单株果数平均值为(16.31±5.04)个,其中呼和浩特地区的平均值最大,为(17.50±3.50)个;果粒数平均值为(6.22±2.07)粒,其中集宁地区的平均值最大,为(6.52±2.67)粒;千粒质量平均值为(5.42±1.69)g,其中集宁地区的平均值最大,为(5.58±1.48)g;单株粒质量平均值为(0.52±0.20)g,其中呼和浩特地区平均值最大(0.55±0.15)g。7个产量相关性状的4个环境下的平均变异系数为11.18%~18.29%,其中分枝数变异系数最小(11.18%),单株粒质量的变异系数最大(18.29%)。在4个环境下千粒质量的广义遗传力最大(63.25%),工艺长度的广义遗传力最小(48.85%),7个产量相关性状的广义遗传力从大到小依次为千粒质量>果粒数>单株粒质量>株高>单株果数>分枝数>工艺长度(表3)。对7个产量相关性状的正态分布检验结果表明,所有性状基本呈现正态分布的趋势(图1),说明亚麻株高、工艺长度、单株果数、果粒数、单株粒质量、千粒质量、分枝数主要由基因型控制。
表3 不同环境下7个亚麻产量相关性状的统计分析Tab.3 Statistical analysis of 7 yield-related traits in different environments
图1 229份亚麻品质(系)的7个产量相关性状的频率直方图Fig.1 Frequency histogram of 7 yield-related traits in 229 flax germplasm
2.2 亚麻产量相关性状的相关性分析
7个产量相关性状之间的相关性分析结果表明,除了工艺长度和千粒质量、千粒质量和株高之间呈极显著负相关,株高与工艺长度的相关系数最大,为0.863(表4),说明亚麻株高和工艺长度是密切相关的2个性状,在纤维亚麻中该特征更为明显,此结果与前期对401份亚麻材料的表型分析结果一致[17]。亚麻单株粒质量、单株果数、果粒数和千粒质量是影响亚麻单株产量的主要性状,本研究结果表明,亚麻单株粒质量与分枝数、单株果数和果粒数之间呈极显著正相关,说明单株果数、果粒数和千粒质量的增多,可以提高单株粒质量,其是亚麻单产直接相关的因素。千粒质量与株高和工艺长度呈极显著负相关(P<0.01),该结果进一步说明了纤维亚麻和油用亚麻之间的表型差异,纤维亚麻株高较高,但种子籽粒较小,而油用亚麻株高较矮,但种子籽粒大。
表4 亚麻7个产量相关性状间的相关性分析Tab.4 Correlation coefficient among 7 agronomic traits of flax
2.3 SSR引物多态性分析
由表5可知,利用30对SSR引物在229份亚麻材料中共扩增出365条条带,平均每对引物扩增出12.17条条带,其中Lu462引物扩增的条带最多(19条),多态性位点在5~19,有效等位基因数在1.199 1~ 1.832 0,引物多态性含量为0.248 9~0.625 7,其中Lua37引物的多态性含量最高,为0.625 7,其次为Lu422引物(0.611 7),引物平均多态性含量为0.432 2。本试验使用的SSR引物多态性好、条带清晰,以Lu661引物在29份亚麻种质上扩增结果为例(图2)。
表5 30对SSR引物在229份亚麻种质的扩增Tab.5 Amplification of 229 flax germplasm using 30 pairs of SSR primer
2.4 遗传多样性分析
将229份亚麻种质划分为两大类群,分别表示为A和B(图3),其中,A群包括116份亚麻种质,其中国内种质33份,国外种质83份。该群分为2个亚群,第1个亚群(A-Ⅰ)包括74份亚麻种质,其中国内种质20份(内蒙古9份、甘肃5份、宁夏2份、新疆2份、山西1份、河北1份),占该亚群的27.02%;国外种质54份,占该亚群的72.98%。第2个亚群(A-Ⅱ)包括42份亚麻种质,其中国内种质13份(内蒙古8份、甘肃3份、河北1份、新疆1份),占亚群的30.95%;国外种质29份,占该亚群的69.05%。B群包括113份亚麻种质,其中国内种质87份,国外种质26份。该群分为2个亚群,第1个亚群(B-Ⅰ)包括56份亚麻种质,其中国内种质45份,占该亚群的80.35%;国外种质11份(加拿大3份、美国2份、法国2份、巴基斯坦2份、西德1份、匈牙利1份),占该亚群的19.64%。第2个亚群(B-Ⅱ)包括57份亚麻种质,其中国内种质42份,占该亚群的73.68%;国外种质15份(加拿大7份、美国3份、俄罗斯2份、匈牙利1份、法国1份、阿根廷1份),占该亚群的26.32%。从A和B这2个大类群国内外种质占比来看,基本能区分开。
M.DL1500;1—29依次为29份亚麻样品。M.DL1500;1—29 were 29 flax samples in turn.
图3 229份亚麻种质的系统进化树Fig.3 Phylogenetic tree of 229 flax germplasm
对229份亚麻种质的群体结构分析结果显示,当K=4时,ΔK的值出现显著峰值(图4),因此,当K=4时,分为4个群体,第1个群、第2个群和第4群均为56份种质,第3群为61份种质(图5)。
2.5 关联分析
使用TASSEL 5.0软件的广义线性模型(GLM)和混合线性模型(MLM)程序,将每份种质的Q值作为协变量,对30个SSR标记分别与不同环境下检测到表型数据均值进行关联分析,检测目标性状显著(P<0.01)关联的标记。GLM和MLM的关联分析结果分别见表6,7,GLM下检测到了36个SSR标记,标记对性状表型变异的解释率为1.15%(Lu146)~7.75%(Lu747),平均为4.19%;MLM下检测到了23个SSR标记,标记对性状表型变异的解释率为2.26%(Lu203a)~7.16%(Lu291),平均为3.62%。在GLM和MLM下,单株粒质量、单株果数和分枝数同时检测到了Lu203a和Lua125a标记,分别分布在第12,2号染色体上。
图4 ΔK随K值的变化曲线Fig.4 ΔK with the change of K values
图5 229份亚麻种质群体结构分析Fig.5 Analysis of population structure of 229 flax germplasm
表6 亚麻产量相关性状的GLM关联分析Tab.6 GLM correlation analysis of flax yield related traits
表6(续)
表7 亚麻产量相关性状的MLM关联分析Tab.7 MLM correlation analysis of flax yield related traits
3 结论与讨论
亚麻是一种高度自花授粉作物,在高产育种技术上,仍沿用常规育种手段,能用的分子标记较少,导致育种周期长,选择效率低,品种更新换代缓慢。因此,通过亚麻种质资源产量相关性状的关联分析,挖掘实用性分子标记对亚麻遗传改良具有重要意义。关联分析研究中,种质资源的表型鉴定评价是最关键的一步,利用本课题组前期构建的229份亚麻核心种质材料[18],通过4个环境的表型鉴定分析结果表明,在呼和浩特地区种植的亚麻种质株高((58.40±5.67)cm)、单株果数((17.50±3.50)个)和单株粒质量((0.55±0.15)g)指标表现为最大;在集宁地区种植的亚麻种质分枝数((5.00±1.25)个)、果粒数((6.52±2.67)粒)和千粒质量((5.58±1.48)g)的指标表现为最大,说明不同种植环境对亚麻产量相关性状的影响较大。7个产量相关性状的变异系数为11.18%~18.29%,除千粒质量与株高和工艺长度呈极显著负相关外,其他性状之间相关性均为正相关。广义遗传力从大到小依次为千粒质量>果粒数>单株粒质量>株高>单株果数>分枝数>工艺度。基于SSR标记的遗传多样性分析结果表明,229份亚麻种质分为2个大群,国内外种质基本能区分开。此结果为亚麻种质资源收集保存和种质创新提供重要的参考信息。然而为了更好地服务亚麻育种,这些试验结果还需要多年多点的大田试验来进一步鉴定与评估。
近几年,亚麻SSR标记开发研究报道较多[19-20],但是这些成千上万标记真正应用于亚麻育种当中的寥寥无几,因此,亚麻种业发展需要更多种质资源的表型和基因型鉴定评价,并挖掘实用性分子标记。本研究筛选出30对SSR多态性引物,共扩增出365条条带,与亚麻7个产量相关性状进行关联分析,GLM下检测到了36个显著关联的SSR标记,MLM下检测到了23个SSR标记。其中Lu203a和Lua125a标记在2种模型下均关联到单株粒质量、单株果数和分枝数。通过亚麻参考基因组(https://www.ncbi.nlm.nih.gov/nuccore?LinkName)的比对,Lu203a(CCTTTTCACGCAGAGCTACC/GCTTCCGTAATCCTCTTCCA)标记分布在12号染色体上,Lua125a(GCCTTTGGAGGGCTTAACTT/ACAATCCCAACATTCCCAAA)标记分布在2号染色体上。前人对亚麻种质的SSR标记研究中大量使用了这2个标记[21-24],说明后期可以利用Lu203a和Lua125a标记辅助选择对应的目标性状,对亚麻遗传改良提供便利。