陆地棉株型及生育期相关性状QTL 定位
2021-04-14贾晓昀王士杰赵红霞朱继杰李妙王国印
贾晓昀,王士杰,赵红霞,朱继杰,李妙,王国印
(河北省农林科学院粮油作物研究所/ 河北省作物遗传育种实验室,石家庄050035)
株型是棉花的重要性状,不同株型材料在产量、品质、抗逆性等方面存在显著差异,理想株型是高产优质的保证[1-5]。 近年来,全程机械化成为棉花生产的重要发展方向,机采棉成为育种的主攻目标, 而机械采摘对株型的要求较为严格,因此挖掘株型相关分子遗传机制成为基础研究的重点[3,6]。 此外,株高越矮、株型越紧凑的材料早熟性越好,改良棉花早熟性,适当无膜晚播,有利于减少地膜使用量,保护耕地质量和环境[1,7-8]。
棉花株型性状主要包括株高 (Plant height,PH)、第一果枝节位(Nodeofthefirstfruitingbranch,NFFB)及其高度(Height of NFFB,HNFFB)、果枝长度 (Fruiting branch length,FBL)、 果节长度(Branch node length,BNL) 及 果 枝 角 度(Fruit branch angle,FBA)等性状;生育期主要包括出苗期(Budding time,BT)、现 蕾 期(Squaring time,ST)、开花期(Flowering time,FT)、花铃期(Flowering to boll-opening period,FBP) 和全生育期(Whole growth period,WGP)[7,9-11]。 目前,关于棉花株型及生育期性状的分子遗传机制研究主要通过QTL(Quantitative trait loci,数量性状位点)定位和GWAS (Genome-wide association analysis,全基因组关联分析)挖掘相关染色体位点。 范术丽等[12]首先开展棉花株型及生育期性状QTL定位研究,得到12 个相关QTL。Li 等[13]构建2 个F2群体定位到54 个生育期相关的QTL。 Li 等[14]针对10 个株型性状开展QTL 定位, 在F2和F2:3群体定位到73 个位点。 Jia 等[11]以重组自交系为材料, 定位到247 个株型及生育期相关QTL 位点,并在D3 染色体上发现一段关键区域。Su 等[7]以355 份陆地棉为试验材料,开展株型相关性状GWAS,关联到22 个SNP。 Ma 等[15]构建海陆种间回交群体,定位到10 个株高相关QTL,并验证了1 个GhPIN3 基因。然而,棉花株型及生育期性状均为复杂的数量性状,目前得到的基因信息较少,难以为品种选育提供有效参考。
本研究立足生产需求, 以冀丰914 和冀丰817 为亲本构建F2群体,分析棉花株型及生育期性状的相关性。 采用GBS(Genotyping-by-sequencing, 基于测序的基因分型) 技术开发群体SNP(Single nucleotide polymorphism,单核苷酸多态性) 标记, 构建了1 张包含11 488 个SNP 标记、总图距为4 202.12 cM(centiMorgan,厘摩)的高密度遗传图谱(数据未发表),定位与株型、生育期相关的QTL,为深入分析棉花株型及生育期性状的分子遗传机制奠定研究基础,为机采棉分子标记辅助育种提供理论指导。
1 材料与方法
1.1 试验材料
以自育国审品种冀丰914(国审棉2015003)为母本, 以优质自交系冀丰817 (原系名: 优系817)为父本。 冀丰914 株型高大、丰产性好,冀丰817 株高较低、纤维品质优良。 于2018 年在河北石家庄组配杂交组合,收获F1种子,同年冬天在海南加代自交,收获F2种子。于2019 年在河北石家庄播种F2群体413 个单株, 行长7 m, 行距0.76 m,株距0.2 m,共15 行,管理同当地大田。
现蕾后调查NFFB,9 月初调查PH、HNFFB、FNLFFB (First node length of the fourth fruiting branch, 第四果枝第一果节长度)、FNLSFB(First node length of the seventh fruiting branch, 第七果枝第一果节长度);全生育期内及时调查开花期和吐絮期,统计FT、FBP 和WGP。
1.2 分析方法
通过Excel 2016 对数据的基本统计量进行分析,通过SPSS21.0 分析性状之间的简单相关性。
通过QTL IciMapping 4.0 分析加性及上位性QTL[16]。 加性QTL 的分析参数为:Step=1 cM,PIN=0.001。 上位性QTL 的分析参数为:Step=5 cM,PIN=0.000 1。LOD 值通过1 000 次迭代计算确定。 本研究中,母本基因型为BB,父本基因型为AA;加性效应为负,表示对应QTL 的增效基因来源于母本冀丰914;加性效应为正,表示对应QTL 的增效基因来源于父本冀丰817。
1.3 基因注释及表达量分析
根据Wang 等[17]公布的参考基因组信息对重要QTL 位点进行基因注释,并通过KOBAS 3.0软件[18]进行KEGG 通路和GO 富集分析,根据Hu 等[19]公布的转录组信息进行注释基因表达量分析。
2 结果与分析
2.1 群体表型的基本统计
表1 为群体性状基本统计量。 除花铃期外,冀丰914 的其他性状值显著大于冀丰817,F1的性状表型值居于亲本之间,F2群体性状呈现双向超亲分布;峰度和偏度的绝对值小于1,近似正态分布,适合进行QTL 分析。 由标准差和变异系数可 以 看 出, 试 验 群 体 的PH、NFFB、HNFFB、FNLFFB 和FNLSFB 等5 个株型性状的变异幅度显著大于FT、FBP 和WGP 等3 个生育期性状,说明试验群体的株型性状变异丰富,含有丰富的株型相关QTL/基因。
表1 亲本及群体性状的基本统计量Table 1 Statistics of the parents and population traits
2.2 性状之间的简单相关性分析
表2 为性状之间简单相关性分析。 可以看出,除FT 与FBP 负相关外,其他性状间均为正相关。PH 与NFFB、HNFFB、FNLFFB、FNLSFB 的相关性达到极显著水平, 与WGP 的相关性达到显著水平。 NFFB 与HNFFB、FNLFFB、FT、WGP的相关性达到极显著水平,与FBP 的相关性达到显著水平。HNFFB 与FNLFFB、FT 的相关性达到极显著水平, 与WGP 的相关性达到显著水平。FNLFFB 与FNLSFB、FT、WGP 的相关性达到极显著水平;FNLSFB 与WGP 的相关性达到极显著水平,与FBP 的相关性达到显著水平。WGP 与FT、FBP 的相关性达到极显著水平。 可知,PH 与其他4 个株型性状均为极显著正相关,NFFB 与生育期性状均为显著/极显著正相关。
2.3 株型性状的主成分分析
表3 为株型性状主成分分析结果,前两个主成分因子累计贡献率为61.53%。因子1 的特征值为2.03,贡献率为40.53%,特征向量值较大的是HNFFB(0.74)和PH(0.73),主要是垂直高度相关性状。因子2 的特征值为1.05,贡献率为21.00%,特征向量值较大的是FNLSFB(0.77),为水平长度相关性状。 因此,PH、HNFFB 和FNLSFB 是鉴定棉花株型垂直和水平方向特征的典型性状。
表2 各性状之间的相关性分析Table 2 Correlation analysis among the seven traits
表3 五个株型性状主成分分析Table 3 Principal component analysis of the five plant architecture traits
2.4 QTL 定位结果及分析
本研究共得到36 个加性QTL(Additive QTL,aQTL)位点,包括31 个株型相关aQTL 和5 个生育期相关aQTL,其中26 个位点的增效基因来源于母本冀丰914,10 个位点的增效基因来源于父本冀丰817 (表4 和图1)。 定位到14 个PH 相关aQTL, 分布于11 条 染色体。 其 中,qPH-D12-1 的贡献率最大, 为9.64%,LOD 值达到11.97,增效基因来源于母本冀丰914;qPHD2-1 和qPH-D5-1 的贡献率分别为8.53%和8.62%,LOD 值分别为10.85 和10.86, 增效基因均来源于母本冀丰914。 定位到6 个NFFB 相关aQTL, 分布于5 条染色体。 其中,qNFFB-A11-1的贡献率最大,为8.63%,增效基因来源于母本冀丰914。 定位到3 个HNFFB 相关aQTL,分布于A12、D3 和D8 染色体, 贡献率分别为6.18%、5.61%和6.75%。 定位到5 个FNLFFB 相关aQTL, 分布于A2、A6、D8 和D11 染色体,A6 染色体分布有2 个位点, 即qFNLFFB-A6-1 和qFNLFFB-A6-2, 这两个位点的贡献率分别为10.36%和10.38%, 其中qFNLFFB-A6-1 的增效基因来源于父本冀丰817,qFNLFFB-A6-2 的增效基因来源于母本冀丰914。 定位到3 个FNLSFB 相关aQTL,分布于A9、D8 和D10 染色体,其中qFNLSFB-D8-1 的位置与qFNLFFBD8-1 相近,位于135~139 cM 区段,增效基因均来源于父本冀丰817。 分别定位到2、1、2 个FT、WGP、FBP 相关aQTL,分布于5 条染色体,贡献率为6.29%~8.11%。
表4 株型及生育期相关性状加性QTL 信息Table 4 Additive effect QTL information of the plant architecture and growth period related traits
图1 定位的加性QTL 在染色体上的分布Fig. 1 Additive QTL distribution on chromosomes
发现3 个染色体片段处同时分布有2 个aQTL 位点, 分别为A11 染色体1.5~4.5 cM 处qNFFB-A11-1 和qWGP-A11-1 重叠、D3 染色体157.5~166 cM 处qHNFFB-D3-1 和qPH-D3-1 重叠、D8 染色体138.5~139.5 cM 处qNFFB-D8-1和qFNLSFB-D8-1 重 叠。 其 中,D8 染 色 体 的134.5~135.5 cM 有1 个qFNLFFB-D8-1。 因此,D8 染色体135~139 cM 区段内可能存在与株型相关的关键基因。
此外, 定位到263 个上位性QTL(Epistatic QTL,eQTL)位点,涉及全部的26 条染色体(附表1)。 其中31 个与PH 相关、28 个与NFFB 相关、19 个与HNFFB 相关、62 个与FNLFFB 相关、21个 与FNLSFB 相 关、44 个 与FT 相 关、21 个 与WGP 相关和37 个与FBP 相关,单个eQTL 的贡献率为1.17%~6.19%。 其中,96 个eQTL 分布于41 个染色体位点, 每个位点至少有2 个eQTL;21 个eQTL 与19 个aQTL 位置重叠,但是仅有4个位点影响相同性状,说明在互作条件下同一个遗传位点表现出复杂遗传效应。
2.5 基因注释及候选基因筛选
基于Wang 等[17]公布的陆地棉参考基因组注释信息,针对贡献率大于8.00%的加性QTL 所在区间及D8 染色体的135~139 cM 区段进行基因注释,共注释到115 个基因。 通过KEGG 通路比对发现,注释基因比对到37 个KEGG 通路(附图1);GO 富集结果发现,注释基因主要富集到纤维素酶活性等生物活性、纤维素及植物初生细胞壁生物合成等生物过程、细胞内膜结合细胞器细胞组分等40 个GO 条目(附图2)。 根据Hu 等[19]公布的转录组信息,对注释得到的115 个基因进行表达量分析,筛选到在根、茎、叶、花或萼片5个组织表达量较高的基因共21 个, 其中GH_D02G1779 和GH_D08G0595 在叶片中表达量最高,GH_D08G0525 在茎中表达量最高,GH_D08G0638 在根和花中表达量最高(图2)。
图2 根、茎、叶、花、萼片中表达量较高的注释基因Fig. 2 Highly expressed genes in root, stem, leaf, flower and sepal
3 讨论
株型是植物特征特性的外在表现,是进行植物鉴定、分类的重要依据。 株型的形成是遗传因素与环境条件共同作用的结果,受到内源激素与外源刺激的协同调控[20]。 株型也是农作物产量和品质形成的基础, 三者之间存在显著的相互影响,理想株型是实现高产、优质的重要保障[3,21-23]。近年来,机械化的发展特别是机械采摘对棉花株型提出更严格的要求[7,24],合理的株型有利于提高机械采摘质量,减少原棉的杂质污染。 因此,开展株型育种、培育适于机采的棉花新品种对发展植棉产业、提高经济效益有重要影响。 加强棉花株型性状的分子基础研究, 挖掘株型相关遗传位点,有利于提高分子标记辅助育种效率、加快机采棉育种速度。
本研究以国审品种冀丰914 为母本、自交系冀丰817 为父本构建F2分离群体,分析5 个株型性状和3 个生育期性状表型和遗传基础。 经简单相关性分析和主成分分析发现,本文研究的大部分性状间存在正相关关系,株高与其他株型性状均为极显著正相关,第一果枝节位与生育期性状均为显著或极显著正相关,可作为鉴定棉花早熟性的株型性状,株高、第一果枝节位高度和第七果枝第一果节长度是鉴定株型垂直和水平特征的典型性状,与他人研究结果相似[11,25-27]。 本研究调查的第四和第七果枝第一果节长度在其他研究中报道较少。据纪从亮等[28]研究,第一果节长度与产量呈正相关,并且对棉株内围构造有显著影响。 因此,本研究结合试验材料特征,分别测量棉株下部和中部一个果枝的第一果节长度,不仅有助于了解棉花株型特征,而且为下一步研究株型与产量之间的关系奠定基础。结果表明,第七果枝第一果节长度可用于鉴定棉花株型的水平特征。
本实验室前期基于Wang 等[17]公布的参考基因组,构建了1 张包含11 488 个SNP 标记、总图距为4 202.12 cM 的高密度遗传图谱 (数据未发表)。 基于此图谱,本研究定位到36 个株型及生育期相关的aQTL 位点, 冀丰914 为其中26 个位点提供增效基因, 冀丰817 为其中10 个位点提供增效基因,说明冀丰914 对株型及生育期的可遗传控制更强,可作为机采棉品种选育的基础材料。 比对前人的研究结果[7,11,14],本研究定位的17 个aQTL 与已报道的aQTL 位置重叠或相近,例如本研究得到的qPH-D3-1 与Su 等[7]、Jia 等[11]在D3 染色体上得到的区段相近, 另外19 个QTL 未见报道。 由于株型相关的QTL 定位、GWAS 分析等相关研究较少,因此本研究得到的新位点较多。 此外,冀丰914 与冀丰817 首次作为试验材料开展株型及生育期的基础研究,与其他的研究材料存在一定遗传差异。 本研究发现了3 个aQTL 重叠区段,其中在D8 染色体上的区段内分布有3 个aQTL 位点,可能存在与株型相关的关键候选基因。 At 基因组和Dt 基因组分别分布有17 个和19 个aQTL, 说明2 个亚组中控制株型的遗传位点数量基本相同。同时,检测到263个eQTL,显著多于aQTL 位点数,说明全基因组范围内的互作效应对株型及生育期有重要影响;共在19 个aQTL 位点检测到了eQTL, 而仅有4个位点影响相同的性状,说明在互作条件下,同1个aQTL 位点表现出更多的遗传效应;At 基因组的eQTL 显著多于Dt 基因组,可能是由于At 基因组的长度更长,因而检测到的上位性互作位点更多[29]。 QTL 之间的重叠及互作关系,可能是造成表型性状之间复杂相互关系的重要遗传因素。本研究发现的3 个QTL 重叠区段内, 包含了PH、NFFB、HNFFB、FNLSFB、FNLFFB 及WGP 等多个性状相关的QTL 位点, 由此也可以解释株型性状及生育期性状之间的显著相关性。 如PH与HNFFB 极显著正相关,QTL 定位发现qPH-D3-1 与qHNFFB-D3-1 重叠,且增效基因均来自于母本冀丰914。 同时,根据参考基因组信息[17,19],本研究注释到21 个在陆地棉TM-1 和海岛棉海7124 的根、茎、叶、花、萼片等组织中表达量较高的基因,其中GH_D02G1779、GH_D08G0595、GH_D08G0525、GH_D08G0638 在不同组织中的表达量最高。 GH_D02G1779 位于株高相关QTL qPH-D2-1 区间;GH_D08G0595、GH_D08G0525、GH_D08G0638 均位于D8 染色体的135~139 cM区段内,该区段是第一果枝节位、第四果枝第一果节长度和第七果枝第一果节长度相关QTL 的重叠区域。 因此,这4 个基因均位于本研究定位到的重要区段内,可能参与棉花株型的调控。海7124 株高 较 高,TM-1 株 高 一 般,GH_D08G0525 在 海7124 茎中的表达量显著高于TM-1, 推测该基因可能参与棉花株高的调控。
4 结论
株高、第一果枝节位高度和第七果枝第一果节长度是鉴定棉花株型垂直和水平特征的典型性状,第一果枝节位可作为鉴定棉花早熟性的株型性状。 定位到36 个株型及生育期相关QTL 位点, 单个QTL 对表型变异的贡献率为1.70%~10.38%,发现3 个QTL 重叠的染色体区段,并在qPH-D2-1 和Chr. D8 的135~139 cM 区段 内发现4 个表达量较高的基因,为进一步分析棉花株型的分子遗传机制及候选基因筛选奠定了基础。
附图、附表:
附图、附表详细内容参见http://journal.cricaas.com.cn/
附图1 KEGG 通路分析结果
Fig.S1 Results of the KEGG pathway mapping
附图2 GO 富集结果
Fig.S2 Results of the GO enrichment analysis
附表1 上位性QTL 检测结果
Table S1 Results of the epistatic QTL