花生重要农艺性状QTL/基因定位研究进展
2021-08-30赵慧玲周希萌鲲付春李长生李爱芹马长乐王兴军赵传志
赵慧玲 周希萌 张 鲲付 春李长生李爱芹马长乐王兴军*赵传志*
(1.山东师范大学生命科学学院,山东 济南 250014;2.山东省农业科学院生物技术研究中心/山东省作物遗传育种与生态生理重点实验室,山东 济南 250100;3.潍坊市农业科学院,山东 潍坊 261071)
栽培花生(ArachishypogaeaL.)是由二倍体野生祖先种A.duranensis和A.ipaensis杂交后通过染色体加倍形成的异源四倍体,是重要的油料作物,也是优质植物蛋白来源。我国花生2018年种植面积约462万hm2,其总产占国内油料作物(包括油菜、花生、向日葵、芝麻和胡麻)的50%[1]。遗传分析表明我国大部分花生品种均具有伏花生或狮头企的血缘[2-3],遗传基础狭窄。另外,由于花生的抗病、耐逆性状、株型、粒型等农艺性状大多由数量性状位点(Quantitative trait locus,QTLs)控制,传统育种方法在改良这些性状时有诸多局限性。
分子标记辅助选择为代表的分子育种方法以基因型鉴定为基础,可对目标性状定向改良,提高育种的精准性和效率,缩短育种周期,因此,在育种过程中采用准确高效的分子育种方法十分必要。近年来,花生二倍体祖先种[4]、四倍体野生种A.monticola[5]、栽培花生狮头企[6]、伏花生[7]和Tifrunner[8]的基因组相继公布,花生重要性状QTL/基因定位研究也取得重要进展。本文旨在综述花生在分子标记开发、遗传图谱构建及QTL/基因鉴定及分子育种的研究进展。
1 分子标记开发
分子标记是QTL/基因定位的基础。在2010年之前,花生的遗传研究主要以传统的分子标记为主,主要包括限制性片段长度多态性(Restriction fragment length polymorphism,RFLP)、简单重复序列(Simple Sequence Repeats,SSR)、RAPD(Randomly Amplified Polymorphic DNA)、AFLP(Amplified Fragment Length Polymorphism)等。近十年来,随着测序技术的进步和花生基因组测序计划的实施,高通量的单核苷酸多态性(Single Nucleotide Polymorphism,SNP)、插入缺失标记(Insertion and Deletion Sequence,InDel)等标记快速发展,逐渐成为了花生遗传研究的重要工具。
第一代的分子标记RFLP 于1980年由Botstein[9]首先提出,后在玉米、小麦、水稻等农作物广泛应用,也一度成为花生野生资源遗传分析[10]、连锁图谱构建及QTL定位[11]的重要工具。此后,在PCR技术的基础上,RAPD 标记技术发展起来,与RFLP相比,RAPD技术省去了分子杂交和放射性自显影等步骤,操作更简单、成本更低,在花生研究上先后被用于遗传图谱构建、分子标记辅助选择育种及花生种质资源的遗传多样性分析[12-14]。SSR标记是最具代表性的第二代分子标记技术,也是在花生上应用最为广泛的分子标记之一。1999年Hopkins[15]等通过(GT)10和(CT)10为探针对基因组文库进行筛选,鉴定了6对多态性SSR,并完成了对19份栽培种和3份野生种的遗传分析。此后,大量EST 或转录组序列成为花生SSR 分子标记的重要来源[16]。最近,基于花生野生种和栽培种的基因组序列信息,超过十万多个全基因组SSR 标记被报道[17]。SSR 标记已经成为花生杂交种真伪鉴定、种质资源遗传多样性分析、遗传图谱构建、QTL定位的重要工具[17-19]。
SNP和InDel被认为是第三代分子标记。SNP标记是指在单个核苷酸的变异形成的遗传标记,因其在基因组中广泛分布,多态性丰富且容易被芯片、高通量测序技术鉴定,应用越来越多。Clevenger等通过对20多个Arachis物种的重测序结果,鉴定了54 564个SNP标记,这些SNP标记为花生SNP Array的开发提供了重要的参考[20];转录组测序也是花生SNP标记开发的重要方法,Chopra等通过对4个花生品种的转录组测序,鉴定了263 840个SNP和InDel位点[21]。除了高通量测序之外,SNP芯片分析也是SNP基因型鉴定的重要手段,目前可用的花生SNP 芯片有两个,58K SNP Array (Axiom_Arachis,v1)[22]和48K SNP Array (Axiom_Arachis2,v2)[23],是花生基因型分析的重要工具。InDel则是指在样本间同一位点核苷酸片段的插入或缺失,其多态性高、带型简单、易于检测,在花生上也被应用到抗病基因鉴定、栽培花生的遗传多样性和种群聚类分析等方面[24-25]。
2 花生遗传连锁图谱研究进展
遗传图谱是QTL/基因定位及图位克隆的基础,随着测序和生物信息学技术的发展及花生基因组测序计划的实施完成,花生遗传连锁图谱的研究也取得了长足的进步。最早的花生二倍体野生种遗传图谱是Halward于1993年建立,图谱长1063 cM,包含了117个RFLP 标记[11]。Herselman等2004年构建了首张AFLP标记图谱,长度139.4 cM[26]。此后,融合第二代分子标记SSR 的栽培种花生遗传图谱也陆续出现(表1)。花生遗传图谱的密度也不断增加[27-28]。例如,Li等(2019)利用SLAFseq(Specific-Locus Amplified Fragment Sequencing)构建了花生高密度遗传图谱,图谱总长1208.2 cM,包含2808个SNP标记,平均两个标记之间的遗传距离为0.47 cM[29]。Agarwal等(2019)通过对花生S群体两个亲本及140个RIL(重组近交系)群体重测序,共找到11 106个SNP位点,最终构建的Bin-map全长2004 cM,包含5816个Bins,两个标记间的平均遗传距离为0.34 cM[30]。
3 花生主要农艺性状QTL 定位的研究进展
在花生生产中,许多因素都会制约产量,如种子大小、株型高低、荚果大小及数目等都会直接影响产量,且花生是主要的油料作物,其油酸、亚油酸及脂肪酸等自身所含营养物质的多少与花生品质有关。此外,外界环境也会对其造成影响,如盐碱、寒冷、干旱等非生物因素的胁迫,及各种病虫害造成的减产等。然而,花生的诸多性状多属于遗传复杂的数量性状,仅依靠传统的育种方法不能有效解决这些问题。随着遗传连锁图谱的构建及复杂数量性状的QTL 定位和图位克隆的发展,产量、品质、抗病、抗逆等重要性状的QTL 定位研究也取得了较大进展 (表2)。
3.1 产量相关性状
种子质量、荚果质量和出仁率是花生产量的主要构成因素,了解产量构成及其相关性状的遗传基础是花生遗传改良的重要前提。李振动等利用“远杂9102×徐州68-4”的F5和F6家系群体,在两个环境下鉴定了41个与荚果长、宽、厚和百果质量相关的QTL,表型变异解释率为3.14%~18.27%[31];此后Luo等进一步利用“远杂9102×徐州68-4”的RIL群体,在四个环境下鉴定了42个与荚果长、荚果宽和百果质量相关的QTL位点,表型变异解释率为3.68%~27.74%,其中3个主效QTL被定位在A05染色体[32]。Fonceka[33]对涉及花生生产力的若干性状进行了详细的QTL研究,定位了4个与种子长相关的QTL,能够解释的表型变异(Phenotypic variation explained,PVE)为10.5%~16.3%(表2);与种子宽相关的9 个QTL,PVE为8.7%~23.7%,大约一半分布在LG a07上。Shirasawa[34]检测了百仁质量和出仁率性状相关的QTL,PVE分别为19.1%和6.8%。这些QTL位点的定位为将来花生产量性状的遗传改良提供了参考依据。
3.2 发育相关农艺性状
株型、果型等是影响花生发育的主要农艺性状。株型主要涉及到株高、侧枝长、分枝数和茎间夹角等,其株型特征直接关系到种群密度和受光面积等,从而会影响花生产量。Zhou等定位了32个与株型相关的QTL 位点,其中与主茎高相关的QTL位点10个、与总分枝数相关的QTL 位点7个、与侧枝长相关的QTL位点15个,可以解释4%~15%的表型变异[35]。此后,Zhou等又鉴定了9个荚果长QTL、10个荚果宽QTL和12个百果质量QTL,对 应 的PVE 在3.07%~15.77%之 间[36]。Huang等[37]也对荚果长、荚果宽、百果质量、主茎高和分枝数进行了QTL定位,共获得9个QTL,PVE范围为2.1%~18.7%。果嘴、果腰的性状是影响花生果型的重要农艺性状,Shirasawa等[34]和Fonceka等[33]分别定位了9个关于果腰相关和11个关于果嘴相关的QTL,贡献率为6.9%~23.9%。
3.3 品质性状
含油量、油酸含量、蛋白含量及其他有效营养成分含量是花生品质的重要判断依据,目前对含油量及油酸和亚油酸的定位研究较多,对花生酸、山俞酸、硬脂酸的研究相对较少。Liu等[38]对2014-2017年4个环境下的油酸含量性状进行QTL分析,共检测了7个与含油量性状相关的QTL,贡献率为6.07%~27.19%。张新友等[39]对脂肪酸含量、油酸含量、亚油酸含量等7个性状进行检测,共鉴定了10个QTL,贡献率为4.82%~24.14%,该研究发掘出的10个QTL位点中,其中与花生酸含量相关的1个QTL及与硬脂酸含量相关的QTL贡献率较大,分别为18.33%和24.14%。Wang等[40]通过对S群体(SunOleic97R×NC94022)和T群体(Tifrunner×GT-C20)的遗传和定位分析,鉴定了山俞酸、花生酸、棕榈酸等6个性状相关的164个QTL位点,贡献率为0.16%至40.56%。
3.4 抗病性状
培育抗病品种是作物育种家的永久课题。危害花生的病害较多,主要包括黄曲霉、青枯病、叶斑病等。花生是最容易遭受黄曲霉菌感染的农作物之一,黄曲霉本身对花生产量的影响较少,但黄曲霉容易产生黄曲霉毒素,对花生的产品安全至关重要。雷永等[41]用BSA 法获得两个与黄曲霉抗性相关的AFLP标记,分别为E44M53-520和EA5/M53440,PVE 分别为9.0%和14.6%,并开发了与黄曲霉抗性相关的SCAR 标记[42]。叶斑病是花生最常见的病害,主要有早斑病、晚斑病和网斑病,另外,番茄斑萎病(tomato spotted wilt virus,TSWV)、叶锈也是造成花生减产的重要叶部病害。目前,研究最广泛的是晚斑病。随着分子标记技术的发展,与花生病害抗性相关的AFLP和SSR 标记相继被检测。王辉[43]共检测到49个与TSWV、早斑病和晚斑病抗性相关的QTL,可以解释6.26%~15.54%的表型变异;Agarwall等[44]利用WGRS绘制了高密度遗传图谱,并定位了2个与晚斑病相关的QTL,PVE 分别为47.63%和34.03%;Khedikar等[45]和Sujay等[46]分别鉴定了与锈病相关的主效QTL,最高PVE分别可达55.2%和82.96%,具有较高的应用价值。徐志军等定位了33 个与青枯病相关的QTL位点,PVE为1.39%~28.72%[47];李威涛等利用远杂9102 和徐州68-4 杂交构建的RIL 群体,在B02染色体上定位到青枯病抗性主效QTLqBWRB02,贡献率为27.87%[48]。
4 新方法和新技术在花生QTL 定位上的应用
传统QTL定位的方法需要借助一定数量的群体后代和大量的分子标记,并需检测每个标记在群体后代每个株系(单株)的基因型,需耗费大量人力和时间,过程繁琐且成本较高。集团分离分析法(Bulk Segregant Analysis,BSA)通过将极端性状的群体进行混池,研究混池间等位基因/分子标记频率的差异,进而定位目标性状基因,其不需要对群体中每个个体进行基因分型,降低了工作量和成本,故在遗传基因定位中被广泛应用。另外,随着高通量测序、生物信息学等技术的发展,基因型和表型鉴定的逐渐高通量化,限制性酶切位点相关DNA 测序(Restriction site Associated DNA Sequencing,RAD-Seq)、特定位点扩增片段(Specificlocus amplified fragment,SLAF)、全基因组关联分析(Genome wide association study,GWAS)、表达数量性状基因座(expression Quantitative Trait Loci,eQTL)等技术逐渐发展起来,并被广泛应用于遗传图谱的构建和QTL定位研究中,显著提高了花生QTL定位的效率。
4.1 基于BSA原理的QTL定位方法在花生上的应用
BSA 的方法最早报道于1991 年,Michelmore[49]首次利用BSA的方法鉴定了3个与霉病抗性基因紧密相关的标记后,一系列依托高通量测序和BSA方法的QTL/基因鉴定技术逐渐发展,例如Bulked segregant RNA-Seq(BSR-Seq)、QTL-seq、MutMap、MutMap+等方法,并被应用到花生重要农艺性状QTL/基因的定位中。
BSR-seq主要通过研究混池间转录本上序列变异的情况定位目标基因,最早报道于2012年[50],目前该法在花生上已有成功报道,Kayam 利用BSR-seq检测发现了与株型有关的34个SNP标记,并发现了位于B05染色体上的6个SNP标记,并将性状基因座定位在了相关区段中[51]。与BSRseq不同的是,QTL-seq是利用混池间基因组序列变异定位目标基因,需对混池及双亲进行全基因组重测序(Whole-genome resequencing,WGRS)[52]。近年来,以QTL-seq等为代表的新型方法也成功应用到花生QTL定位中,提高了QTL 定位的效率,如Luo等采用QTL-seq方法分别鉴定了与花生青枯病抗性和花生脱壳相关的QTL位点[53-55]。Zhao等通过QTL-seq结合BSR的方法,将控制花生黑种皮颜色基因定位在10号染色体的特定区间内,并鉴定了关键的候选基因[56]。
MutMap的原理与QTL-seq类似,主要是用于突变体突变基因或位点的定位。首先,将具有目的性状的突变体与野生型亲本杂交,所得F1代自交后在F2代中选择突变表型和野生表型的个体分别构建混池;然后进行高通量测序,通过极端池之间的比较计算SNP-index,确定与目标性状关联的位点。MutMap具有定位周期短且效率高的优点,在农业中具有较大的应用潜力。随着研究的深入,MutMap技术也不断升级,MutMap+和MutMap-Gap等方法相继被报道。MutMap+是基于Mut-Map方法形成,主要针对于不能用于突变型和野生型杂交的情况;MutMap-Gap是在MutMap的基础上多了一个denovo组装的过程,目前,花生突变体库的创建已经取得重要进展[57],MutMap将为花生突变体的研究提供帮助。
4.2 基于高通量测序的QTL 定位方法及在花生上的应用
RAD-Seq是一项基于全基因组酶切位点的简化基因组测序技术[58]。Zhou等利用RAD-Seq技术从栽培花生中鉴定了5万多个SNP位点,并建立第一个SNP高密度遗传连锁图谱,该图谱可作为栽培花生品种的参考图谱[59]。
SLAF-seq 通过选择均匀分布在整个基因组、且避开重复序列区域的特异片段进行高深度测序,也是一种简化基因组测序的方法,也被应用到花生遗传图谱的构建和QTL 定位研究中。Wang等利用SLAF-seq 构建了花生的高密度SNP遗传图谱,该图谱长度为2098.14 cM,包括3630个SNP标记,平均标记距离为0.58 cM,并定位了62个与产量相关的QTL[60]。Hu等也利用SLAF-seq技术构建了一个花生的高密度遗传图谱,该图谱包括68个SSR和2266个SNP标记,总长度2586.37cM,利用该图谱定位了多个与油酸含量、油酸/亚油酸比值等相关的QTL位点[61]。
GWAS基于全基因组分子标记与目标性状的连锁不平衡关系,通过统计分析获得与性状关联的候选基因或基因组区域,是目前植物遗传研究炙手可热的技术,近年来GWAS也被应用到花生的遗传研究上。Zhang等利用GWAS技术从栽培花生中鉴定了18 个与早斑病抗性相关、28个与晚斑病抗性相关的QTL[62];Zhang 等通过GWAS分析鉴定了36个与花生矿物质元素浓度相关的QTL,可以解释18.35%~27.56%的遗传变异[63]。此外,GWAS 也被用于发现花生中与产量、过敏和驯化相关的候选基因[64-65]。
eQTL是指控制数量性状表达位点,即是染色体上一些能特定调控mRNA和蛋白质表达水平的区域。Huang等通过对中花10(粉红色种皮)和ICG12625(紫色种皮)的重组自交系(RIL)群体未成熟种子的转录组进行了测序,开发了一个与紫色种皮的控制有关的InDel02标记[66]。
5 问题和展望
目前我国花生育种已达到较高水平,育成品种的单产处于国际领先,但大多是通过常规杂交选育而成,选育周期长、时效性差、目标性状选择效率较低,不能充分满足当前生产上对品种更新换代的需求。且现今花生育种还有很多问题需要解决,如数量性状QTL目前研究较少,抗黄曲霉方面的研究也需进一步推进,可通过以下途径解决:①利用多亲本杂交富集有效性状,应用多次回交对目标性状进行改良;② 利用花生基因组学、生物信息学的最新研究进展,全基因组SNP分析、Binmap等新方法推进花生农艺性状QTL基因的研究进展;③收集筛选利用野生花生的优异基因资源,采用基因编辑的方法对这些材料的优异性状基因进行功能研究,创建并合理利用花生突变体。