APP下载

普通菜豆基因组研究进展

2021-12-04

四川农业大学学报 2021年1期
关键词:基因库菜豆抗性

武 晶

(中国农业科学院作物科学研究所,北京 100081)

菜豆属(Phaseolus L.)为同源二倍体作物,染色体基数为 11,染色体数多为 2n=22,极少数为2n=20,基因组大小为 0.4~1.9 pg(https://cvalues.science.kew.org/)。菜豆属包含有80多个物种,多数为野生种,仅有5个栽培种,分别为普通菜豆(P.vulgaris L.)、多花菜豆(P.cocineus L.)、利马豆(P.lunatus L.)、丛林菜豆(P.dumosus L.)和宽叶菜豆(P.acutifolius L.),其中普通菜豆在世界范围内种植范围最广、栽培面积最大、食用人群最多[1]。经过长期驯化和地理隔离,普通菜豆形成了安第斯和中美两个栽培普通菜豆多样性中心,均为二倍体,染色体数为2n=20,基因组大小相差不大,均在600 Mb左右[1]。由于普通菜豆籽粒富含蛋白质和多种微量元素,且脂肪含量非常低,是人类极佳的植物蛋白来源,正日益受到大众的青睐。据联合国粮农组织2018年统计,我国年种植面积约1 000万km2,年均产量为130万t,居世界第五,其中,80%以上出口欧洲、南美洲等国,是主要的出口创汇商品之一,也是食用豆类中出口量最大的豆种。

1 普通菜豆遗传连锁图谱概述

遗传连锁图谱是开展基因定位和克隆的强有力工具。普通菜豆遗传图谱的研究与水稻、小麦、玉米等作物相比稍显滞后,但也是经历了由表型标记、限制性内切酶切片段长度多态性标记(restriction fragment length polymorphism,RFLP)、扩增片段长度多态性标记(amplified fragment length polymorphism,AFLP)、简单重复序列标记(simple sequence repeats,SSR)、单核苷酸多态性标记(single nucleotide polymorphisms,SNPs)等的发展历程。十九世纪中叶,Gregor Mendel利用P.vulgaris和P.nanus的后代第一次对普通菜豆进行遗传分析,目的是验证利用豌豆所获得的遗传定律[2]。随后,Shaw和Norton在1918年,利用普通菜豆种内杂交试验,确定籽粒颜色是由多个独立因子控制[2]。1921年,Tjebbes和Kooiman报道了普通菜豆中的首个连锁现象,开启了普通菜豆的遗传连锁研究[2]。20世纪80年代,随着RFLP、AFLP、SSR等分子标记的出现,开始了基于分子标记的遗传图谱构建。C.E.Vallejo等[3-4]利用来自中美基因库的XR-235-1-1和安第斯基因库的Calima杂交获得的分离群体构建了包含P基因、224个RFLP标记、9个种子蛋白标记和9个酶标记,图谱长度为960 cM的遗传连锁图谱。R.O.Nodari等[5]利用中美基因库的BAT 93和安第斯基因库的Jalo EEP 558杂交获得的分离群体构建了包含有108个RFLP标记、7个同工酶标记、7个RAPD标记和3个表型标记,图谱长度为827 cM的遗传连锁图谱,之后P.Gepts等[6]又加密了该遗传图谱,将标记增加到204个,图谱总长度为1 060 cM。此外,还构建了多个涉及回交群体(back cross,BC1)、重组自交系群体(recombinant inbrad strain,RIL)的包含 RFLP、AFLP和RAPD的遗传图谱[7-19]。同水稻、玉米和小麦等大作物一样,SSRs或SCAR等基于单一位点的PCR标记的开发为普通菜豆遗传图谱的构建带来了快速发展,迅速取代了RFLP、AFLP和RAPD等第一代标记作为遗传图谱的首选标记。2000年,Yu K.等[20]首次将15个SSR标记锚定到包含RAPD和RFLP的图谱上,随后M.W.Blair等[21]利用81个基于基因组序列和69个基于序列表达标签(expressed sequence tag,EST)开发的 SSR 标记,与RFLP、RAPD和AFLP标记构建了遗传图谱。日益增长的普通菜豆EST序列和基因组序列为SSR、SNP等标记的开发提供了海量的序列信息。2005年,M.Ramírez等[22]分析了中美基因库的Negro Jamapa和安第斯基因库的G19833材料的cDNA文库中的21 000条EST序列,并开发SNP标记。特别是近年来测序技术的飞速发展,标记的开发更为便捷。Zou X.等[23-24]通过对36个普通菜豆种质资源基因组的二代测序,鉴定出 43 698个 SNPs和 1 267个 InDels,其中 24 907个SNPs和692个InDels位于基因区,Müller分析了52 270个BAC文库的末端测序序列,鉴定出3 789个SSR位点。2013年Chen M.L.等[25]利用454测序结果开发了90对SSR标记,并将其中的85对定位于染色体上。特别是针对抗病基因所开发的RGA标记,2012年Liu J.等[26]利用454测序结果开发了365个与抗病相关基因的标记,使得普通菜豆遗传图谱的质量得到进一步提升。SNP标记由于其具有在基因组上分布广、数量多等优点而受到研究者青睐。2013年M.W.Blair等[27]利用Illumina Golden Gate assay方法开发了736个SNP引物,并利用这些标记研究了236份材料间的多样性。基于丰富的标记信息,遗传图谱的质量也进一步提升。例如,C.H.Galeano等[28]2012年基于DOR364×BAT477群体,构建了包含2 706个SNP标记的连锁图谱,J.Schmutz等[29]2014年基于F2群体构建了包含有7 015个SNP标记的遗传图谱。特别值得一提的是,2020年中国农业科学院作物科学研究所研究人员通过对683份普通菜豆种质资源进行10倍基因组覆盖率的全基因组重测序,构建了包含480万个SNP的高密度、高精度的单倍型图谱,为进一步开展基因组结构分析和基因定位提供了丰富的标记信息[30]。

2 普通菜豆重要性状基因定位概述

大量分子标记的开发和高质量的遗传图谱的构建,也促进了普通菜豆重要农艺性状的基因/位点的定位研究。首先,针对炭疽病和普通细菌性疫病等非生物胁迫抗性定位了大量的QTLs,例如,花叶病毒抗性(4个 QTLs)、炭疽病抗性(17个 QTLs)、普通细菌性疫病抗性(27个QTLs)、白霉病抗性(27个QTLs)、锈病抗性(12个 QTLs)、根腐病抗性(30个QTLs)、角斑病抗性(24个 QTLs)和白粉病抗性(36个QTLs)等[2]。其中,研究较为深入的是炭疽病抗性遗传位点Co-1,陈明丽等[31]利用图位克隆的方法将候选基因定位在46 Kb的区段内,包含4个候选基因,通过抗感亲本间候选基因表达模式分析,初步确定Phvul.001G243700为候选基因。此外,针对效应较大的QTL位点开发出可应用于分子育种的分子标记,例如在已发现的细菌性疫病抗性QTL中,BC 420、SU 91和SAP 6位点的抗病基因由于抗性水平高而得到较为广泛的应用,特别是其中两个抗病基因同时存在时其抗性更强[32-36]。Shi C.等[36]针对BC 420和SU 91两个重要位点开展了基因克隆工作,利用图位克隆并结合关联分析的方法初步明确了候选基因,并且开发了鉴定抗性候选基因的特异标记。非生物逆境抗性QTL的定位主要集中在旱、养分利用效率等方面,2012年M.W.Blair等[37-38]在6个环境中利用RILs群体检测抗旱相关性状的QTLs;Asfaw检测到15个根部性状QTLs与抗旱性密切相关。还有针对缺铁、锌等微量元素耐受性位点定位的报道,例如利用RIL群体在第六连锁群检测到效应比较高的遗传位点,此外,还在第2、3和4染色体定位到多个微效位点[39-40]。针对株高、生长习性、开花期、百粒重、粒重和产量等重要农艺性状也定位到一系列遗传位点[41-45]。近年来,全基因组关联分析已经成为定位基因的重要手段之一,最先在普通菜豆中开展全基因组关联分析的对细菌性疫病的定位,Shi C.等[46]利用132个SNP标记,基于395份种质资源的自然群体开展了CBB抗性基因的定位,共有12个SNP与已经报道的抗性QTL一致,还检测到8个新的抗性位点。之后,利用关联分析的方法陆续定位了开花期、生物量、产量性状和籽粒性状等性状的基因/QTLs[47-49]。2020年中国农业科学院作物科学研究所研究人员利用480万个SNP开展了20个农艺性状的全基因组关联分析,共定位到500余个遗传位点,为普通菜豆的分子育种提供了关键性状的准确标记选择依据[30]。

3 普通菜豆基因组测序

普通菜豆有两个独立的起源中心,中美基因库和安第斯基因库。因此,美国和西班牙科学家先后发起了对中美基因库(G19833)和安第斯基因库(BAT 93)代表性材料的全基因组测序计划[29,50]。2014年美国等科学家领导的研究团队率先利用鸟枪法完成了G19833的测序,用454测序平台获得24.1 Gb的数据量,同时利用Sanger测序法完成了3个fosmid文库和两个BAC文库的末端测序,并结合包含7 015个SNP标记的基于F2群体和261个SSR标记的基于RIL群体的遗传图谱进行序列组装。最终,组装scaffold序列总长度为521 Mb,而contig序列总长度为472.5 Mb,占预估基因组大小587 Mb的80%。G19833基因组的重复序列约占45.4%,其中LTR反转录转座子是最多的一类,占基因组的36.7%。同时,研究团队完成了根、茎和叶等11个组织的转录组测序用于基因的预测和分析,共鉴定出27 191个基因[29]。J.Schmutz等[29]还证实了普通菜豆的多种驯化途径,鉴定出1 875个中美基因库的基因和748个安第斯基因库的基因在驯化过程中进行了选择,仅有59个基因是两个基因库所共有的;同时也说明了驯化过程中的瓶颈效应,安第斯基因库的遗传变异减少了75%。2016年西班牙科学家领导的研究团队完成了BAT 93的全基因组测序,同美国科学家的测序策略基本一致,采用多种方法相结合进行基因组的测序组装,最终,获得549.6 Mb的序列,与预期的基因组大小基本一致,重复序列占基因组的35%,LTR反转录转座子仍是重复序列的主要类型。通过对34个不同的组织或是时期的RNA文库的测序,鉴定出30 491个编码基因[50]。两个研究团队都发现了普通菜豆的两个基因库在豆科基因组发生复制之后再次发生了基因的复制现象[29,50]。总而言之,基因组序列的公布,对于阐明普通菜豆的起源以及基因库间的进化关系提供了更加翔实的数据,也为基因的发掘和利用奠定了基础。

4 普通菜豆转录组研究进展

转录组测序可以在单核苷酸水平上检测物种的整体的转录,可以获得在特定组织、特定时间的转录本信息。2014年,O’Rourke首次在普通菜豆中开展转录组研究,构建了普通菜豆中美基因库材料Negro jamapa包括根、茎和叶等7个组织不同时期的21个转录组数据库,鉴定到11 010个组织间差异表达基因,15 752个同一组织不同时期的差异表达基因,2 315个组织特异表达基因[51],而安第斯基因库典型材料BAT93的转录组分析说明,40%的基因是在根、叶和籽粒等7个组织中表达,10%的基因可以被认为是持家基因,当然也存在小部分持家基因在大豆中的同源基因也是持家基因[50]。通过不同材料间的转录组数据可以编辑的研究逆境胁迫下的差异表达基因,O’Rourke鉴定了2 970个氮胁迫响应的基因[51];中国农科院作科所食用豆研究组利用转录组测序在在耐旱性强的材料和敏感材料分别检测到4 139个和6 989个旱胁迫响应基因,耐旱、敏感材料间有2 187个差异基因表达模式一致,仅有9个差异基因表达模式不一致,同时,鉴定到24个响应旱胁迫的 miRNAs[52-53]。Gómez-Martín 等[54]研究小组通过对不同裂荚性材料进行转录组测序,鉴定了材料间差异表达基因,筛选到一批裂荚性相关基因。此外,通过转录组分析对菜豆枯萎病、细菌性疫病、根腐病和锈病等相关基因进行研究[55-58]。最后,转录组数据还可以鉴定鉴定结构变异、SSR和SNP等,例如,从抗旱性不同的材料构建的转录组数据库中鉴定出10 482个SNP和 4 099个SSR位点[52]。A.Xanthopoulou等[59]利用2个普通菜豆的资源的转录组数据库鉴定了8 278个SSR位点和19 281个SNP,为进一步开发遗传标记开展基因定位和认识普通菜豆的遗传结构变异提供了信息。

5 普通菜豆比较基因组研究进展

比较基因组是通过对不同的物种,甚至不同属间的基因组序列的比较分析,研究不同物种间的基因和基因组结构、基因表达量和功能差异,进而揭示物种的起源、演化等[60-62]。近年来,大量作物的基因组测序的完成,极大地方便了全基因组层面研究不同生物的起源进化过程[63-65]。例如,2019年豌豆基因组草图绘制完成之后,通过与已经完成测序的豆科植物基因组比较研究发现了豆科植物的基因组重排现象,同时与其他豆科植物相比,豌豆的基因组表现出更加强烈的基因波动,而在豌豆的进化过程中,易位和转座在不同谱系中差异明显[65]。普通菜豆被认为是研究食用豆基因分子机制和基因的进化过程的模式作物,因此开展了较多的比较基因组学研究[1,66]。有研究表明:大豆中WRKY等转录因子的数量是普通菜豆的2倍,这与之前所报道的大豆和菜豆从同一个祖先分化后,大豆经历了一次的基因组的复制相吻合[41,51,67-68]。但是,也有基因家族与此相反,例如普通菜豆中鉴定到376个核苷酸结合位点-富亮氨酸重复(nucleotide-binding site-leucinerich repeat)基因,而大豆中鉴定到319个NLR基因[69-70],NAC转录因子在大豆(101个)和普通菜豆(86个)中数量也相差不大[71,72]。那么,为什么菜豆中的抗性基因会比大豆中的多呢?可能原因是普通菜豆对生态环境的适应性要比大豆强,从而进化出更多的抗性机制,导致有更多的抗性基因[50]。重要农艺性状的基因也是比较基因组的重点研究对象,普通菜豆光周期基因E1(Phvul.009G204600)是大豆E1基因的同源基因,过量表达Phvul.009G204600说明普通菜豆和大豆中的E1基因的功能一致,都是控制开花期[73],同样,生长素响应因子(auxin response factor,ARF)基因家族在普通菜豆和大豆中也被认为是功能保守的[74]。菜豆属内的普通菜豆和宽叶菜豆遗传图谱的比较分析研究表明,两个菜豆种间具有高度的共线性,在少数染色体内也发生重排[75]。越来越多的基因定位或克隆及基因组序列的不断更新,豆科种间、种内比较基因组的研究将为豆科间的遗传进化关系研究提供更加详细且准确的信息。

6 未来研究重点方向

普通菜豆基因组及其相关研究对于研究和利用菜豆属种质资源具有重要意义,有助于理清菜豆属不同种间的进化关系,快速地从种质资源中挖掘优异基因资源并应用于育种实践。目前,基因组的研究进展尚不能有效的支持普通菜豆的遗传改良及相关研究,因此建议今后重点从以下几方面展开研究:

6.1 普通菜豆金标基因组和泛基因组构建

尽管,美国和西班牙科学家先后完成了普通菜豆安第斯基因库(G 19833)和中美基因库(BAT 93)典型材料的基因组测序,由于这两个基因组都是基于二代测序平台,基因组序列还不够完整,未达到金标基因组的水平,在一定程度上仍然限制普通菜豆的遗传研究;同时,单一材料的参考基因组并不能反映该物种的基因多样性,而泛基因组反映了基因组中的结构变异和多态性,能够深入比较多个分类水平的基因组结构变异。因此,应该利用最新的测序技术开展金标基因组和泛基因组的测序组装,提供更为丰富的基因组序列。

6.2 普通菜豆群体基因组学研究

群体基因组学是将基因组原理和技术同群体遗传学有机结合的一种新的表现形式。推动从单一基因研究向全基因组水平基因的全面研究,通过全基因组范围内的大量SNP、InDel和SV等变异来研究控制特异表型的基因或微端在全基因组的效应等。在获得基因组序列基础上进行普通菜豆安第斯基因库群体、中美基因库群体等遗传群体材料的基因组重测序,在基因组水平开展不同基因库间在基因组水平上的遗传多样性、连锁不平衡、起源演化、自然和人工选择过程和重要农艺性状的机制等研究。

6.3 普通菜豆分子育种

基因组学的快速发展促进了全基因组辅助育种的发展,基因组研究可以鉴定大量的优异遗传变异和有利基因;利用全基因组的标记和基因信息,进行种质资源育种价值的评估、优异基因或等位变异的聚合、基因互作网络的协调、基因组结构的优化等研究,从而加快普通菜豆育种进程、缩短育种时间和提高育种效率,选育抗病、优质和高产的新品种。

猜你喜欢

基因库菜豆抗性
不忘初心,回归经典!养虾至暗时刻,海茂坚定高抗苗,携抗性更强“普利茂”回来了
Pib、Pi9、Pi2、Pi54和Pish在粳稻品种(系)中的分布及对穗颈瘟的抗性
我国最大藜麦基因库落户山西农谷
8个基因库逾万分种子10月入库Svalbard全球种质库
8个基因库逾万分种子10月入库Svalbard全球种质库
亚洲玉米螟Bt抗性种群的遗传多样性分析
中国首个国家基因库开始运营
菜豆娃娃
菜豆之音
册亨县杂交水稻引种试验