APP下载

果树基因组学研究进展

2021-05-27吴锦程林授锴吴毕莎林顺权

莆田学院学报 2021年2期
关键词:基因组学甜橙基因组

吴锦程, 林授锴, 吴毕莎, 林顺权,3

(1.莆田学院 环境与生物工程学院,福建 莆田 351100;2.莆田学院 枇杷种质资源创新与利用福建省高校重点实验室,福建 莆田 351100;3.华南农业大学 园艺学院,广东 广州 510642)

0 引言

基因组学(genomics)是一门进行生物基因组研究和利用的学科,通过分析基因组DNA序列或其表达产物等来解读基因组信息。果树基因组学研究是在人类、拟南芥、水稻等模式生物基因组计划取得成功的基础上开展起来的[1]。它的兴起大大促进了相关果树全基因组的获取、果树数据库资源的构建、果树物种起源与演化、果树功能基因的定位与克隆等方面的发展。本文综述果树基因组测序的历史、基因组学在果树的应用研究进程,最后进行了展望。

1 果树基因组测序简史

植物基因组学研究起源于1999年模式植物拟南芥核基因组2号和4号染色体的相继测序,2000年12月拟南芥全部染色体被测序完成并发表[2]。2001年,人类基因组计划公布了人类基因组草图,为基因组学研究翻开了一个新的篇章;2002年水稻基因组测序完成,是第一个完成测序的作物基因组;最早进行基因组测序的果树是葡萄,该项研究由法国和意大利科学家组成的团队于2007年完成;2008年,明瑞光领导的小组完成了番木瓜的基因组测序[3]。随后,越来越多的果树基因组完成测序。由此,果树迎来了基因组学时代。

果树基因组研究的进展是与测序技术的进步紧密相关的。自Sanger法测序(也称第一代测序技术)诞生以来,测序技术取得了革命性进展[4]。新产生的测序技术,根据出现时间、读长和通量等特征,被称作第二代、第三代测序技术等,也被统称为新一代测序技术[5]。果树中的葡萄、番木瓜和桃是采用Sanger法全基因组测序(即第一代测序技术)[6-8]。而苹果、可可、香蕉、西瓜、甜橙等是采用第二代测序技术的[9-11]。杜梨、苹果、枇杷等则是采用二代结合三代测序技术升级了基因组。其中苹果的基因组序列最先于2010年发表,2016年利用二代和三代测序技术对苹果基因组序列进行了更新,2017年又结合光学图谱技术对苹果基因组序列进行了再次更新[12-13]。

单子叶果树被测序的有香蕉、菠萝、椰子和枣椰树等。蔷薇科果树被测序的种类最多,包括苹果、甜樱桃、桃、白梨、欧洲梨、黑树莓、草莓及其近缘种、枇杷及其近缘种等[3,14]。中国科学家在果树基因组测序中也作出了很大的贡献,甜橙、梨、菠萝、椰子、桑树、猕猴桃、枣、榴莲、石榴、杨梅、荔枝和枇杷等均是以我国科学家为主完成基因组测序[3,15-18]。

近年来,果树的结构基因组学和功能基因组学也取得一些重要进展[19],许多新的技术(如Hi-C、Chicago、Linked-reads和光学图谱等)被开发应用于基因组的辅助组装,例如八倍体栽培草莓和枇杷(作者未发表资料)都是应用Hi-C技术将scaffold组装到染色体水平[20];榴莲基因组先是利用Chicago技术组装出高质量的超长Scaffold,随后结合Hi-C技术将超长Scaffold组装到染色体水平。在功能基因定位方法上,采用从上而下的方法,通过表型差异来找到对应的突变基因并揭示其功能,包括连锁分析、全基因组关联分析等,如在番茄中分析定位粉果果皮颜色的关键位点[21]。

2 果树基因组测序的基本信息

笔者初步统计,截至2020年4月,至少已有175个科255种园艺植物被测序,这些园艺植物包括93种果树或砧木及其近缘种,其中72种果树的基因组基本信息见表1。

?

注:表1中的果树主要指栽培果树或水果(如西瓜、甜瓜、番茄、草莓、菠萝等),也包括部分野生果树和砧木。统计截止时间为2020年4月。篇幅所限,本表未能尽列参考文献,只能选一,且未能全部列入篇末的参考文献表里。

随着全基因组测序技术的持续发展,通过测序获得了越来越多果树的全基因组序列,积累了大量的基因组数据;同时,果树的转录组、蛋白质组、代谢组、表型组等大量生物信息数据也在不断增长。因此,构建了许多果树的科属或物种数据库,可以对获得的大量数据进行分析、贮存、整合以及传播,为果树基础研究和应用研究提供实用生物数据[22]。部分果树科属和物种基因组数据库见表2。

表2 部分果树科属和物种基因组数据库

3 基因组学在果树上的应用研究

3.1 利用全基因组测序研究物种起源与演化

3.1.1 物种起源进化

大多数植物在进化过程中经历了全基因组复制事件,它是植物重要的进化动力。全基因组复制事件根据发生时间可以分为古老和近代两大类[23]。通过全基因组复制使得物种全基因组多倍化的方式包括全基因组倍增(genome duplication)和全基因组三倍化(genome triplication)[22]。香蕉属于单子叶植物,发生过3次全基因组倍增事件,其基因组测序进一步阐明了单子叶植物的系统发育关系[7,24]。对芒果全基因组的分析,鉴定到一个发生于3 300万年前的近代全基因组倍增事件[25]。葡萄基因组分析表明,葡萄祖先物种可能存在一个基因组古三倍化事件(γ),使祖先二倍体进化成六倍体;进一步分析表明,该古三倍化事件发生的时间在单子叶和双子叶分化之后,真双子叶植物共同经历了该古三倍化事件。蔷薇科果树梨、苹果和草莓的祖先种也经历了该古三倍化事件(γ)。此外,梨和苹果的祖先还经历了一次近代全基因组倍增事件,推测时间在4 500万~3 000万年前。二者的分化时间出现在2 150万~540万年前[26]。

3.1.2 物种演化进程

基于基因组重测序分析发现,哈萨克斯坦的中亚野苹果(Malus sieversii)先被驯化,而后驯化的苹果与欧洲野苹果(M.sylvestris)的杂交种通过丝绸之路从中亚向西传播至欧洲;而哈萨克斯坦的中亚野苹果与山荆子(M.baccata)杂交种沿丝绸之路向东传播[27]。基因组重测序分析表明,梨资源可以分为亚洲梨和欧洲梨两大类,亚洲梨具有较高的遗传多样性,而欧洲梨遗传背景相对简单。亚洲梨和欧洲梨分化于660万~330万年前,之后二者分别独立驯化。目前公认的栽培梨由三种野生梨驯化而来。梨的驯化和传播路径为:梨起源于中国西南部,后经过中亚地区传播至西亚和欧洲[28]。在甜橙(Citrus sinensis)的起源分析中,利用甜橙、橘(C.reticulata)和柚(C.grandis)的全基因组数据,推测橘和柚对甜橙起源的贡献基本上符合3∶1的关系;进一步选择橘、柚和甜橙各3种类型进行基因组重测序分析,利用全基因组序列信息进一步证实橘和柚的贡献比例符合3∶1关系,结合叶绿体基因组信息,推测甜橙起源模型为:甜橙=(柚×橘1)×橘2[11,29],如图1(引自文[11],有修改)。通过基因组学、系统发生及生物地理学技术分析,发现柑橘属物种多样化首次发生在800万~600万年前的中新世晚期,并随着亚洲季风减弱在东南亚地区迅速辐射进化;而在400万年前的上新世,柑橘属植物越过华莱士线从东南亚地区迁移到大洋洲导致了第二次辐射进化[30]。

图1 甜橙起源的模型

3.2 果树若干特征性状功能基因研究

3.2.1 开花与生殖

(1)开花性状

Soyk等应用QTL-seq技术定位到两个番茄光周期反应的主效QTL,结合基因表达水平锁定了候选功能基因SP5G,CRISPR/Cas9编辑的SP5G突变番茄植株能迅速开花,番茄植株的紧凑型生长习性也得到增强,表明SP5G是调控番茄日照长度敏感性的关键基因[31]。Jia等通过杨梅全基因组测序、混池分离分析和个体重测序分析等,发现了一段雌性杨梅树特异的花性别决定区(FSR),该59 kb大小的染色体区域包含了多个与性花发育有关的基因,其基因表达水平受环境因素调控,会导致部分雌性杨梅树枝条开雄花[32]。

(2)生殖性状

在梨的基因组研究中发现,6个S-haplotype specific F-box(SFB)基因表现出串联重复,而且这些序列位于高度重复序列区,在一定程度上抑制了S位点的重组,这些基因组机制有可能与其自交不亲和性相关[26]。梨重测序研究发现,梨通过S-RNase基因的快速进化和平衡选择来保持自交不亲和性,从而促进梨的异交和解释梨横跨欧亚大陆的基因组多样性[28]。柑橘进化过程中在生殖上表现出了另一种现象——无融合生殖,以柑橘原始种、野生种和栽培种的基因组为基础,Wang等采用比较基因组、遗传学和基因表达分析方法解析了柑橘无融合生殖的分子基础,设计了“基因组+群体”及“目的区域精细关联”的策略锁定了控制柑橘多胚的关键基因CitRWP[21]。

3.2.2 果实性状

(1)果实大小与色泽

果实大小与产量息息相关,是人工选择的主要靶向性状之一。Yuste-Lisbona等通过全基因组测序作图结合CRISPER/Cas9技术分离出一个AP2/ERF转录因子ENO,ENO基因突变会导致植物由于花分生组织的增大而产生更大的多室果实,在长期驯化过程中,ENO基因启动子突变被正向选择所靶向,为现代番茄果实大小的显著增加奠定了基础[33]。Zhang等通过分析发现苹果花青素生物合成的核心转录激活因子MdMYB1基因上游的Gypsy-like反转座子redTE插入可以充当增强子调控苹果红皮表型[34]。不易着色的苹果品种因为缺少这一增强子而无法有效合成花青素。

(2)果实风味

Battilana等利用QTL分析与候选基因方法,鉴定了控制葡萄香气形成的关键遗传因子,最终在葡萄10号连锁群上控制芳樟醇含量QTL区域定位到两个香气候选基因,还有一个候选基因1-脱氧-d-木酮糖5-磷酸盐(1-deoxy-d-xylulose5-phosphate)合酶基因定位在5号连锁群上控制单萜含量的主效QTL区域[35]。Zhu等从油柿基因组中鉴定了57个参与原花青素代谢的基因,其中33.96%的基因以基因簇的形式聚集在第一染色体上,这对油柿果实发育过程中原花青素大量积累导致涩味形成十分重要[36]。

(3)果实硬度

Hu等结合QTL定位和GWAS分析发现苹果ERF4基因的EAR基序发生了一个突变(C-G),导致其对ERF3基因表达抑制降低,进而促进苹果果实乙烯的产生和硬度的降低[37]。Feng等通过对番石榴全基因组的选择分析和基因表达分析,发现番石榴的淀粉代谢基因受到正向选择,大多数淀粉降解相关基因在番石榴果实发育过程中表达增加[38]。除细胞壁降解外,淀粉降解可能是导致桃金娘科肉质果实软化的主要原因。

(4)果实营养

通过对甜橙4条维生素C调控途径的基因表达以及基因组比较分析发现,甜橙果实内大量合成维生素C的关键途径是半乳糖醛酸酯途径,半乳糖醛酸还原酶基因(GalUR)扮演着关键因子的角色,该基因家族的扩增、快速进化、功能分化以及组织特异表达等可能与甜橙果实大量合成维生素C有关[11]。对枣树基因组研究发现,枣果同时具有两种积累维生素C的方式,一种与柑橘类似,大幅度加强了L-半乳糖合成维生素C的途径,另一种与猕猴桃类似,维生素C再生途径中的关键基因家族单脱氢抗坏血酸还原酶家族出现极显著扩张[39]。

3.2.3 抗逆和次生代谢物质合成

(1)抗逆性

Guan等通过分析银杏全基因组序列,发现银杏树中提供各种防御机制的基因家族有广泛扩增现象,特别是能够抵抗病原体的基因有大量复制,使得银杏具有多重的化学和抗菌防御途径[40]。Dong等在杜梨的全基因组序列中鉴定了573个NBS型抗性基因类似物(RGAs),其中有150个为TIR-NBS-LRR(TNL)型抗性基因,是已获得全基因组序列的蔷薇科植物中含TNL型抗性基因数量最多的,解释了该野生种具有强抗病性的原因[41]。

(2)次生代谢物质合成

Su等(私人通讯)通过比较基因组分析枇杷、美吐根、苹果、梨等近缘物种基因组发现,枇杷三萜酸合成的OSC等几个关键步骤酶基因,在全基因组复制后均得以保留并活跃表达,表达分析发现OSC基因与后续催化步骤的酶基因在组织中具有共表达趋势,使得枇杷叶片中大量富集熊果酸和科罗索酸等三萜酸。

4 展望

从前述的进展中不难看出,主要的果树科属是基因组研究进展较快的,突出的例子包括蔷薇科中的苹果和梨等多种果树、芸香科中的多种柑橘类果树;此外,葡萄科和芭蕉科也受到重视,得到较好的发展。其他一些较重要的果树所属科也占有一席之地。例外的是桃金娘科,该科内有多种果树,只测序了番石榴[38],而蒲桃、莲雾等都未见测序的报道。这些果树多数在热带、南亚热带地区栽培,或许与这些地区科研基础和经济实力有关。但是,随着测序技术的高速发展和测序成本的大幅降低,以及果树基因组学研究的进展,相信很快将会有更多的高质量果树基因组完成测序。

截至目前为止,果树功能基因组学的进展远远落后于水稻、玉米等大田作物(小麦受困于复杂的倍性),更不要说模式植物拟南芥等,这显然与两个原因有关:一是果树是多年生的植物,多数还是木本植物,有性生殖周期很长,建立一个杂交后代群体到开花结果要多年时间;二是多数果树受体系统的再生体系尚未建立起来,使得功能基因的定位、候选基因功能分析以及基因功能的验证都严重受阻。对于果树来说,除了充分借助模式植物上的可行办法外,已经在果树等木本植物自身上获得的成功实例,都将迅速被应用到其他果树上。

另一方面,植物上重要的生物学问题,开花、结实和世代繁衍问题,仅依靠拟南芥和水稻等一年生植物(甚至一年可以繁殖多代)是不够的,尤其是结实方面的问题,反而有可能在果树上先获得某一方面的突破。因为,果树的结实方式丰富多彩,多样性程度高,这是一年生植物所无法比拟的。因此,果树学的研究者应当加倍努力,果树基因组学研究的前景是非常光明的,尽管困难很多很大。

猜你喜欢

基因组学甜橙基因组
巴西:甜橙产量预计保持在2.6 亿箱
南非:甜橙产量预计增长6%
埃及:全球最大的甜橙出口国
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
本草基因组学
本草基因组学
二十四节气之大寒篇