组学技术在蔷薇属植物研究进展
2024-05-30赵小慧韩丹丹李振涛李成俊
赵小慧,马 策,韩丹丹,李振涛,李成俊
(辽宁省经济作物研究所,辽宁 辽阳 111000)
蔷薇属(Rosa)植物为半木本多年生植物,是被广泛栽培的世界著名观赏植物之一[1],其种类繁多,颜色丰富,形态各异,是最具多样化的园艺作物之一。 在园林绿化、家庭园艺、香水、化妆品和制药等不同领域得到广泛应用,给人们的生活生产带来巨大经济、绿化及药用价值。 蔷薇属植物经过多年研究,在品种选育、栽培技术、基因筛选、分子克隆等方面取得重大突破。 后基因组时代各种组学技术的快速发展,为深入研究表型性状背后的遗传、基因组学和分子机制提供了强有力的工具,基于各种组学数据,研究人员得以发现新的基因、解析背后的分子机制、研究基因之间相互作用、蛋白表达调控、基因与环境相互作用、物种起源进化、物种多样性等问题。 该文以蔷薇属植物组学目前研究现状及背景为基础,总结了在基因组学、转录组学、蛋白质组学、代谢组学、表观组学等方面的研究现状及存在问题,并进行展望,以期发现新基因、解析分子机制,进而把分子编辑技术应用于蔷薇属植物,为加速分子育种提供技术保障。
1 基因组学
1.1 核基因组
蔷薇属植物基因组(nuclear genome)虽然较小,只有约560 Mb,但染色体却高度杂合,物种群体有复杂的多样化和多倍体性质,整个基因组由7 条染色体组成,倍体范围在二倍体(2n= 2×= 14; R. chinensis)到十倍体(2n=10×= 70; R.praelucens)之间[1]。 截至目前已完成蔷薇属4 个种核基因组测序,这些测序结果为深入研究蔷薇属植物分子机制、基因筛选奠定了基础。
Lu 等首次采用Hiseq2500 测序技术完成了缫丝花(R. roxburghii) 基因组测序,组装后基因组大小为480.97 Mb,但由于测序技术的局限性和蔷薇属植物基因组的高度杂合性,仅仅完成了草图组装[2]。 随后,Nakamura 等使用高通量测序平台完成野蔷薇(R. multiflora Thunb)测序,其基因组总长度约为740 Mb[3],但序列存在高度碎片化问题。 为解决因高度杂合造成的组装碎片化问题,Raymond 等和Hibrand Saint-Oyan 等采用双单倍体技术和三代测序技术对‘月月粉’ (R. chinensis ‘Old Blush’)进行测序,提高了复杂区组装质量,获得高质量测序图谱[4,5]。 Hibrand Saint-Oyan 等组装后基因组大小为512 Mb,共鉴定了551 个支架,Contig N50 为3.4 Mb,鉴定了39 669 个编码基因和4 812 个非编码基因,并使用荧光原位杂交技术绘制了着丝粒的位置[4]。 Raymond 等基于SMRT 和Hi-C 技术进行测序,组装的总基因组约515 Mb,N50 值非常高(24 Mb),93.5%的完整基因在‘月月粉’的杂合基因组中被鉴定出来[5]。 除对蔷薇和月季基因组测序之外,学者对玫瑰(R. rugosa)基因组也进行了测序。Zang 等利用PacBio 和Hi-C 技术获得一个高质量玫瑰染色体基因组。 其基因组序列大小约为407. 1 Mb,连接N50 大小为2.85 Mb,支架N50 大小为56. 6 Mb。 超过98%的组装基因组序列锚定在7 个假染色体上(402.9 Mb)。 基因组包含37 512 个蛋白质编码基因,其中37 016 个基因(98.68%)被功能注释[6]。 高质量参考基因组的获得为开展分子图谱构建,数量性状位点定位,遗传变异发掘,新型分子标记开发以及功能基因克隆提供了参考和框架。
1.2 叶绿体基因组
叶绿体基因组(Chloroplast genome)是独立于核基因组外的半自主遗传系统,由于其结构简单、高度保守、核苷酸置换率适中、单亲遗传且基因组较小等特点,被广泛应用于系统进化、种质资源鉴定和分类、居群遗传、谱系地理研究中。 基于其外源基因表达量高,空间独立以及安全性高等特点,也作为生物反应器,应用于叶绿体遗传转化中,目前在植物中已经实现抗性基因、逆境胁迫基因、有害基因在叶绿体中的表达[7]。 蔷薇属植物叶绿体基因组研究虽然起步较晚,但发展迅速,自2014 年第一个蔷薇属植物大花香水月季(R. odorata var. Gigantea)叶绿体基因组首次测序以来[8],已取得丰硕成果,截至目前(2023 年9 月26 日)NCBI 上共发表了351 种蔷薇属植物叶绿体基因组。 基于叶绿体基因组的保守性,学者进行系统进化研究[9~10],结果与蔷薇属植物目前的分类学结果基本一致。
1.3 线粒体基因组
同叶绿体基因组一样,线粒体基因组(Mitochondrial genome)也是独立于核基因组外的另一套半自主遗传系统。 在植物中,线粒体基因组大小变化范围大,基因顺序、结构高度可变,结构重排率高,但序列进化缓慢,母系遗传,被应用于系统发育、群体遗传和进化,目前已经完成了玉米、葡萄、水稻等的线粒体基因组测序[11]。 与叶绿体基因组相比,线粒体基因组更加复杂,结构也较多变,目前对蔷薇属植物线粒体基因组研究较少,Park 等首次用高通量技术对一种玫瑰新品种(R. angusta)线粒体基因组测序,其基因组全长303,484 bp,总GC 含量为45.2%,包含52 个基因,涵盖31 个蛋白质编码基因,17 个tRNA 和3 个rRNA。 通过与已发表的由测序原始数据组装而成的玫瑰线粒体基因组相比,共鉴定出124 个SNP和769 个INDEL[12]。
1.4 比较基因组学
比较基因组学(Comparative genomics)是以基因组数据为基础,利用软件对比基因组结构和功能区域寻找相同点与不同点,进而发现新基因、揭示基因功能,研究物种进化和DNA 条形码等的学科[13]。 Jeon 等将蔷薇属合柱组野蔷薇、伞花蔷薇(R. maximowicziana)及光叶蔷薇(R.luciae),小叶组缫丝花以及月季组大花香水月季叶绿体基因组进行比较,发现合柱组植物因假基因化而丢失了infA 基因。 两个蛋白质编码基因区域(ndhF 和ycf1)和5 个非编码区域(5'matK-trnK, psbI-trnS-trnG, rps16-trnG,rpoB-trnC 和rps4-trnT)被鉴定为高度信息性标记,13 个基序被鉴定为有效标记[13]。 Yin 等对金樱子(R.laevigata)、玫瑰、狗蔷薇(R.canina)进行叶绿体基因组重复序列、IR缩扩、突变位点分析,筛选出高变异区域(trnH-GUU、trnSGCU、trnG-GCC、psbA-trnH、trnC-GCA、petN、trnT-GGU、psbD、petA、psbJ、ndhF、rpl32、psaC 和ndhE),可作为叶绿体条形码,为蔷薇属叶绿体基因组的条形码鉴定奠定了基础[14]。
2 转录组学
转录组学(Transcriptomics),是基于测序技术,研究特定细胞类型、组织或个体在特定发育阶段或特定生理状况下的一整套RNA (包括信使RNA、转移RNA、核糖体RNA 和其他非编码RNA)转录物的学科。 转录组学着眼于RNA 水平基因表达,利用转录本对差异表达基因进行筛选,并构建特定信号调控下生物学过程中相关基因的共表达网络,提供基因结构和功能的全基因组信息,以揭示特定生物过程中涉及的分子机制[15]。 转录组测序已经成为分析差异基因表达,从而提供基因结构、基因表达调控、基因产物功能和基因组动力学等不可缺少的工具,也是筛选目标基因及解析特定信号通路分子机制的重要手段。 目前已经完成蔷薇属植物农艺性状相关的转录组测序,包括香味[16,17]、叶色[18]、花色[19],花芽分化和发展[20~22,16],花瓣脱落[23~24]等;抗病相关转录组测序,包括黑斑病[29],白粉病[30],灰霉病[31,32]等;抗逆相关的转录组测序,包括抗氧化[33],抗寒[34~37],耐热[38~39],耐盐[40]等,除此之外,对寄主植物介导的病虫害互作关系转录组也做了研究[41]。 这些转录组数据丰富了蔷薇属植物基因信息,为深入了解并利用基因信息进行育种奠定了基础。
3 代谢组学
代谢组学(Metabolomics)是分析内源性或外源性小分子代谢物的学科,作为研究代谢物与其他代谢物之间复杂相互作用的工具,可直接反映复杂生物化学反应网络结果,从而提供对细胞生理学多个方面的见解[42],目前已广泛用于农业、医药和微生物等诸多领域中,在筛选优良品种或基因型、解析代谢途径、评价基因改造效果、抗逆境研究、自然变异遗传结构分析等方面发挥重要作用[43]。
蔷薇属植物在不同生境、不同发育阶段通过代谢产物的差异表达以满足生命的正常活动。 研究差异代谢物不但能深入了解植物与环境互作、植物表型与生长发育的关系,还能筛选有益品种用于生产。 Su 等采用超高效液相色谱—电喷雾质谱联用技术(UPLC-ESIMS/MS)研究月季‘晨曦’花色变化机理,发现花变色是56 个化合物在异黄酮、类黄酮、黄酮、黄酮醇、苯丙素、花青素的富集途径上差异表达造成的[44]。 Zhang 等采用非靶向液相色谱-质谱(LC-MS)方法鉴定了缫丝花果实中的251 个代谢产物,筛选出42 种不同于无籽刺梨(R. sterilis S. D. Shi)的代谢产物,避免了混淆[45]。 还通过抗坏血酸特征离子和基于特征的分子网络(FBMN)发现了17 个由抗坏血酸单元与有机酸、黄酮类化合物或葡萄糖醛酸偶联形成的抗坏血酸(AA)衍生物,揭示了抗坏血酸衍生物不限于抗坏血酸糖苷,为缫丝花的开发利用奠定了基础。 Elhawary等对黄木香(R. banksiae)和两种小姐妹月季(R. polyantha)地上部分以及花挥发油成分进行多变量数据分析和抗菌活性评估,结果表明3 个品种的挥发油主要成分基本一致,但含量不同,筛选出了含量最好品种[46]。 同一植物不同基因型其代谢产物不同,研究代谢物差异筛选出质量更好、产量更高的作物,对增产增效具有重要指导意义。 Jiang 等采用UPLC-MS 鉴定和定量6 种基因型缫丝花果实的营养代谢产物,共鉴定出723 种代谢产物。 比较分析表明,每个基因型都有一些特征代谢产物,黄酮类化合物、三萜类化合物和酚酸类化合物与果实提取物抗氧化能力显著相关[47]。 与其他基因型相比,基因型Rr-7 和Rr-f 具有更大的药用和功能食品应用潜力,为开发新的基因型功能性食品提供了有益信息,也为植物育种确定最佳基因型。
植物响应逆境胁迫时会通过代谢网络调控产生一系列适应环境的差异代谢物以抵御生物、非生物胁迫。 Lv等对丛枝菌根真菌(Arbuscular mycorrhizal fungi, AMF)诱导‘紫枝’玫瑰(R. rugosa ‘Zizhi’)对舞毒蛾的抗性研究表明,接种AMF 可促进玫瑰叶片茉莉酸、脱落酸、黄酮类化合物的积累,抑制糖苷类化合物的积累,从而抑制虫的生长来提高玫瑰的抗病性,为菌根真菌在植物病虫害防治中的应用提供了参考,为菌根—植物—昆虫相互作用研究提供了依据[48]。 陈宇春等研究月季响应灰霉菌侵染代谢调控机制,对侵染灰霉病的‘月月粉’花瓣进行代谢组分析,结果表明差异代谢物主要显著富集在代谢途径、抗生素生物合成、氨基酸生物合成、ABC 运输、次生代谢产物生物合成、不同环境中的微生物代谢、类黄酮生物合成、黄酮和黄酮醇合成等通路,大部分参与蛋白质的合成,为植物抗逆研究提供理论依据[49]。
4 蛋白质组学
蛋白质组(Proteomics)是应用各项技术研究蛋白质在细胞、组织或生物体中表达、修饰和相互作用的学科[50]。 蛋白质位于中心法则最末端,是基因发挥作用,进行生命活动的最终执行者,通过对蛋白质组研究,可探索基因表达,表达后修饰、亚细胞定位、蛋白质相互作用等实际情况,为筛选及确定基因功能,植物抗逆境等研究提供更精确的技术手段。
目前对蔷薇属植物蛋白质组的研究主要集中于生命活动的形成、抗逆境条件下蛋白差异表达等。 自2014 年Song 等用定量蛋白质组学研究1-甲基环丙烯(1-methylcyclopropene, 1-MCP)对花瓶插期影响以来,进行了越来越多的蛋白质组学研究[51]。 马文涛利用TMT 蛋白质组定量分析对无籽刺梨表皮毛形成与发育研究,共鉴定到差异表达蛋白277 个,其中12 个蛋白与内源激素合成和信号转导相关,表明多个基因家族及内源激素参与调控不同表皮毛的形成与发育[52]。 Lu 等研究月季‘萨曼莎’(R.hybrida ‘Samantha’)花瓣在衰老过程中蛋白质组和泛素组变化,发现蛋白质降解和自噬在花瓣衰老过程中起重要作用[53]。 此外,还发现物质转运与花瓣衰老相关,并受到泛素化的调控,为在翻译后水平上解析月季花瓣衰老提供新的观点。 Soundararajan 等研究盐胁迫下硅对月季蛋白质组的影响,结果表明施硅处理改善了盐胁迫引起的叶片焦化和气孔损伤,减少了气体交换、光合色素、脂质过氧化速率和活性氧类的积累[54]。 差异表达蛋白质在功能上分为6 组:光合作用、碳水化合物/能量代谢、转录/翻译、应激/氧化还原稳态、离子结合和泛素化,揭示了盐胁迫下月季因外源硅而适应的潜在机制。 Muneer 等利用差异蛋白质组学分析鉴定4 个月季品种(2 个抗蚜,2 个敏感)对蚜虫的防御机制,发现与泛素代谢和应激反应相关的蛋白质因蚜虫侵袭而差异表达,解释月季抗蚜和敏感品种的分子机制[55]。
5 表观基因组学
表观基因组学(Epigenomics)又叫表观遗传修饰,是在不改变DNA 序列情况下研究基因组化学修饰和染色质结构变化对基因表达调控机制的学科。 表观遗传调控包括DNA 甲基化、染色质重塑、miRNA、组蛋白修饰以及RNA 修饰等,表观遗传修饰已在不同的作物中得到广泛研究[56]。 在蔷薇属植物中,Xu 等首次进行了表观遗传研究,对‘假日美景’(R.hybrida cv. ‘Carefree Beauty’)进行细胞分化中甲基化敏感AFLP 分析,结果表明未分化愈伤组织诱导过程中甲基化改变最大,体细胞胚胎发生和体外器官发生甲基化模式不同,在体细胞胚胎发生过程中,外胞嘧啶发生了巨大的去甲基化事件[57]。 DNA 甲基化在花瓣雄蕊发育中的重要作用也有报道,Ma 等研究DNA甲基化在雄蕊中的发育过程中的作用,结果表明雌蕊发育过程中低温处理导致启动子中CHH 环境的高甲基化,高甲基化启动子下调RhAG 基因的表达,从而增加花瓣数量。 DNA 甲基化在遗传中具有高度稳定性,鉴定与性状相关的DNA 甲基化在表观育种中对于改良蔷薇品种具有重要意义[58]。
miRNA 在基因表达调控和表型控制中也起重要作用。 在蔷薇中,共报告了500 多个保守的miRNA 和50 多个新的miRNA[59~62]。 Kim 等在4 个种(3 个蔷薇杂交种‘Vital’、‘Maroussia’、‘Sympathy’和1 个玫瑰种R. rugosa‘Thunb Haedang’),鉴定出花发育过程中242 个保守和25 个新的靶向参与花发育的主要转录因子家族miRNA[59]。 Pei 等对月季‘萨曼莎’开花早期花瓣中的miRNA 分析,确定了33 个保守miRNA 和47 个新miRNA,28个保守和22 个新型miRNA 在乙烯处理后差异表达,表明它们在乙烯依赖性花卉发育中发挥作用[60,61]。 更进一步研究发现,乙烯通过微调miRNA164/RhNAC100 模块调节细胞膨胀,为NAC 转录因子的功能提供了新的见解(2013 b)。 此外,Guo 等利用玫瑰根、叶、花瓣、花粉、雄蕊等不同组织对其进行了全局小RNA 谱分析,共报道了248 个保守miRNA,这248 个miRNA 与Kim 和Pei 两项研究鉴定的miRNA 不同,转录组比对鉴定出25 个保守miRNAs 前体和22 种新型miRNAs[62]。
6 多组学
单一组学法分析一个层面产生差异的生物学过程的信息,植物生长、发育、繁殖等生命活动是一个极其复杂的网络系统,单一组学研究不足以精确表达生命的过程。多组学(Multi-omics)联合分析通过整合多个组学水平的信息,对基因、mRNA、蛋白、代谢等多个层面进行整合,构建全面的基因调控网络,从而在多个层次上解析各分子之间的调控及因果关系,更全面解析生命的过程。
利用多组学联合分析,解析与农艺性状相关的调控机制,可为分子育种提供指导。 Wang 等研究生长素和糖对月季分枝拮抗作用的分子机制,结果表明蔗糖和生长素的拮抗作用主要针对氨基酸代谢、硫酸盐代谢、核糖体生物合成、核酸代谢和植物激素信号传导等几个重要生理过程[63]。 Lu 等对微型月季‘海神王’及其颜色突变品种‘皇后’花期花青素生物合成途径关键基因和代谢产物进行分析,共鉴定出190 个类黄酮相关代谢产物和38 551个独特基因[64]。 45 种黄酮相关代谢产物含量和15 个参与黄酮途径基因表达品种间差异显著,30 个转录因子在品种间差异表达,13 个花色苷生物合成相关基因及8 个TT 12 基因在突变体中呈上调趋势,为深入了解微型月季花色素苷生物合成途径的主要基因和代谢产物提供了重要依据。 马文涛对无籽刺梨表皮毛特征及果柄刺形成调控基因进行筛选,筛选出可能参与抑制果柄刺形成基因RchiOBHm_Chr2g0159921,并进行基因克隆,异源转化后证明其对表皮毛形成具有抑制功能[52]。
逆境胁迫下,多组学联合分析也能探索植物病虫害防御机制,筛选抗病抗逆候选基因,为育种提供理论依据。 陈宇春对‘月月粉’响应灰霉菌侵染进行转录组代谢组关联分析,结果表明差异基因和差异代谢物在同一个通路中不呈正比分布,差异代谢物主要富集在氨酰基-tRNA、氨基酸、缬氨酸、亮氨酸和异亮氨酸等蛋白类物质生物合成通路[50];差异表达基因主要富集在MAPK 信号转导、苯丙烷生物合成、光合作用、天线蛋白、植物激素信号转导等通路,说明‘月月粉’响应灰霉菌侵染的防御机制是多种代谢物和通路相互作用的结果。 Gao 等对长尖叶蔷薇(R.longicuspis)感染玫瑰卷叶螟后的防御调控机制进行研究,发现谷胱甘肽代谢和硫代葡萄糖苷生物合成途径显着富集[65]。 MAPK 信号传导参与了对该昆虫的抗性反应,为蔷薇抗蚜提供了候选基因和代谢产物,为探索蔷薇属植物蚜虫抗性的分子调控机制和抗蚜育种提供了理论依据。 Yang 等研究斑点单囊壳(Podosphaera pannosa)感染和外源水杨酸处理后月季转录组学和代谢组学变化。 结果表明在二者双重诱导下,月季对MAPK 级联反应、植物—病原体相互作用途径激活和抗性(R)基因表达一致,三萜类化合物生物合成、谷胱甘肽代谢和亚油酸代谢与对照相比显著增加,表明这些途径和代谢物参与了对斑点单囊壳感染的抗性[66]。 综上,转录组从基因层面进行分析,代谢组是基因与表型的桥梁,转录组+代谢组多组学分析,可以同时从原因和结果两个层面深度解析生物系统宏观发育过程,更加精确筛选目的基因。
7 存在问题与展望
组学技术的发展,为深入研究蔷薇属植物物种起源、物种鉴定、分子标记开发、新基因挖掘、基因蛋白相互作用、蛋白表达调控、基因与环境相互作用等提供了有力手段,有助于我们更好了解蔷薇属植物并指导实践。 蔷薇属植物物种丰富,为人们生活带来重要的经济价值和观赏价值,深入研究蔷薇属植物,将能更好利用蔷薇属植物服务生活,将能培育优良蔷薇属植物品种。 从目前研究成果来看,各组学技术在蔷薇属植物研究中取得很多进展,然而也存在一些不足,主要体现在:(1)目前研究主要集中在基因组学、转录组学、代谢组学、表观修饰等,在多组学技术联用方面的研究仍然较少,在表型组学、泛基因组甚至超泛基因组的研究还处于空白阶段;(2)目前利用组学数据进行分子辅助育种仍然处于空白阶段,蔷薇属植物仍然通过传统杂交手段育种,育种效率低下,育种速度慢,分子辅助育种技术及分子编辑技术应用于精确育种仍然处于空白阶段;(3)目前关于叶绿体基因组的研究主要集中于序列和结构、系统发育、DNA 条形码、SSR 序列等研究,关于用作生物反应器在叶绿体遗传转化中研究处于空白阶段。随着技术的发展,更多的组学数据被公布,将有助于解决目前存在的问题。 蔷薇属组学目前虽然取得一定成果,但仍然有很长的路需要走,随着各项技术的发展,必将实现对蔷薇属植物更加深入和全面了解,实现性状精确标记及分子育种建模,指导分子编辑技术精确应用于品种改良及品种选育。