APP下载

药用植物基因组测序及功能基因组学研究进展

2021-01-14蔡嘉慧王慧中孟一君

关键词:药用植物铁皮石斛

李 杰,蔡嘉慧,王慧中,孟一君

(1. 杭州师范大学生命与环境科学学院,浙江 杭州 311121; 2. 浙江省药用植物种质改良与质量控制技术重点实验室,浙江 杭州 311121)

1 药用植物相关简介

药用植物指的是能够预防、治疗疾病并对人体有保健养护功能的植物.在人类与疾病作斗争的长期过程中,药用植物扮演着至关重要的角色,其在民间医学中已使用了至少4 500年.从大约200年前开始,化学家们先后致力于从植物、真菌和细菌中分离具有生物和药理活性的物质,并进一步制成纯化合物.至今,大约有32 000个化合物来源于中药,包括抗疟药青蒿素.而在已经发现的天然产物数量中,有3/4是从植物中分离而来的,表明了植物对次级代谢产物的巨大贡献.因此,药用植物不仅是不断积累并保存下来的宝贵财富,也是未来药物研发和创新的重要源泉.而从古至今,原材料缺乏一直是广泛应用药用植物活性成分的最大阻碍.如:提取1 kg天然抗癌药物紫杉醇需要3 000棵红豆杉,也就是说每个病人每一疗程大约需要6棵红豆杉,而一棵红豆杉至少需种植3年以上才能提取紫杉醇;5~6 kg的纯长春新碱足以治疗美国一年份所有的癌症患者,而这些二聚生物碱在植物组织中大约占1 μg/g.据估计,中国每年需要200万磅新鲜长春花产生大约25万磅长春花干叶以供应国内医疗所需起始物料.虽然相关药用植物的人工栽培优化研究也不断有所突破,但对于方案优化的研究仍是集中在资源调查、形态识别、人工栽培、药性、药效分析、化学物质基础揭示等方面,而对药用植物基因资源的认识则相对薄弱,使得药用植物学和现代生命科学缺乏沟通桥梁.

针对有重大经济价值的药用植物进行全基因组测序及功能基因组研究,能够推动药用植物资源化、标准化、大数据化、科学化及国际化.关于药用植物基因组测序的必要性主要体现在:1)药用植物资源收集所需年份较长并具有道地性,对周围的生长环境具有特定的要求.同种药材因其产地的地理位置、气候、自然条件的不同,尤其是土壤的理化性质、微量元素含量不相同,其药效、药性存在显著差异.通过研究药用植物各组学之间的关系,形成以精准药效研究为目标的种质资源大数据中心,从而能够广泛运用于药用模式生物研究、阐明道地药材形成机制、基因组辅助育种、基因资源保护和利用、中药质量评价和控制、中药新药研发等领域;2)对药用植物的理论研究不够深入,无法预估还有多少天然产物未被发现.但是,随着更多植物基因组被测序,也许能够给出更准确的数值;3)超过半数已知的药用植物活性成分仍然无法被人工合成.在细菌与真菌中,生物合成基因通常是紧密成簇的.但植物中一个完整代谢途径所涉及的基因却是分散在整个基因组中的,这就使得药用植物生物合成途径和重构变得极为困难.因此,通过基因组信息和算法定义出完整的集合这一方法具有巨大的潜力.

本文将简要概括目前已测序的药用植物并对其中较有代表性的药用植物基因组结构及功能基因挖掘进展进行详细的描述,以探究药用植物基因组结构特点及功能基因在调控植物生长、活性成分合成和抗逆境生长中所起的重要作用.

2 药用植物基因组测序进展

2010年6月20日,中国医学科学院药用植物研究所与广药集团在京举行了丹参基因组框架图成果发布会[1].这是世界上首个药用植物基因组框架图,标志着中药研究进入了基因组学时代.2011年中,共有5种药用植物基因组被测序,而随着测序技术和关注度的不断提高,2018年被测序的药用植物已经达到了18种.目前,总计有43种药用植物的基因组相继被测出,共涉及31个科.所用到的技术手段主要为Illumina、Roche454和PacBio等.其中,除银杏外,买麻藤的基因组最大,为4.07 Gb,其次为人参(3.43 Gb).而有的药用植物基因组非常小,如虫草和灵芝等类,均小于40 Mb.其中最小为广东虫草,仅有29.05 Mb.个别药用植物基因组研究文献有多篇,如大麻、木豆、蛹虫草、长春花、人参、灵芝等,能够提供更多的参考;对于同种药用植物而言,基因组的组装结果也存在差异,这主要是因不同研究报告所涉及的组装方法以及物种的产地不同而导致[2-11];大部分文献都对药用植物重要活性成分相关的基因家族及代谢通路进行了深入研究,如作为传统抗菌药物,博落回能够产生具有高水平抗微生物活性的苄基异喹啉生物碱(BIA),例如血根碱(SAN)和白屈菜赤碱(CHE).而基于基因组学数据,能够对SAN和CHE生物合成的16个代谢基因的完整集合进行检索,并验证其生化活性,从而最终将保守的BIA代谢途径完整地梳理出来[12];广藿香油是广藿香中主要的药用成分,同时也是一种定香性能优越的天然香料.对萜烯合酶(TPS)基因家族中268个TPS基因位点的鉴定,揭示了基因扩张所导致的a型TPS基因的高度特异化以及其在广藿香油代谢途径中所起的重要作用[13];作为有效抗疟疾化合物青蒿素的唯一天然来源,黄花蒿的基因组测序带来了许多不曾预料到的结果:根据表达模式,MYB家族TF、AaMYB2基因与青蒿素生物合成特异性基因紧密聚集,而在此之前,并不清楚该转录因子家族与青蒿素生物合成有关;50%的核苷酸序列同一性表明黄花蒿基因组中的两个3-羟基-3-甲基戊二酰辅酶a还原酶(HMGR)来自不同的基因,而在之前的研究报道中它们却被认定为是两个等位基因;基因组结构分析表明,存在多个酶促步骤在限制青蒿素生物合成的代谢流量,因此,通过同时过表达青蒿素生物合成途径上游(HMGR)、中游(FPS)和下游(DBR2)的多个基因,最终获得了青蒿素含量显著增加的转基因黄花蒿品系[14].

在进行药用植物基因组测序时,也离不开各种数据库及生物信息学软件的比较分析.主要的综合基因组数据库有Assembly(https://www.ncbi.nlm.nih.gov/assembly/)、CNGB(https://db.cngb.org/)、GigaDB(http://gigadb.org/)等;针对于植物的基因组数据库包括EnsemblPlants(http://plants.ensembl.org/index.html)、JGI-Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)、PlantGDB(http://www.plantgdb.org/)等;更为细化专一的数据库包括ChloroplastDB(植物叶绿体基因组数据库:http://chloroplast.cbio.psu.edu/)、HarvEST(作物EST序列数据库:http://harvest.ucr.edu/)、PlantCARE(植物调控元件数据库:http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)、PlantTFDB(植物转录因子数据库:http://planttfdb.cbi.pku.edu.cn/)、BAR(植物生物学分析工具平台:http://www.bar.utoronto.ca/welcome.htm)等.药用植物基因组生物信息学分析软件主要分为7类:1)BLAST套件[15];2)基因组测序,LSC[16]、SOAPfilter[17]、Skewer[18]等;3)基因组组装以及质量评估,SOAPdenovo[17]、CEGMA[19]、BUSCO[20]等;4)重复序列检测,RepeatModeler[21]、TRF[22]、EMBOSS[23]等;5)基因预测和注释,SNAP[24]、GENEWISE[25]、Pfam[26]等;6)基因家族鉴定和系统发育分析,OrthoMCL[27]、MEGA[28]、ProtTest[29]等;7)转录组测序和分析,Trinity[30]、TopHat[31]、gCLUTO[32]等.

接下来,本文将详细描述其中一些药用植物(铁皮石斛、人参、天麻、红景天、灵芝)基因组测序的研究进展.其中涉及主要技术手段、蛋白编码基因、重复序列、功能基因家族和信号调控网络等关键信息.

3 代表性药用植物基因组研究

3.1 铁皮石斛基因组测序研究进展

铁皮石斛(DendrobiumofficinaleKimura et Migo)是兰科石斛属药用植物中最为珍稀名贵的物种,内含多糖、茋类、联苄类、生物碱类等化学成分,具有抗氧化、抗肿瘤、增强免疫力、减轻肝损伤、降血糖等功效.其巨大的药用价值、科学价值和商业价值掀起了相关研究热潮.Yan等[33]结合Illumina Hiseq 2000平台的二代测序技术(SGS)和PacBio平台的三代测序技术(TGS)首次从头组装得到了1.35 Gb的铁皮石斛全基因组序列.结果覆盖94%的全基因组和91.5%的基因编码区,鉴定出的蛋白编码基因共有35 567个,其中97.56%被注释.鉴定到的RNA包括396个rRNA、545个tRNA、16个sRNA、89个snRNA和1 005个microRNA;Zhang等[34]利用二代测序技术和SOAPdenovo2/Platanus组装得到的铁皮石斛全基因组序列大小为1.01 Gb.

以上研究中,重点提及的内容有较多共同之处,如都提及了重复序列在整个基因组中的占比极大,其进一步的鉴定注释结果也均表明其中很大一部分为转座元件.此外,大量基因家族存在扩张现象,主要体现包括:与真菌共生和抗旱性相关的基因、涉及葡甘露聚糖合酶活性的基因、参与发育和生长调控的MADS-box基因.这些基因的大量重复解释了铁皮石斛能够适应多变的环境而具有的强大免疫系统以及其药用多糖的生物合成分子机制.全面的基因组结构解析还表明,次生代谢产物16-epelloellosimine是由生物碱合成途径进一步生成而来、铁皮石斛具有完整的花序基因集以及胚乳种子丢失可能是由于I型MADS-box基因家族成员的缺失所导致的.

3.2 人参基因组测序研究进展

作为我国传统名贵药材,人参(PanaxginsengC. A. Mey)享有“百草之王”的美誉,共有48条染色体(2n=4x=48)[35].人参基因组数据的收集和进一步完善能极大促进人参基础研究和产业的开发.Xu等[36]利用二代测序技术对4年生人参(株系IR826)进行全基因组测序.组装后的基因组大小为3.5 Gb.总共预测到42 006个编码蛋白质的基因模型;Kim等[37]在Illumina平台上通过全基因组鸟枪法策略对名为ChP型的人参进行了从头基因组组装,得到的基因组大小为2.98 Gb,注释基因共59 352个.

以上研究表明,人参基因组中的重复序列高达60%以上,为所有已测序的被子植物中最高.而串联重复也使得UDP-糖基转移酶(UGT)基因扩增和分化至225个,这也进一步解释了人参皂甙的多样性;在与甲羟戊酸途径(MVA)相关的31个基因中有8个3-羟基-3-甲基戊二酰辅酶A还原酶特异性表达;重测序数据还显示,南亚的二倍体人参品种的分化与全球变暖有关,而北美的两种新品系的形成则是由两次洲际迁徙进化而来.

3.3 天麻基因组测序研究进展

据中华人民共和国药典所记,天麻(GastrodiaelataBl.)干燥块茎可入药,是中国名贵中药材,性甘、平,归肝经,有息风止痉、平抑肝阳、祛风通络等功效,可用于小儿惊风、头痛眩晕、肢体麻木等症状.Yuan等[38]利用全基因组测序(WGS)技术确定了天麻基因组大小为1.06 Gb,包含18 969个蛋白编码基因.由于假基因化和基因组重排现象,天麻经历了广泛的基因缺失事件.与另外两种兰科植物(桃红蝴蝶兰、铁皮石斛)相比,天麻基因组上有3 586个基因家族收缩了.其中甚至包括一些在其他植物物种中具有保守性的基因,BUSCO分析表明,195(20.4%)个高保守的基因在天麻基因组中丢失了.此外,由于不需要进行光合作用,天麻的质体基因组也收缩至35 326 bp并具有明显重组现象,其中编码光合复合体蛋白(NEP)的基因只保留有12个.但是,糖苷水解酶、尿素酶、ATPase等多个基因家族却发生了扩张的现象,尤其是天麻的线粒体基因组的大小显著扩大为1 339 kb.这些结果可能都是其因适应完全异养生活方式而导致的,这也暗示了完全异养植物的基因组具有较大的可塑性.

3.4 红景天基因组测序研究进展

红景天(Rhodiolacrenulata(HK. f. et.Thoms)H. Ohba)是景天科多年生草本开花植物,主要生长在亚北极地区的凉爽气候环境中,如北美、北欧和中欧以及中国的西南和西北山区.通常,红景天属具有相似的形态,导致其在分类学的鉴定和分类中具有一定的困难[39].尽管许多红景天属品种已长期被用作传统药物,其中一些还被广泛用于心血管疾病、低压缺氧、微生物感染、肿瘤和肌肉无力的治疗中,但其确切的药理作用机理仍不清楚[40-41].Fu等[42]在Illumina HiSeq 2000/4000平台上利用WGS技术测序得到了第一张属于红景天属的大红花景天的基因组草图.进一步对基因组进行高质量组装后,得到的大小为344.5 Mb.据k-mer分析,其基因组不仅高度杂合,而且高度重复,比率分别为1.12%和66.15%.此外,共检测到226.6 Mb的转座因子,其中77.03%为长末端重复序列.总共鉴定到31 517个蛋白编码基因,BUSCO分析表明,其中86.72%被预测为植物基因.此外,有79.73%的蛋白编码基因在功能上有注释.草图的完成有助于理解抗逆基因的进化机制以及不同药物成分(例如红景天中的红景天苷)的生物合成途径.

3.5 灵芝基因组测序研究进展

灵芝(GanodermalucidumKarst)也被称为“不朽的蘑菇”和“中药的象征”,是世界上最著名的药用大型真菌之一.正如《美国草药药典》和《治疗纲要》[43]所示,它的药理活性已得到广泛认可.现代药理研究表明,灵芝具有多种治疗活性,包括抗肿瘤、抗高血压、抗病毒和免疫调节活性[44].灵芝含有大量不同的生物活性化合物,目前已鉴定出的就有400多种[45],这使得这种真菌成为生物学上具有能够生产化合物功能的模拟细胞“工厂”.而其中最主要的两种药理活性化合物就是三萜和多糖.除了产生这些生物活性化合物外,灵芝还像其他白色腐烂担子菌一样,会分泌能够有效分解纤维素和木质素的酶.这种酶的活性可能对生物质利用、纤维漂白和有机污染物降解有帮助[46].

Chen等[47]利用二代测序技术和光学绘制法对单倍体核细胞的灵芝菌株260125-1进行了全基因组测序,组装后得到的基因组大小为43.3 Mb,预测编码基因有16 113个.Liu等[48]在Illumina Hiseq 2000 Sequencer平台上采用全基因组鸟枪法策略对灵芝进行全基因组测序,经SOAPdenovo最终组装得到的基因组大小为39.9 Mb,注释蛋白编码基因12 080个;Binder等[49]在对多孔菌目进行系统发育分析和概述时,也对灵芝进行了全基因组测序,大小为39.52 Mb,筛选出的基因有12 910个;Zhou等[50]通过Roche公司的454超高通量测序技术对灵芝菌株G0119进行全基因组测序,最终由Illumina Solexa GAIIx组装,得到了大小为41.49 Mb的基因组,并筛选出11 123个基因.

研究发现,在基因组水平上,灵芝的萜类生物合成仅通过MVA途径,而不是MEP途径.而从基因组结构来看,灵芝基因组中的转座元件相对于其他已报道的真菌来说要少得多,只占基因组的4.6%.对于基因家族的研究主要集中于CYP基因,在24个CYP基因簇中发现了78个与羊毛甾醇合酶共表达的CYP基因,其中与灵芝酸(GA)生物合成相关的CYP基因有222个.可能是基因横向转移的结果抑或是基因自身具有迅速分化并伴随新功能化的能力,灵芝中的CYP基因家族存在着大量扩张和新家族产生的现象,这也就导致了在所有已测序的真菌中,灵芝基因组中所含的CYP基因的多样性和丰富度是最高的.此外,值得注意的是,除涉及三萜类和多糖生物合成的基因外,还发现某些基因可能参与了非核糖体多肽(NRP)、聚酮(PK)和其他种类萜烯的生物合成,而这些化合物之前却从未从灵芝中分离得到,这表明其合成可能受到严格调控.由此可见,基因组的分析使我们进一步地了解生物体整体的化学特征,这对于研究药物的合成途径以及所产生的药理活性都具有极大的帮助.

4 代表性药用植物功能基因组研究进展

4.1 铁皮石斛

铁皮石斛中含有许多的活性成分,如多糖、生物碱、酚类、芪类、氨基酸等.多糖作为主要成分之一,与铁皮石斛的药理活性也有着紧密联系.因此,目前判断铁皮石斛质量的主要根据就是其多糖含量的多少.进一步研究发现,铁皮石斛中占主导地位的多糖是含甘露糖的多糖(MCP).在MCP的生物合成过程中,GDP-甘露糖转运蛋白(GMT)的存在是必不可少的,它能够将GDP-甘露糖转运至高尔基体腔中.Yu等[51]研究发现,MCP具有多个亚型并且存在于多个不同的生理阶段.他们从铁皮石斛中鉴定出了3个GMT基因,命名为DoGMT1-3.蛋白序列分析表明DoGMT1、DoGMT2和DoGMT3均属于NST超家族.通常情况下,植物合成多糖时需要NST超家族的参与,它们将糖核苷酸从细胞溶质转移到高尔基体腔中.亚细胞定位和液体闪烁分析表明这3种DoGMT蛋白都靶向高尔基体.采用qRT-PCR和半qRT-PCR进行基因表达分析,发现甘露糖的积累与DoGMT1-3基因的转录水平是呈正相关的,在茎中这3个基因的转录水平最高,而铁皮石斛中储存MCP的器官则正是茎.在圆球茎到幼苗这一系列生长阶段中,3个基因的表达都有明显的上调,而这也与相同阶段中水溶性多糖(WSP)含量的逐渐增加相对应.这些发现都表明了铁皮石斛中GMT基因在MCP生物合成中的重要性;除GMT基因外,GDP-甘露糖焦磷酸化酶(GMP)基因也参与了MCP的生物合成,GMP催化GDP-甘露糖的形成,而后者则作为合成MCP所需的供体.基于已测内部转录组参考数据库的基因注释,2017年He等[52]鉴定出了3个GMP基因(DoGMP1-3).研究着重于DoGMP1基因的功能解析,与野生型相比,从DoGMP1转基因拟南芥品系1、2、3中提取到的MCP含量要高出很多,分别增加了67%、96%和92%.荧光标记技术显示DoGMP1蛋白位于细胞质中,ClustalX2序列比对分析表明,来自铁皮石斛和水稻的所有GMP蛋白均显示出多种序列/结构相似性关系.为了研究可能存在的非生物胁迫耐受性,用150 mM NaCl处理,结果显示转基因品系种子的萌发率要高于野生型种子,而且种子的生长情况也优于野生型.以上的结果证明了GMP基因参与了MCP的生物合成,以及在种子发芽和幼苗生长期间,GMP基因在对盐胁迫响应中所起的介导作用.He等[53]还通过RACE法从铁皮石斛中克隆得到了磷酸甘露糖变位酶(PMM)基因的cDNA.PMM能够催化6-磷酸甘露糖和1-磷酸甘露糖之间的相互转化,而1-磷酸甘露糖则又是GDP-甘露糖的前体.一系列的遗传研究证据证明PMM基因参与了总抗坏血酸(AsA)和多糖的生物合成并在非生物胁迫耐受性中起介导作用.此外, Yu等[54]利用生物信息学序列分析最终从铁皮石斛基因组中确定了13种半乳糖基转移酶(DoGALT1-13).系统发育分析和基因表达分析表明它们参与了β-1,3-半乳糖结合多糖的生物合成,且均属于CAZY GT31家族.对DoGALT2的研究表明,其对于铁皮石斛柱头黏液的积累至关重要,并可能参与了铁皮石斛花粉发育过程中含半乳糖多糖的生物合成调控.

对于如何增强作物品种胁迫耐受性而言,发展胁迫耐受性植物的基因工程可能是一个有效捷径.因此,在建立于拟南芥和水稻的胚胎发育晚期丰富(LEA)完整蛋白质组的亲缘关系基础上,Ling等[55]对铁皮石斛的LEA基因家族进行了首次全面调查,共鉴定出17种铁皮石斛LEA(DofLEA)的编码基因.根据系统发育分析、蛋白质基序分析以及qPCR结果表明,铁皮石斛中的LEA蛋白是一个大家族,有多种序列、基序组成、染色体位置和表达模式.而在盐和热胁迫下,分别有6个和7个DofLEA的表达能够使大肠杆菌的生长状况改善.而根据qPCR数据,暴露于盐和热胁迫后,所有这些基因在各种组织中的表达均上调.Zhang等[56]则研究鉴定出了8个铁皮石斛中的PLP_deC(II型磷酸吡哆醛依赖性脱羧酶)基因.对基因结构分析表明,PLP_deC基因家族中外显子的数量在进化过程中增加或减少,以此为同源PLP_deC基因之间的功能差异提供了基础.而对保守基序的研究发现,同一亚科中的大多数PLP_deC基因具有高度相似的基序,这一点进一步支持了它们紧密的进化关系以及所构建的系统树的可靠性.对各组织的基因表达谱进行的计算机模拟分析表明,高表达水平的PLP_deC基因可能参与了铁皮石斛的组织生长和分化.此外,还发现铁皮石斛的PLP_deC基因对非生物胁迫(例如MeJA、ABA和SA胁迫)有反应.

4.2 人参

人参是对人类健康和医学最重要的草药之一,而其中的主要活性成分人参皂苷被认为是有极大应用前景的高价值药用化合物.原人参二醇作为人参皂苷达玛烷型的糖苷配基前体,包含了最多种类的人参皂苷(如人参皂苷Rb1、Rb2、Rb3、Rc、Rd、Rg3、Rh2及糖苷基PD).它能够通过不同的糖基转移酶而转变成人参皂苷.而原人参二醇的生物合成离不开细胞色素p450原人参二醇合成酶(PPDS)的参与.PPDS又被命名为CYP716A47,是CYP基因超家族的一员.Zhao等[57]将PPDS导入酿酒酵母中以建立更加优化的原人参二醇人工生物合成途径.他们通过跨膜结构域截断以及自给自足的PPDS-ATR1融合结构对PPDS进行了改进.结果表明,融合酶的催化活性提高了约4.5倍,原人参二醇的产量提高了71.1%.体内实验表明,带有融合蛋白的工程酵母有效地将96.8%的达玛烯二醇-II转化为了原人参二醇.这种能够提高植物细胞色素P450单氧酶活性的通用方法也有望应用于酵母中的其他P450系统.

2020年,Chen等[58]通过多个转录组数据库进行系统分析得到了189个AP2/ERF基因(PgERF001-189).APETALA2/乙烯反应因子(AP2/ERF)基因家族在植物生长发育、胁迫反应和次生代谢产物的生物合成中起着至关重要的作用.对397个PgERF转录本分析表明,在不同组织、发育阶段和基因型之间,其表达活性和网络构造已基本呈现多样化.随机选择DREB亚科中的6个PgERF基因进行冷胁迫处理实验,结果发现PgERF基因的表达发生了显著的变化.这表明DREB亚家族基因在植物对冷胁迫产生反应中起作用.进一步研究发现,PgERF基因对茉莉酸甲酯(MeJA)处理也会产生反应:397个PgERF基因转录物中有288个(72.5%)对MeJA处理有反应,其中上调的有136个,而下调的有152个.

此外,研究指出:作为PgGST、PgApx1和PgSOD这3个基因的上游转录因子,人参中属于WRKY家族的PgWRKY6基因可能是通过体细胞胚发生中生长素与ROS的信号交联作用,而在胚性愈伤组织的发育中发挥重要的作用[59];人参的STS基因参与萜类化合物的生物合成,MeJA和SA的处理能够使该基因表达上调,从而使人参产生更多的萜烯以抵御病原体(丁香假单胞杆菌番茄致病变种(PST))的侵袭[60];人参尿苷依赖性糖基转移酶(PgUGT)72AL1参与了人参皂苷化合物K的生物合成,该基因的过表达会导致腋窝叶中的器官融合.JA、SA和ABA处理会使PgUGT72AL1表达下调[61];人参液泡膜水通道蛋白编码基因TIP1的过表达赋予了拟南芥更快的生长以及更高的盐胁迫耐受性,这可能是因为PgTIP1的过表达影响了胁迫相关基因的表达.而且PgTIP1的蛋白质生物学活性与第128位的丝氨酸(Ser)残基有关.进一步研究发现,PgTIP1转基因大豆品系除了表现出优异的盐胁迫耐受性外,也具有更强的根系活力,根和叶中细胞的细胞膜损伤减少,抗氧化酶(SOD、POD、CAT和APX)活性增强,蒸腾速率(Tr)、光合速率(Pn)、叶片相对含水量(RWC)值增加.此外,该基因还能调整根、茎和叶中Na+、 K+和Cl-的分布方式.对应激相关基因的转录模式分析发现,盐处理后的根和叶中一些与胁迫相关的基因(GmPOD、GmAPX1、GmSOS1和GmCLC1)的表达上调了.以上结果表明,PgTIP1基因表达导致耐盐性提高的原因与植株中的水分关系、离子稳态和ROS清除的正调控有关[62-63].

4.3 灵芝

近几年,灵芝中含有β-1,3-葡聚糖和1,6-葡聚糖的多糖组分正受到越来越多的关注,因为它们具有抗氧化、抗癌、抗炎和免疫调节等重要的生物活性.在灵芝多糖的生物合成途径中,磷酸葡糖突变酶(PGM)是核苷酸糖前体生物合成途径中的关键酶,它负责糖分解代谢和糖合成代谢之间的联系,催化6-磷酸葡萄糖和1-磷酸葡萄糖之间的相互转化.Xu等[64]通过过表达磷酸葡糖突变酶(PGM)基因来提升灵芝多糖的产量,研究发现,PGM基因过表达会对细胞内的多糖(IPS)含量、细胞外多糖(EPS)的产生有影响.还有就是会影响到3个基因的转录水平.而这3个基因编码的都是与多糖生物合成相关的酶,它们分别是PGM、UDP-葡萄糖焦磷酸化酶(UGP)和β-1,3-葡聚糖合酶(GLS).过表达PGM基因灵芝的最大IPS和EPS含量分别比野生型菌株高出40.5%和44.3%.对工程菌株的研究表明,PGM、UGP和GLS的转录水平与野生型菌株相比分别上调了4.77、1.51和1.53倍,这表明较高的多糖生物合成可能就是由于这些基因的存在;除PGM基因外,Li等[65]将透明颤菌血红蛋白(VHb)基因导入灵芝中使其异源表达,并通过观察VHb特异性CO-差光谱证实了VHb的表达活性.对灵芝多糖生物合成相关基因的转录水平分析发现,VHb基因也会影响PGM、UGP和GLS这3个基因的转录水平.与野生型相比,转基因品系中的PGM、UGP和GLS的转录水平分别上调了1.51、1.55和3.83倍.而且转基因品系灵芝中最高的IPS和EPS产量也增加了,分别比野生型菌株高30.5%和88.2%.以上研究表明,PGM基因和VHb基因都有着能够提高灵芝多糖生产的潜力.

其他相关灵芝功能基因研究指出,灵芝中1,4-β-内切葡聚糖酶的一个候选基因——GlCel5A表现出CMC(纤维素酶)水解活性.在毕赤酵母中表达的重组GlCel5A蛋白能够水解CMC和β-葡聚糖,但不能水解木聚糖和甘露聚糖.该酶在60 ℃和pH 3~4时显示最佳活性,并在80 ℃和90 ℃时仍能持续保持50%的活性至少15和10 min[66];过氧化物酶超家族中的锰过氧化物酶基因GluMnP1可以在毕赤酵母中有效表达,并具有较高的氧化活性.除了能够使4种类型的染料脱色外,HPLC验证表明,该基因表达产物能够降解苯酚.而苯酚的降解及氧化产物的产生所依赖的主要途径则是儿茶酚介导的循环途径[67].此外,Xiang等[68]通过对灵芝基因组数据库的广泛搜索,确定了13个寡肽转运蛋白 (Gl-OPT1-13).表达谱分析表明,除了未检测到转录本的G1-OPT7-G1-OPT9外,所有旁系同源物均差异表达,暗示了它们可能参与了应激反应和人参的功能发育.

5 总结

从2011年至今,基于不同的测序平台,通过一、二、三代测序技术的结合以及多种生物信息学分析方法,已经有40多种药用植物的全基因组序列被人们所洞悉.尤其是近几年,已测序药用植物基因组的数量快速增加,不仅说明生物技术的快速发展,也说明了药用植物正越来越受到世界范围性的关注.

本文主要对铁皮石斛、人参、天麻、红景天和灵芝这5种药用植物的基因组测序进展做了详细的描述,此外,还对铁皮石斛、人参和灵芝的功能基因研究进展进行了简要介绍.从已测序的药用植物基因组报道来看,全基因组的解析使我们能够从分子层面去了解药物活性成分的产生过程、物种胁迫耐受性的由来、主要代谢途径和道地药材形成机制等等.从整体来看,药用植物基因组中存在着大量的重复序列,而重复序列中又发现了众多的转座元件,这也就不难解释药用植物中的许多基因家族都存在着基因扩张现象.基因在基因组上的流动性促进了遗传的多样性,也为物种的进化提供了基础.虽然不同药用植物都有各自的特点,但从它们的基因组分析来看,与抗性、主要活性成分相关的基因家族普遍存在大量重复以及扩张现象,而对于那些有明显特点的药用植物而言,由于环境的改变以及自身的设定,它们的基因组相较于其祖先已经有了很大的改变.比如:天麻通过实现特定基因收缩甚至缺失、扩张以及基因的新功能化以建立其特有的微生物共生模式,而这一过程中发生的基因缺失甚至包括了许多的保守基因;人参长期生长在地下,但却仍然能够进行高效的光合作用,这是因为人参中的CAB基因要比其他的植物多得多,此外,全基因组重复现象也使得人参具有更强的越冬能力从而能够在严苛的环境中生存.由此可见,大多数药用植物的基因组有着很大的可塑性,其上的基因会进行纯化选择以适应各种不同的环境.

对于功能基因而言,它们中大多数是以基因家族的形式存在的.因此,了解一个基因家族如何发挥作用是全面了解生物的必要条件.尽管随着时空的变迁,基因家族的分化程度较高,具有多样性,但是基因超家族的大多数成员表达时仍然互相关联并形成共表达网络.也就是说,相对于整个组织和发育阶段,大多数同属一个家族的基因具有一致的表达水平和模式.此外,由于药用植物栽培过程中存在产量过低、品种退化、资源缺乏和生长条件不适等问题,目前对于功能基因的研究主要是集中于药用活性成分、生长发育调控和抗胁迫耐受性等领域,以此来提高药用植物的应用性和价值性.研究成果的内容主要包括:1)于热门宿主中异源表达目的基因以进一步研究其整体表达系统、表达量高低、表达产物纯化等;2)通过过表达药用植物中的特定基因从而提高产量或改变特定性状;3)分析表达产物在不同器官中的含量以确认在最终收集时应该采集哪一部位最佳;4)向研究样品中导入抗性基因以培育具有优良商品性状的品系.从个体来看,铁皮石斛、灵芝、人参等较为有名的药用植物的功能基因克隆发展迅速,分离鉴定到的功能基因数量快速增加,而如天麻、红景天等物种的功能基因研究则仍然处于萌芽初期.整体来看,药用植物的结构基因组学到功能基因组学的过渡比预期的要早,两者相辅相成并相互渗透,难以划出明确的分界线.但是,若要揭示基因组及其所包含的全部功能基因,并在此基础上阐明遗传、系统发育、进化、功能调控等基本生物学问题,以及解决人类健康和疾病相关的生物医学问题,则是一项更加艰巨、耗时良久的工程.

目前药用植物基因组研究所面临的挑战主要有:1)测序技术还有待进一步改善.一代测序技术存在通量低成本高的问题;二代测序技术引入的PCR过程在一定程度上会导致测序错误,更关键的是面对复杂基因组组装时,读长不足这一缺点会使其“束手无策”;而三代测序技术的测序错误率较高.因此,目前的测序往往会结合二、三代测序技术进行优势互补,如有必要再辅助以一代测序技术以保证基因组组装的高质量.2)基因组上大量基因功能尚未被注释,精细功能基因组研究尚未完全展开.3)多数已知功能基因研究还处于基因分离阶段,并且过度依赖于生物信息学预测,缺乏直接实验证据(如基因功能验证方法:RNA干扰技术、基因敲除技术和酵母双杂交等).4)对于功能基因组仍处于单一对象的片面研究,还需要通过表达序列标签(EST)、cDNA微阵列、基因表达连续分析法(SAGE)等进行大规模的基因功能分析,以及通过表观遗传和非编码RNA调控分析来构建全面系统的分子信号网络.综上所述,人类对药用植物基因组和功能基因的研究和认知依然十分有限,对其研究任重而道远.

猜你喜欢

药用植物铁皮石斛
石斛兰
24种石斛在贵阳的适应性初探
CRISPR/Cas9技术在药用植物功能基因组研究中的应用和展望
药用植物保育研究团队
铁皮侠的装备
铁皮园
杨景波 石斛花开香满城
寻找家里的药用植物
药用石斛种质资源生物学特性观察
我的爸爸(下)