APP下载

不同生长年限蒙古黄芪转录组学分析及三萜皂苷合成关键基因挖掘

2023-02-08王育朋王七龙井亚江黄建萍颜永刚

中草药 2023年3期
关键词:萜类三萜蒙古

王 祥,王育朋,安 佳,王七龙,井亚江,黄建萍,张 岗,彭 亮,颜永刚*

1.陕西中医药大学 陕西省秦岭中草药应用开发工程技术研究中心/“秦药”研发重点实验室,陕西 咸阳 712046

2.陕西海天制药有限公司,陕西 咸阳 712000

蒙古黄芪Astragalus membranaceus(Fisch.)Bge.var.mongholicus(Bge.) Hsiao 的干燥根作为中药黄芪应用[1],最早见于《神农本草经》,药用历史悠久,为“补气之要药”具有补气升阳、固表止汗等功效[2]。临床用于治疗脑缺血性疾病,免疫系统疾病,肾病及血糖、血压等疾病[3-4]。黄芪为临床常用大宗药材,且为药食两用药材,市场需求量大,野生资源供不应求,故黄芪药材市场供给以人工种植为主[5-6]。经市场调研及实地考察,黄芪药材人工种植采收多以两年或三年生为主,故本研究以两年生、三年生蒙古黄芪为研究对象。黄芪药材主要有效成分之一为三萜皂苷类[7-8],目前已从黄芪植物中获得三萜皂苷类化合物50 余种,主要为黄芪皂苷I~VIII,异黄芪皂苷I、II、IV,乙酰基黄芪皂苷,大豆皂苷等[9-10]。黄芪生物体内化学成分的积累呈动态变化,不同采收时间有效成分含量差异巨大,即使在相同年限相同采收时间,不同个体有效成分含量仍然存在较大差异[11-12]。这些差异不仅受种质遗传的影响,也受外界环境因子的影响[13],环境因子通过影响生物个体的基因表达调控,进而影响植物次生代谢产物的合成与积累[14-15]。故研究黄芪三萜皂苷的合成基因及其表达调控机制尤为重要,有助于进一步研究如何提高黄芪药材的质量[16]。

转录组测序技术可测定不同时期个体的功能基因及表达情况,可将生物基因组遗传信息与功能代谢物建立连接,有助于分析功能基因[17]。目前转录组测序技术已广泛应用于细胞[18]、组织[19]、动物[20]、植物[21]等领域,极大地扩宽了生物代谢产物的研究方法,有利于研究药用植物有效成分的合成与积累机制,尤其适用于像黄芪这样的非模式植物[22]。目前少量关于黄芪转录组的研究,主要集中在膜荚黄芪且研究部位为茎、叶、花和种子[23],缺少以蒙古黄芪研究对象,且研究部位为药用部位(根)的转录组分析[24]。故本研究以蒙古黄芪的根为研究对象,对不同生长年限蒙古黄芪转录组数据进行生物信息学分析[25],挖掘其有效成分合成基因及相关酶的表达情况,为后续深入研究蒙古黄芪的植物育种、遗传变异、生长发育、有效成分合成提供理论依据。

1 材料与仪器

1.1 材料

蒙古黄芪样品来源于内蒙古通辽市科尔沁区庆和镇黄芪实验基地(121°60'21''E,43°35'46''N;海拔141 m)。于2022 年5 月1 日分别采集两年生(A)和三年生(B)蒙古黄芪新鲜植物根各3 份(每份6株),进行分组A1、A2、A3 和B1、B2、B3,液氮速冻,每组样品分别进行转录组测序和含量测定。植株经陕西中医药大学王继涛高级实验师鉴定为豆科植物蒙古黄芪A.membranaceus(Fisch.) Bge.var.mongholicus(Bge.) Hsiao。

1.2 仪器

S3000 高效液相仪(华谱科仪(北京)科技有限公司);UM5800plus 蒸发光检测器(上海通微分析技术有限公司);K5500®分光光度计(凯奥公司,北京);Bio-RAD CFX 96 荧光定量PCR 仪(美国伯乐公司);Bioanalyzer 2100 系统(美国加利福尼亚州安捷伦科技)的RNA Nano 6000 检测试剂盒。

2 方法

2.1 不同生长年限蒙古黄芪中三萜皂苷定量测定

每组蒙古黄芪样品中各取50 g,按《中国药典》2020 年版项下方法对蒙古黄芪样品分别进行制备和含量测定[1],流动相为0.3%甲酸水溶液(A)-乙腈(B)。柱温30 ℃;进样体积10 μL;梯度洗脱(0~13 min,82% A;13~43 min,82%~70% A;43~60 min,70%~45% A;60~70 min,45%~30%A)。ELSD 检测器条件:漂移管温度:65 ℃,气体体积流量2.5 L/min,信号增益5。测定黄芪中6 种主要皂苷(黄芪甲苷、黄芪皂苷I、黄芪皂苷II、黄芪皂苷III、异黄芪皂苷I、异黄芪皂苷II)成分的含量[26]。

2.2 RNA 提取、文库构建

对蒙古黄芪各组样品总RNA 分别进行提取后,用Nanodrop 检测RNA 的纯度、浓度、核酸吸收峰是否正常;用Agilent 2100 检测样品中RNA 的完整性。样品检测合格后用带Oligo(dT)的磁珠富集mRNA,然后加入Fragmentation Buffer 将mRNA 随机打断,以之为模板用六碱基随机引物(random hexamers)合成第一条cDNA 链,再加入缓冲液、dNTPs、RNase H 和DNA polymerase I 合成第2 条cDNA 链,利用AMPure XP beads 纯化cDNA,并进行末端修复、加A 尾并连接接头,并进行片段大小选择,再经PCR 富集后得到cDNA 文库。经Qubit 2.0 进行初步定量后,用Agilent 2100 对文库的insert size 进行检测,最后用Q-PCR 方法对文库的有效浓度进行准确定量(文库有效浓度>2 nmol)。

2.3 转录组数据的测序与拼接组装

库检合格后,不同文库按照目标下机数据量进行蓄集。用Illumina HiSeq 进行测序,对上机测序得到的原始序列(raw reads)进行过滤,去掉含接头的reads 和低质量的reads,得到高质量的序列(clean reads)。采用Trinity 软件对clean reads 进行拼接得到转录本序列,筛选其中必要的非冗余序列(Unigene)用于后续分析。

2.4 Unigene 功能注释和分类

用转录本蛋白编码潜能预测工具(CPC2)查找含编码潜能的Unigene,然后用BLAST 软件将发掘可编码的Unigene 与非冗余蛋白质序列数据库(non-redundant protein sequence database,Nr)、基因本体论(gene ontology consortium,GO)、同源蛋白质簇数据库(cluster of orthologous groups of proteins,eggNOG/COG)、真核生物蛋白相邻类的聚簇(clusters of orthologous group for eukaryotic complete,KOG)、京都基因与基因组百科全书数据库(Kyoto encyclopedia of genes and genomes,KEGG)、Swiss-Prot、Pfam 等数据库进行序列相似性对比,获得基因功能注释信息。用 FPKM(fragments per kilobase of transcript per million fragments mapped)计算法对样品中的mapped reads数目和转录本长度进行归一化,获得各个样本的表达量值。用DESeq(R 包)对各组样品进行差异表达分析。利用BenjaminiHochberg 校正方法对原有假设检验的显著性P值(P-value)进行校正得到q值,以FDR 为差异表达基因(differentially expressed genes,DEGs)筛选的关键指标,对转录本进行KEGG 代谢通路分析及差异基因表达分析。

3 结果与分析

3.1 不同生长年限蒙古黄芪三萜皂苷含量差异

对不同生长年限蒙古黄芪,按组分别制样,于“2.1”项下色谱条件进行含量测定。对不同生长年限蒙古黄芪中三萜皂苷含量进行对比分析,结果表明三年生蒙古黄芪各种皂苷成分含量均有不同程度提高,其中黄芪甲苷、黄芪皂苷I、黄芪皂苷II、黄芪皂苷III、异黄芪皂苷I、异黄芪皂苷II 的平均质量分数较两年生分别上升42.50%、86.05%、95.82%、100.00%、27.11%、37.81%。两年生蒙古黄芪总皂苷质量分数(6 种黄芪三萜皂苷含量之和)为16.8~27.1 mg/g,平均质量分数为22.57 mg/g;三年生蒙古黄芪总皂苷质量分数为28.7~39.0 mg/g,平均质量分数为35.57 mg/g;蒙古黄芪总皂苷平均质量分数三年生较两年生高出13.0 mg/g,为两年生的1.58倍。进一步对不同生长年限蒙古黄芪样品中三萜皂苷含量进行统计学分析验证,结果表明不同生长年限蒙古黄芪中三萜皂苷含量存在显著差异(P<0.05),三年生蒙古黄芪三萜皂苷含量显著升高。

3.2 转录组测序与序列拼接

对不同生长年限蒙古黄芪样本进行转录组测序,每个样本重复3 次,共生成282 321 486 个clean reads,包含有42.22 Gb 的clean base。Q20 的碱基百分比分布在98.57%~97.71%,Q30 的碱基百分比分布在94.88%~95.29%,GC 碱基量为46.10%~49.86%(表1)。结果表明蒙古黄芪转录组测序数据质量较高,用Trinity 软件将高质量数据进行De novo 组装,共得到369 790 条transcripts 和336 068条Unigene,N50 长度分别为1293、904 bp,N90长度分别为275、261 bp,组装完整性较好。长度分布在200~500 bp 的Unigene 最多,有227 595 条,占Unigene 总数的67.72%(表2)。将Trinity 拼接得到的转录组作为参考序列,将各样品的clean reads 与参考序列进行比对,得到各个样品的mapped reads,其样品匹配度均在76.0%以上,表明测序数据组装拼接效果较好。

表1 各样品转录组测序基础数据Table 1 RNA-seq data of samples

表2 转录本拼接情况统计Table 2 Statistics of transcripts and Unigenes after sequence assembly

3.3 蒙古黄芪Unigenes 的功能注释

将得到的336 068 条Unigene 与各大核苷酸和蛋白质数据库进行比对,发现Unigene 在NR 数据库和PFAM 数据库中基因匹配率最高分别为97.18%、85.94%。其次是Swiss-Prot 数据库和GO 数据库,在Swiss-Prot 数据库、GO 数据库、PFAM 数据和NR 数据库被同时注释的Unigene 为16 916 条。在5 个数据库被共同注释到的Unigene 有21 194 条,占总Unigene 的6.31%(表3 和图1)。

图1 序列注释韦恩图Fig.1 Venn diagram of transcript annotation in different databases

表3 序列注释统计Table 3 Statistics of sequence annotation

统计在NR 数据库中比对到的注释信息,共得到61 285 条Unigene,其中蒙古黄芪与双子叶植物纲(Dicotyledoneae)相似序列匹配度最高为60 059条(98%);其次为豆目(Fabales Bromhead)39 222条(64%),豆科(Fabaceae)41 061 条(67%),鹰嘴豆属CicerLinn.18 385 条(30%)、苜蓿属MedicagoL.12 870 条(21%)。进行物种信息对比发现,蒙古黄芪与植物鹰嘴豆Cicer arietinumLinn.相似序列匹配度最高为21 450 条(35%),其次是蒺藜状苜蓿Medicago_truncatulaGaertn.15 321 条(25%)、欧洲栓皮栎Quercus suberL.4290 条(7%)、百脉根Lotus japonicusLinn.4290 条(7%)、木豆Cajanus cajan(Linn.) Millsp.3677 条(6%)、稻Oryza sativaL.3064 条(5%)。这些注释信息可为蒙古黄芪基因相关研究提供参考(图2)。

图2 同源序列物种比对Fig.2 Species distribution annotated in NR database gene_ontology_blast

3.4 GO、eggNOG 与KEGG 注释分析

通过GO 基因本体论数据库注释,进一步将蒙古黄芪基因产物功能和概念阐释[27]。将蒙古黄芪的Unigenes 比对到GO 数据库中,发现共有39 166 条基因序列得到注释。总体分为3 大类:分子功能(molecular function,81 027 条,30.20%)、细胞组分(cellular component,88 136 条,32.85%)和生物过程(biological process,99 156 条,36.95%)。注释到具有分子功能的Unigenes 共分为15 种,其中结合蛋白(binding,17 842 条)和催化活性(catalytic activity,16 395 条)比对到的基因数目最多。注释到细胞组分的20 个组别中,细胞(cell,24 644 条)、细胞器(organelle,19 296 条)和细胞部分(cell part,24 578 条)所占的比例最高。在比对到生物过程的 26 个分组中新陈代谢过程(metabolic process,16 150 条)、细胞过程(cellular process,20 126 条)和生物调控(biological regulation,7978 条)基因数目最多(图3)。

图3 转录组的GO 注释统计Fig.3 GO annotation of the transcriptome

将蒙古黄芪的Unigenes 在eggNOG/GO 数据库中进行信息比对,共注释到了36 559 条基因,分为24 类(图4),其中已知功能且条目数最多的有翻译后修饰/蛋白质周转(posttranslational modification,protein turnover)2982 条、碳水化合物的运输和新陈代谢(carbohydrate transport and metabolism)2553条、信号转导机制(signal transduction mechanisms)2442 条。

图4 基因eggNOG/COG 注释分类统计图Fig.4 EggNOG/COG annotation classification statistical map of genes

KEGG 注释分析发现蒙古黄芪共有23 630 个Unigene 成功比对到84 条通路中,主要在代谢(metabolism,6594 条67.42%)、遗传信息处理(genetic information processing,2 195 条,22.44%)、细胞过程(cellular processes,690 条,7.06%)、有机系统(organismal systems,179 条,1.83%)、环境信息处理(environmental information processing,122 条,1.25%)5 个大的分类中(图5)。富集到代谢过程的Unigene 最多,其中有20 条代谢途径共2911 条Unigene 与植物的次生代谢产物合成相关;聚集在氨基酰基-tRNA 生物合成(aminoacyl-tRNA biosynthesis,228 条)的DEGs 数目最多,后富集较多Unigene 的5 条代谢途径依次是苯丙素生物合成(phenylpropanoid biosynthesis,226 条)、苯丙氨酸、酪氨酸和色氨酸生物合成(phenylalanine,tyrosine and tryptophan biosynthesis,152 条)、萜类骨架生物合成(terpenoid backbone biosynthesis,122条)、不饱和脂肪酸的生物合成(biosynthesis of unsaturated fatty acids,114 条)、泛酸盐和辅酶A 生物合成(pantothenate and CoA biosynthesis,107 条)(表4)。

表4 差异次生代谢物合成途径Table 4 Differential secondary metabolite synthesis pathways

图5 基因KEGG 二级分类统计Fig.5 KEGG secondary classification statistics of genes

3.5 不同生长年限蒙古黄芪差异表达基因分析

差异丰度基因筛选,以差异倍数|FoldChange|≥2且FDR(false discovery rate)<0.01 作为筛选标准,判断转录本上调和下调表达情况,筛选到蒙古黄芪转录本差异表达基因共48 261 条,其中三年生蒙古黄芪上调表达30 138 条,下调表达18 123 条。进一步对差异表达基因进行KEGG 代谢通路富集分析(图6),结果共有10 061 条DEGs 被富集到84条pathway 上,在富集较显著的15 条通路中,差异代谢基因主要富集在萜类骨架生物合成、二萜类生物合成(diterpenoid biosynthesis)、氨基酰基-tRNA 生物合成中。三年生蒙古黄芪在氨基酰基-tRNA 生物合成途径富集到228 条Unigenes 的背景下,富集到差异代谢基因有183 条,99 条显著上调;在萜类骨架生物合成途径富集到122 条Unigenes 的背景下,富集到100条差异代谢基因,其中有53 条DEGs 显著上调;在二萜类生物合成途径富集到的14 条Unigenes 的背景下,在富集到13 条差异代谢基因,全部表达下调。

图6 差异基因KEGG 途径富集Fig.6 KEGG pathways enriched for differentially expressed genes

3.6 三萜皂苷骨架生物合成通路差异表达基因分析

不同生长年限蒙古黄芪的萜类骨架生物合成和二萜类生物合成通路中共筛选到15 种差异表达关键酶基因,分别为六异戊二烯二磷酸合酶(hexaprenyl-diphosphate synthase,hexPS,2 条Unigene)、酰基辅酶 A-胆固醇酰基转移酶(acetyl-CoA C-acetyltransferase,ACAT,10 条Unigene)、羟甲基戊二酰辅酶 A 合酶(hydroxymethylglutaryl-CoA synthase,HMGCS,5 条Unigene)、羟甲基戊二酰辅酶A 还原酶(hydroxymethylglutaryl-CoA reductase,HMGCR,13条Unigene)、甲羟戊酸激酶(mevalonate kinase,MVK,4 条 Unigene)、磷酸甲羟戊酸激酶(phosphomevalonate kinase,MVAK2,4 条Unigene)、二磷酸甲羟戊酸脱羧酶(diphosphomevalonate decarboxylase,MVD,4 条Unigene)、异戊烯二磷酸Delta-异构酶(isopentenyl-diphosphate deltaisomerase,IDI,3 条Unigene)、过二磷酸合酶(farnesyl diphosphate synthase,FDPS,11 条Unigene)、牻牛儿基牻牛儿基焦磷酸合酶(geranylgeranyl diphosphate synthase,GGPS1,6 条Unigene)、蛋白香叶烯基转移酶(protein farnesyltransferase subunit beta,FNTB,7 条)、内肽酶(endopeptidase,STE24,4 条Unigene)、蛋白质-S-异戊二烯半胱氨酸O-甲基转移酶(protein-S-isoprenylcysteineO-methyl transferase,STE14,2 条Unigene)、异戊二烯半胱氨酸氧化酶(prenylcysteine oxidase/ farnesylcysteine lyase,FCLY,6 条)、二转聚戊二烯基二磷酸合酶(ditranspolycis-polyprenyl diphosphate synthase,DHDDS,9 条)。其中hexPS均上调表达,ACAT、HMGCS、HMGCR、MVK、MVAK2、MVD、IDI、FDPS、GGPS1、FNTB、STE24、STE14、FCLY、DHDDS既有上调又有下调表达的Unigene,其差异表达基因聚类热图(图7)。

图7 差异代谢基因聚类热图Fig.7 Clustering heat map of differential metabolic genes

3.7 三萜皂苷生物合成后修饰基因CYP、UGT 挖掘及表达分析

不同生长年限蒙古黄芪皂苷合成通路中共筛选到8 种CYP 和2 种UGT 差异表达关键酶基因。分别为参与丙酮酸代谢和氨基苯甲酸酯降解的酰基磷酸酶基因(acylphosphatase,acyP);参与苯丙烷生物合成的阿魏酸-5-羟化酶基因(ferulate-5-hydroxylase,CYP84A/F5H);参与类固醇生物合成的甾醇14α-去甲基化酶基因(sterol 14alpha-demethylas,CYP51)和甾醇 22-去饱和酶基因(ERG5/CYP61A,sterol 22-desaturase);参与色氨酸代谢、氨基苯甲酸酯降解的细胞色素P450/NADPH-细胞色素P450 还原酶基因(cytochrome P450/NADPH-cytochrome P450 reductase,cypD_E/CYP102A/CYP505);参与坏死性凋亡和细胞衰老通路的肽基-脯氨酰异构酶基因(peptidyl-prolyl isomerase D,PPID/CYPD);剪接体酶肽基脯氨酰异构酶H [peptidyl-prolyl isomerase H,PPIH/CYPH(cyclophilin H)];参与视黄醇代谢的细胞色素P450 家族26 亚家族A 酶基因(cytochrome P450 family 26 subfamily A,CYP26A)。2 种UGT 关键酶基因分别是:糖蛋白葡糖基转移酶基因(UDP-glucose:glycoprotein glucosyltransferase,HUGT);SKP1的G2 等位基因抑制因子(suppressor of G2 allele ofSKP1,SUGT1/ SGT1)。筛选的10 种三萜皂苷生物合成后修饰基因,在三年生蒙古黄芪中的表达均上升(表5)。

表5 黄芪皂苷生物合成的CYP、UGT 基因Table 5 Astragalus saponin biosynthesis of CYP, UGT genes

4 讨论

本研究用高通量测序技术,对不同生长年限蒙古黄芪新鲜植物根进行转录组测序分析,质控和拼接后得到了336 068 条Unigenes,在5 个数据库(NR、Swiss-Prot、GO、KEGG、PFAM、)被共同注释到21 194 条Unigene,占总Unigene 的6.31%,极大地丰富了蒙古黄芪的转录组信息和生物学信息,扩充了黄芪的数据库信息。进一步对其基因进行分析,发现在KEGG 数据库中有23 630 个Unigenes成功比对到84 条通路中,两、三年生蒙古黄芪至少有10 061 条差异表达基因,主要表现在氨基酰基-tRNA 生物合成、萜类骨架生物合成、二萜类生物合成途径中。

蒙古黄芪的Unigene在Nr数据库获得注释比例最高(98.17%),注释到的同源信息主要为双子叶植物纲(98%),其次为豆目(64%)、蝶形花科(67%)、鹰嘴豆属(30%)、苜蓿属(21%),这可为蒙古黄芪的物种起源、植物进化、遗传变异、物种分类等提供重要参考。进一步进行物种序列相似性比对发现,蒙古黄芪与植物鹰嘴豆(35%)、蒺藜状苜蓿(25%)、欧洲栓皮栎(7%)、百脉根(7%)、木豆(6%)的相似序列匹配度较高,这些物种的基因信息可为蒙古黄芪的基因功能研究提供参考。对蒙古黄芪已知序列但未知结构功能的蛋白质,可以从这些植物中寻找它的相似序列,从而推测出相似序列表达产生的蛋白质结构和功能[28-29]。

进一步对两、三年生蒙古黄芪差异表达基因进行KEGG 代谢通路分析,发现差异代谢基因主要富集在萜类骨架生物合成和二萜类生物合成中,其中三年生蒙古黄芪hexPS酶基因均上调表达,ACAT、HMGCS、HMGCR、MVK、MVAK2、MVD、IDI、FDPS、GGPS1、FNTB、STE24、STE14、FCLY、DHDDS既有上调表达又有下调表达的Unigene。其中hexPS作为萜类合成的关键基因,主要参与萜类基础骨架合成,以满足黄芪三萜皂苷前体物质的供应,对黄芪三萜皂苷的合成起着支撑性作用[30]。三年生蒙古黄芪的hexPS基因表达明显上调,可能与其三萜皂苷合成量大,对萜类基础骨架需求量大有关,这与本研究对两年生、三年生蒙古三萜皂苷含量验证结果一致[31]。ACAT、FNTB、STE24、STE14、FCLY、DHDDS主要参与萜骨架的合成与修饰,其表达既有上调又有下调,但上调表达数明显大于下调表达数,这可能与萜骨架合成与修饰过程中一些负反馈调节基因的参与有关,当植物合成的某些有机物积累到一定量时,负反馈调节机制会降低其正向合成基因的表达[32]。HMGCR是HMGCS经甲羟戊酸途径合成C5 类异戊二烯中间体的负反馈调节基因,二者双向调节异戊二烯中间体的合成速率,故当C5 类异戊二烯中间体合成达到一定量时,HMGCS基因会受到HMGCR的反馈调节而出现短暂的表达减弱。MVK将高能供体分子磷酸基团转移到特定靶分子“激活”或“能化”甲羟戊酸底物分子,然后MVAK2将甲羟戊酸磷酸化,MVD对二磷酸甲羟戊酸进行脱羧反应,生成的异戊烯二磷酸再由IDI、FDPS、GGPS1、FNTB等酶基因经一系列反应生成三萜皂苷前体物质异戊烯焦磷酸(isopentenyl pyrophosphate,IPP)[33]。黄芪三萜皂苷的生物合成首先经过萜类骨架生物合成途径生成萜类前体物质,然后经过甲羟戊酸(mevalonate)途径或2-C-甲基-D-赤藓醇-4-磷酸(2-C-methl-Derythritol-4-phospate)途径磷酸化,生成异戊烯焦磷酸[34],IPP 再由法尼基焦磷酸合酶、鲨烯合酶、鲨烯环氧酶、环阿屯醇合酶经一系列反应生成三萜皂苷的前体环阿屯醇(cycloartenol)[35-36],环阿屯醇再经一系列的氧化、还原、糖基化等后修饰,最终生成黄芪皂苷类化合物。

关于黄芪三萜皂苷生物合成的后修基因目前少有报道,因此,本研究进一步从蒙古黄芪转录组测序结果中挖掘参与黄芪三萜皂苷生物合成后修饰的CYP、UGT 酶基因。从不同生长年限蒙古黄芪皂苷合成通路中共筛选到8 种CYP 差异表达关键酶基因,分别为acyP、PPID/CYPD、PPIH/CYPH、CYP26A、CYP51、CYP84A、CYP61A、cypD_E/CYP102A/CYP505;2 种UGT 差异表达关键酶基因,分别是HUGT、SUGT1。共筛选的10 种CYP、UGT 酶基因在三年生蒙古黄芪的表达均明显增强,本研究对蒙古黄芪三萜皂苷含量进行测定,三年生蒙古黄芪三萜皂苷含量明显上升,这可能与黄芪三萜皂苷生物合成的后修饰酶基因CYP、UGT的表达调控有关[37]。其中CYP84A可通过苯丙烷生物合成途径合成木质素单体[38];CYP61A主要通过类固醇生物合成角鲨烯 2,3-环氧化物[39];CYP51主要通过胆固醇生物合成、麦角钙化醇生物合成、植物甾醇生物合成途径合成角鲨烯2,3-环氧化物[40];HUGT主要参与内质网中的蛋白质加工修饰[41];这些CYP、UGT 酶基因均可作为蒙古黄芪三萜皂苷合成后加工与修饰的候选基因。

本研究通过对蒙古黄芪转录组测序和生物信息学分析,极大地丰富了蒙古黄芪的生物学信息,挖掘了参与黄芪三萜皂苷的合成通路及关键基因,探讨了关于黄芪三萜皂苷生物合成的后修饰酶基因CYP、UGT及其表达规律,为后续深入研究蒙古黄芪的植物育种、遗传变异、生长发育、有效成分合成提供理论基础。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢

萜类三萜蒙古
泽泻原三萜、降三萜和倍半萜的分离及其抗炎活性研究
西藏白肉灵芝三萜高效液相检测分析及含量测定
三叶委陵菜的化学成分和药理作用研究进展
蒙古靴
明英宗羁留蒙古陪侍考
苍耳子中萜类化学成分的研究
《雲使》在蒙古
深海来源真菌Alternaria tenuissma DFFSCS013中混源萜类化合物及其抗菌活性研究
蒙古香
植物中萜类化合物的提取方法研究进展