基于转录组测序的铁皮石斛黄酮代谢途径及相关基因解析
2019-09-10林江波王伟英邹晖戴艺民
林江波 王伟英 邹晖 戴艺民
摘要:[目的]分析铁皮石斛Dendrobium officinale黄酮类化合物的生物合成途径及相关基因,为铁皮石斛黄酮类化合物代谢调控、药用价值的开发研究提供参考。[方法]利用IlluminaHiSeq4000测序平台对铁皮石斛2个生长阶段茎、叶进行高通量转录组测序,对组装获得的unigenes进行功能注释和黄酮类化合物的生物合成相关基因解析。[结果]铁皮石斛黄酮类化合物代谢相关Unigenes48个,涉及14个酶。5个CHS相关Unigenes具有CHS-like保守结构域,活性位点氨基酸残基(Cys-His-Asn)高度保守,丙二酰辅酶A结合位点和产物结合位点的部分氨基酸残基发生变异。CHl(Unigene0013781)属于类型I查尔酮异构酶,异构化6'-羟基查尔酮为5-羟基黄烷酮。表达分析表明,2个生长时期的茎和叶,CHS(Unigene0008250)、CHI(Unigene0013781)和F3H的表达量都高于CHS(Unigene0012884)和C3'H。[结论]通过对转录组数据分析,共获得铁皮石斛黄酮类化合物代谢相关Unigenes48个,涉及14个酶;5个CHS相关Unigenes中,2个编码查尔酮合酶,3个编码联苄合酶;CHl(Unigene0013781)属于类型I查尔酮异构酶。
关键词:铁皮石斛;转录组;黄酮;功能注释;表达;代谢
中图分类号:S567.239文献标志码:A 文章编号:1008-0384(2019)09-1019-07
0引言
(研究意义)黄酮类化合物是铁皮石斛活性成分之一,通过分析铁皮石斛高通量转录组测序数据,发掘黄酮类化合物代谢相关基因,分析代谢途径,对铁皮石斛黄酮类化合物的代谢调控和药用价值的开发具有重要意义。(前人研究进展)黄酮类化合物属于一类低分子多酚化合物,又称黄酮体、黄碱素,是一类重要次生代谢产物,核心结构是由15个碳原子组成的2-苯基色原酮,具有C6-C3-C6基本骨架,由2个苯环(A环和B环)通过中央3个碳原子相连。目前已经发现并鉴定的黄酮类化合物有9000多种,可分为查尔酮类、黄酮和黄酮醇类、黄烷酮和黄烷醇类、异黄酮类等。黄酮类化合物具有抗氧化、抗癌、降脂降糖、抗心肌缺血等功能。铁皮石斛Dendrobium officinale是中国传统名贵中药材,具有抗氧化、增强机体免疫力、降血压血脂、抗肿瘤等生理活性。黄酮类化合物是铁皮石斛活性成分之一,不同部位、不同栽培方式和时间,总黄酮含量存在差异。徐丽红等比较了不同栽培方式铁皮石斛黄酮含量(以干基计),最高的是纯野生栽培,为0.25%,最低的是大棚仿野生栽培,为0.09%。唐丽等比较了不同生长龄铁皮石斛叶、茎的总黄酮含量,0.5年生长龄植株茎、叶的总黄酮分别为0.035%和0.104%,高于其他生长龄。黄秀红等研究结果表明:铁皮石斛盛花期、花苞期和微花期花的总黄酮含量分别为1.66%、1.52%和1.41%,差异显著。铁皮石斛花总黄酮对羟自由基、DPPH自由基和ABTS自由基都具有较强的清除能力,质量浓度为10mg·mL时,对DPPH和羟基自由基的清除率分别为89.77%和80.01%,花总黄酮对DPPH自由基、ABTS自由基和超氧阴离子的清除率效果比茎黄酮佳。黄酮类化合物与糖形成苷或以游离苷元形式存在。已经从铁皮石斛中分离到的黄酮苷化合物有新西兰牡荆苷Ⅱ、芦丁、新西兰牡荆苷Ⅰ、佛莱心苷、异佛莱心苷、夏佛塔苷和异夏佛塔苷等,新西兰牡荆苷Ⅱ是不同道地种源铁皮石斛共性黄酮苷,能有效抑制人肝癌HepG2细胞增殖,浓度50.35uml·L,给药48h,细胞存活率为50.89%,可能通过调控MAPK信号通路和Bax/Bcl-2,Caspase途径诱导细胞发生凋亡。高通量转录组测序技术可以全面分析转录本,有利于分析次生代谢产物合成途径,挖掘关键酶基因。马婧等对草麻黄高通量转录组数据进行分析,获得类黄酮代谢相关基因70个。邹毅辉等对半枝莲进行了转录组测序,获得注释unigenes 74185个,与黄酮类生物合成途径相关89个,其中差异表达36个。邹福贤等对不同种植时期的金线莲进行转录组测序,获得51370个unigenes,黄酮类生物合成代谢通路中,22个基因(6种酶)表达量差异显著。(本研究切入点)利用转录组测序技术,可以发掘铁皮石斛黄酮类化合物代谢相关基因,了解代谢途径,但目前尚未见到相关报道。(拟解决的关键问题)本研究通过分析铁皮石斛2个生长阶段茎、叶的高通量转录组数据,发掘黄酮类化合物代谢相关基因,分析代谢途径,解析CHS和CHI相关的unigenes,分析部分关键酶基因的表达,旨在为铁皮石斛黄酮类化合物代谢调控、药用价值的开发研究提供参考依据。
1材料与方法
1.1试验材料与转录组数据组装
铁皮石斛采自福建省龙岩市连城县冠豸山,经过茎段扩繁后,种植于福建省农业科学院亚热带农业研究所资源圃,于生长期(2016年8月15日)和成熟期(2016年12月15日)随机采集3株新鮮茎、叶样品供转录组测序,分别标记为T1(生长期茎)、T2(生长期叶)、T3(成熟期茎)、T4(成熟期叶)。转录组测序、数据的拼接、组装和功能注释由广州基迪奥生物科技有限公司完成,测序平台为Illumina HiSeq 4000。
1.2黄酮类相关Unigenes分析
为了获得与黄酮类化合物代谢相关的基因信息,根据KEGG注释信息进一步获得Unigenes的Pathway注释,分析黄酮类化合物代谢通路及相关unigenes。采用NCBI的BLAST X和BLAST P搜索序列相似性和氨基酸保守结构域。氨基酸序列的多重比对由软件DNAMAN V6.0完成。采用MEGA6.0软件NJ法进行分子进化树分析。
1.3黄酮类合成关键酶基因表达分析
利用RPKM(Reads Per kb per Million reads)法计算Unigene表达量,分析关键酶基因的表达。RPKM法计算公式为:RPKM=(1000000×C)/(N×L/1000)。其中,设RPKM为Unigene A的表达量,C为比对到Unigene A的reads数,N为比对到所有Unigene的总reads数,L为UnigeneA的碱基数。
2结果与分析
2.1黄酮类化合物代谢途径解析
4个样品的原始数据(NCBI SRA号:SRPl81716)经过拼接、组装后共获得43085条Unigenes,KEGG数据库注释的有8972条。通过KEGG代谢途径分析,共获得48个黄酮类化合物代谢相关Unigenes,涉及14个酶(表1),根据Pathway分析的代谢通路结合铁皮石斛已经报道的黄酮类成分,推测黄酮类化合物生物合成途径见图1。首先,通过苯丙烷代谢途径,在PAL、4CL和C4H的连续催化下,把苯丙氨酸转化成黄酮类化合物代谢的起始底物对香豆酰辅酶A;PAL是苯丙烷代谢的第一个反应酶、限速酶,与PAL相关的Unigenes 4个。对香豆酰辅酶A接下去的反应有2条支路:一条是在HCT、C3'H和CCoAOM了等酶的催化下形成咖啡酰辅酶A和阿魏酰辅酶A,再经过CHS的催化形成2',3,4,4’,6'五羟基查尔酮和4,2',4',6'四羟基-3-甲氧基查尔酮;另一条是在CHS的催化下,形成柚皮素查尔酮,CHS是苯丙烷代谢流向黄酮类代谢的第一个关键酶,相关的Unigenes 5个。柚皮素查尔酮经CHI异构化形成黄烷酮类化合物柚皮素,CHI相关的Unigenes2个。柚皮素在F3H、F3'H、F3'5'H、FLS等酶催化下形成二氢黄酮醇和黄酮醇类物质。二氢黄酮醇在DFR和LDOX等酶的催化,形成花色素。
2.2CHS相关Unigene生物信息学分析
KEGG代谢途径分析与CHS相关的5个Unigene为Unigene0008250、Unigene0012884、Unigene0023486、Unigene0023487和Unigene0023488。利用DNAMANV6.0软件预测Unigene的开放阅读框(ORF)和比对氨基酸同源性,Unigene0008250、Unigene0012884、Unigene0023487和Unigene0023488含有完整的ORF,分别编码395、390、390和390个氨基酸,同源性80.18%(图2);Unigene0023486含部分的ORF,编码148个完成氨基酸。采用NCBI的BLAST P搜索氨基酸序列相似性和保守结构域,Unigene0008250、Unigene0012884分别与金钗石斛(Dendrobium nobile)的查尔酮合酶(ABE77392.2)、海枣(Phoenixdactylifera)的查尔酮合酶(XP_008797107.1)同源性最高,为99%和88%。Unigene0023487和Unigene0023488与姬蝴蝶蘭(Phalaenopsis equestris)的联苄合酶(XP 020572026.1)分别具有87%和93%的同源性;Unigene0023486与蝴蝶兰(Phalaenopsis Jp.)的联苄合酶(P53416)具有96%的同源性。4个含有完整ORF的Unigenes都具有CHS-like保守结构域,含有3个活性位点,5个丙二酰辅酶A结合位点和6个产物结合位点。从图2可以看出,3个活性位点的氨基酸残基是保守的,但是,位点ii的N端相邻两个氨基酸残基发生变异,Unigene0008250和Unigene0012884是IA,Unigene0023487和Unigene0023488是VP。5个丙二酰辅酶A结合位点中,位点1和3的氨基酸残基保守;位点2和5的氨基酸残基,Unigene0008250和Unigene0012884为RM和GPA,而Unigene0023487和Unigene0023488为RJ和GRA;位点4的氨基酸残基Unigene0008250和Unigene0012884为F、Unigene0023487为P、Unigene0023488为A。6个产物结合位点只有e和f位点保守,b、c、d位点的氨基酸残基Unigene0008250和Unigene0012884为G、IDG、T,Unigene0023487和Unigene0023488则为A、IGG、L;a位点的氨基酸残基Unigene0008250和Unigene0012884为EIT,Unigene0023487为ETS、Unigene0023488为ETT。
2.3CHI相关Unigene生物信息学分析
KEGG代谢途径分析与CHI相关的2个Unigenes为Unigene0013780和Unigene0013781。Unigene0013780带有部分ORF,编码89个氨基酸,Unigene0013781带有完整的ORF,编码244个氨基酸,氨基酸同源性比对发现,Unigene0013780编码的89个氨基酸与Unigene0013781编码的一段氨基酸一致性100%。通过NCBI的BLAST P搜索氨基酸序列相似性和保守结构域,Unigene0013781编码的氨基酸属于Chalcone_3superfamily,具有查尔酮.黄烷酮异构酶保守结构域,能够异构化查尔酮形成柚皮素(4',5,7.三羟基黄酮),与姬蝴蝶兰(Phalaenopsis equestris)的查尔酮-黄烷酮异构酶(XP 020583376)同源性为76%。采用MEGA6.0软件将Unigene0013781编码的氨基酸序列与来自其他物种的9个查尔酮-黄烷酮异构酶进行NJ聚类分析(图3),聚类结果把10个查尔酮-黄烷酮异构酶分为2类,日本百脉根(Lotusjaponicus)的BAC53983和BAC54038聚为一类,Unigene0013781同其他7个聚为一类,与姬蝴蝶兰(Phalaenopsis equestris)的查尔酮-黄烷酮异构酶(XP 020583376)亲缘关系最近。
2.4黄酮类化合物代谢关键酶基因表达分析
刘CH3(Unigene0008250)、CHS(Unigene0012884)、CHI(Unigene0013781)、C3'H和F3H采用RPKM值分析他们在生长期和成熟期茎、叶中的表达量。从图4可以看出,在同一个组织,CHS(Unigene0008250)、CHI(Unigene0013781)和F3H的表达量都高于CHS(Unigene0012884)和C3'H。CHS(Unigene0008250)在生长期叶的表达量高于茎,成熟期则茎高于叶;CHI(Unigene0013781)的表达量,生长期茎高于成熟期,叶则成熟期高于生长期,在相同生长时期,茎的表达量都比叶高;F3H的表达量成熟期茎和叶都高于生长期。
3讨论与结论
黄酮类化合物是铁皮石斛重要的次生代谢产物之一,本研究通过分析铁皮石斛2个生育期的茎、叶转录组测序数据的KEGG注释结果,获得涉及黄酮类化合物代谢的酶14个,相关Unigene48个,并推测铁皮石斛黄酮类化合物生物合成途径,为今后关键基因的克隆、鉴定及代谢调控奠定基础.
CHS超基因家族包括查尔酮合成酶和一系列由于基因复制和功能分化衍生出的类CHS(CHS-like)蛋白。联苄合酶是兰科植物普遍含有的类CHS(CHS-like)蛋白,催化1分子间羟基苯丙酰辅酶A和3分子丙二酰辅酶A形成三羟基二苯甲酰。CHS超基因家族成员间序列同源性高,结构和催化机制相似,活性位点都是由Cys-His-Asn 3个保守氨基酸构成的三联体活性中心,功能分化在于丙二酰辅酶A缩合次数,起始底物的偏好和活性位点附近少数氨基酸的替换从而改变产物的环化方式等。本实验获得的5个CHS相关Unigene,2个属于查尔酮合酶,3个属于联苄合酶。4个含有完整ORF的Unigene都含有CHS-like保守結构域,同源性80.18%,活性位点都是Cys-His-Asn。但是,活性位点His的N端相邻2个氨基酸残基发生变异,查尔酮合酶是IA,联苄合酶是VP;5个丙二酰辅酶A结合位点中,2个位点的氨基酸残基保守,3个位点的氨基酸残基查尔酮合酶和联苄基合酶之间发生变异,其中1个位点联苄合酶之间也发生变异。6个产物结合位点中,2个位点的氨基酸残基保守,4个位点的氨基酸残基查尔酮合酶和联苄合酶之间发生变异,其中1个位点联苄合酶之间也发生变异。
CHI催化查尔酮形成二氢黄酮,植物CHI家族可分为两大类:类型Ⅰ只能以6'-羟基查尔酮为底物,异构化为5-羟基黄烷酮,类型Ⅱ除了具有类型Ⅰ的活性外,还能将6'-脱氧查尔酮异构化为5-脱氧黄烷酮,Shimada等克隆了日本百脉根的3个查尔酮异构酶,cCHll(BAC53983)和cCHl3(BAC54038)属于类型Ⅱ,cCHl2(BAC53984)属于类型Ⅰ。CHI(Unigene0013781)与cCHl2聚为一类,属于类型I查尔酮异构酶。
在黄酮类化合物代谢中,CHS是催化反应的第一步,CHI是催化反应的第二步,表达量高低直接影响黄酮类代谢产物的量。CHS的催化底物有对香豆酰辅酶A、肉桂酰辅酶A和咖啡酰辅酶A,在逆境条件下,更倾向于咖啡酰辅酶A。从表达量来看,2个生长时期的茎和叶,CHS(Unigene0008250)、CHI(Unigene0013781)和F3H的表达量都高于CHS(Unigene0012884)和C3'H,推测CHS(Unigene0008250)是以对香豆酰辅酶A为底物,形成柚皮素查尔酮,后经CHI(Unigene0013781)异构化形成柚皮素,而CHS(Unigene0012884)以咖啡酰辅酶A为底物,这需要通过酶活性实验进一步验证。