高良姜倍半萜合成酶基因的生物信息学和表达分析
2022-07-22黄琼林郑伟穰黄学山吴民华
黄琼林,郑伟穰,黄学山,吴民华
(广东医科大学,广东 湛江 524023)
高良姜是传统药食两用中药材,为姜科多年生草本植物高良姜AlpiniaofficinarumHance的干燥根茎,具有散寒止痛、温中止呕的功效[1]。萜类是高良姜发挥药效和产生芳香气味的物质基础之一。高良姜萜类成分复杂、种类繁多,包括单萜、倍半萜、二萜等多种化合物[2]。目前已从高良姜中分离出多种倍半萜成分[3-5],但高良姜倍半萜生物合成的分子研究还鲜有报道。开展高良姜倍半萜合成酶(sesquiterpene synthase,SES)的研究可为高良姜倍半萜生物合成的机制研究奠定基础,以期能通过基于倍半萜生物合成的基因工程手段来提高高良姜品质,进而缓解高良姜面临的资源逐年减少的困境[6-7]。
本研究在前期高良姜转录组分析[8]的基础上,挖掘和鉴定SES的编码基因,通过生物信息学分析基因及其编码蛋白的序列特征和功能,并分析SES基因在高良姜不同组织中的表达差异,以期为利用基于SES基因的基因工程途径调控高良姜倍半萜成分的生物合成与含量积累奠定基础。
1 材料与方法
1.1 基因序列来源
在转录组测序数据[8]基础上,以错误值(Evalue)小于10为筛选条件,检索注释为“sesquiterpene synthase”、含有完整编码区的非重复序列基因。此外,在转录组数据中搜索微管蛋白β-Tubulin的编码基因,用于后续实时荧光定量PCR(qPCR)检测的内参基因及其引物设计。
1.2 试剂与仪器
RNAprep Pure Plant Kit试剂盒、ddH2O,天根生化科技(北京)有限公司;GoScript Reverse Transcription System、GoTaq qPCR Master Mix试剂盒,美国普洛麦格生物技术有限公司;其他试剂均为化学纯。
Stepone Plus荧光定量PCR仪,美国Applied Biosystem公司;TGL-16MS型离心机,上海卢湘仪离心机仪器公司;JS-power 300型核酸电泳仪、JS-8600B型凝胶成像分析仪,上海培清公司。
1.3 基因序列分析
采用Omiga 2.0对高良姜SES基因序列进行编码区检索,并将其翻译成编码蛋白的氨基酸序列。利用Protparam和Protscale软件分析编码蛋白的基本理化特征。使用CD-search在线工具分析编码蛋白的保守功能域,利用Target1.1和TMHMM在线软件完成编码蛋白的亚细胞定位分析。分别采用SOPMA、Swiss-prot在线软件分析编码蛋白的高级结构。运用ClustalX和MEGA软件完成编码蛋白的多重序列比对和系统发育分析。
1.4 基因表达分析
采用qPCR检测高良姜SES在不同组织样品中的表达模式。参照说明书,使用RNA prep Pure Plant Kit分别提取高良姜根茎、茎和叶片总RNA,再用GoScript Reverse Transcription System反转录合成cDNA。
目的基因和内参基因用于qPCR的特异性引物如表1所示。参照GoTaq qPCR Master Mix试剂盒说明书,qPCR反应体系总体积为20 μL,其中2×qPCR Master Mix 10 μL,10 μmol/L上下游引物各0.3 μL,cDNA模板适量,并用灭菌蒸馏水补足体积。qPCR反应条件为:95℃预变性10 min;95℃变性15 s,60℃退火20 s,72℃延伸20 s,40个循环。采用2-ΔΔCt计算高良姜SES基因的相对表达量。
表1 高良姜SES基因qPCR分析所用的引物Table 1 Primers for qPCR analysis of SES gene in A.officinarum
2 结果与分析
2.1 基因序列特征
经过在高良姜转录组数据中检索,共获得2条编码SES基因及其cDNA序列。根据高良姜的拉丁学名及这些基因在转录组中的注释,将它们分别命名为AoSES3和AoSES6。AoSES3和AoSES6的cDNA序列长度分别为1 818 bp和2 257 bp,各自含有1个长度为1 653bp和1 647 bp的开放阅读框(open reading frame,ORF),分别编码含有550和548个氨基酸的蛋白质。
编码蛋白的理化和结构特征如表2所示。AoSES3和AoSES6的等电点均小于7,皆为酸性蛋白质。AoSES3的蛋白质不稳定指数大于40,属于不稳定蛋白质,而AoSES6则为稳定性蛋白质。AoSES3和AoSES6的多肽链整体表现为亲水性,为水溶性蛋白质。AoSES3和AoSES6均不含有跨膜结构域,也不具有信号肽、转运肽和靶向肽等结构。AoSES3和AoSES6均含有倍半萜合成酶来家族典型的保守序列——天冬氨酸富集基序(DDXYD),推测其为高良姜倍半萜类合成酶蛋白。
表2 高良姜SES理化及结构特征Table 2 Physicochemical and structural characteristics of SES in A.officinarum
2.2 编码蛋白的保守功能域分析
为了进一步明确高良姜SES的功能和分类,对其编码蛋白质的保守功能域进行分析。如图1所示,AoSES3和AoSES6均具有多个底物结合位点和天冬氨酸富集区域,包含有植物萜类环化酶和萜类合成酶等特异性功能域,归属类异戊二烯合成酶生物合成酶超级家族。因此,AoSES3和AoSES6均为高良姜萜类生物合成酶基因。
图1 高良姜SES的保守功能域分析Figure 1 Conservative functional domain analysis of SES in A.officinarum
2.3 编码蛋白的聚类分析
基于20种植物萜类合成酶构建的聚类树如图2所示,AoSES3和AoSES6与其他SES聚成一支,而其他萜类合成酶则聚成另外一支。SES分支又分为2个小分支,其中AoSES3和AoSES6与单子叶植物来源的SES聚集在一起,而双子叶植物SES则聚集在一起,说明AoSES与单子叶植物SES有更高的同源性,与其来源植物的亲缘关系相符。
图2 20种植物萜类合成酶蛋白的聚类树Figure 2 Cluster tree of 20 plant terpenoid synthase proteins
2.4 编码蛋白高级结构分析
蛋白质二级结构预测结果如图3所示,AoSES3和AoSES6均由α-螺旋,延伸链、β-转角和随意卷曲等4种元件构成,各元件的数量分别是379(68.91)和384(70.07%)、26(4.73%)和23(4.20%)、16(2.91%)和15(2.74%)、129(23.45%)和126(22.99%),表明两者均为混合型结构的蛋白质,并且在元件组成及比例上较为相似。
图3 高良姜SES的二级结构预测Figure 3 Secondary structure prediction of SES in A.officinarum
AoSES3和AoSES6的空间结构如图4所示,它们的三级结构元件组成与二级结构预测较为一致,均以α-螺旋为主,随意卷曲次之,其他两种元件则较少。AoSES3和AoSES6的空间排列也较为相似,提示它们的序列具有较高的保守性。
图4 高良姜SES的三级结构预测Figure 4 Prediction for tertiary structure of AoSES proteins
2.5 基因表达趋势
通过qPCR测定AoSES3、AoSES6在高良姜不同组织中的表达水平,结果如图5所示,AoSES3和AoSES6在高良姜叶、茎和根茎中均有表达,但表达趋势不尽相同。两者在茎中的表达均为最低,AoSES3在叶中的表达最高,根茎则次之;而AoSES6在根茎中的表达显著高于其他2个组织。
图5 SES基因在高良姜不同组织中的表达差异Figure 5 Expression analysis of AoSESs in different tissues of A.officinarum
3 讨论
本研究从高良姜转录组测序数据中鉴定获得萜类合成途径下游关键酶萜类合成酶(terpene synthase,TPS)的家族成员——倍半萜合成酶的2条编码基因AoSES3和AoSES6,它们分别编码550和548个氨基酸。AoSES3和AoSES6包含有倍半萜合成酶家族典型的保守序列DDXXD,并含有植物萜类环化酶和萜类合成酶等特异性功能域。聚类分析结果也发现,AoSES3和AoSES6与其他植物来源的倍半萜合成酶聚集在一起,具有较高的同源性。前人研究[9-10]认为倍半萜合成酶没有信号肽,定位于细胞质中,本研究对于AoSES3和AoSES6的分析也得到一致的结果。这些结果表明,AoSES3和AoSES6很可能具有植物倍半萜合成酶的功能。
组织表达特异性分析发现,AoSES3和AoSES6在高良姜的不同组织中均有表达,但表达丰度存在差异。AoSES3倾向在叶片中表达,而AoSES6则主要在根茎中表达,推测高良姜不同组织中的倍半萜生物合成可能是由不同倍半萜合成酶来实现的。
本研究通过转录组分析挖掘和鉴定出2条编码SES的基因,分析了其编码蛋白的序列特点和功能,生物信息学分析表明这些基因具有SES必需的功能域,并明确了这些基因在高良姜中的表达模式,为后续AoSES基因的功能鉴定和调控研究奠定了基础。