APP下载

杜仲SQS基因的特征信息分析

2019-09-10雷跃杨仕梅张天缘赵德刚宋莉

山地农业生物学报 2019年6期
关键词:生物信息学

雷跃 杨仕梅 张天缘 赵德刚 宋莉

摘要:鯊烯合酶(SQS)是催化植物细胞合成甾醇和三萜类化合物的一种关键酶。为探明杜仲SQS基因家族成员的存在及其特性,本文通过生物信息学分析方法,对杜仲SQS基因(EuSQS)进行发掘,并对其进化关系、基因结构、保守基序、染色体定位、蛋白理化性质、空间结构、调控元件等进行分析。从杜仲基因组数据中获得3条EuSQS基因,它们分布于不同的scaffold上,有5 ~6个外显子;EuSQS蛋白含396~ 440 aa,相对分子质量为4573 ~ 4906 kDa,均属于不稳定蛋白,主要由α-螺旋和无规则卷曲构成;EuSQS1和EuSQS3在结构上较为接近,二者与EuSQS2差异较大;除含有基本元件外,EuSQSs的顺式作用元件还包括光照和激素响应、分生组织表达、逆境胁迫及类黄酮生物合成等六类;在进化关系上,杜仲EuSQSs与产胶植物橡胶草及橡胶树的亲缘关系较近。分析结果为进一步对EuSQS基因的功能鉴定和利用提供了依据。

关键词:杜仲鲨烯合酶基因;萜类化合物;生物信息学;基因结构;功能预测

中图分类号:Q8114

文献标识码:A

文章编号:1008-0457(2019)06-0001-07国际DOI编码:10.15958/j.cnki.sdnyswxb.2019.06.001

Characteristic Information Analysis of Eucommia ulmoides SQS Gene

LEI Yue1,YANG Shi-mei1,ZHANG Tian-yuan1,ZHAO De-gang1,2,SONG Li1*

(1. Institute of College of Life Sciences and Agro-Bioengineering,Guizhou University/The Key Laboratory of Plant Resources Conservation and Germplasm Innovation in Mountainous Region (Ministry of Education)/ Guizhou Key Lab of Agro-Bioengineering,Guiyang,Guizhou 550025,China; 2. Guizhou Academy of Agricultural Sciences,Guiyang,Guizhou 550006,China)

Abstract:Squalene synthase (SQS )is a key enzyme catalyzing the formation of sterols and triterpenes in plant cellsIn order to explore the  existence and characteristics of the  SQS gene family members of  Eucommia ulmoidesthe Eucommia ulmoides SQS genes (EuSQSs )were screened and further analyzed for a better cognition by bioinformatic analysis including phylogenetic evolution,gene structure,conserved motif,chromosome positioning,the physicochemical properties,spatial structure and regulatory elements etcThe results showed that three EuSQS genes scattering different scaffold were obtained from the genome data,which have 5-6 of exonsEuSQS proteins were composed of 396-440 aa with a relative molecular weight of 4573 ~ 4906 kDaThe main structure of α- helix and random coil were found in these unstable proteinsEuSQS1 and EuSQS3 are similar in structure,but they are quite different comparing with EuSQS26 types of cis-acting elements related to gene regulation including basic elements,photoresponse,hormone response,meristem expression,stress tolerance and flavonoid biosynthesis also were found in the EuSQS genesIn terms of evolutionary relationship,Eucommia ulmoides EuSQS is closely related to the Taraxacum kok-saghyz and Hevea brasiliensis based on the phylogenetic analysisThis study preliminarily revealed the EuSQS molecular characteristics,which laid a good foundation for further study on the function of EuSQS genes.

Key words:EuSQS genes; terpenoids; bioinformatics; gene structure; function prediction

杜仲(Eucommia ulmoedes oliver)又名思仲、木棉、丝棉树及玉丝皮等,是我国特有的名贵药用树种,也是世界上分布于亚热带和温带的极少数优质天然橡胶木本植物之一。杜仲的皮、叶、果及雄花均可入药,具有消炎、抑菌、抗疲劳、抗氧化、降血脂、降血糖、增强免疫功能等多重功效[1-4],这些生物学活性是由杜仲含有的甾醇类、三萜类、环烯醚萜类、苯丙素类、黄酮类等多种次生代谢产物决定的。其中,杜仲甾醇类和三萜类具有降胆固醇、降血糖、调节机体免疫力、抗癌等活性[5,6]。甾醇类和三萜类的生物合成首先是通过甲羟戊酸途径(mevalonic acid pathway,MVA)生成法尼基焦磷酸(farnesyl diphosphate,FPP),FPP在鲨烯合酶(Squalene Synthase,SQS,EC25121)的进一步催化下合成鲨烯(Squalene,SQ),鲨烯作为甾醇、三萜等物质的共同前体[7],再经过多步代谢反应即可合成甾体类和三萜类物质[8,9]。可见,鲨烯合酶SQS作为催化甾醇和三萜类生物合成途径中的重要调节点[10],是一种调控杜仲药用活性成分的关键酶。尽管对橡胶树等植物的鲨烯合酶的研究较多[11],但仍缺乏对杜仲鲨烯合酶及其编码基因特性的了解,限制了对杜仲甾醇、三萜等活性成分合成调控的分子机制解析及利用。

本文通过生物信息学分析方法,对杜仲SQS基因进行发掘,并对其进化关系、基因结构、染色体定位、理化性质、三维结构及顺式作用元件组成等基本特征进行分析研究,为今后研究杜仲SQS基因功能和揭示甾体类和三萜类等杜仲化合物的合成调控提供依据。

1材料与方法

11材料来源

杜仲基因组数据库来源于http://bigdbigaccn/gwh/Assembly/13/show。

12分析方法

根据Pfam数据库中SQS基因的SQS_PSY(PF00494)功能域特征,构建隐马尔可夫模型,设置e-value值为1e-20,从杜仲基因组数据库中鉴定SQS基因成员(EuSQSs)。参考相关文献方法[12],利用在线工具GSDS(http://gsdscbipkueducn/)对EuSQS成员进行CDS结构分析,根据文献报道方法[13],通过在线工具MEME对杜仲SQS蛋白的motif进行预测分析;从基因组数据库中心(http://bigdbigaccn/)获得杜仲基因组注释文件,根据SQS基因所在Scaffold的位置信息绘制其位置信息图,并用在线工具MG2C(http://mg2ciaskin/mg2c_v20/)制作染色体定位图;利用 ExPASy中的ProtParam (http://webexpasyorg/protparam/)软件对EuSQS蛋白的基本特性进行分析;利用在线软件SOPMA((https://npsa-prabiibcpfr/cgi-bin/npsa_automatpl? page=npsa_sopmahtml))对SQS蛋白的二级结构进行分析,通过在线软件SWISS-MODEL(https://swissmodelexpasyorg/interactive)分析其三维结构[14];参考文献方法[15],利用bedtools工具获得SQS基因上游2000 bp序列,利用在线软件PlantCARE对获得的序列進行结构分析[16],探讨EuSQSs基因的主要顺式作用元件;基于多序列比对的邻接法(Neighbor-Joining),利用软件 MEGA7,构建EuSQSs基因的进化树。执行参数为bootstrap 1000次重复,其他参数为系统默认值。

2结果与分析

21杜仲SQS基因家族成员组成

基于构建的隐马尔可夫模型,从杜仲基因组中筛选到5条EuSQS基因,根据SQS基因特有SQS_PSY功能域,去掉不含SQS_PSY功能域的2条假阳性基因,最终从杜仲基因组中鉴定获得3条EuSQS基因,其序列ID分别为GWHPAAAL000046、GWHPAAAL013859、GWHPAAAL007514,根据其在Scafflold上的位置分别命名为EuSQS1、EuSQS2、EuSQS3。

22杜仲SQS基因的结构特征

利用在线网站工具GSDS对EuSQS基因内含子和外显子进行分析发现,杜仲三条EuSQSs成员的基因结构中均含有内含子和外显子(图2),其中,EuSQS1和EuSQS3内含子数量和外显子数量一致,分别为5和6;而EuSQS2的内含子数量和外显子数量较少,分别为6和5。

利用 MEME软件对3条杜仲SQS蛋白序列进行结构分析,结果表明(图3),EuSQS1和EuSQS3两条蛋白均含8个基序,其中,6个基序相同,仅2个基序存在差异,推测二者在空间结构和功能上接近;EuSQS2所含基序最少,仅有4个,表明EuSQS2与EuSQS1、EuSQS3在结构上差异较大,功能上也可能存在差异。

23杜仲SQS基因在染色体上的位置

对SQS基因进行染色体定位分析显示(图4),EuSQS1、EuSQS2、EuSQS3三条基因分别位于Super-Scaffold_1、Super-Scaffold_91、Super-Scaffold_309三条Scaffold上,且杜仲三条SQS基因之间关联度较差,不存在串联重复。

24杜仲SQS蛋白的理化特性

理化性质分析表明(表1),EuSQS1、EuSQS2、EuSQS3蛋白长度分别为434aa、440aa、396aa ,相对分子质量大小分别为4874 kDa、4906 kDa、4573 kDa,理论等电点分别为909、920、844,编码氨基酸序列最长的是EuSQS2,其相对分子质量最大为4906 kDa;EuSQS3相对分子质量最小,为4573 kDa。不稳定指数分析表明,SQS蛋白不稳定系数均大于40,为不稳定蛋白,其中EuSQS2的不稳定系数最小,为5232。三条蛋白的脂溶指数分别7959、8766、7588,均小于100,总平均亲水性分别为-0384、-0263、-0484,均小于0,说明 SQS蛋白为亲水性蛋白。

25SQS蛋白的二级结构和三维结构特征

对3条杜仲SQS蛋白的二级结构分析表明,SQS蛋白由α-螺旋、延伸链、无规则卷曲、β-转角四种结构单元组成。其中,以α-螺旋比例最高,三条蛋白分别为5415%、5636%、5530%,占一半以上;其次是无规则卷曲,所占比例分别为3387%、3023%、3308%(表2)。

通过SWISS-MODEL对三维结构进行的分析表明,SQS蛋白的三维结构均由多个螺旋、延伸链和转角组成,其中,EuSQS1和EuSQS3的三维结构高度相似(图5),这与motif分析推论出的二者空间结构相似是一致的,可能二者属于同一类型。

26杜仲SQS基因的顺式作用元件组成

参照相关文献报道方法[17],对EuSQS基因上游2000 bp序列进行分析发现,SQS基因所含顺式作用元件除CAAT-box和TATA-box基本元件外,还包括五类调节元件(图6),第一类参与光响应,包括G-box、G-Box、Box-4、Sp-1、MRE等;第二类是激素响应调节元件,有脱落酸反应相关的ABRE,参与茉莉酸甲酯反应的CGTCA-motif,水楊酸反应所需的TCA-element以及赤霉素响应元件GARE-motif等;第三类是与分生组织表达相关的顺式作用调节元件CAT-box;第四类属于逆境胁迫相关的顺式作用元件,有参与防御、胁迫和应激反应的TC-rich-repeats,以及低温响应元件LTR;第五类参与类黄酮生物合成基因调控的MYB结合位点作用元件MBSI,该元件仅在EuSQS3中发现,EuSQS1和EuSQS2中没有。因此,EuSQSs基因在杜仲中具有广泛的生物学活性,在光照、温度及激素等信号分子的介导下,可能参与细胞光合过程、信号转导、生长发育、逆境胁迫耐受和次生代谢活动等生物学过程的调控。

27杜仲SQS基因的进化特性

利用MEGA70软件对3条杜仲SQS基因和模式植物拟南芥(10条)以及产胶植物橡胶草(6条)和橡胶树(11条)的SQS基因构建进系统化树,并进行亲缘性分析。结果显示(图7),3条杜仲SQS基因与模式植物拟南芥在进化上均较远,而EuSQS1和EuSQS3与橡胶草的SQS基因、EuSQS2同橡胶树的SQS基因在进化关系上接近,这从分子层面上为杜仲既是一种药食兼用植物,也是一种产胶植物提供了依据。

3结论与讨论

鲨烯合酶(SQS)是结合在内质网上的合成植物甾醇和三萜类化合物的关键酶[18],在细胞内,其含量和活性直接影响鲨烯的合成,进而影响到以其作为前体的次生代谢物质合成[19]。近年来对植物SQS基因的调控研究倍受重视,尽管已对葡萄[20]、人参[21]、雷公藤[22]、甘草[19]和灵芝[23]等植物中的SQS基因进行了克隆分析,但其在杜仲中的研究还较为有限。

本研究对杜仲SQS基因家族成员进行发掘和基本特征的信息学预测分析,发现杜仲SQS蛋白长度范围在396~440aa之间,相对分子质量大小范围为4573 ~ 4906 kDa,这与目前已知的植物鲨烯合酶的氨基酸残基为410 ~ 461个,分子量介于469 ~525 kDa是接近的[24]。基因家族成员之间既有功能相互一致或促进的,也有因分工不同而存在差异的。杜仲EuSQS1和EuSQS3的保守基序和空间结构相似,且均与EuSQS2差异较大,可能与EuSQS1和EuSQS3的生物学功能相似而与EuSQS2不同有关。可见,杜仲SQS基因家族成员在细胞中的功能较为丰富。杜仲既是一种药用植物,也是一种产胶植物[25]。对杜仲与拟南芥、橡胶草、橡胶树SQS基因间的进化关系分析表明,杜仲与产胶植物橡胶草和橡胶树的同源性较高亲缘关系较近,这可能和杜仲与同是橡胶植物的橡胶草、橡胶树在生物学功能、生长调控机制上存在相似性有关,这也暗示SQS基因可能在橡胶合成代谢中重要作用[11]。

植物激素作为细胞次生代谢的重要信号分子[26],促进SQS基因表达,从而调控三萜等的合成[27-29]。植物细胞中,水杨酸和茉莉酸甲酯是参与次生代谢过程的重要信号分子[26],水杨酸可通过提高灵芝SQS基因的表达促进灵芝三萜的高效合成[26],茉莉酸甲酯则可以增强灵芝甲羟戊酸途径(MVA)中SQS、FPS、 HMGS、HMGR、MVD等关键酶基因的表达[25],而茯苓中MeJA可以显著上调SQS基因表达而实现对三萜类的生物合成[29]。可以看出,药用植物中有效成分相关的次生代谢产物合成过程需要激素分子的参与启动。本研究分析表明,杜仲SQS基因均含有水杨酸及茉莉酸甲酯反应的顺式作用调节元件TCA-element和CGTCA-motif,这为杜仲三萜类药用成分的合成调控需要激素参与从分子层面上提供了依据。值得关注的是,EuSQS3基因中含有参与类黄酮生物合成调控的MYB转录因子结合位点作用元件,表明杜仲降糖降脂药用活性成分——类黄酮的合成通过MYB调控途径实现,与其它植物一致[30]。本研究对发掘的3条杜仲SQS基因进行了系统的特征信息分析,研究结果将有助于对EuSQSs基因克隆、功能分析及利用等的进一步研究。

参考文献:

[1]Kobayashi Y,Hiroi T,Araki M,et alFacilitative effects of Eucommia ulmoides on fatty acid oxidation in hypertriglyceridaemic rats[J]. Journal of the Science of Food and Agriculture,2012,92(2):358-365.

[2]冯晗,周宏灏,欧阳冬生杜仲的化学成分及药理作用研究进展[J].中国临床药理学与治疗学,2015,20(6):713-720.

[3]项丽玲,温亚娟,苗明三杜仲叶的化学、药理及临床应用分析[J].中医学报,2017,32(1):99-102.

[4]董旋,丁延庆,冉昕,等.杜仲EuCHIT1基因表达载体构建及在大肠杆菌中的表达[J].山地农业生物学报,2016,35(05):9-12.

[5]Seppo L,Jauhiainen T,Nevala R,et alPlant stanol esters in low-fat milk products lower serum total and LDL cholesterol[J]. European Journal of Nutrition,2007,46(2):111-117.

[6]丁艳霞,王腾宇,张耀文,等.杜仲雄花中三萜类化学成分研究[J].中国中药杂志,2014,39(21):4225-4229.

[7]朱振洪,沈静炎,周利萍,等.浙贝母鲨烯合酶核心功能区基因克隆与序列分析[J].生物技术,2014,24(3):1-5.

[8]Pirronen V,Lindsay D G,Miettinen T A,et alPlant sterols:biosynthesis,biological function and their importance to human nutrition[J]. Journal of the Science of Food and Agriculturc,2000:939-966.

[9]谢琴鼎,陈瑶,唐亚琴,等.植物三萜代谢途径中角鲨烯合成酶研究进展[J].分子植物育种,2018,16(9):2997-3005.

[10]KVishwakarma R,Patel K,Sonawane P,et alSqualene Synthase Gene from Medicinal HerbBacopa monniera:Molecular Characterization,Differential Expression,Comparative Modeling,and Docking Studies[J]. Plant Molecular Biology Reporter,2015,33(6):1675-1685.

[11]張志平,仇键,杨文凤,等.巴西橡胶树鲨烯合酶基因的克隆与序列分析[J].广西植物,2014,34(2):235-241.

[12]Hu B,Jin J,Guo A Y,et alGSDS 20:An upgraded gene feature visualization server[J]. Bioinformatics,2014,31(8):1296.

[13]Bailey T L,Boden M,Buske F A,et alMEME SUITE:tools for motif discovery and searching[J]. Nucleic Acids Research,2009,37(2):W202-W208.

[14]吕晶晶,张天缘,杨仕梅,等.大肠杆菌茶氨酸合成酶基因γ-GGT的生物信息学分析[J].山地农业生物学报,2019,38(01):74-78.

[15]Quinlan A RBEDTools:The Swiss-Army tool for genome feature analysis[J]. Current Protocols in Bioinformatics,2014,47(111211):11121.

[16]Quinlan A R,Hall IM. BEDTools:a flexible suite of Utilities for comparing genornic features[J].Bioinform atics,2010,26(6):841-842.

[17]陈虹君,高臻毅,郭小勤毛竹IDD基因家族启动子分析[J].福建农林大学学报(自然科学版),2016,45(4):427-433.

[18]Filiz E,Ozyigit I I,Vatansever RComparative analyses of squalene synthase (SQS)proteins in poplar and pine by using bioinformatics tools[J]. Tree Genetics & Genomes,2016,12(2):32.

[19]荣齐仙,刘春生,黄璐琦,等.甘草鲨烯合酶基因及cDNA的克隆与序列分析[J].中国中药杂志,2011,36(11):1416-1420.

[20]郑祥正葡萄鲨烯合成酶基因的克隆与序列分析[J].江西农业学报,2012,24(11):8-10,13

[21]张明哲,王真慧,张美萍,等.人参SQS和SE酶基因的克隆及其表达载体的构建[J].现代农业科技,2010,(4):20-22.

[22]Zhang B,Liu Y,Chen M,et alCloning,Expression Analysis and Functional Characterization of Squalene Synthase (SQS)from Tripterygium wilfordii[J]. Molecules,2018,23(2):269.

[23]Zhao M W,Liang W Q,Zhang D B,et alCloning and Characterization of Squalene Synthase (SQS)Gene from Ganoderma lucidum[J]. Journal of Microbiology & Biotechnology,2007,17(7):1106-1112.

[24]侯嵘,龚诺希,刘法涛,等.麻疯树鲨烯合酶基因SQS的克隆及生物信息学分析[J].热带亚热带植物学报,2011,19(5):391-399.

[25]Wang L,Wuyun T N,Du H Y,et alComplete chloroplast genome sequences of Eucommia ulmoides:genome structure and evolution[J]. Tree Genetics & Genomes,2016,12(1):12.

[26]邹琳,周洁,王晓,等.药用植物次生代谢信号转导研究进展[J].中国现代中药,2015,17(7):747-752.

[27]Ren A,Qin L,Shi L,et alMethyl jasmonate induces ganoderic acid biosynthesis in the basidiomycetous fungus,Ganoderma lucidum[J]. Bioresource Technology,2010,101(17):6785-6790.

[28]叶丽云,林强,刘梅,等.钙离子和水杨酸诱导灵芝多糖和三萜的合成[J].菌物学报,2017(02):220-228

[29]陈林,崔培梧,鲁耀邦,等.茉莉酸甲酯对茯苓三萜生物合成的调控研究[J].湖南中医药大学学报,2017(6):606-610.

[30]Ravaglia D,Espley R V,Henry-Kirk R A,et alTranscriptional regulation of flavonoid biosynthesis in nectarine (Prunus persica)by a set of R2R3 MYB transcription factors[J]. BMC Plant Biology,2013,13(1):68.

猜你喜欢

生物信息学
中药蛋白质组学研究策略
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究
案例教学法在《生物信息学》本科教学中的应用
论生物信息学研究进展及在蛋白质组学研究中的应用
农学类专业《生物信息学》课程教学改革探讨
微生物二元网络作用关系研究