APP下载

陆地棉KASII酶蛋白结构分析

2017-04-20郝青婷刘宝玲吉夏洁李润植薛金爱

山西农业科学 2017年4期
关键词:油脂脂肪酸氨基酸

郝青婷,刘宝玲,吉夏洁,李润植,薛金爱

(山西农业大学分子农业与生物能源研究所,山西太谷030801)

陆地棉KASII酶蛋白结构分析

郝青婷,刘宝玲,吉夏洁,李润植,薛金爱

(山西农业大学分子农业与生物能源研究所,山西太谷030801)

β-酮脂酰-ACP合成酶II(KASII)(EC:2.3.1.179)是控制植物细胞脂肪酸合成和16C与18C脂肪酸比值的关键酶,亦是植物油脂代谢修饰的分子靶标。应用基因组学分析工具从陆地棉(Gossypium hirsutum)基因组鉴定获得一个与已知KASII高度同源的棉花KASII基因GhKASII,编码576个氨基酸肽链,其分子量为61.8 kDa,理论等电点为8.83。蛋白结构预测分析显示,GhKASII蛋白为可溶性酶蛋白,具有质体转运肽,定位于质体中;GhKASII蛋白二级结构主要形式为α-螺旋(32.99%)和无规则卷曲(36.63%)。3D结构模拟表明,GhKASII蛋白为同源二聚体,由2个相同的亚基构成,空间构型为紧密的心形结构。蛋白序列多重比对发现,GhKASII与雷蒙德氏棉、亚洲棉、可可树的KASII蛋白亲缘关系较近,植物KASII蛋白C端保守性高,N端变异大。GhKASII蛋白保守的酶催化活性域位于318~334位(氨基酸残基),其关键酶活位点是位于327位的半胱氨酸。研究结果可为深入解析棉花等油料作物的脂肪酸生物合成机制及油脂遗传改良提供科学参考。

陆地棉;β-酮脂酰-ACP合成酶II(KASII);油脂;生物信息学

脂肪酸组成决定着植物油脂的理化性质和用途。高等植物细胞中脂肪酸从头合成主要发生在质体中[1],涉及到一系列酶促反应。脂肪酸从头合成的前体物质是乙酰-辅酶A(acetyl-CoA),其在乙酰辅酶A羧化酶(ACCase)催化下合成丙二酰-辅酶A(malonyl-CoA),再进一步在丙二酰辅酶A:酰基载体蛋白S-丙二酰基转移酶(MAT)催化下,丙二酰基被转移到酰基载体蛋白(ACP)上,生成丙二酰-ACP,作为合成脂肪酸的碳供体。丙二酰-ACP经脂肪酸合酶复合体(FAS)催化,进行连续循环的聚合反应,每次循环增加2个碳的酰基碳链,直至合成含有ACP的饱和脂肪酸16∶0-ACP和18∶0-ACP,其中,催化16∶0-ACP生成18∶0-ACP的是β-酮脂酰-ACP合成酶II(KASII)。16∶0-ACP生成18∶0-ACP可在酰基-ACP硫酯酶(FAT)催化下,将脂肪酸从ACP上释放出来,再在酰基CoA合成酶(ACS)的作用下生成16∶0-CoA和18∶0-CoA,并从质体转出进入内质网,参与膜脂和三酰甘油(TAG)等合成。因此,KASII是决定植物细胞内16C和18C脂肪酸比值大小的关键酶。一些研究还显示,KASII参与植物对低温环境的响应以及与植物生长发育状况密切相关[2]。然而,高等植物KASII基因突变通常是致死突变,这限制了有关KASII基因及其编码蛋白功能的深入研究和在脂质代谢工程中的应用[3]。

棉花既是优异纤维作物,也是重要的油料作物。陆地棉剥壳后棉籽的棉仁油分含量能够达到30%~40%,棉籽油有较高的营养价值,是优质的食用油[4],棉籽油含有丰富的人体所必需的不饱和脂肪酸,如亚油酸(C18∶2)的含量可达50%以上(54%),是所有食用油中含量最高的;另外还含有油酸(C18∶1,占18%)和亚麻油酸(C18∶3,约占1%)等不饱和脂肪酸。陆地棉棉籽仁中脂肪酸的含量不仅高于油菜和大豆,并且不含有对人体有害的芥酸[5]。棉籽油除了可以用于生活食用油外,还是重要的化学工业原料[6],可用于制取生物柴油[7]。解析参与棉花脂肪酸生物合成的关键酶蛋白及其作用机制,可为棉籽油品质改良及油脂产品的开发提供科学指导。已有棉花和其他植物KASII基因克隆的报道[1],但对KASII酶蛋白结构特征还知之甚少。新近公布的陆地棉基因组序列[8],为深入研究参与油脂等代谢各类基因及其编码蛋白的功能奠定了序列平台。

本研究利用基因组学工具,从陆地棉基因组中鉴定获得棉花GhKASII基因,并对编码酶蛋白的理化性质、亚细胞定位、蛋白序列及3D结构特征、酶活性域和关键酶活位点等蛋白结构信息和系统发育进行了预测分析,结果将为未来全面研究棉花GhKASII基因及其编码蛋白质在油脂合成途径中行使功能的具体分子机制,以及该酶基因在高值油脂品种培育的代谢工程中应用等奠定基础。

1 材料和方法

1.1 数据来源

在NCBI的Genbank数据库中查找到拟南芥KASII基因(β-酮脂酰-ACP合成酶Ⅱ基因)(Genbank ID:AF318307.1),通过Blastp比对在棉花数据库(https://www.cottongen.org/)中,得到与之高度同源的KASII蛋白序列,并且通过NCBI CDD数据库(http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)鉴定为真正的棉花β-酮脂酰-ACP合成酶Ⅱ蛋白序列(图1),该蛋白序列将用于后续分析。

陆地棉KASII基因的cDNA及其蛋白序列(Genbank ID:KF611921.1/AIL53811.1)和另外19个物种的KASⅡ蛋白序列均来源于NCBI(http://www. ncbi.nlm.nih.gov/)中的Genbank数据库,其相应的蛋白序列及Genbank号分别为:可可(Theobroma cacao,XP_007012567.2)、亚洲棉(Gossypium arboreum,XP_017620024.1)、雷蒙德氏棉(Gossypium raimondii,XP_012463810.1)、落花生(Arachis duranensis,XP_015972847.1)、紫苏(Perilla frutescens,AAC04692.1)、桑树(Morus notabilis,XP_010089666. 1)、麻风树(Jatropha curcas,XP_012077111.1)、葡萄(Vitis vinifera,XP_002276214.1)、向日葵(Helianthus annuus,ABI18155.1)、亚麻荠(Camelina sativa,NP_ 001289900.1)、蓖麻(Ricinus communis,AAA33872. 1)、油棕(Elaeis oleifera,AAF26738.2)、芝麻(Sesamum indicum,XP_011093876.1)、巨桉(Eucalyptus grandis,AAF26738.2)、胡杨(Populus euphratica,XP_011039936.1)、芥菜型油菜(Brassica napus,AA F61739.1)、拟南芥(Arabidopsis thaliana,AAK69603. 1)、大豆(Glycine max,KASIIA,AAW88763.1;KASIIB,AAW88762.1)、红花(Carthamus tinctorius,AGC65509.1)。

1.2 数据分析方法

利用美国国家生物技术信息中心NCBI的ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)工具在线分析棉花GhKASII基因的ORF[9];利用Ex-Pasy的ProtParam(http://web.expasy.org/protparam/)在线工具分析GhKASII编码蛋白的氨基酸组成、数目、蛋白质相对分子质量、理论等电点、原子数量和原子组成、半衰期、疏水指数等理化性质[9];通过在线工具Target P 1.1 Server(http://www.cbs.dtu.dk/services/TargetP-1.1/)对该蛋白进行亚细胞定位;使用在线网站TMHMM[10](http://www.cbs.dtu.dk/services/ TMHMM/)和ProtScale(http://web.expasy.org/protsc-ale/)分析其跨膜结构和疏水区;运用SOPMA(http://metadatabase.org/wiki/SOPMA)预测GhKASII的二级结构;使用SWISS-MODEL网站(http://swissmodel.expasy.org/)对GhKASII的三级结构进行同源建模,并在Rasmol软件查看其三维构型;使用Genedoc和MEGA6.06软件对GhKASII和另外19个物种的KASII蛋白进行ClustalW多序列比对;并采用邻接法(Neighbor-Joining,N-J)构建无根系统发育树,自举检验值设为1 000个循环,采用p-distance模式。

2 结果与分析

2.1 陆地棉GhKASII蛋白理化性质分析

陆地棉GhKASII基因编码序列全长为2268bp,使用在线开放阅读框工具ORF Finder分析,其开放阅读框(ORF)的长度为1 731 bp,得到的氨基酸序列全长为576个氨基酸,起始密码子和终止密码子分别为ATG,TAA。陆地棉GhKASII基因编码的蛋白质含有C,H,O,N,S共5种原子,其分子式为C2702H4270N772O815S37,分子量为61.8 kDa,理论等电点为8.83,摩尔消光系数为51880,酸性氨基酸有48个,碱性氨基酸有58个,即带电荷的氨基酸占氨基酸总数的比例为18.4%。含量较高的氨基酸及其比例分别为Gly,10.1%;Ala,9.7%;Ser,8.9%;Leu,7.5%;Asn,6.1%;Val,5.9%,甲硫氨酸(Met)位于序列的氨基端。该蛋白质的不稳定指数为42.36,在生理条件下为不稳定蛋白(一般小于40视为稳定)。

2.2 陆地棉KASII蛋白的基础结构分析

经过TargetP 1.1分析,陆地棉GhKASII蛋白含有叶绿体转运肽,cTP值为0.818(大于0.73),定位于质体中。该蛋白不存在跨膜现象,N端存在叶绿体转运肽剪切位点,说明该蛋白在细胞质核糖体上合成后通过转运肽引导进入质体中,然后催化16∶ 0-ACP脂酰链的羧基端延长为18∶0-ACP。经疏水性检测分析(图2),结果发现,该GhKASII多肽链中分值最低的氨基酸是Arg精氨酸(-3.222),亲水性最强;分值最高的是甘氨酸(2.378),疏水性最强。该蛋白有3个明显的亲水区,分别为:121~142位氨基酸,244~263位氨基酸,372~394位氨基酸,与上述GhKASII蛋白的亲水性相一致。

2.3 陆地棉KASII蛋白序列的高级结构分析

运用SOPMA在线预测软件对棉花KASII蛋白进行二级结构的预测(图3),构成该蛋白质二级结构的主要形式为:α-螺旋占32.99%,延伸链占20.66%,无规则卷曲占36.63%,而β-转角所占的比例较少,仅为9.72%。使用在线工具Swiss-model通过同源建模的方式对陆地棉KASII三级结构进行预测(图4),结果显示,陆地棉KASII蛋白的氨基酸序列与模板序列的一致性达到47.16%,整体呈现为一个紧密的心形结构,X-射线晶体衍射发现,该蛋白是同源二聚体,由2个相同的亚基组成。

2.4 陆地棉KASII蛋白的氨基酸多序列比对

使用Genedoc软件对陆地棉与其他物种KASII蛋白进行多序列比对分析,结果显示,这些植物的KASII蛋白与陆地棉KASII蛋白均具有较高的同源性,序列一致性可达到75%以上。结合Blastp分析表明,与GhKASII蛋白序列相似性最高的是雷蒙德式棉和亚洲棉的KASII序列,相似度为99%,与可可的相似度为90%,其次是亚麻荠,相似度是80%。可见,不同植物的KASII蛋白的功能区极其保守,但是肽链的N端在序列长度和氨基酸组成上有着很大的差异(图5),且因物种不同而序列差异大小都不相同。在PROSITE数据库中分析GhKASII的氨基酸序列发现,其存在一个酶催化活性区域,位于318~334位氨基酸(GPNYSISTACATSNFCI),327位的半胱氨酸是关键的酶活位点,已有人在花生的KASII蛋白序列中发现了相同活性位点的存在[11]。多序列分析结果发现,所有物种都有该段保守区段,催化脂肪酸碳链的延长。推测,由于β-酮脂酰-ACP合成酶是植物油脂代谢过程中十六碳脂肪酸碳链延长的关键催化剂,因此,其序列的稳定遗传性和物种间进化趋同性明显表现出其结构与功能的重要性。

2.5 陆地棉KASII蛋白系统进化分析

进化树是在使用MEGA 6.06软件进行Clustal W多序列比对基础上,运用邻接法(Neighbor-Joining,即N-J法)设置,重复循环数为1 000,构建系统发育树,结果如图6所示。依据系统发育关系,从上往下可大体划分为7组,陆地棉KASII蛋白与同属锦葵科的亚洲棉、雷蒙德氏棉及梧桐科的可可的KASII蛋白聚类在一起,它们同属于锦葵目,说明这些KASII蛋白更多参与植物体内脂肪酸链的延长反应,在影响植物体内不同链长脂肪酸的比例方面起着至关重要的作用。植物间这种序列、结构和功能分化如此明显的现象与各物种在漫长进化过程中适应不同环境、执行不同的功能有着密切的联系。

3 讨论与结论

β-酮脂酰-ACP合成酶II(KASII)主要存在于植物和细菌中,是脂肪酸合成途径中催化16∶0-ACP延长为18∶0-ACP的关键酶,是决定最终油脂成分用途的关键因素。除此之外,脂肪酸可以通过不同代谢途径形成一组功能相关、结构各异的化合物,这些化合物可以作为信号分子,控制相关基因的转录,调节相关蛋白质的表达,从而提高植物对不良环境的免疫能力,增强植物对伤、病、冻害等胁迫的抗性[12]。目前,关于KASII研究较多的是拟南芥和油菜[13-15],但国内外对它的研究相对较少。本研究对KASII及其编码的蛋白的结构和理化性质的分析和预测将为深入系统地了解该酶提供一定的参考作用。本研究结果表明,陆地棉KASII蛋白分子量为61.8 kDa,活性最适pH为8.83,并且含有大量的中性小分子氨基酸,如Gly,Ala和Ser;该蛋白被预测带有一个叶绿体转运肽,合成后将进入质体发挥作用,是一个非跨膜的亲水性蛋白;KASII蛋白是以同源二聚体的形式存在,整体呈一个紧密的心形结构;与GhKASII序列相似性最高的是雷蒙德式棉和亚洲棉,高达99%,并含有一个活性位点,除雷蒙德式棉和亚洲棉外,GhKASII与可可也有较近的亲缘关系。

早在1980年,JEFFREY等[16]就详细研究了大肠杆菌KASII蛋白的结构,酶学和遗传学特点,随后的相关研究也是以细菌为主。本研究对油料作物陆地棉KASII单个蛋白进行了一系列生物信息学分析,将为后期继续研究陆地棉β-酮脂酰-ACP合成酶II基因家族控制油料作物16C脂肪酸和18C脂肪酸的合成比例及影响油料作物油脂用途等提供一系列理论基础,从而在分子水平上通过基因工程对陆地棉的油脂合成途径进行遗传改良,最终提高油脂的产量和品质,获得所需要的产物。因此,本研究所做的一系列上游分析为后续的实验验证该蛋白的表达和功能提供了较好的参考价值。

[1]董佳,魏利斌,胡艳,等.棉花4个脂肪酸合成相关基因的克隆和表达特征分析[J].作物学报,2010(12):2084-2090.

[2]SELCUK ASLAN,PER HOFVANDAER,PARESH DUTTA,et al. Transient silencingof the KASII genes is feasible in Nicotiana benthamiana for metabolic engineeringof waxester composition[J].Scientific Report,2015,11:1.

[3]禹山林,杨庆利,任增凯,等.花生β-酮脂酰-ACP合成酶Ⅱ基因的克隆与表达分析[C]//科技部863计划现代农业技术领域办公室.全国植物分子育种研讨会摘要集.北京:科技部863计划现代农业技术领域办公室,2009:1-2.

[4]李文峰,李超,周治国,等.基于异速生长关系的棉籽油分含量模拟模型[J].作物杂志,2012(1):22-25.

[5]沈端庄,钱思颖,刘桂林,等.陆地棉棉仁蛋白质、脂肪及脂肪酸含量[J].作物品种资源,1987(4):21-22,40.

[6]徐鹏,张香桂,沈新莲.棉籽营养品质性状的研究进展[J].江苏农业学报,2009(5):1173-1177.

[7]张欢,孟永彪.用棉籽油制备生物柴油[J].化工进展,2007(1):86-89.

[8]TIANZHEN Z,YAN H,WENKAI J,et al.Sequencing of allotetraploid cotton(Gossypium hirsutum L.acc.TM-1)provides a resource for fiber improvement[J].Nature Biotechnology,2015,33:531-537.

[9]肖向文,朱奇朗,刘海峰,等.棕色棉DFR基因的克隆与生物信息学分析[J].生物技术通报,2014(5):90.

[10]谢冰心.拟南芥SPO11基因的生物信息学分析[D].郑州:郑州大学,2014:33-34.

[11]禹山林.花生脂肪酸代谢关键酶基因的克隆与表达分析[D].南京:南京农业大学,2008.

[12]刘丽,赵鹏,王丹,等.棉花3个脂肪酸碳链延长基因的cDNA克隆和表达分析[J].中国农业科学,2013(17):3523-3533.

[13]MACKINTOSH ROBERT W,HARDIE D GRAHAME,SLABAS ANTONI R,et al.A new assay procedure induction of β-ketoacyl-ACP synthase I and II,and the complete purification of β-ketoacyl-ACP synthase I fromdevelopingseeds ofoil seed rape(Brassica napus)[J].Biochimica et Biophysica Acta,1989,1002:114-124.

[14]ANTONI R SLABAS,DIANA CHASE,IKUO NISHIDA,et al. Molecular cloning of higher-plant 3-oxoacyl-(acyl carrier protein)reductase[J].Biochemical Journal,1992,283:321-326.

[15]HIROKAZU HALOZAKI,JONG I P,MAKOTO ENDO,et al.Expression and development function of the 3-ketoacyl-ACP synthase2 gene in Arabidopsis thaliana[J].Genes&Genetic Systems,2008,83:143-152.

[16]JEFFREY L GARWIN,AMY L KLAGESG,JOHN E CRONAN J R.Structural,enzymatic,and genetic studies of β-Ketoacyl-Acyl carrier protein synthases I and II ofEscherichia coli[J].The Journal ofBiological Chemistry,1980,255(24):11949-11956.

Protein Structure Analysis of a KASII Enzyme inGossypium hirsutum

HAOQingting,LIUBaoling,JI Xiajie,LI Runzhi,XUE Jin'ai
(Institute ofMolecular Agriculture and Bioenergy,Shanxi Agricultural University,Taigu 030801,China)

β-ketoacyl-ACP synthase II(KASII)(EC:2.3.1.179)is a key enzyme responsible for fatty acid synthesis and the ratio of16C/18C fatty acid in plant cells.It is also the molecular target for lipid metabolism modification.In this study,genomics analysis tools were employed to obtain a GhKASII gene from upland cotton(Gossypium hirsutum)genome,which was highly homologous to the known KASII genes.GhKASII gene encoded 576-amino acid peptide with a predicted molecular mass of about 61.8 kDa and a PI of 8.83. Protein structure prediction showed that GhKASII protein was a soluble protein with a plastid transit peptide,and located in the plastid. Secondarystructure ofGhKASII were made up of α-helices(32.99%)and random coils(36.63%).Three-dimensional(3D)structure modeling revealed that the GhKASII protein was a homodimer consisting oftwo same subunits,and the spatial configuration was a tightly heart-shaped structure.Multiple sequence alignment showed that GhKASII was much closely to the KASII proteins from Raymond cotton,Asian cotton and cacaotree evolutionally.The C-terminus ofKASII proteins was highlyconserved whereas N-terminus was highly variable.The enzyme-active domain of GhKASII protein was located between 318 and 334 amino acid residues with the conserved Cys(327)as the key active site.The results of the study will provide a scientific reference for further understanding the fatty acid biosynthesis mechanismand genetic improvement ofcotton and other oil crops.

Gossypium hirsutum;β-ketoacyl-ACP synthase II(KASII);lipid;bioinformatics

S562

A

1002-2481(2017)04-0505-05

10.3969/j.issn.1002-2481.2017.04.04

2016-12-28

国家自然科学基金项目(31501323);国家“948”项目(2014-Z39);山西省煤基重点科技攻关项目(FT-2014-01);山西省科技专项(201603D312005)

郝青婷(1992-),女,山西平遥人,在读硕士,研究方向:分子遗传与基因工程。薛金爱为通信作者。

猜你喜欢

油脂脂肪酸氨基酸
揭开反式脂肪酸的真面目
A taste of Peking duck
Al-Zr-CeO2固体酸催化剂的制备及其油脂环氧化性能
月桂酰丙氨基酸钠的抑菌性能研究
中国油脂
荷莲荳脂肪酸成分分析
揭开反式脂肪酸的真面目
UFLC-QTRAP-MS/MS法同时测定绞股蓝中11种氨基酸
欢迎订阅2019年《中国油脂》
一株Nsp2蛋白自然缺失123个氨基酸的PRRSV分离和鉴定