螺旋藻基因组中糖苷酶类基因的序列分析
2016-02-08戴世鲲吴华莲向文洲曾海心
戴世鲲,何 慧,李 涛,吴华莲,向文洲,曾海心
(中国科学院南海海洋研究所/中国科学院热带海洋生物资源与生态重点实验室,广东 广州 510301)
螺旋藻基因组中糖苷酶类基因的序列分析
戴世鲲,何 慧,李 涛,吴华莲,向文洲,曾海心
(中国科学院南海海洋研究所/中国科学院热带海洋生物资源与生态重点实验室,广东 广州 510301)
在NCBI基因组数据库中可检索到3个钝顶螺旋藻藻株、1个极大螺旋藻藻株、1个盐泽螺旋藻藻株和1个螺旋藻属未定种的藻株基因组序列。6个螺旋藻基因组序列来源的糖苷酶基因共计32个,编码蛋白含260~1 084个氨基酸,BLAST序列比对显示,与非螺旋藻种属来源的已知序列的相似性在49%~84%之间。系统进化分析表明,32个糖苷酶基因聚类成8个簇,另有3个基因分别单独构成进化分支。酶学功能预测显示,这些糖苷酶基因分别属于8个糖苷酶家族(GH3、GH9、GH13、GH23、GH25、GH38、GH57、GH104),具有8种糖苷酶催化活性(纤维素酶、溶菌酶、α-甘露糖苷酶、α-淀粉酶、普鲁兰酶、1,4-α-葡聚糖分支酶、肽聚糖结合功能、β-葡萄糖苷酶)。
螺旋藻;基因组;糖苷酶
螺旋藻(Spirulina)是一种多细胞丝状微藻,是微藻产业的重要藻种,具有极高的开发价值。螺旋藻属于蓝藻门(Cyanophyta)、段殖藻目(Hormogonales)、颤藻科(Oscillatoriaceae)、螺旋藻属(Spirulina)。螺旋藻现已改名为节旋藻(Arthrospira),但由于螺旋藻这一名称一直被广泛使用,因而这两种名称被同时使用。目前,用于工业化生产的螺旋藻主要有钝顶螺旋藻(S.platensis)和极大螺旋藻(S.maxima)[1]。
研究发现,螺旋藻含有60%~71%的蛋白质以及其他丰富而独特的生物活性物质,如γ-亚麻酸、藻蓝蛋白、β-胡萝卜素、肌醇、螺旋藻多糖、维生素B12和大量矿质元素等,是一种国际公认的超级营养食品[1]。
多糖一般由10个以上的单糖聚合成,单糖以醛糖或酮糖的形式通过糖苷键线性或分枝连接,分为同多糖和杂多糖。螺旋藻多糖是一类重要的天然生物活性物质,是从螺旋藻藻体中提取分离出来的水溶性生物大分子,螺旋藻多糖占藻体2%~3%,具有免疫调节、抗肿瘤、抗辐射、抗衰老、抗病毒等多种生物学功能,是目前国内外海洋药物研究的热点之一[2]。螺旋藻多糖属于酸性杂多糖,组成结构复杂。一般认为,一部分多糖与蛋白质结合形成糖蛋白,多糖链有支链结构,单糖之间多数以α-糖苷键相连,也有发现存在β-糖苷键,其多糖链由岩藻糖、L-鼠李糖、D-半乳糖、D-木糖、D-甘露糖、D-葡萄糖以及葡萄糖醛酸等分子组成[3-5]。
目前对螺旋藻多糖的研究包括其生物学活性评价、多糖的提取工艺和多糖的结构组成等,但是对于螺旋藻多糖的生物学代谢过程及其相关酶类的酶学机制缺乏研究。
糖苷酶是多糖生物学代谢过程中的重要组成酶类。糖苷酶(Glycosidase)又称为糖基水解酶(Glycoside hydrolase),具有催化糖苷键水解的活性,不需要任何辅酶或辅助因子,在国际酶学命名中归位序号为EC3.2.1,根据氨基酸序列的进化关系,分为133个家族[6]。
本研究对NCBI基因组数据库中的6个不同螺旋藻基因组中的糖苷酶基因序列进行生物信息学检索和分析,为进一步对这些糖苷酶酶学性质及其螺旋藻多糖的生物代谢过程和基因工程研究提供一定理论依据。
1 材料与方法
1.1 试验材料
在NCBI(http:// www.ncbi.nlm.nih.gov/)基因组数据库中可检索到6个不同的螺旋藻基因组序列,分别是Arthrospira platensis NIES-39、Arthrospira platensis C1、Arthrospira platensis str.Paraca、Arthrospira maxima CS-328、Arthrospira sp.PCC 8005、Spirulina subsalsa PCC 9445。根据这些基因组序列的基因注释信息可检索到27个序列不同的糖苷酶基因,在NCBI数据库中的编号分别是WP_006621369、WP_006670090、Y P_0 0 5 0 6 8 5 7 3、W P_0 3 5 7 3 6 8 5 5、W P_0 0 6 6 1 6 9 3 8、W P_0 0 8 0 5 7 1 2 6、W P_0 0 6 6 2 1 4 7 0、W P_0 0 6 6 1 7 8 6 1、W P_0 0 6 6 2 5 7 8 4、W P_0 0 6 6 6 9 1 4 0、W P_0 3 3 3 7 4 2 5 8、W P_0 3 3 3 7 5 4 2 5、W P_0 0 6 6 2 5 8 1 0、W P_0 0 8 0 5 2 4 4 2、W P_0 0 6 6 1 9 7 7 5、W P_0 1 7 3 0 5 6 3 2、W P_0 0 6 6 1 7 7 2 8、W P_0 0 6 6 2 2 8 3 9、WP_006668919、YP_005069303、YP_005071301、EKD07789.1、YP_005066672、WP_014274076、YP_005068490、EKD10749.1、WP_008057264。
1.2 试验方法
在NCBI网站中使用Protein BLAST工具在GenBank的NR数据库中对27个糖苷酶氨基酸序列进行同源性比对,验证基因注释信息的正确性。并将这些氨基酸序列提交到糖苷酶类研究的相关网站dbCAN(http://csbl.bmb.uga.edu/dbCAN/annotate.php)和CAZymes Analysis Toolkit(http://cricket.ornl.gov/cgi-bin/cat.cgi)中,进行检索和比对,推测糖苷酶的家族和酶学功能[7-8]。使用Clustal X软件对糖苷酶基因的氨基酸序列进行多序列比对。由MEGA软件根据邻位相连法(NeighborJointing method,NJ)构建系统进化树,用Bootstrap进行检验,重复次数为1 000次,分析其可靠性[9]。
2 结果与分析
2.1 螺旋藻基因组序列概况
目前在NCBI基因组数据库中可检索到3个钝顶螺旋藻藻株(Arthrospira platensis NIES-39、Arthrospira platensis C1、Arthrospira platensis str.Paraca)、1个极大螺旋藻藻株(Arthrospira maxima CS-328)和另外2个螺旋藻种属(Arthrospira sp.PCC 8005、Spirulina subsalsa PCC 9445盐泽螺旋藻)的基因组序列(表1)。典型的螺旋藻基因组大小为5.0~6.7 Mb,平均GC含量为44.3%~44.8%,基因组中被注释的基因数有4 515~6 094个[10-13]。2个钝顶螺旋藻藻株A.platensis NIES-39和A.platensis C1已经得到整个基因组图谱。
表1 NCBI数据库中螺旋藻基因组序列的基本信息
2.2 螺旋藻基因组中糖苷酶基因的多样性
来源于上述6个螺旋藻基因组序列的糖苷酶基因共计32个,其中来自A.platensis NIES-39有5个,来自A.platensis C1有7个,来自A.platensis str.Paraca有6个,来自A.maxima CS-328有5个,来自Arthrospira sp.PCC 8005有6个,来自Spirulina subsalsa PCC 9445有3个。其中来源于A.platensis C1的3条基因的氨基酸序列与来源于Arthrospira sp.PCC 8005的3条序列两两完全一致,分别是WP_006621369、WP_006625784、WP_006622839;A.platensis C1的另外2条基因与来源于A.maxima CS-328的2条序列两两完全一致,分别是WP_006621470、WP_006625810。因此,32条糖苷酶基因中具有不同氨基酸序列的有27条。
图1 6个螺旋藻基因组中糖苷酶基因的系统进化树
糖苷酶基因系统进化树(图1)中代表序列(表2)的比对分析结果表明,这些糖苷酶基因编码蛋白含260~1 084个氨基酸,与非螺旋藻种属来源的已知序列的相似性为49%~84%,既具有较高的同源性,也存在很大的差异,其酶学性质均未得到充分阐明。序列比对中同源性最高的非螺旋藻种属序列均来自蓝藻门(表2),分别为Lyngbya(鞘丝藻属)、Oscillatoria(颤藻属)、Crinalium(发毛针藻属)、Filamentous cyanobacterium(丝状蓝藻)、Tolypothrix(单歧藻属)、Planktothrix(浮游蓝丝藻属)。
表2 糖苷酶基因系统进化树中代表序列的比对分析
系统进化分析结果(图1)表明,32个糖苷酶基因聚类成8个簇,另有Arthrospira platensis NIES-39的1条基因和Spirulina subsalsa PCC9445的2条基因分别单独构成1个进化分支。同一进化簇中的基因同源性很高,但是8个簇和3个单独分支之间的同源性很低,同一簇中均为来自不同藻株的基因。进化簇与非螺旋藻种属来源的已知序列相似性高于70%的只有簇Ⅴ和簇Ⅷ,其他6个簇和3个单独分支的序列相似性均低于70%。
2.3 螺旋藻基因组中糖苷酶基因的功能预测
选取8个进化簇的代表序列和3个单独分支序列在GenBank的NR数据库中进行氨基酸序列比对分析,对酶蛋白保守的结构功能域进行分析,并将序列提交至糖苷酶类的分析网站dbCAN和CAZymes Analysis Toolkit,对糖苷酶的酶学功能进行预测,结果(表2)表明,这些糖苷酶基因分别归属于GH3、GH9、GH13、GH23、GH25、GH38、GH57、GH104等8个糖苷酶家族,具有的酶催化活性包括纤维素酶、溶菌酶、α-甘露糖苷酶、α-淀粉酶、普鲁兰酶、1,4-α-葡聚糖分支酶、肽聚糖结合功能、β-葡萄糖苷酶。
将属于GH3家族的簇Ⅶ和Ⅷ的5条序列进行同源性比对分析,在2个簇内部分别具有非常高的同源性,同时2个簇之间在53个氨基酸位点具有保守性(图2),这与2个簇属于同一个糖苷酶家族但具有2种不同的酶活性的预测结果一致。而属于GH57家族的7条序列具有3种不同的糖苷酶活性,序列比对分析显示,7条序列仅存在18个保守位点,同时S.subsalsa PCC9445来源的2条单独分支的序列之间同源性很低(图3)。
图2 GH3家族糖苷酶基因的氨基酸序列比对
图3 GH57家族糖苷酶基因的氨基酸序列比对
3 结论与讨论
在NCBI基因组数据库中可检索到6个螺旋藻基因组序列,包含糖苷酶基因32个,其中具有不同氨基酸序列的有27条。系统进化分析显示,32个糖苷酶基因聚类成8个簇和3个单独的进化分支。对这些糖苷酶基因的酶学功能进行预测,结果显示分别属于8个糖苷酶家族,具有8种糖苷酶催化活性。6个螺旋藻藻株中的4个藻株(A.platensis C1、A.platensis str.Paraca、A.maxima CS-328、Arthrospira sp.PCC 8005)的5个糖苷酶基因共同归于进化簇Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,显示这4个藻株的糖苷酶基因具有很高的同源性。而A.platensis NIES-39藻株的5个糖苷酶基因则有明显差异,分别归于簇Ⅰ、Ⅵ、Ⅶ、Ⅷ和1个单独的进化分支。Spirulina subsalsa PCC 9445藻株(盐泽螺旋藻)的3个糖苷酶基因尤为特殊,均属于GH57家族,其中2条序列为单独的进化分支,另一条序列在簇Ⅴ中与其他4条序列的进化关系也比较远。
糖苷酶在生物体的糖和糖缀合物的水解与合成过程中具有重要作用,对其性质和功能的研究一直是生物学和糖生物学研究的热点。螺旋藻多糖组成结构复杂,由于多糖类物质分离纯化困难,以及各种分离检测方法等存在一定差异,导致可能得出不同的结果,因此仅通过螺旋藻多糖准确的一级结构推测多糖的生物合成过程具有很大难度。利用螺旋藻基因组信息,从多糖合成相关酶类基因的角度,通过对螺旋藻糖苷酶酶学催化机制的阐明,可为螺旋藻多糖生物学合成过程的研究及其基因工程提供有力支撑。
糖苷酶具有很高的应用价值,可用于酶法制备功能性低聚糖。低聚糖又称寡糖(Oligosaccharide),由2~10个单糖聚合成。功能性低聚糖有利于人体肠道中的双歧杆菌等有益菌群,调节肠道微生态系统,从而促进健康。此外,还具有非致龋齿性和良好的口感等特点,因此被用作功能性食品添加剂[14]。目前,利用糖苷酶水解天然多糖或利用糖苷酶酶法合成是功能性低聚糖生产的重要方式[15]。32条螺旋藻糖苷酶基因中有24条序列与非螺旋藻种属来源的已知序列的相似性均低于70%,这些酶基因必然具有未知的、不同的酶学性质和催化活性。通过深入研究这些螺旋藻糖苷酶,能够为螺旋藻产业多元化发展提供一定的应用基础。
[1] 向文洲,李涛,吴华莲,等.我国大力发展海水螺旋藻(节旋藻)产业的战略思考[J].广西科学,2014,21(6):1-7.
[2] 崔叶洁,胡滨.螺旋藻多糖的生理功能及其修饰改性研究[J].食品工业科技,2010,31(4):405-407.
[3] 孙鹏,胡君艳,李瑞强.螺旋藻多糖的结构及生物学活性研究[J].中国生化药物杂志,2005,26(3):185-187.
[4] 涂芳,杨芳,郑文杰.螺旋藻多糖的研究进展[J].天然产物研究与开发,2005,17(1):115-118.
[5] 张芳,王旻,尹洪萍.螺旋藻多糖的性质结构研究[J].药物生物技术,2004,11(6):389-391.
[6] Vuong T V,Wilson D B.Glycoside hydrolases:catalytic base/nucleophile diversity[J].Biotechnol Bioeng,2010,107(2):195-205.
[7] Yin Y,Mao X,Yang J C,et al.dbCAN:a web resource for automated carbohydrate-active enzyme annotation[J].Nucleic Acids Res,2012,40:W445-W451.
[8] Park B H,Karpinets T V,Syed M H,et al.CAZymes Analysis Toolkit(CAT):web service for searching and analyzing carbohydrate-active enzymes in a newly sequenced organism using CAZy database[J].Glycobiology,2010,20(12):1574-1584.
[9] Tamura K 1,Peterson D,Peterson N,et al.MEGA5:molecular evolutionary genetics analysis using maximum likelihood,evolutionarydistance,and maximum parsimony methods[J].Molecular Biology and Evolution,2011,28:2731-2739.
[10] Cheevadhanarak S,Paithoonrangsarid K,Prommeenate P,et al.Draft genome sequence of Arthrospira platensis C1(PCC9438)[J].Stand Genomic Sci,2012,6(1):43-53.
[11] Janssen P J,Morin N,Mergeay M,et al.Genome sequence of the edible cyanobacterium Arthrospira sp.PCC 8005[J].J Bacteriol,2010,192(9):2465-2466.
[12] Fujisawa T,Narikawa R,Okamoto S,et al.Genomic structure of an economically important cyanobacterium,Arthrospira(Spirulina)platensis NIES-39[J].DNA Res,2010,17(2):85-103.
[13] Lefort F,Calmin G,Crovadore J,et al.Whole-Genome Shotgun Sequence of Arthrospira platensis Strain Paraca,a Cultivated and Edible Cyanobacterium[J].Genome Announc,2014,2(4).pii:e00751-14.
[14] 张雪云.功能性低聚糖制备研究进展[J].粮食与油脂,2012(10):45-48.
[15] Honda Y,Fushinobu S,Hidaka M,et al.Alternative strategy for converting an inverting glycoside hydrolase into a glycosynthase[J].Glycobiology,2008,18(4):325-30.
(责任编辑 崔建勋)
Sequence analysis of glycosidase genes in Spirulina (Arthrospira) genome
DAI Shi-kun,HE Hui,LI Tao,WU Hua-lian,XIANG Wen-zhou,ZENG Hai-xin
(South China Sea Institute of Oceanology,Chinese Academy of Sciences/ Key Laboratory of Tropical Marine Bio-resources and Ecology,Guangzhou 510301,China)
There are genome sequences of three Arthrospira platensis strains,an Arthrospira maxima strain,a Spirulina subsalsa strain,an Arthrospira sp.strain in the NCBI genome database up to date.32 glycosidase genes can be retrieved from the 6 Spirulina genome sequences,which have 260-1 084 amino acids in length.By BLAST analysis in GenBank,the similarity with the known sequences from the non-Spirulina species was 49%-84%.Phylogenetic analysis indicated that the 32 glucosidase genes were divided into 8 groups,and the other 3 genes constituted an independent evolutionary branch,respectively.The enzyme function prediction of these glucosidase genes showed that they belonged to 8 glucosidase families: GH3,GH9,GH13,GH23,GH25,GH38,GH57,GH104,and 8 kinds of glycosidase catalytic activity: cellulase,lysozyme,α-mannosidase,α-amylase,pullulanase,1,4-α-glycogen branching enzyme,peptidoglycan binding function,β-glucosidase.
Spirulina; genome; glycosidase
Q754
A
1004-874X(2016)12-0115-07
10.16768/j.issn.1004-874X.2016.12.020
2016-08-11
海南省科技兴海专项(2015XH04);广东省海洋渔业科技与产业发展专项(A201501C09)
戴世鲲(1977-),男,博士,助理研究员,E-mail:deepseabio@163.com
戴世鲲,何慧,李涛,等.螺旋藻基因组中糖苷酶类基因的序列分析[J].广东农业科学,2016,43(11):115-121.