灰盖拟鬼伞GH9家族内切葡聚糖酶的生物信息学分析
2021-11-26柴倩囡韩彦弟张富霞王文丽邵莉桃王璐杰汉佳昕
柴倩囡 韩彦弟 张富霞 王文丽 邵莉桃 王璐杰汉佳昕 胡 娇 牛 鑫,*
(1.河西学院甘肃省应用真菌工程实验室/甘肃省食用菌遗传育种重点实验室/祁连山食用菌产业协同创新中心;2.河西学院农业与生态工程学院;3.河西学院生命科学与工程学院,甘肃 张掖 734000)
我国农作物秸秆的产量巨大,每年有8亿t左右,约占全球总量的20%[1].秸秆主要由纤维素、半纤维素、木质素及少量细胞壁蛋白组成,其中纤维素约占秸秆干重的40%到50%[1,2].目前,我国秸秆的利用率不高,绝大部分丢弃于农田或就地焚烧,不仅污染环境还浪费自然资源[3,4].纤维素是一种由D型葡萄糖通过β-1,4-糖苷键形成的直链均聚物,聚合度在3000以上,是自然界中最丰富的可再生资源[5].因此,如何将纤维素转化为燃料、生物塑料和酶等高附加值产品成为当前研究的热点,而真菌是生产纤维素酶的首选[6].灰盖拟鬼伞是一种食用真菌[7],属于中高温菌,喜湿热环境,简单易培养,仅两周即可完成整个生活史,其天然培养基为马粪[8],能够仅利用稻草秸秆为培养基生长并产生子实体,但因其子实体较小,且易自溶,因此,其栽培和食用价值有限.灰盖拟鬼伞属于白腐真菌能降解纤维素和木质素,可用于秸秆或园林绿化废弃物等的固体发酵[9].
纤维素酶是多种水解酶的统称,根据作用方式和对底物的特异性,可分为内切葡聚糖酶(EC 3.2.1.4)、外切葡聚糖酶(EC 3.2.1.74和EC 3.2.1.91)和β-葡糖苷酶(EC 3.2.1.21)[10].内切葡聚糖酶通过随机作用于纤维素链生成纤维寡糖,外切葡聚糖酶裂解纤维素链末端生成纤维二糖[11].纤维二糖通过纤维二糖酶(亦称β-葡糖苷酶)水解生成葡萄糖[12].三种酶通过协同机制高效地分解纤维素类生物质.内切葡聚糖酶存在于许多糖基水解酶家族,通常真菌内切葡聚糖酶含有CBM1s 模块,主要分布在GH5、7、9、12和45等家族中[13].GH9家族成员大部分具有纤维素酶活性,GH9糖苷水解酶家族以前被称为“纤维素酶家族E”[14].一些来自梭状芽胞杆菌属(Clostridia)[15]和拟杆菌属(Bacteroides)[16,17]的GH9成员被证明具有内切木葡聚糖酶(EC 3.2.1.151)或混合键连的内切葡聚糖酶(EC 3.2.1.73)活性.另外,在该家族中成员中也发现具有外切-β-氨基葡萄糖酶(EC 3.2.1.165)[15,18].GH9家族的所有持续性内切葡聚糖酶都包含一个3c CBM结构,并严格地附着在GH9催化结构域的c端.该结构域是活性位点的一部分,并且对持续水解至关重要[19].CBM3c结构域与纤维素的结合很弱,因为它们缺乏一些保守的芳香族残基,而这些残基在3a和3b家族成员中对纤维素结合很重要[20].所有已知的植物纤维素酶都属于GH9,其他大多数GH9成员分布在真细菌中,但也有两个古细菌成员和一些真菌、蚯蚓、节肢动物、脊索动物、棘皮动物和软体动物成员中鉴定到GH9家族水解酶.GH9中有两个亚群E1和E2,E1只包含来自细菌的纤维素酶,包括来自好氧菌和厌氧菌的纤维素酶,E2包含一些细菌和所有非细菌纤维素酶[21].进化研究表明,真核生物GH9成员包含两个古老的单系群:一个包括所有动物成员,另一个包括所有植物成员[22].所有已知的持续性内切葡聚糖酶基因都属于E1亚组.迄今为止,已研究的大多数植物GH9家族水解酶都是内切葡聚糖酶(EC 3.2.1.4),对结晶纤维素几乎没有活性,但对可溶性纤维素衍生物有明显的活性,如羧甲基纤维素(CMC)[23].由于GH9酶的广泛分布和数量众多,植物GH9酶可进一步细分为三大类[24],A类蛋白质是膜锚定的,B类蛋白质是分泌性的,C类蛋白质也是分泌性的,但含有家族49碳水化合物结合模块(CBM49)[25].而对于真菌GH9 家族成员的研究较少.本研究采用生物信息学分析方法,对灰盖拟鬼伞的GH9 蛋白(Cc_GH9)的基本理化性质、亚细胞定位、信号肽、跨膜结构、二级结构、三级结构、磷酸化位点、糖基化位点、功能结构域、系统发育和基序进行了分析,为后续Cc_GH9在灰盖拟鬼伞纤维素酶参与子实体生长发育过程机制的研究奠定基础,也为真菌GH9家族纤维素酶的开发提供新思路.
1 材料与方法
1.1 数据来源
试验中Cc_GH9 序列来源于美国国家生物技术中心(national center for biotechnology information,简称NCBI)数据库,蛋白名称为9 glycosyl hydrolase,序列登录号为XP_001837301.1(=EAU84918.1).
1.2 研究方法
在NCBI中以“9 glycosyl hydrolase”和“Coprinopsis cinerea”进行检索,选择结果中的“Gene”选项,点击第一个结果“CC1G_00437”,即可获得Cc_GH9 的基因信息;使用ProtParam(http://web.expasy.org/protparam/)预测Cc_GH9的分子量、等电点、氨基酸含量、不稳定指数和脂肪族系数等等理化参数;采用SignalP-5.0服务器(http://www.cbs.dtu.dk/services/SignalP/)分析Cc_GH9的信号肽及其剪切位点;利用WoLFPSORT(https://wolfpsort.hgc.jp/)和CELLO v2.5(http://cello.life.nctu.edu.tw/)对Cc_GH9 进行亚细胞定位分析;采用DictyOGlye1.1(http://www.cbs.dtu.dk/services/DictyOGlyc/)预测Cc_GH9 的糖基化位点;采用Sompa(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)预测Cc_GH9的二级结构;采用TMHMM 2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)分析Cc_GH9 的跨膜结构;使用SWISS-MODEL(http://swissmodel.expasy.org/)进行同源建模;使用NCBI 中的保守域数据库(https://www.ncbi.nlm.nih.gov/Structure/cdd/docs/cdd_search.html)分析Cc_GH9的功能结构域,打开以上网址,粘贴Cc_GH9 氨基酸序列至蛋白或核酸查询序列(Protein or Nucleotide Query Sequence)文本框点击提交查询按钮即可进入结果页面;采用MEGA-X中的邻接(Neighbor-joining,NJ)构建Cc_GH9的系统发育树,选择自举法(bootstrap method)检验系统发生,自举重复次数设置为1000次;利用MEME(http://meme-suite.org/tools/meme)对Cc_GH9进行基序分析.
2 结果与分析
2.1 Cc_GH9编码基因的分析
Cc_GH9的基因位于灰盖鬼伞基因组序列(NW_003307540.1)中的5号染色体上,基因标签为CC1G_00437,全长为2298nt(1899563~1901860),含有11 个外显子,分别为1~289,348~368,419~444,495~543,599~669,726~768,819~1421,1471~1595,1651~1702,1758~1951,2002~2298,编码基因长1770 nt(图1),登录号为XM_001837249,编码蛋白9 glycosyl hydrolase,登录号为XP_001837301.该基因5’端为氧化还原酶基因(CC1G_00438),3’端为同化亚硫酸盐还原酶基因(CC1G_00436).
图1 灰盖拟鬼伞GH9家族水解酶基因结构Fig1 Structure of the GH9 family hydrolase(Cc_GH9)gene of Coprinopsis cinerea
2.2 Cc_GH9的理化性质分析
使用ProtParam分析Cc_GH9的理化性质,结果表明,Cc_GH9由589个氨基酸组成,其中含量较高的氨基酸组成有丙氨酸(63个,10.7%)、亮氨酸(59个,10.0%)和丝氨酸(47个,8.0%).Cc_GH9的分子量为64997.79u,理论等电点为4.93,序列中含有5个半胱氨酸,可能形成二硫键.Cc_GH9蛋白序列中带负电荷的氨基酸残基数为66个,带正电荷的氨基酸残基数为50个,分子式为C2922H4423N761O892S16.假设Cc_GH9的胱氨酸残基以半胱氨酸的形式出现,即形成二硫键,其消光系数为136390L/(mol·cm),吸光度(D280nm)为2.098;如果序列中的二硫键全部打开,则Cc_GH9的消光系数为136140L/(mol·cm),吸光度(D280nm)为2.095.当Cc_GH9的N端为甲硫氨酸时,在哺乳动物的网织红细胞体外培养的半衰期为30h,在酵母细胞内的半衰期大于20h,在大肠杆菌细胞内的半衰期大于10h.Cc_GH9的不稳定指数为36.32,小于40,故为稳定蛋白.Cc_GH9的脂肪指数为77.11,其亲水性平均值为-0.322,故Cc_GH9为亲水性蛋白.
2.3 Cc_GH9的信号肽和亚细胞定位分析
使用SignalP-5.0分析了Cc_GH9蛋白序列的信号肽和剪切位点,N端前21个氨基酸为信号肽序列,剪切位点为ALA-QL(图2),故而Cc_GH9 可能为分泌性蛋白. 使用WoLFPSORT 和CELLO v.2.5 对Cc_GH9的亚细胞定位进行了预测分析,结果表明最有可能定位在胞外.
图2 Cc_GH9信号肽分析结果Fig 2 signal peptide analysis results of Cc_GH9
2.4 Cc_GH9的跨膜螺旋结构分析
使用TMHMM-2.0分析了Cc_GH9的跨膜螺旋结构(图3),结果表明含有1个跨膜螺旋,1~555位氨基酸位于膜外部,556~578位氨基酸为跨膜螺旋部分,579~589位氨基酸位于膜内部.因此,Cc_GH9可能为跨膜蛋白.
图3 Cc_GH9的跨膜螺旋结构预测Fig 3 Prediction of transmembrane helices in CC_GH9
2.5 Cc_GH9的二级结构分析
利用SOPMA 分析了Cc_GH9 的二级结构(图4),结果表明其二级结构由α-螺旋(222 个,占37.69%)、延伸链(75 个,占12.73%)、β-转角(16 个,占2.72%)和无规则卷曲(276 个,占46.86%)组成.因此,无规则卷曲和α-螺旋是Cc_GH9二级结构中最主要的结构元件.
图4 Cc_GH9的二级结构预测Fig 4 The secondary structure Prediction of Cc_GH9
2.6 Cc_GH9的三级结构分析
使用SWISS-MODEL分析了Cc_GH9的三级结构,得到了3个预测模型,其中以1tf4.1.A为模板的预测模型其全局模型质量评估分数(GMQE)为0.52,高于其他模板预测模型,更加接近1;而QMEAN得分为-3.10,较其他预测模型更接近于0,表明该模型与实验结果具有较好的一致性.若QMEAN得分小于-4.0,则表明模型质量与目的蛋白匹配度差.该模型与模板的相似度为39.26%.从Cc_GH9的预测三级结构(图5A)可以看出,α-螺旋和无规则卷曲是主要组成结构(图5A),它们可能对于Cc_GH9结构的稳定和酶的功能具有重要意义.
图5 Cc_GH9的三级结构预测(A)卡通格式(B)表面格式Fig.5 Prediction of tertiary structure of CC_GH9(A)cartoon format(B)surface format
2.7 Cc_GH9的翻译后修饰预测
使用NetPhos预测了Cc_GH9氨基酸序列中的磷酸化修饰位点,从图6可以看出Cc_GH9的氨基酸序列中在29 个丝氨酸(S)上、17 个苏氨酸(T)上和17 个酪氨酸(Y)上可能发生磷酸化修饰.使用DictyO⁃Glyc-1.1 预测了Cc_GH9 氨基酸序列中O-α-N-乙酰葡萄糖胺修饰糖基化位点(图7),在182 位丝氨酸(S)处可能发生O-糖基化修饰.
图6 Cc_GH9的磷酸化位点分析Fig 6 The predited phosphorylation site in Cc_GH9
图7 Cc_GH9的O-糖基化位点分析Fig 7 The preditedO-glycosylation site in Cc_GH9
2.8 Cc_GH9的功能结构域分析
使用NCBI中的保守域数据库对Cc_GH9的功能结构域进行了分析(图8),可以看出Cc_GH9属于糖基水解酶9 超家族(Glyco_hydro_9 superfamily),Cc_GH9 序列中55~500 位氨基氨酸序列含有Glyco_hy⁃dro_9 保守结构域,表明该蛋白能够水解纤维素链中的β-1,4-糖苷键.但是在325-384 位氨基酸之间存在缺口(gap),表明该蛋白可能在功能方面较其他物种中的GH9蛋白存在差异.
图8 Cc_GH9的功能结构域分析Fig.8 Functional domain analysis of CC_GH9
2.9 Cc_GH9的系统发育和基序分析
使用MAGA-X 对Cc_GH9及其在担子菌、结合菌、植物、动物和细菌中的同源蛋白进行了系统发育分析(图9A),可以看出GH9蛋白的系统发育基本与其物种分类具有一致性,可以分为真核生物和原核生物组,原核生物酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)的GH9成员(ACV59481.1)单独为一支,可以看作该发育树的外群,但是嗜热醋弧菌(Acetivibrio thermocellus)的GH9蛋白(BAB33148.1)却与动物组的GH9成员聚为一支.真核生物GH9成员按照“界”分类地位(真菌界、植物界、动物界)可以分为三大支,真菌GH9成员又包括担子菌和结合菌的GH9成员,植物和动物的GH9成员进化关系较近,可以聚为一大支与真菌GH9成员并列,然而在接合菌卷枝毛霉(Mucor circinelloides)的GH9蛋白(EPB83463.1)未和其他真菌GH9成员聚为一支,却和动物和植物的GH9成员聚为一支.除小鬼伞Coprinellus angulatus和平田头菇Agrocybe pediades中含有2个GH9蛋白,绝大多数担子菌中仅含有1个GH9蛋白,而结合菌M.circinelloides则含有4个GH9蛋白.担子菌GH9成员的系统发育基本与物种的系统发育一致,如小鬼伞属和拟鬼伞属中两个GH9蛋白对应两个种,Cc_GH9与拟鬼伞C.marcescibilis的GH9蛋白(TFK29350.1)亲缘关系最近,其次是小鬼伞属,与美味牛肝菌(Boletus edulis)的GH9蛋白(KAF8138651.1)亲缘关系最近.
图9 Cc_GH9的系统发育(A)及其基序分析(B)Fig 9 Phylogenetic analysis of Cc_GH9(A)and its motif analysis(B)
使用MEME分析了Cc_GH9系统发育分析所用的GH9蛋白成员氨基酸序列中的基序(图9B),大多数GH9蛋白均含有-ENAYVLYGAVVGGPDKRDRFYDIRSDWPQTEVALDYNAPLL-、-LTGGYYDAGDYSKFT⁃FPLSFTLMSJCWGATDFGKGYDLANQ-和- YWGGDRSIPTPRPVYQINDTNPGTDAAAGTAAAFAACSNLY-等3个基序,在卷枝毛霉M.circinelloides(EPB83463.1)、嗜热醋弧菌属A.thermocellus(BAB33148.1)、拟南芥Arabidopsis thaliana(AAC83240.1)和陆地棉Gossypium hirsutum(AAP83128.1)中缺少基序3,而酸热脂环酸杆菌Alicyclobacillus acidocaldarius(ACV59481.1)中没有以上3 个基序,故和其他GH9 蛋白差异较大,进化树中起到外群的角色.
3 讨论
大部分蕈菌营腐生型营养方式,能够分泌胞外酶降解大分子的蛋白和多糖生成氨基酸、葡萄糖等能直接吸收利用的小分子物质,其中分泌的纤维素酶能够将基质中的纤维素组分降解为葡萄糖.灰盖拟鬼伞是最早基因组测序的伞菌之一,并且作为模式生物,在孢子减数分裂、菌柄伸长生长以及菌盖自水解等方面有着广泛研究[26].灰盖拟鬼伞的生长周期短,经常被当作食用菌生产过程中的杂菌,如与草腐菌草菇或双孢蘑菇竞争营养,因此,鬼伞能够高效利用秸秆等基质中的纤维素组分.对灰盖拟鬼伞纤维素酶的研究主要集中在GH6家族的β-葡聚糖酶,日本学者对CcCel6C进行了异源重组表达,并对其晶体结构进行了表征分析[27,28].灰盖拟鬼伞中含有5个GH6蛋白(CcCel6A,CcCel6B,CcCel6C,CcCel6D和CcCel6E)基因,经检索灰盖拟鬼伞基因组中仅含有1个GH9蛋白基因.已有文献表明,GH9蛋白主要存在于细菌、植物中,偶尔也存在于动物中,在真菌中研究较少.棉花内切-β-1,4-葡聚糖酶(EG17)属于GH9家族蛋白,在植物器官的的脱落过程中发挥一定作用,刘康永等人对其基因进行了克隆和生物信息学分析[29],EG17编码基因为1533bp,与本研究Cc_GH9编码基因大小相近;EG17二级结构也主要以无规则卷曲为主,也与本研究Cc_GH9类似.王丽珊对拟南芥和水稻的GH9家族纤维素酶进行了生物信息学分析[30],这些蛋白大多为稳定蛋白,二级结构主要是无规则卷曲和α-螺旋,大部分是分泌蛋白,这与本研究Cc_GH9 相似,说明GH9 家族蛋白存在保守性,但它们的亚细胞定位于细胞膜或细胞壁,而本研究Cc_GH9定位于胞外.并非所有真菌都含有GH9家族蛋白编码基因,Hüttner等分析了微小根毛霉(Rhizomucor pusillus)FCH 5.7的基因组,预测获得2个GH9蛋白编码基因[31],大部分担子菌中含有1个该基因,子囊菌中没有该基因[32].对于真菌GH9蛋白的生理功能目前仍不清楚.对担子菌黄孢原毛平革菌(Phanerochaete chrysosporium)的有关研究表明,GH9可能与结晶纤维素的降解有关,当P.chryso⁃sporium在纤维素上生长时,GH9基因表达上调[32].
内切葡聚糖酶随机水解纤维素链的内部位点,随后产生不同长度的寡糖,其活性位点形貌特征为一“裂缝”(cleft)或“凹槽”(groove),其开放的表面允许纤维素链中的若干糖单元随机结合[33].本研究中Cc_GH9的三级预测结构的表面格式(图9B)可以看出,其催化结构域为一“裂缝”.GH9家族内切葡聚糖酶通过异头立体化学的反转完成催化反应,含有1个保守谷氨酸(Glu)残基作为催化广义酸以及结合催化水的2个保守天冬氨酸(Asp)残基,其中一个作为催化广义碱[34].已报道的GH9蛋白催化域结构含有一个(α/α)6折叠桶结构,包含一个至少含有6个糖结合位点(-4到+2)的开放活性位点裂缝[35,36].通常持续性内切葡聚糖酶都包含一个3c CBM结构,但是灰盖拟鬼伞Cc_GH9中缺失该结构域,因此,推测其对结晶纤维素不具有水解活性或者具有微弱水解活性.此外,Cc_GH9在Glyco_hydro_9保守结构域中存在60位氨基酸的缺失,可能导致其结构和活性较其他真菌GH9蛋白不同.通过本研究可以为Cc_GH9基因的克隆及重组表达研究提供指导,比如检测重组蛋白是否具有水解活性,应当选择可溶性底物,如羧甲基纤维素或者纤维寡糖等,而不选不溶性的结晶纤维素等作为底物.通过对Cc_GH9的生物信息学预测分析,为灰盖拟鬼伞纤维素酶的开发利用提供新的思路.