Streptomyces sp.DJ菌株产生的角蛋白酶的序列分析
2021-12-14杨家臣屈奇奇袁小枚黄镜如
柯 野,杨家臣,屈奇奇,袁小枚,黄镜如
(韶关学院英东生物与农业学院,广东 韶关 512005)
【研究意义】近年来,由于全球畜牧产业飞速发展,全球每年产生废弃羽毛成千上万吨[1]。羽毛富含角蛋白具有的独特天然结构,致使其难被降解,成为了蛋白资源废弃物以及病源微生物滋生的污染物[2-3]。为了对废弃羽毛的高值化开发利用、保护生态环境,分离、纯化和筛选出羽毛高效降解微生物菌株成为了研究者关注的热点。【前人研究进展】从自然界分离获得降解废弃羽毛的微生物已经超过30种,在细菌[2,4-6]、放线菌[7]和真菌[8-9]中均有分布。多数能降解羽毛的真菌同时也有致病性,这限制其应用[10],因此,多数研究集中在放线菌和细菌。目前所报道微生物对羽毛的降解能力有限,尚达不到工业化生产的水平。这主要由于当羽毛粉浓度高于1.5%,微生物菌株产生的胞外蛋白酶被抑制,致使羽毛的降解效率下降[8];如JAIN R等[7]发现StreptomycesexfoliatusCFS 1068菌株对0.5%浓度的羽毛降解率为96.6%,对2.0%羽毛粉的降解率仅为72.1%。【本研究切入点】笔者在前期研究中分离筛选获得一株S.sp.DJ菌株,该菌株在羽毛含量为5.0%的情况下,对羽毛的降解率高达50.0%;该DJ菌株对羽毛的降解率是现有文献报道中对高羽毛浓度降解效果最好的菌株之一[11]。【拟解决的关键问题】为了探究该菌株对羽毛高效降解的原因,预测分析羽毛降解的相关角蛋白酶基因及其酶结构特征,采用二代高通量测序技术对S.sp.DJ菌株进行全基因组测序,并将其基因组序列提交至美国国立生物基础信息中心的Genbank数据库中,获得登录号为PKSK00000000。进一步对该基因组序列进行了比对分析,深入分析其编码分泌角蛋白酶的序列与结构,以期能对Streptomycessp.DJ菌株高效降解羽毛的角蛋白酶机理提供参考。
1 材料与方法
1.1 试验材料
1.1.1 菌株来源 羽毛降解菌(Streptomycessp.) DJ菌株,是韶关学院的英东生物与农业学院微生物学实验室分离纯化获得的一株高效分解羽毛菌株,由本实验室提供。
1.1.2 培养基 LB培养基:酵母提取物0.5%,蛋白胨1.0%,NaCl 1.0%,pH 7.0左右。
1.1.3 试剂 酵母提取物、蛋白胨、琼脂糖等购自生工生物工程(上海)股份有限公司,其他化学试剂均为国产分析纯试剂。
1.2 试验方法
1.2.1 DJ菌株的培养及其基因组DNA的提取 将DJ菌株接种于LB培养液中,37 ℃、180 r/min培养2~3 d后,1000 r/min离心5 min收集菌体,按照酵母DNA快速分离方法[11],对DJ菌株的基因组DNA进行提取,电泳鉴定基因组DNA质量。
1.2.2 DJ菌株的基因组测序、组装及其基因组注释 将电泳鉴定合格后的基因组DNA 送至生工生物工程(上海)股份有限公司进行全基因组测序。采用Illumina Hiseq 2500平台对DJ菌株基因组进行高通量测序,对测序的原始数据采用FastQC质量评估后,利用Trimmomatic对数据进行质量剪切,获得相对准确的有效数据后;利用SPAdes对测序数据进行拼装,之后采用Kmer值进行组装,最终根据各Kmer值组装获得最佳的序列结果。将获得DJ菌株的基因组序列提交至GenBank数据库,根据NCBI网站提供的Prokaryotic GenomeAnnotation Pipeline注释系统对基因功能进行预测和注释,同时也利用NCBI Blast+将基因蛋白序列与NT、NR、CDD、COG、GO、KEGG和TrEMBL等多个数据库进行比对,进一步确定注释基因的结构与功能。
1.2.3 DJ菌株角蛋白酶基因的序列分析 运用Bio-Edit 7.0软件对基因和角蛋白酶的序列组成、比对等的分析,http://www.cbs.dtu.dk/services/SignalP/的SignalP 5.0软件和http://www.softberry.com中蛋白定位的ProtCompB 9.0软件对酶定位分析,https://swissmodel.expasy.org/网站进行同源建模以及模型评估,Discovery Studio 2.5软件、VMD 1.9 软件和DeepView软件对角蛋白酶的结构分析。
2 结果与分析
2.1 DJ菌株的基因组组成
采用SPAdes 3.5.0软件对DJ菌株的高通量测序结果进行拼接,获得测序片段,最长为91 450 bp,平均片段长度为2540 bp,拼接获得2058 个contigs,N50大小为3327 bp。进一步利用GapFiller 1.11软件对contig补GAP,采用PrInSeS-G 1.0.0软件对序列矫正后,获得完整的DJ菌株基因组序列,该序列全长5 225 166 bp,其中GC含量为72%,预测编码5668个基因,基因序列占整个基因组序列72.65%,基因平均长度756.70 bp,将该全长序列提交到GenBank数据库(登录号PKSK00000000)。通过GenBank数据库的基因注释系统分析,DJ菌株基因组中共Genes (total) 5668个,CDS (total)5592个,其中CDS (coding) 为5338个,将每个CDS编码的氨基酸序列与NT、NR、CDD、COG、GO、KEGG和TrEMBL等数据进行比对,其中有4456个序列能被同源基因注释分类。
2.2 确定角蛋白酶序列
根据DJ菌株基因组的注释分类结果,在4456个基因中有42个基因是编码蛋白酶的基因。由于DJ菌株是分泌胞外蛋白酶对羽毛进行降解;因此,利用http://www.cbs.dtu.dk/services/SignalP/的SignalP 5.0软件和http://www.softberry.com中蛋白定位的ProtCompB 9.0软件,对42个预测的蛋白酶分析可知,其中14个肽酶分泌到胞外,前期研究表明,DJ菌株分泌到胞外降解羽毛的蛋白酶主要为丝氨酸角蛋白酶[11]。在这14个分泌胞外的肽酶中有9个丝氨酸蛋白酶,即3个胰蛋白酶、2个类胰蛋白酶、4个类Subtilase;目前角蛋白酶一般都被归类为subtilisin-like超家族(属于丝氨酸蛋白酶,S8家族),当然并不是subtilisin-like超家族的蛋白酶都能降解角蛋白[12],在这4个类Subtilase酶中,其中3个酶(GenBank数据库的登录号分别为:PLW69544.1、PLW71753.1和PLW71754.1)与已发现的角蛋白具有较高的序列同源性;因此,本论文仅对该3个角蛋白酶的结构进行分析。
2.3 角蛋白酶的一级结构分析
由表1可知,3种角蛋白酶的肽链长度差异显著,最长为522 aa,最短为386 aa,相差高达136 aa,但是3种角蛋白酶肽链中含量最多为G和A,最少为W或C,肽链主要由疏水性的非极性氨基酸(A,V,L,I,F,W,M和P)和极性氨基酸(A,V,L,I,F,W,M和P)组成,占肽链总氨基酸残基数83(mol,%)左右,而酸性和碱性氨基酸含量差异不大,都约占肽链氨基酸量的17(mol,%)左右。3种角蛋白酶的信号肽切割位点不完全一致(26或34),3种角蛋白酶的前导肽长度均为71~78 aa,成熟肽长度均为274~278 aa,长度差异较小。
2.4 角蛋白酶的同源建模及其二级结构分析
利用3种角蛋白酶的保守区域与来自MeiothermustaiwanensisWR-220的角蛋白酶(PDB数据库code:5WSL.1.A)的氨基酸序列同源性高达60%以上[13],根据同源性高于30%以上可建模的理论,这3种角蛋白酶以5WSL.1.A为模板进行同源建模;利用Ramachandran软件对建模的3种酶分别进行模型的合理性评估,每种酶的肽链主链中φ角和ψ角均在合理范围之内,表明3种角蛋白酶的建模结构合理,可用于酶结构分析。
3种角蛋白酶3-D结构序列在自身肽链位置如表1所示,而3种角蛋白酶及其模板(PDB code:5WSL.1.A)的序列比对及其二级结构结果如图1所示。将PLW69544.1、PLW71753.1和 PLW71754.1编码的角蛋白酶分别命名为K1、K2和K3;对于3-D结构中氨基酸残基的编号,以序列比对中模板5WSL的第1个A氨基酸残基的编号为1,往后残基编号以此类推。由图1可知,4种角蛋白酶包含α 螺旋6个、310α 螺旋2个和β折叠15个。4种角蛋白酶的催化三联体D/H/S前后的氨基酸残基均非常保守;为了确保酶的催化水解能力,虽然催化三联体残基在一级结构上相距较远,但是通过空间结构(即催化三联体残基分别位于第3个 β 折叠、第2个α螺旋和第6个α螺旋上)将3个残基的距离靠近,以确保其催化水解功能。
2.5 二硫键、脯氨酸和钙结合的分析
5wsl角蛋白酶中存在2个二硫键(C69~C101,C165~C196),表明这2个二硫键有助于该酶的热稳定[13]。然而K1中2个二硫键位点均为C,表明K1中存在2个二硫键;而K2和K3中4个位点残基分别为GG、DN、SS和GI,且其他位点均无C残基,表明K2和K3中未有二硫键形成。
这4种酶的部分loop环中有脯氨酸残基,如在270位点,4种酶都有脯氨酸残基来稳定loop结构,而在含有242位点的loop环中,只有5wsl和K2酶具有脯氨酸残基;因此,脯氨酸残基维持loop环稳定性的差异也可能导致4种酶具有不同热定性。
表1 3种角蛋白酶的一级结构分析
“→”表示β折叠,“”表示螺旋,“▲”表示催化位点 ‘→’ indicated β sheets,“”indicated helixes,‘▲’indicated catalytic sites图1 3种角蛋白酶与M.taiwanensis角蛋白酶(PDB code:5WSL.1.A)的序列及其二级结构分析Fig.1 Analysis of sequences and secondary structures of three kinds of keratinases and Meiothermus taiwan keratinase (PDB code:5WSL.1.A)
Ca2+对酶的正确折叠、结构稳定性以及热稳定的提高具有重要作用[14]。5WSL中有2个Ca2+结合,1Ca是V172和G175主链羰基O、T177的Oγ相结合,K1、K2和K3的172和175位点分别为A/V/V和A/A/A,虽然与模板的残基不一致,但都有主链羰基O;177位点残基分别为S/T/T,S残基具有Oγ,与WSL T177的Oγ位置一致,表明K1、K2和K3都具有1Ca结合。5WSL中的2Ca对稳定酶表面位于α1螺旋和β2折叠间的loop环具有作用;2Ca是D11和D14的Oδ1(分别相距Ca为2.322Å和2.370Å,D14的Oδ2与Ca相距3.634Å,未能与Ca相结合),D11和T23主链羰基O(分别相距Ca为2.475Å和2.348Å),S21的Oγ以及Q15的Oε与Ca相结合(分别相距Ca为2.518Å和2.268Å)。在K1、K2和K3中,11、14和15位点为保守的D、D和Q;23位点分别为S/K/S,由于该位点主链羰基O与Ca结合,残基保守性对Ca结合影响不大。21位点分别为S/D/N,K1和5WSL一致,表明K1有2Ca;对于K2酶,D残基的Oδ具有2个O,Oδ1和Oδ2与Ca分别相距3.984Å和5.371Å,K3酶中N残基的Oδ与Ca相距5.150OÅ,这表明K2和K3的21位点虽有O,但其与Ca相距远,不利于Ca结合;因此,在K2和K3酶中可能没有2Ca。
2.6 酶表面电荷、底物结合区域的分析
由图2可知,S4底物结合区域是由保守残基序列104~107和132~136围成的口袋形状,139位点残基位于口袋底部,99和110位点残基位于口袋的底侧。在104~107序列中,4种酶都有高度保守的S104G105残基,106和107位点残基的保守性较差。106位点的残基侧链基团面向溶剂,未占S4空间;5wsl和K1是S残基,K2和K3是T残基,S和T残基的侧链仅相差一个甲基,该甲基占据空间较小;因此,该位点的残基变化对S4影响不显著。对107位点,5wsl、K2和K3分别是N、L和T残基,这3个残基侧链基团与136位点残基连在一起围成S4,该位点侧链基团越大,越利于扩大S4,这导致3种酶的S4大小具有差异。在K1中,107位点为Y,Y残基的侧链苯环基团直接进入占据S4区域,与132~134构成S4口袋,这导致该K1的S4明显小于其他3种酶。在5wsl、K2和K3的S4底部是高度保守的139位点残基L组成,而且在K1中,由于107位点残基直接进入S4形成口袋,导致其S1口袋显著小于其他3种酶,其底部由110位点的I残基构成。
S3底物结合区域由保守G132和G103S104残基构成,无明显口袋形状,本区域容纳底物P3位点的残基主链,且底物P3位点的残基侧链朝向溶剂,未与S3进行结合。
S2底物结合区域是一个“cleft”构造,在4种酶中,构成S2的重要残基位点均高度保守,如G103和H72残基位于S2侧边,L99、D39和T40残基位于S2底部,N70位于S2的边缘,其中D39和H72残基为4种酶的活性位点残基。
红色表示正电荷氨基酸残基,蓝色表示负电荷残基,不同的颜色表示不同的S1、S2、S3、S4和S2`底物结合区域。a:5wsl;b:K1角蛋白酶;c:K2角蛋白酶;d:K3角蛋白酶 Red indicated positive charged amino acid residues,blue indicated negative charge amino acid residues,different colors respectively indicated different substrate binding regions of S1,S2,S3,S4 and S2.a:5wsl;b:K1keratinase;c:K2keratinase;d:K3keratinase图2 3种角蛋白酶与角蛋白酶(PDB code:5WSL.1.A)的底物结合区域比较Fig.2 Analysis of substrate binding region of three kinds of keratinases and M.taiwan keratinase (PDB code:5WSL.1.A)
S1底物结合区域具有明显的口袋构造,S1主要由残基序列131~133、159~160以及167残基围成,其底部由高度保守A156构成,底侧部由高度保守的A157G158构成。在131~133残基序列中,5WSL、K1、K3是保守的LGG残基,而K2是VGG残基,L的侧链比V多一个CH2基团,但是L或V残基的侧链基团朝向酶分子内部,不占据S1口袋空间;虽然这两个残基不保守。但是并不影响S口袋构造。在159~160残基序列中,5WSL、K1、K3的159位点均为高度保守的N残基, K2为S残基;虽然S侧链残基比N残基少NH2基团,但是这两种残基的侧链面向溶剂,虽然该位点残基不保守,但对4种酶S1影响不显著。对于160位点残基,5WSL和K2是不带电荷的S残基,K1和K3为带负电荷的D残基,该位点残基的大小相比较于带电荷而言,带电荷情况对酶的底物特异性具有较大的影响[15];因此,K1、K3相对于5WSL、K2更偏向于P1带正电荷的底物,更排斥P1带负电荷的底物。167位点的残基非常不保守,5WSL为F,K1和K3酶为Y,K2为S,对于F和Y残基的侧链有苯环基团,犹如对S1口袋该了一个盖子,而S侧链无苯环,缺乏盖子;因此,K2的S1具有更大的空间容纳底物P1的侧链。
S2`底物结合区域主要由159、190、221和222位点残基形成。在S2`中,如对S1的分析,159位点的N或S残基对S2`影响不大;对于190位点,为含有苯环侧链基团的Y(5wsl)或F(K1、K2和K3)残基,正如多数subtilisin-like 超家族酶在该位点均为Y或者F残基一样,这个保守苯环侧链基团的取向决定了S2`的大小[16]。对于221和222位点,4种酶都分别是高度保守的S和G残基构成,为表现出任何差异。
3 讨 论
蛋白质一级序列结构决定蛋白质三维结构,三维结构决定蛋白质空间构象,对其功能起到至关重要的作用。本研究中DJ菌株产生3种角蛋白序列的信号肽、前导肽和成熟肽在氨基酸残基组成、极性和长度等方面较为保守一致,其催化三联体(D/H/S)均为IDTG/NGHGTHV/SGTSM(V)A的Motif结构,表明3种酶属于Subtilase超家族[16],具有相似水解角蛋白能力;但是这3种角蛋白酶α螺旋、β折叠、特别是无规卷曲、loop环间的氨基酸残基存在差异,以及与报道的其他角蛋白之间存在氨基酸残基的取代、替换、删除差异,导致其具有不同的底物肽键偏好性[17]。特别对于底物结合区域而言,氨基酸性质、序列差异、空间结构直接决定了其度底物肽键的选择性,这主要是由于酶通过S4-S1和S2`底物结合区域与底物P4-P1和S2`残基结合底物的侧链与之形成氢键,稳定底物分子后,活性位点残基对底物发起亲核攻击,实现切断裂底物分子达到酶解作用。这3种酶的底物结合区域形态构造大体一致,主要由疏水性残基构成;这表明对疏水性底物具有更强的水解能力,而对亲水性强的底物水解能力较弱,这种水解能力与其他报道结果一致[11];对这几种酶的S4-S1和S2`底物结合区域综合分析而言,而这些酶S3、S2和S2`的重要构成位点的氨基酸残基非常保守,而在S1和S4中重要位点的氨基酸残基保守性相对而言差一些,这也就直接体现出不同底物特异性。
在subtilisin-like超家族中,二硫键、脯氨酸和钙离子结合的位点和数量是影响该类酶热稳定性的重要因素之一[18]。对于这类蛋白酶而言,一般天然自发形成的二硫键越多,热稳定性就越强;因此,K1热稳定性可能比K2和K3更强。蛋白质表面loop环中的脯氨酸限制了环结构的柔性,使之具有刚性,有助于高温下保持适当结构,是保持其具有较强的热定性因素之一;如aqualysin I的P5N、P240N、P7I和P268T突变体相对于野生型而言,热稳定性下降,特别是P7I和P268T突变体热稳定性显著降低[19];在这3种酶中,K2具有脯氨酸残基,可能比K1和K3有更强的稳定性。在subtilisin-like超家族存在2个Ca2+结合,大多数具有第一个强结合(1Ca)位点,部分酶有第二个弱结合(2Ca位)点[20-21],K1具有1Ca和2Ca结合位点,而K2和K1只有1Ca结合位点,这表明K1可能具有更强的耐热性。这些酶的耐热性是二硫键、脯氨酸和钙离子结合位点等多方面的综合体现的结果,因此,可以对这些针对性强的位点进行理性设计和改造,以提高其热稳定性[22]。
4 结 论
本论文对羽毛高效降解的Streptomycessp.DJ菌株进行了全基因组的测序,通过对该基因组编码的蛋白进行预测分析,DJ菌株具有的高效降解羽毛的特性与其产生的3种角蛋白密切相关,这3种角蛋白酶的氨基酸残基含量、长度等差异不大,均是活性残基为D/H/S的胞外丝氨酸蛋白酶,并且3种酶的3-D结构中主要由6个α 螺旋、2个310α 螺旋和15个β折叠构成,3种酶中K1酶具有2个二硫键,2个Ca2+结合位点,而K2和K3具有1个二硫键,1个Ca2+结合位点;3种酶都具有含有Pro残基的loop环,而在K2种含有这种loop环2个。3种酶都是主要偏向于对疏水性强的底物进行水解,并且主要由S1和S4底物结合区域决定酶对底物水解的特异性,但是3种酶的S1和S底物结合区域重要位点的氨基酸残基的不保守性,导致了3种酶对不同的底物特异性,这可能是DJ菌株分泌的3种酶对羽毛底物降解的互补性,导致对羽毛高效水解的重要因素之一。为了探究这些角蛋白酶对羽毛高效降解的机理,需进一步对这些基因进行克隆表达和定点突变,进一步揭示其结构与酶解机制。