16种微生物蛋白酶的生物信息学分析
2020-04-16富玉竹李欣李晔王斯德金丽华于然
富玉竹 李欣 李晔 王斯德 金丽华 于然
摘要:蛋白酶(protease)是以降解蛋白质为主的糖苷酶,具有丰富的多样性,在生物有机体中发挥着重要而又广泛的作用,具有广泛的研究和应用价值。本研究采用ProtParam、ProtScale、SignalP 4.1 server和NPSA serve等生物信息学软件,对天蓝色链霉菌、普通拟杆菌、金黄色葡萄球菌、枯草杆菌等16种微生物蛋白酶的理化性质、蛋白结构、系统发生树和功能域等进行了分析。结果表明:通过分析16种微生物蛋白酶的稳定性发现,金黄色葡萄球菌、唾液链球菌、短小芽孢杆菌、绿脓杆菌为不稳定蛋白;二级结构由α螺旋、β转角、无规则卷曲和延伸链等结构元件组成;除了节杆菌属、无乳链霉菌、普通拟杆菌、肠杆菌属具有信号肽,其余蛋白酶氨基酸序列不具有信号肽的特点。可以推测出蛋白酶为非分泌性蛋白;只有绿脓杆菌和猪链球菌有跨膜结构,剩下其余几种微生物均没有跨膜结构。具有2个蛋白功能域,分别为Peptidase S8 familyi、Fn3_5like domain。
关键词:微生物;蛋白酶;序列分析;生物信息学;理化性质;蛋白结构;信号肽
中图分类号: S188+.3文献标志码: A
文章编号:1002-1302(2020)04-0065-08
收稿日期:2018-12-14
基金项目:北京市自然科学基金(编号:2182019);北京市教育委员会项目(编号:1-PXM2018-014306-000057/7);国家自然科学基金青年科学基金(编号:51708005);北京电子科技职业学院重点课题(编号:2019-KXZ);北京市优秀人才资助(拔尖自然科学)(编号:2020Z002-002-KWT)。
作者简介:富玉竹(2000—),女,北京人,研究方向为酶与基因重组,E-mail:1002967685@qq.com;共同第一作者:李欣(1998—),女,北京人,研究方向为生物技术,E-mail:1217436404@qq.com。
通信作者:李 晔,博士,副教授,研究方向为蛋白重组表达和分子诊断。E-mail:liyeyashi@163.com。
蛋白酶是催化水解蛋白质肽键的一类酶的总称[1],在生物有机体中发挥着重要而又广泛的作用,具有广泛的研究和应用价值。按其水解多肽的方式,可以将其分为内肽酶和外肽酶2类。内肽酶将蛋白质分子内部切断,形成分子质量较小的肽。外肽酶从蛋白质分子的游离氨基或羧基的末端逐个将肽键水解而游离出氨基酸,前者为氨肽酶,后者为羧肽酶[2-4]。蛋白酶在食品产业中运用十分广泛,如在白酒发酵中可添加适量蛋白酶对白酒香气进行改良[5-7],或在对肉类进行加工中添加,改进肉的嫩度,提升口感[8-10],或使用蛋白酶对小麦提取有益物质[11-13],或对对虾进行改良[14-15],等等。市面上食品用蛋白酶大部分来源于植物中蛋白酶的分离提取,如木瓜蛋白酶,但是提取率较低[16-18],若采用基因工程手段,对其进行分析优化,使其在细菌中重组表达,则有望大幅度提高产量,进一步推广工业化应用[19]。
本研究采用生物信息学的分析方法,结合ProtParam、ProtScale、TargetP 1.1 Server等生物信息学软件,对天蓝色链霉菌、节杆菌属、普通拟杆菌、金黄色葡萄球菌、肠杆菌属、霍氏肠杆菌、大肠杆菌、粗球孢子菌、无乳链霉菌、枯草杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、短小芽胞杆菌、来源于海洋细菌、唾液链球菌、绿脓杆菌等共计16种微生物蛋白酶氨基酸序列的理化性质、序列分子进化、亲/疏水性、磷酸化位点、二级结构、功能域、亚细胞定位、信号肽等进行分析和预测,为下一步进行基因工程菌构建、表达、重组蛋白酶奠定基础。
1 材料与方法
1.1 数据来源
试验中氨基酸序列均来自于美国国家生物信息中心(NCBI)中已登录的序列,分别为天蓝色链球菌、节杆菌属、普通拟杆菌、金黄色葡萄球菌、肠杆菌属、霍氏肠杆菌、大肠杆菌、粗球孢子菌、无乳链霉菌、枯草杆菌、嗜碱芽孢杆菌、地衣芽孢杆菌、短小芽孢杆菌、来源于海洋细菌、唾液链球菌、绿脓杆菌,共16种微生物(表1)。
1.2 研究方法
运用ProtParam分析微生物蛋白酶序列理化性质;运用MEGA 5软件中的邻接(neighbor-joining,简称NJ)法建分子进化树;运用ProtScale进行亲/疏水性的分析和预测;运用TargetP 1.1 Server进行亚细胞定位分析和预测;运用在线工具SignalP 4.1 server进行信号肽分析和预测;运用NPSA server进行微生物蛋白酶氨基酸序列二级结构分析和预测;运用NetPhosK 2.0 Server进行磷酸化位点分析和预测;运用TMHMM 2.0 Server进行跨膜结构域的分析和预测;运用NCBI上的保守域数据库(CDD)進行功能结构域分析和预测(表2)。
2 结果与分析
2.1 微生物蛋白酶氨基酸理化性质特性
经过ProtParam工具分析16种微生物蛋白酶氨基酸序列,结果见表3。先讨论各蛋白酶的氨基酸数目,除天蓝色链霉菌、节杆菌属、普通拟杆菌、肠杆菌属、无乳链霉菌、来源于海洋细菌外,其他的微生物蛋白酶氨基酸残基数量在325~654个之间。以分子量来说,无乳链霉菌最大,粗球孢子菌最小。所选细菌蛋白酶理论等电点(pI)均在4.78~6.61之间,霍氏肠杆菌最大,金黄色普通球菌菌最小。所选细菌蛋白酶脂肪指数基本集中在80左右。通
过分析16种微生物蛋白酶的稳定性,发现除金黄色葡萄球菌、唾液链球菌、短小芽孢杆菌、绿脓杆菌为不稳定蛋白外,其他均为稳定蛋白。在天蓝色链霉菌中,最丰富的氨基酸是Ala、Gly和Arg,可能与维持蛋白酶空间结构的稳定性有关[20]。
2.2 微生物蛋白酶氨基酸分子进化树分析
对16种微生物蛋白酶氨基酸序列,运用MEGA5软件中的NJ法进行分子系统进化分析,得到微生物蛋白酶氨基酸序列的分子进化树(图1),可以较为精确地确定其微生物的进化地位[21-22]。绿脓杆菌、唾液链球菌、霍氏肠杆菌、嗜碱芽孢杆菌、无乳链霉菌、金黄色葡萄球菌、来源于海洋细菌、短小芽胞杆菌、地衣芽孢杆菌、枯草杆菌聚在同一支,而粗球孢子菌,天蓝色链霉菌、大肠杆菌、节杆菌属。肠杆菌属、普通拟杆菌聚在另一分支上,表明微生物蛋白酶有较高的保守性,可以作为微生物遗传分子进化的重要理论依据。
2.3 微生物蛋白酶氨基酸序列的疏水性/亲水性
疏水性指的是1个分子(疏水物)与水互相排斥的物理性质。蛋白质由20种氨基酸组成,它们的亲/疏水性的相互作用是维持蛋白质三级结构最重要的作用力之一。经ProtScale对16条微生物蛋白酶氨基酸序列疏水性/亲水性进行预测,正值表示疏水,值越大表示疏水性越强;负值表示亲水,值越大表示亲水性越强;而数值在-0.5~0.5之间的主要表现为两性氨基酸[23-25]。以枯草杆菌为例的结果如图2所示,多肽链中第336位甘氨酸有最低分值-2.10,亲水性最强;第115位天冬氨酸有最高分值2.522,疏水性最强。其他位的氨基酸疏/亲水性均匀分布,且亲水性氨基酸数量较多。因此在整个蛋白酶肽链上表现为一定的亲水性,但亲水性较弱。
2.4 微生物蛋白酶亚细胞定位分析
亚细胞定位是指某种蛋白或表达产物在细胞内的具体存在部位[26]。对16条微生物蛋白酶氨基酸序列采用TargetP 1.1 Server在线生物学工具进行了亚细胞定位。结果表明,除来源于海洋细菌可信度为5没有明确定位以外,其余的可信度均为3或3之下。由此推断,在天蓝色链霉菌、节杆菌属、普通拟杆菌等微生物中,微生物蛋白酶的定位有所不同。
2.5 微生物蛋白酶氨基酸序列磷酸化位点分析
磷酸化是蛋白质重要的翻译后修饰之一,磷酸化反应泛指把磷酸基团在酶催化作用下转移到其他化合物的过程,是生物体内一种普通的调节方式,在细胞信号转导的过程中起重要作用[27-29]。本研究以16条微生物蛋白酶氨基酸序列为对象,通过NetPhosK 2.0 Server对其蛋白酶氨基酸序列进行预测,预测其丝氨酸(Ser)、苏氨酸(Thr)、酪氨酸(Tyr)磷酸化位点位置及数量。以枯草杆菌为例,研究结果(图3)显示,磷酸化位点有34个,苏氨酸的位点最多。其中,酪氨酸磷酸化位点有Y81、Y99、Y221、Y325、Y339、Y413,共计6个;丝氨酸磷酸化位点有 S9、S56、S138、S140、S163、S180、S191、S205、S242、S271、S280、S415,共计12个;苏氨酸磷酸化位点有T19、T62、T84、T121、T135、T162、T201、T223、T277、T314、T316、T322、T337、T352、T380、T385,共计16个。对16种微生物蛋白酶氨基酸序列进行分析,除肠杆菌属、节杆菌属、普通拟杆菌、无乳链霉菌、来源于海洋细菌外,其他磷酸化位点数量都在100个以下。其中,丝氨酸磷酸化位点较多的是无乳链霉菌、来源于海洋细菌、节杆菌属,苏氨酸磷酸化位点较多的是无乳链霉菌、来源于海洋细菌、节杆菌属,酪氨酸磷酸化位点较多的是来源于海洋细菌、无乳链霉菌、普通拟杆菌(表4)。
2.6 微生物蛋白酶的二级结构分析
蛋白质的二级结构是指蛋白质多肽链本身的折叠和盘绕的方式,其基本单位主要有α-螺旋、β-折叠、β-转角和无规则卷曲4种类型。二级结构是通过骨架上的羰基和酰胺基团之间形成的氢键维持的,氢键是稳定二级结构的主要作用力[30-31]。微生物蛋白酶均由α螺旋、β转角、无规则卷曲和延伸链等结构元件组成,以16条微生物蛋白酶氨基酸序列为研究对象进行蛋白质二级结构分析预测。以枯草杆菌为例,通过NPSA server程序对其蛋白酶氨基酸序列进行二级结构分析,结果表明,其中α螺旋(35.55%)所占比例最高,其次为无规则卷曲(27.73%)或延伸链(24.40%) β转角(12.32%)所占比例最小(表5)。
2.7 微生物蛋白酶信号肽分析
信号肽位于分泌蛋白的 N 端,一般由 15~30 个氨基酸组成,并大致分为3个区段:一个带正电的 N 末端; 一个中间疏水序列,它是信号肽的主要功能区; 一个较长的带负电荷的 C 末端,是信号序列切割位点。对信号肽分析,是进行体外重组表达的一项重要工作。外源蛋白在宿主菌,如大肠杆菌中的表达形式多为细胞内不溶性表达(包涵体),少数为细胞外分泌表达。利用信号肽来引导外源蛋白定位分泌到细胞特定区间,提高可溶性,可避免因包涵体复性带来的困难[32]。利用工具Signal 4.1 server对16条微生物蛋白酶氨基酸序列进行信号肽分析,其中无乳链霉菌蛋白酶的信號肽分析结果见图4。
由图4可见,原始剪切位点C最大值在第31个氨基酸,分值为0.768;综合剪切位点Y最大值在第31个氨基酸,分值是0.698;信号肽S最大值在第14个氨基酸,分值为0.838;平均信号肽S值在第1~30个氨基酸之间,平均值是0.652。因此,推断蛋白酶有信号肽存在的可能性,可能是分泌性蛋白。对16种微生物蛋白酶进行信号肽的相应分析,除了节杆菌属具有信号肽,位点在20与21之间;无乳链霉菌具有信号肽,位点在30与31之间;普通拟杆菌具有信号肽,位点在20与21之间;肠杆菌属具有信号肽,位点在20与21之间,其他蛋白酶氨基酸序列不具有信号肽的特点。
2.8 微生物蛋白酶跨膜结构域的分析
跨膜结构域是膜内蛋白质与膜脂相结合的主要部位,一般由 20个左右的疏水氨基酸残基组成,形成α螺旋,固着于细胞膜上起锚定作用,对正确认识和理解蛋白质的功能、结构、分类 、方位及蛋白质在细胞中的部位和作用均有着重要的指示意义。以无乳链霉菌为研究对象,用在线生物学工具TMHMM 2.0 Server进行预测分析,结果见图5:无乳链霉菌有1个跨膜区,为1次跨膜的膜蛋白。
2.9 微生物蛋白酶功能域分析
蛋白质的结构域是指在超二级结构的基础上组装而成的,多肽链折叠成近乎球状的组装体,这种相对独立的三维实体叫结构域。由一个或几个完整独立的结构域组成。利用生物学工具CDD分析无乳链霉菌蛋白酶氨基酸序列功能结构域,结果(图6)表明,无乳链霉菌蛋白酶具有3个功能域:N端164~650的肽段与Peptidase S8 family有较高的同源性,N端402~545的肽段与PA_C5a有较高的同源性,N端664~774的肽段与Fn3_5 -like domain有较高的同源性。
3 讨论与结论
采用生物信息学的分析方法 以枯草杆菌为重点,对天蓝色链霉菌、节杆菌属、普通拟杆菌等16种微生物蛋白酶氨酸序列的理化特性、亲/疏水性、信号肽、二级结构、系统发育进化、功能结构域、磷酸化位点等进行了预测和推断。
蛋白酶氨基酸序列理化性质分析显示,天蓝色链霉菌、节杆菌属、普通拟杆菌等微生物理论等电点pI大小不等,脂肪指数基本上在80左右,除金黄色葡萄球菌、唾液链球菌、短小芽孢杆菌、绿脓杆菌为不稳定蛋白外,其余的均为稳定蛋白。在天蓝色链霉菌中,最丰富的氨基酸是Ala、Gly和Arg。
系统进化分为2支,绿脓杆菌、唾液链球菌、霍氏肠杆菌、嗜碱芽孢杆菌、无乳链霉菌、金黄色葡萄球菌、来源于海洋细菌、短小芽胞杆菌、地衣芽孢杆菌、枯草杆菌聚在同一分支,而粗球孢子菌、天蓝色链霉菌、大肠杆菌、节杆菌属、肠杆菌属、普通拟杆菌聚在另一分支上。
在整个微生物蛋白酶多肽中,疏/亲水性氨基酸均匀分布在其中,且亲水性氨基酸数量略多,因此在整个蛋白酶肽链上表现为一定的亲水性,但亲水性较弱。除源于海洋细菌可信度为5没有明确定位外,其余的可信度均为3或3之下,由此推断,在天蓝色链霉菌、节杆菌属、普通拟杆菌等微生物中,蛋白酶的定位有所不同。枯草杆菌的磷酸化位点有34个,苏氨酸的位点最多。
在微生物蛋白酶氨基酸序列中,α-螺旋、β-转角、延伸链、无规则卷曲等二级结构元件的数量、比例差异不大,在整个肽链中无规则卷曲占据主导地位。在微生物蛋白酶功能域分析中,通过对16种微生物蛋白酶氨基酸序列分析,最多只有3个功能域。蛋白酶在不同生物种类中的大小数量是不同的,在大多数微生物中是由325~654个氨基酸组成的。
目前,蛋白酶在许多方面都有相关研究,如干酪生产、肉类嫩化和植物蛋白改性等。现今市面上销售的蛋白酶大部分来源于对动物及植物组织的提取,虽然可基本满足市面上对其需求,但依然存在产率低、成本高等问题。近年来,随着基因工程手段的发展,在分析清楚蛋白酶的结构和性质的前提下可以通过分子生物学手段对其进行异源重组表达,为探究其性质及在生物学过程中的应用奠定基础。
参考文献:
[1]银 凤,周爱梅,张祥刚,等. 南美白对虾虾头主要自溶酶的分离纯化及鉴定[J]. 食品与发酵工业,2011,37(3):23-26.
[2]付 静. 食品外肽酶的研究进展[J]. 食品科学,2013,34(7):349-354.
[3]胡二坤,郭兴凤,吴欣欣,等. 中性蛋白酶水解条件对玉米蛋白酶水解产物抗氧化活性影响研究[J]. 粮食与油脂,2015(5):51-54.
[4]刘丽莉,杨协力. 产骨胶原蛋白酶菌种的筛选与鉴定[J]. 食品与生物技术学报,2011,30(6):917-923.
[5]马 特,宋连宝,赵 辉. 白酒窖泥中蛋白酶产生菌的篩选及复配[J]. 食品科学,2016,37(7):146-151.
[6]李树森. 酸性蛋白酶在酒精生产中的应用[J]. 酿酒,2014(3):84-86.
[7]王春才,郭福阳,宫殿良,等. 酸性蛋白酶和发酵促进剂在玉米浓醪发酵生产食用酒精中的联合应用[J]. 粮食与食品工业,2015,22(1):47-50.
[8]郭正富,杨小琴,李 军. 高粱替代玉米日粮添加蛋白酶对肉鸡生长性能、养分利用率和肉质的影响[J]. 中国饲料,2018(4):23-28.
[9]李丽杰,杨志华. 木瓜蛋白酶嫩化鹿肉方法的研究[J]. 食品工业科技,2015,36(6):216-219,234.
[10]赵 立,陈 军,李苗云,等. 木瓜蛋白酶嫩化鸭肉效果的研究[J]. 食品与发酵科技,2015,51(6):41-46.
[11]李君兰. 牛羊胰酶提取,胰蛋白酶纯化及其酶学特性研究[D]. 兰州:甘肃农业大学,2011.
[12]郑志强. 不同蛋白酶对小麦蛋白酶解物抗氧化活性的影响[J]. 食品科学,2017,38(7):161-166.
[13]孟丹阳,赵 伟,杨瑞金,等. 小麦面筋蛋白酶解过程中功能性质的变化规律研究[J]. 食品工业科技,2016,37(5):115-119.
[14]庄志凯,吉宏武. 南美白对虾虾头内源酸性蛋白酶的分离纯化及其酶学特性研究[J]. 食品工业科技,2012,33(18):116-120.
[15]郑鸯鸯,吉 薇,吉宏武,等. 大豆胰蛋白酶抑制剂的提取纯化及其对凡纳滨对虾类胰蛋白酶的抑制作用[J]. 食品与发酵工业,2016,42(11):231-236.
[16]刘 平,胡志和,吴子健,等. 超高压对木瓜蛋白酶构象及酶活力的影响[J]. 食品科学,2015,36(23):23-27.
[17]程云龙,管军军,李世豪. 酶法改性大豆分离蛋白最新研究进展[J]. 粮食与饲料工业,2015,12(3):20-23,27.
[18]张金兰,王文平,王夫杰,等. 酱油酿造中蛋白酶系的研究进展[J]. 中国酿造,2014,33(11):1-5.
[19]冯 炘,裴宇航,周晓飞. 纤维素降解菌的筛选与高效混合菌群的构建[J]. 西北农林科技大学学报(社会科学版),2012,40(4):155-160.
[20]陈巧容,李 娟,王亚军. 猪Smad7和Smad9基因克隆、序列分析与组织表达图谱探究[J]. 四川大学学报(自然科学版),2015,52(1):157-162.
[21]胡彦婷,安丽康,尹淑丽,等. 推定第四类羊毛硫素合成酶生物信息学分析[J]. 微生物学通报,2016,43(11):2464-2472.
[22]李 宁,王柏柯,杨生保,等. 21种植物八氢番茄红素合成酶的生物信息学分析[J]. 新疆农业科学,2015,52(12):2157-2165.
[23]Cai L T,Jiang G H,Lei B,et al. Cloning and sequence analysis ofT-psy1 gene from flue-cured tobacco[J]. Tobacco Science and Technology,2010(2):58-63.
[24]王凌云,郭 明,赵 艳,等. 谷子蔗糖合成酶基因家族鉴定及生物信息学分析[J]. 江苏农业科学,2017,45(15):30-34.
[25]Qin X,Coku A,Inoue K,et al. Expression,subcellular localization,and cis-regulatory structure of duplicated phytoene synthase genes in melon (Cucumis melo L.)[J]. Planta,2011,234(4):737.
[26]Dibari B,Murat F,Chosson A,et al. Deciphering the genomic structure,function and evolution of carotenogenesis related phytoene synthases in grasses[J]. BMC Genomics,2012,13(1):221.
[27]孫 倩. 三种不同来源(植物、细菌和真菌)蛋白酶的纯化、性质及应用研究[D]. 北京:中国农业大学,2016.
[28]冯立娟,焦其庆,尹燕雷,等. 石榴果皮DHQ/SDH基因的克隆及序列分析[J]. 江苏农业科学,2017,45(1):26-29.
[29]要笑云,张 强,撖静宜,等. 毛果杨半胱氨酸蛋白酶基因PtCP3的基因克隆和原核表达分析[J]. 中国农学通报,2016,32(14):50-55.
[30]骆东伟,陈 杰,刘 娟. 蛋白质二级结构预测方法初探[J]. 生物技术世界,2014(11):225.
[31]吴玉明. 蛋白质二级结构预测的一种新的编码方式[J]. 工业控制计算机,2015(4):109-110,113.
[32]Wang Z,Wei P,Wu M,et al. Analysis of the sucrose synthase gene family in tobacco:structure,phylogeny,and expression patterns[J]. Planta,2015,242(1):153-166.