APP下载

无色杆菌HZ01细胞色素P450的生物信息学分析

2020-01-06洪跃辉李文哲陈栋华薛金满王江海

生物化工 2019年6期
关键词:信号肽亲水性色素

洪跃辉,李文哲,陈栋华,薛金满,王江海

(1.广东江门中医药职业学院,广东江门 529000;2.中山大学海洋科学学院,广东广州 510006)

细胞色素P450是一类分布广泛的血红素蛋白超家族末端单加氧酶,是生物界中最具催化多样性的催化剂[1-2],能使多种难降解物质转化为可生物降解的化合物,在环境保护(如石油污染修复、化学制药废水的处置)和农业等领域中具有广阔的应用前景[3]。其中P450在环境修复方面的应用探索是近年来国际上的研究热点之一。例如,近年来有不少学者将P450基因导入植株中,用于清除杀虫剂、除草剂等环境污染物[4]。

虽然目前已分离鉴定出不少P450酶,但目前已知的天然P450酶对难降解物质的催化活性较低[4]。因此,在面临环境污染物种类和数量依然不断增加的情况下,寻找具有新催化活性的P450酶或通过基因改造来改善现有酶的性质具有非常重要的科学意义。目前已经有一些对P450基因进行改造的成功例子。例如,李红梅[5]以P450 BM-3为研究对象,从该亲本酶改造出具有新催化特性的酶,并且提高了酶活性,使其应用前景变得更加广阔。为了对P450基因进行有针对性的改造,必须对其基本性质有较深入的认识。

无色杆菌HZ01(Achromobacter sp.HZ01)是能高效降解石油烃和合成新型脂肽类表面活性剂的海洋新菌株[6-7]。Hong等[8-9]采用全基因组和转录组测序剖析了该细菌的遗传背景,预测出一种P450酶在该细菌降解正构烷烃的末端氧化途径中发挥重要作用。该研究虽然已经获得了无色杆菌HZ01的细胞色素P450基因序列,但该P450的性质仍未明晰。本研究通过生物信息学分析揭示该P450的基本性质,为后续基因克隆表达、基因改造以及酶的工业化生产等深入研究和应用奠定基础。

1 材料与方法

1.1 序列下载

从NCBI网站下载无色杆菌HZ01的细胞色素P450基因序列和蛋白序列。基因序列编号为LWKV01000001.1:c1088606-1086252,蛋白序列编号为WP_111825096.1。

1.2 蛋白质理化参数分析

采用ProtParam(http://web.expasy.org/protparam/)分析菌株HZ01_P450的理化性质,包括氨基酸组成、等电点、消光系数、不稳定指数、亲水性平均系数等[10]。分析时与Alcanivoraxborkumensis SK2的P450进行比较。

1.3 开放阅读框(open reading frame,ORF)查找

采用NCBI网站的ORFfinder工具(https://www.ncbi.nlm.nih.gov/orffinder/)查找HZ01_P450基因的开放阅读框。

1.4 系统进化树分析

采用MEGA 6.06软件对细胞色素P450序列进行系统进化树分析。

1.5 亲疏水性分析

使用ProtScale(http://web.expasy.org/protscale/)分析HZ01_P450的亲疏水性特点[11],并与Alcanivoraxborkumensis SK2的P450进行比较。

1.6 跨膜区分析

采用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)对P450进行跨膜区分析[12]。

1.7 信号肽预测

采用SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)对P450进行信号肽预测[13],参数设置选择神经网络法。

1.8 二级结构预测

使用SOPMA对P450进行二级结构预测[14]。

1.9 三级结构预测

使用SWISS-MODEL(http://swissmodel.expasy.org)预测P450的三级结构[15]。

1.10 蛋白功能域预测

使用SMART软件(http://smart.embl-heidelberg.de/)预测P450的功能域。

2 结果与分析

2.1 理化参数

采用ProtParam对细胞色素P450的理化性质进行分析,结果如表1所示。P450序列中亮氨酸残基含量最高,占9.1%。与Alcanivoraxborkumensis SK2比较,菌株HZ01_P450的氨基酸残基数目、分子量和原子总数都大于前者。AlcanivoraxborkumensisSK2是广泛存在的一种海洋细菌,能以石油烃为唯一碳源和能源。Schneiker等[16]采用高通量测序从该细菌中鉴定出与烷烃降解相关的细胞色素P450。前期通过比较基因组分析发现,菌株SK2的基因组比HZ01小,且基因组较精简[9]。菌株SK2_P450的氨基酸残基数目、分子量和原子总数较小的原因可能与其基因组精简性有一定关系。

表1 细胞色素P450的理化性质

从表1的理化参数结果可知,两种P450的亲水性平均系数(GRAVY)都为负数,这说明这两种P450属于亲水性蛋白。预测等电点都小于6.50,这一数据在后续对HZ01_P450进行分离纯化或电泳鉴定时,可作为一个重要的参考信息,有助于选择合适的缓冲液。不稳定指数(instability index)可用于评估蛋白质的稳定性,当某种蛋白的不稳定指数小于40时,被预测为稳定蛋白;当不稳定指数大于40时,则该蛋白可能是不稳定的[17]。表1显示,两种P450的不稳定指数估测值分别为49.15(菌株HZ01)和40.12(菌株SK2),表明它们可能是不稳定蛋白。这一结果提示,在后续HZ01_P450的应用中,需要考虑其不稳定性,这一性质可作为基因改造的一个着手点。

2.2 开放阅读框

开放阅读框查找结果如表2所示,在HZ01_P450基因中查找到13个ORF,有6个ORF位于正链,ORF1最长(2355 nt/784 aa),位于<1至2355 bp区域。

2.3 系统进化树

系统进化树分析结果如图1所示,无色杆菌HZ01的细胞色素P450与木糖氧化无色杆菌(Achromobacterxylosoxidans)的P450聚在一起,为一个单独分支,说明这两种P450的亲缘关系较近;而菌株HZ01_P450与菌株SK2_P450的亲缘关系则较远。从图中还可以看出,与无色杆菌属(Achromobacter)的P450聚类较近,而与其他种属细菌的P450聚类相距较远。

图1 P450的系统进化树

2.4 亲疏水性

使用ProtScale分析了细胞色素P450的亲疏水性,结果如图2所示。图中的横轴表示氨基酸序列的位置,纵轴代表氨基酸的标度值(得分),标度值为负数时代表亲水性,标度值为正数时表示疏水性。在HZ01_P450的氨基酸序列中,标度值小于-2.30的位置分别在第49、197、213、214、215、359、447、763位氨基酸,这些位置可能是HZ01_P450的主要亲水分布区,其中第215位的精氨酸(Arg)具有最低分值(-2.667)。标度值大于2.30的位置分别在第476、477、478、581、582位氨基酸,这些位置可能是HZ01_P450的主要疏水分布区,其中第477位的丝氨酸(Ser)具有最高分值(3.100)。在菌株SK2的P450序列中,第390位的精氨酸(Arg)具有最低分值(-2.956);第302位的丙氨酸(Ala)具有最高分值(2.500)。两种P450氨基酸序列的最低分值都出现在精氨酸(Arg)位置(虽然分值有微小差别)。在两种P450序列中,有较多区域表现为亲水性,与理化参数分析推测两种P450都属于亲水性蛋白的结果一致。

2.5 跨膜区

蛋白跨膜区是指蛋白质序列中跨越细胞膜的区域,跨膜蛋白的疏水区往往也是其跨膜区[18]。采用TMHMM Server v.2.0进行跨膜区分析时,若整条序列被预测为“inside”或“outside”,则说明该序列不含跨膜螺旋。如图3所示,HZ01_P450序列从头至尾被预测为“outside”的概率值几乎都为1,而且预测的跨膜螺旋数(TMHs)为0,表明该P450不存在跨膜区。目前在原核生物中发现的细胞色素P450系统组分都是可溶的,属于非膜结合型蛋白[19]。根据本研究的理化参数、亲疏水性和跨膜区分析结果推测,海洋新菌株HZ01的细胞色素P450是可溶的亲水性非跨膜蛋白。

2.6 信号肽

采用SignalP 4.1对细胞色素P450序列进行了信号肽预测,选用的神经网络法涉及C、S、Y值,含义分别是:信号肽区域的S值较高,信号肽剪切位点处C值最高,max.Y是综合考虑C值和S值的一个参数。如图4的结果显示,C、S、Y值都较低,且signal peptide参数结果为NO,说明该P450不存在信号肽。

图3 细胞色素P450的跨膜区分析

图4 信号肽预测分析

2.7 二级结构

使用SOPMA软件预测了细胞色素P450的二级结构,结果如图5所示。发现该P450含有4种二级结构:α螺旋(Hh),所占比例是35.08%;延伸链(Ee),占比15.82%;β-转角(Tt),占比6.12%;无规卷曲(Cc),占比最高,为42.98%。

图5 细胞色素P450的二级结构预测

2.8 三级结构

使用SWISS-MODEL对菌株HZ01_P450进行了三级结构预测,结果如图6所示。从三级结构模型可推断,海洋新菌株HZ01的细胞色素P450属于球状蛋白,主要由无规卷曲和α螺旋组成,与二级结构预测结果一致。

2.9 P450的功能域

采用SMART软件在HZ01_P450中预测出2个功能域,结果如图7所示。2个低复杂区域(low complexity region,LCR)分别位于氨基酸序列的2~17和574~586,长度分别为16 aa(LCR1)和13 aa(LCR2)。目前认为,LCR在蛋白质间的功能性结合等多种生物学功能中发挥关键作用,LCR在序列中的具体位置可能与其结合性质和生物学作用密切相关[20]。

图6 细胞色素P450的三级结构

图7 细胞色素P450的功能域

3 结论

本研究通过生物信息学分析首次剖析了无色杆菌HZ01细胞色素P450的基本性质。分析结果主要表明:(1)P450基因中最长的ORF长度为2355 nt;(2)HZ01_P450与木糖氧化无色杆菌的P450亲缘关系较近;(3)在P450序列中有较多区域表现出亲水性,且序列中不存在信号肽;(4)该P450可能是可溶性非跨膜蛋白,二级结构中无规卷曲所占比例最高,三级结构分析结果可推断HZ01_P450属于球状蛋白;(5)SMART软件预测出该P450含有2个低复杂区域。这些结果为无色杆菌HZ01_P450的应用(如环境修复等)奠定了基础,有助于后续进行基因改造、酶的工业化生产等更深入的研究。

猜你喜欢

信号肽亲水性色素
色素热舞
双负载抗生素亲水性聚氨酯泡沫的制备与表征
基于信号肽策略提高外源蛋白在枯草芽孢杆菌中的表达
“听话”的色素
一种亲水性温敏聚合物荧光探针的制备及用于农产品中铝离子的检测
运用计算机软件预测木质部寄生属信号肽
甜油的生产及色素控制
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
空气中纳秒脉冲均匀DBD增加聚合物的表面亲水性
水刺型空气加湿器滤材的亲水性改性研究