无色杆菌HZ01细胞色素P450的生物信息学分析
2020-01-06洪跃辉李文哲陈栋华薛金满王江海
洪跃辉,李文哲,陈栋华,薛金满,王江海
(1.广东江门中医药职业学院,广东江门 529000;2.中山大学海洋科学学院,广东广州 510006)
细胞色素P450是一类分布广泛的血红素蛋白超家族末端单加氧酶,是生物界中最具催化多样性的催化剂[1-2],能使多种难降解物质转化为可生物降解的化合物,在环境保护(如石油污染修复、化学制药废水的处置)和农业等领域中具有广阔的应用前景[3]。其中P450在环境修复方面的应用探索是近年来国际上的研究热点之一。例如,近年来有不少学者将P450基因导入植株中,用于清除杀虫剂、除草剂等环境污染物[4]。
虽然目前已分离鉴定出不少P450酶,但目前已知的天然P450酶对难降解物质的催化活性较低[4]。因此,在面临环境污染物种类和数量依然不断增加的情况下,寻找具有新催化活性的P450酶或通过基因改造来改善现有酶的性质具有非常重要的科学意义。目前已经有一些对P450基因进行改造的成功例子。例如,李红梅[5]以P450 BM-3为研究对象,从该亲本酶改造出具有新催化特性的酶,并且提高了酶活性,使其应用前景变得更加广阔。为了对P450基因进行有针对性的改造,必须对其基本性质有较深入的认识。
无色杆菌HZ01(Achromobacter sp.HZ01)是能高效降解石油烃和合成新型脂肽类表面活性剂的海洋新菌株[6-7]。Hong等[8-9]采用全基因组和转录组测序剖析了该细菌的遗传背景,预测出一种P450酶在该细菌降解正构烷烃的末端氧化途径中发挥重要作用。该研究虽然已经获得了无色杆菌HZ01的细胞色素P450基因序列,但该P450的性质仍未明晰。本研究通过生物信息学分析揭示该P450的基本性质,为后续基因克隆表达、基因改造以及酶的工业化生产等深入研究和应用奠定基础。
1 材料与方法
1.1 序列下载
从NCBI网站下载无色杆菌HZ01的细胞色素P450基因序列和蛋白序列。基因序列编号为LWKV01000001.1:c1088606-1086252,蛋白序列编号为WP_111825096.1。
1.2 蛋白质理化参数分析
采用ProtParam(http://web.expasy.org/protparam/)分析菌株HZ01_P450的理化性质,包括氨基酸组成、等电点、消光系数、不稳定指数、亲水性平均系数等[10]。分析时与Alcanivoraxborkumensis SK2的P450进行比较。
1.3 开放阅读框(open reading frame,ORF)查找
采用NCBI网站的ORFfinder工具(https://www.ncbi.nlm.nih.gov/orffinder/)查找HZ01_P450基因的开放阅读框。
1.4 系统进化树分析
采用MEGA 6.06软件对细胞色素P450序列进行系统进化树分析。
1.5 亲疏水性分析
使用ProtScale(http://web.expasy.org/protscale/)分析HZ01_P450的亲疏水性特点[11],并与Alcanivoraxborkumensis SK2的P450进行比较。
1.6 跨膜区分析
采用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)对P450进行跨膜区分析[12]。
1.7 信号肽预测
采用SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)对P450进行信号肽预测[13],参数设置选择神经网络法。
1.8 二级结构预测
使用SOPMA对P450进行二级结构预测[14]。
1.9 三级结构预测
使用SWISS-MODEL(http://swissmodel.expasy.org)预测P450的三级结构[15]。
1.10 蛋白功能域预测
使用SMART软件(http://smart.embl-heidelberg.de/)预测P450的功能域。
2 结果与分析
2.1 理化参数
采用ProtParam对细胞色素P450的理化性质进行分析,结果如表1所示。P450序列中亮氨酸残基含量最高,占9.1%。与Alcanivoraxborkumensis SK2比较,菌株HZ01_P450的氨基酸残基数目、分子量和原子总数都大于前者。AlcanivoraxborkumensisSK2是广泛存在的一种海洋细菌,能以石油烃为唯一碳源和能源。Schneiker等[16]采用高通量测序从该细菌中鉴定出与烷烃降解相关的细胞色素P450。前期通过比较基因组分析发现,菌株SK2的基因组比HZ01小,且基因组较精简[9]。菌株SK2_P450的氨基酸残基数目、分子量和原子总数较小的原因可能与其基因组精简性有一定关系。
表1 细胞色素P450的理化性质
从表1的理化参数结果可知,两种P450的亲水性平均系数(GRAVY)都为负数,这说明这两种P450属于亲水性蛋白。预测等电点都小于6.50,这一数据在后续对HZ01_P450进行分离纯化或电泳鉴定时,可作为一个重要的参考信息,有助于选择合适的缓冲液。不稳定指数(instability index)可用于评估蛋白质的稳定性,当某种蛋白的不稳定指数小于40时,被预测为稳定蛋白;当不稳定指数大于40时,则该蛋白可能是不稳定的[17]。表1显示,两种P450的不稳定指数估测值分别为49.15(菌株HZ01)和40.12(菌株SK2),表明它们可能是不稳定蛋白。这一结果提示,在后续HZ01_P450的应用中,需要考虑其不稳定性,这一性质可作为基因改造的一个着手点。
2.2 开放阅读框
开放阅读框查找结果如表2所示,在HZ01_P450基因中查找到13个ORF,有6个ORF位于正链,ORF1最长(2355 nt/784 aa),位于<1至2355 bp区域。
2.3 系统进化树
系统进化树分析结果如图1所示,无色杆菌HZ01的细胞色素P450与木糖氧化无色杆菌(Achromobacterxylosoxidans)的P450聚在一起,为一个单独分支,说明这两种P450的亲缘关系较近;而菌株HZ01_P450与菌株SK2_P450的亲缘关系则较远。从图中还可以看出,与无色杆菌属(Achromobacter)的P450聚类较近,而与其他种属细菌的P450聚类相距较远。
图1 P450的系统进化树
2.4 亲疏水性
使用ProtScale分析了细胞色素P450的亲疏水性,结果如图2所示。图中的横轴表示氨基酸序列的位置,纵轴代表氨基酸的标度值(得分),标度值为负数时代表亲水性,标度值为正数时表示疏水性。在HZ01_P450的氨基酸序列中,标度值小于-2.30的位置分别在第49、197、213、214、215、359、447、763位氨基酸,这些位置可能是HZ01_P450的主要亲水分布区,其中第215位的精氨酸(Arg)具有最低分值(-2.667)。标度值大于2.30的位置分别在第476、477、478、581、582位氨基酸,这些位置可能是HZ01_P450的主要疏水分布区,其中第477位的丝氨酸(Ser)具有最高分值(3.100)。在菌株SK2的P450序列中,第390位的精氨酸(Arg)具有最低分值(-2.956);第302位的丙氨酸(Ala)具有最高分值(2.500)。两种P450氨基酸序列的最低分值都出现在精氨酸(Arg)位置(虽然分值有微小差别)。在两种P450序列中,有较多区域表现为亲水性,与理化参数分析推测两种P450都属于亲水性蛋白的结果一致。
2.5 跨膜区
蛋白跨膜区是指蛋白质序列中跨越细胞膜的区域,跨膜蛋白的疏水区往往也是其跨膜区[18]。采用TMHMM Server v.2.0进行跨膜区分析时,若整条序列被预测为“inside”或“outside”,则说明该序列不含跨膜螺旋。如图3所示,HZ01_P450序列从头至尾被预测为“outside”的概率值几乎都为1,而且预测的跨膜螺旋数(TMHs)为0,表明该P450不存在跨膜区。目前在原核生物中发现的细胞色素P450系统组分都是可溶的,属于非膜结合型蛋白[19]。根据本研究的理化参数、亲疏水性和跨膜区分析结果推测,海洋新菌株HZ01的细胞色素P450是可溶的亲水性非跨膜蛋白。
2.6 信号肽
采用SignalP 4.1对细胞色素P450序列进行了信号肽预测,选用的神经网络法涉及C、S、Y值,含义分别是:信号肽区域的S值较高,信号肽剪切位点处C值最高,max.Y是综合考虑C值和S值的一个参数。如图4的结果显示,C、S、Y值都较低,且signal peptide参数结果为NO,说明该P450不存在信号肽。
图3 细胞色素P450的跨膜区分析
图4 信号肽预测分析
2.7 二级结构
使用SOPMA软件预测了细胞色素P450的二级结构,结果如图5所示。发现该P450含有4种二级结构:α螺旋(Hh),所占比例是35.08%;延伸链(Ee),占比15.82%;β-转角(Tt),占比6.12%;无规卷曲(Cc),占比最高,为42.98%。
图5 细胞色素P450的二级结构预测
2.8 三级结构
使用SWISS-MODEL对菌株HZ01_P450进行了三级结构预测,结果如图6所示。从三级结构模型可推断,海洋新菌株HZ01的细胞色素P450属于球状蛋白,主要由无规卷曲和α螺旋组成,与二级结构预测结果一致。
2.9 P450的功能域
采用SMART软件在HZ01_P450中预测出2个功能域,结果如图7所示。2个低复杂区域(low complexity region,LCR)分别位于氨基酸序列的2~17和574~586,长度分别为16 aa(LCR1)和13 aa(LCR2)。目前认为,LCR在蛋白质间的功能性结合等多种生物学功能中发挥关键作用,LCR在序列中的具体位置可能与其结合性质和生物学作用密切相关[20]。
图6 细胞色素P450的三级结构
图7 细胞色素P450的功能域
3 结论
本研究通过生物信息学分析首次剖析了无色杆菌HZ01细胞色素P450的基本性质。分析结果主要表明:(1)P450基因中最长的ORF长度为2355 nt;(2)HZ01_P450与木糖氧化无色杆菌的P450亲缘关系较近;(3)在P450序列中有较多区域表现出亲水性,且序列中不存在信号肽;(4)该P450可能是可溶性非跨膜蛋白,二级结构中无规卷曲所占比例最高,三级结构分析结果可推断HZ01_P450属于球状蛋白;(5)SMART软件预测出该P450含有2个低复杂区域。这些结果为无色杆菌HZ01_P450的应用(如环境修复等)奠定了基础,有助于后续进行基因改造、酶的工业化生产等更深入的研究。