APP下载

METTL21C蛋白的序列特征、三维结构及分子进化

2021-01-27王珊珊任艳艳路宏朝

西北农业学报 2021年2期
关键词:残基基转移酶甲基化

王珊珊,任艳艳,马 宇,路宏朝,张 涛,王 令

(陕西理工大学 生物科学与工程学院,陕西汉中 723001)

蛋白质的甲基化修饰是指将甲基转移至特定氨基酸残基上共价结合的过程,是最常见的蛋白质翻译后修饰之一。甲基化修饰是一种极为精细和专一的活性调节方式[1],参与真核生物和原核生物的多种细胞进程,如转录调节、细胞定位、核糖体装配、RNA加工、蛋白质相互作用、细胞内信号传导等[2]。甲基化修饰由S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)依赖的甲基转移酶(Methyltransferases)催化发生[3]。目前,已知大多数甲基化反应发生在蛋白质的赖氨酸和精氨酸位点上,且存在不同的甲基化类型,如赖氨酸残基可发生单甲基化、二甲基化和三甲基化[4]。甲基转移酶样21(Methyltransferase like21,METTL21)是甲基转移酶家族的一类远亲成员,包括METTL21A、METTL21B、METTL21C和METTL21D四个成员[5]。其中,METTL21C具有蛋白质赖氨酸N端甲基转移酶活性,涉及多种细胞功能和生物学过程的翻译后修饰[6]。已有研究基于GWAS(Genome wide-association studies)分析发现METTL21C基因在高品质牛肉中表达水平较高[7];METTL21C基因突变后与人类肌肉减少症有关,可能通过调节钙浓度平衡促进肌细胞的分化[8];Wiederstein等[9]以小鼠为研究模型,发现METTL21C蛋白的表达与I型慢肌纤维的比例呈正相关。由此可见,METTL21C作为甲基转移酶成员可能参与机体多种生命活动过程,发挥重要的调控作用。

随着新一代DNA测序技术的发展和应用,越来越多物种的METTL21C基因及其编码蛋白得以发现。尽管METTL21C是进化上高度保守的蛋白家族,然而不同物种METTL21C蛋白的催化机制和生理功能可能不同。因此,对METTL21C家族蛋白进行系统的生物信息学分析,对了解该家族成员的分子进化和生理功能非常重要。然而迄今为止,对METTL21C的研究报道非常有限,且主要集中于单一物种METTL21C的表达和功能分析,尚无该家族全面系统的分子进化的报道。本试验在蛋白质信息数据库UniprotKB中选取了36个代表物种的METTL21C蛋白,利用生物信息学对蛋白理化性质、motif序列、系统进化树、空间结构和蛋白互作网络等进行分析,探讨不同物种METTL21C蛋白的序列特征、空间结构及分子进化,为进一步深入研究METTL21C参与和调控多种细胞进程奠定了理论基础。

1 材料与方法

1.1 METTL21C蛋白数据的收集及分析

利用蛋白质信息数据库UniProtKB(http://www.uniprot.org/),以METTL21C为关键词搜索,选择具有代表性物种的METTL21C蛋白,下载其一级序列信息。借助蛋白质理化性质预测工具ProtParam(https://web.expasy.org/protparam/)对METTL21C家族蛋白成员进行分子量、等电点、相对分子质量、亲疏水性等理化参数进行分析预测[10]。

1.2 蛋白多序列比对及分子进化树构建

利用在线多序列比对工具Clustal Omega(https://www.ebi.ac.uk/Tools/msa/),对不同物种METTL21C蛋白的一级结构进行多序列比对,将比对结果载入ENDscript/ESPript 3.0(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi/)中进行作图与分析[11]。将多序列比对结果导入系统进化树构建软件MEGA 7.0[12],采用邻位归并法(Neighbor-joining,NJ)构建不同物种METTL21C蛋白的分子进化树,结果载入iTOL(http://itol.embl.de/)进行处理。

1.3 蛋白Motif分析和三维结构预测

基于在线motif分析工具MEME(http://meme-suite.org/tools/meme),对不同物种METTL21C蛋白进行motif分析。在蛋白质结构数据库RCSB PDB(http://www.rcsb.org/)中搜索已解析METTL21C的空间结构。利用蛋白质结构预测服务器SWISS-MODEL(https://swissmodel.expasy.org /interactive)对未解析三维结构的蛋白进行同源建模。采用LigPlot+软件分析蛋白质与配体之间的相互作用[13]。通过PyMOL软件进行蛋白质空间结构的展示和分析[14]。

1.4 METTL21C蛋白互作网络预测

采用String在线软件(http://string-db.org/)预测人METTL21C与其他蛋白质的互作网络。

2 结果与分析

2.1 不同物种METTL21C蛋白的理化特性分析

在UniProtKB中搜索METTL21C蛋白,共获得185个相关结果,其中绝大多数来源于脊椎动物。选择36种代表物种的METTL21C蛋白,哺乳动物有21种,其中陆地哺乳动物包括人、黑猩猩、小鼠、大鼠、川金丝猴、牛、家犬、家猫、猪、绵羊、山羊、大熊猫、北极熊、非洲象、火狐、马、杂交牛和兔,海洋哺乳动物长江豚和抹香鲸,以及原始哺乳动物鸭嘴兽;鸟类共10种,包括原鸡、火鸡、北部野鸭、岩鸽、帝企鹅、朱鹮、短嘴鸦、啄木鸟、大杜鹃和火烈鸟;爬行类共3种,包括扬子鳄、中华鳖和变色龙;鱼类共2种,包括鬼鲨和大西洋鲑鱼。

借助ProtParam对不同物种METTL21C蛋白进行理化参数分析(表1)。一级序列中氨基酸残基个数差异较大,为190~335,平均长度为254个残基,其中序列最短的是帝企鹅,最长的是马。分子质量为21 531.63~37 217.35 u,平均分子质量为28 557.79 u。理论等电点为4.54~5.86,平均等电点为4.93,说明不同物种METTL21C均为偏酸性蛋白。带负电荷氨基酸(Asp + Glu)的个数为22~44,带正电荷氨基酸(Arg + Lys)的个数为13~34。不稳定指数为34.93~55.83,其中低于40.00的仅有8个,表征为较稳定的蛋白,其余为不稳定蛋白。脂肪指数为76.13~ 103.61,总亲水性平均系数为-0.516~0.045,绝大多数为亲水性蛋白,仅帝企鹅和短嘴鸦METTL21C蛋白的亲水性平均系数分别0.030和 0.045,表现为弱疏水性蛋白。

表1 不同物种METTL21C蛋白理化性质分析

2.2 不同物种METTL21C蛋白的多序列比对及进化树分析

通过多序列比对发现,不同物种METTL21C的N末端氨基酸序列差异较大,与人、小鼠、大鼠等哺乳动物相比,马和兔METTL21C蛋白在N端增加了额外的氨基酸序列。与哺乳动物相比,大杜鹃、帝企鹅、朱鹮等鸟类METTL21C蛋白在N端有大段序列缺失。然而,不同物种METTL21C在52~259区氨基酸序列相似度较高,特别是在117~141区有多个连续的绝对保守位点(图1),其中亮氨酸(Leu,L)、谷氨酸(Glu,E)和甘氨酸(Gly,G)的出现频率较高,这可能提示这些氨基酸在分子进化中对维持METTL21C蛋白的稳定性和生物功能有重要意义。

在多序列比对的基础上,通过邻位归并法创建不同物种METTL21C蛋白的系统进化树,结果显示进化树共分为4支。哺乳类为第一支,包括人、黑猩猩、猪等21种。其中,人METTL21C与黑猩猩和川金丝猴的亲缘关系最近,其次为猪;牛与杂交牛、山羊与绵羊、家犬与红狐、北极熊与大熊猫、海洋动物长江豚与抹香鲸的亲缘关系较近;原始卵生哺乳动物鸭嘴兽METTL21C与其他胎生哺乳动物亲缘性较远。爬行类为第二支,扬子鳄与中华鳖亲缘关系较近,变色龙为相对独立的小分枝,亲缘关系较远。鸟类为第三支,原鸡与火鸡、啄木鸟与朱鹮、火烈鸟与大杜鹃的亲缘关系较近,北部野鸭、短嘴鸦、岩鸽和帝企鹅分别为独立的小分枝,与其他鸟类亲缘关系较远。鱼类为第四支,鬼鲨和大西洋鲑鱼与其他物种的亲缘关系较远,处于相对独立进化的蛋白(图2)。

2.3 不同物种METTL21C蛋白的Motif分析

采用MEME分析不同物种METTL21C蛋白的一级序列,共获得10个motif(图3)。Motif 1和motif 2评分最高,序列长达50个氨基酸残基,是所有物种METTL21C蛋白最保守的区域,除大西洋鲑鱼的motif 1内部多余两个氨基酸位点外,其他物种中均含有motif 1和motif 2序列。Motif 3包含41个氨基酸残基,在不同物种中有绝对保守的位点,也有相对可变的区域,32种METTL21C蛋白含有motif 3,在一些鸟类(帝企鹅和短嘴鸦)中有部分序列的缺失,鱼类(鬼鲨和大西洋鲑鱼)中无motif 3结构。36种METTL21C均含有motif 4和motif 5,氨基酸序列长度分别为30和15,绝对保守和部分保守位点交替出现,推测此区域可能定位于蛋白的外侧,不同物种METTL21C在进化过程中,在保留基本构象的基础上,一些氨基酸发生了适应性突变,使构象具有一定的柔性,以利于蛋白空间结构稳定和底物识别催化。Motif 7位于METTL21C的N末端,主要在哺乳动物中出现(17种),而鸟类、爬行类和鱼类中无此序列。Motif 10和motif 8依次位于motif 7之后,也主要在哺乳动物METTL21C中出现,而在鸟类和爬行类中无此motif 序列,说明METTL21C蛋白在进化过程中,N端序列差异较大,哺乳动物保留了这些片段,而鸟类有大段缺失。Motif 6和motif 9序列位于METTL21C的C末端,虽有部分位点的重复,但序列差异较大,motif 6多在哺乳类、爬行类和部分鸟类METTL21C中出现,而motif 9多在鸟类中出现,表明METTL21C蛋白的C端序列,在进化过程中也表现出一定程度的差异。

2.4 METTL21C蛋白三维结构的分析

目前,蛋白质结构数据库RCSB PDB中仅公布了人METTL21C蛋白的三维结构(PDB登录号:4MTL)。人METTL21C的整体结构为同型二聚体,由两条多肽链组成,A链中包含57~264残基的空间排布,B链中包含45~263残基的空间排布,N端结构的缺失推测可能是由于METTL21C N端有大段无序结构,自由度较高,构象变化较大,导致无法通过X射线晶体衍射法精确解析此区域的构象。A链和B链均与配体S-腺苷同型半胱氨酸(S-adenosyl-L-homocysteine,SAH)结合,定位于疏水空腔中(图4-A)。每个单体由9个β-折叠片段(β1~β9)和 6个α-螺旋片段(α1~α6)交替组成,反平行折叠的β1和β2位于N端,β3~β9位于结构内部,α1~α3和 α4~α6分别位于β3~β9折叠结构的两侧,形成特殊的松散内核、紧密表面的空间结构(图4-B)。

在人METTL21C与配体SAH的复合体结构中,SAH定位于疏水口袋中,与氨基酸残基Trp92、Gly120、Trp172和Ser193形成氢键。在A链中SAH与Ala21、Tyr87、Gly88、Val91、Ala95、Gly122、Asp141、Leu142、Val145、Leu170、Val171、Asp194、Tyr197、Phe201存在疏水相互作用;在B链中SAH与Val91、Ala95、Ala121、Gly122、Asp141、Leu142、Leu170、Val171、Asp194、Tyr200、Ser228存在疏水相互作用,以维系SAH的构象(图 5)。

以人METTL21C为模板,利用SWISS-MODEL同源建模获得其他物种METTL21C的空间结构。其中,黑猩猩与人METTL21C蛋白的序列一致性最高,达99.18%;大西洋鲑鱼和鬼鲨与人METTL21C蛋白的序列一致性最低,分别为49.53%和53.00%,表明同源建模获得的三维结构可信度较高。通过比较不同哺乳动物METTL21C的空间结构,发现绝大部分区域的构象近乎完全重叠,仅有局部肽段有一定程度的差异,黑猩猩与人METTL21C结构差异主要体现在N端区域,呈反平行式排列的β1和β2结构更长(图6-A);与人METTL21C相比,抹香鲸METTL21C在β8与β9之间的构象由β-转角变为α-螺旋(图6-B),鸭嘴兽METTL21C的氨基酸残基个数相对较少,在N端有大部分缺失,同时β8和β9的构象更短,局部转变为无规卷曲(图6-C)。通过比较人与其他非哺乳动物METTL21C的空间结构,发现大杜鹃与扬子鳄的结构类似,大西洋鲑鱼与抹香鲸的结构类似,与人METTL21C的结构差异均主要体现在β1~β2和β8~β9区域(图6-D~F)。

2.5 人METTL21C蛋白互作网络预测分析

String数据库基于试验数据、文本挖掘、综合其他数据库资源,以及生物信息学分析(基因临近、基因融合、基因共存、共表达、同源性)进行综合评分,预测蛋白质相互作用网络。以人METTL21C为中心的直接相关蛋白有11种。其中FAM86A的评分最高(0.804),作为甲基转移酶能够三甲基化修饰真核延伸因子2(EEF2)的Lys-525位点,但目前没有明确报道FAM86A与METTL21C具有相互作用,仅推测可能在其他物种中METTL21C作为同源蛋白具有潜在的相关性[15]。其次是甲基转移酶METTL18 (0.798)、METTL20(0.787)[16]、METTL10 (0.725)[17]和钾电压门控通道亚家族A成员KCNA2(0.674)[18],在相关文献中与METTL21C共同出现,并在其他物种中存在共同表达。BMP10[18]、SUCNR1[18]、CAMKMT、N6AMT2、FAM173A、EEF2的评分较低,仅在文献中与METTL21C共同出现。此外,有9种蛋白与METTL21C间接相关。其中BMPR1A、NKX2-5、BMPR2和ACVRL1蛋白为一簇,与BMP10直接相关;KCNAB1、KCNAB2、KCNAB3、CTTN蛋白为一簇,与KCNA2直接相关(图7)。

3 结论与讨论

甲基转移酶METTL21C参与多种细胞进程的翻译后修饰,在生命活动中发挥重要的调控作用[19]。基于蛋白质信息数据库UniProtKB已公布的蛋白信息,发现绝大多数METTL21C来源于脊椎动物,特别是哺乳类、鸟类和鱼类,说明METTL21C在脊椎动物中普遍存在,是一个较为古老的蛋白。本课题组前期研究发现,在略阳乌鸡的多种组织中METTL21C均有表达,在心肌和骨骼肌中表达量最高,推测METTL21C可能在肌肉生长发育中发挥重要的生物学功能[20-21]。

36个代表物种METTL21C蛋白的理化参数分析结果显示,一级序列中氨基酸残基个数差异较大,平均为254个氨基酸残基,大多为偏酸亲水性蛋白。系统进化树分为哺乳类、爬行类、鸟类和鱼类共4支,与物种的亲缘进化关系基本吻合,表明METTL21C的分子进化过程符合物种的进化规律。多序列比对和MEME分析显示36种METTL21C的平均一致性为16.52%,平均相似度为62.30%,一级结构中有多段高度保守序列,10个motif几乎覆盖了全长多肽链,大多都含有motif 1~motif 5,表明这些序列是METTL21C家族执行重要生物功能或组成结构不可缺少的部分。但N端序列差异较大,哺乳动物中含特有的motif 7、motif 8和motif 10,在进化过程中作为独立的一个较大分支;而在多种鸟类中有大段缺失,推测在进化过程中丢弃了冗余序列以适应在空中飞行;鱼类作为最早出现的脊椎动物分支,N端序列与其他物种的差异较大。空间结构对比发现,不同物种METTL21C的构象绝大部分区域近乎完全重叠,仅有自由度较高的局部肽段有一定程度的差异,如转角和无规卷曲区。表明不同物种METTL21C在进化过程中虽然一级序列有一定的差异,但是空间构象极为相似,高度保守。

以人METTL21C为中心的蛋白质互作网络,直接相关的11种蛋白质中,主要是与其他甲基转移酶在相关文献中共同出现,或在其他物种中共同表达,如FAM86A能甲基化修饰真核延伸因子2 (EEF2)[22],METTL10能甲基化修饰真核延伸因子α (eEF1A),从而影响蛋白质的翻译与表达[23]。METTL20作为线粒体赖氨酸甲基转移酶,选择性甲基化修饰黄素蛋白ETFβ,并对其功能起负调节作用[24]。与METTL21C有较弱相互关系的KCNA2和BMP10,作为核心蛋白又与其他多种蛋白直接相关。说明METTL21C作为蛋白质互作网络中心,直接或间接参与多种细胞进程,从而影响机体的生命活动。目前在基因水平已有报道,METTL21C基因在高pH牛肉中表达上调,可能影响Ca2+转运和氧化代谢途径[25];METTL21C能够调节骨骼和肌肉的内稳态,通过NF-κB信号通路促进小鼠成肌细胞分化[8];中国青年男性METTL21C基因的多态性与骨密度和脂肪总量相关,影响骨质疏松症和肥胖[26]。然而,在蛋白质层次有关METTL21C的催化机制和生物学功能的报道较少,仅在小鼠中发现METTL21C能够三甲基化修饰p97的Lys-315位点,是骨骼肌中蛋白降解的重要调制器[9],三甲基化修饰热激蛋白(Hspa8)的Lys-561位点,以增强分子伴侣介导的自噬过程[27]。由此可见,METTL21C作为重要的甲基化修饰酶,可能参与多种胞内蛋白的甲基化修饰过程,从而调控机体的多种生命进程。在不同物种中METTL21C参与和调控的多种生理功能有待未来进一步深入研究。

本研究基于蛋白质信息数据库UniprotKB,通过对36个代表物种METTL21C蛋白的生物信息学分析,表明虽然不同物种METTL21C的氨基酸残基个数差异较大,N端序列差异较大,但在进化上高度保守,整体一级序列相似度较高,10个motif序列几乎覆盖了全长多肽链,哺乳类和鸟类METTL21C分别含其特有的motif序列。不同物种METTL21C的空间构象绝大部分区域近乎完全重叠,仅有少部分自由度较高的局部肽段有一定程度的差异。作为蛋白质互作网络中心与多种蛋白相关,直接或间接参与多种细胞进程,调控机体的生命活动,为进一步深入研究不同物种METTL21C的生物学功能及其分子机制提供了理论基础。

猜你喜欢

残基基转移酶甲基化
木薯UDP依赖型糖基转移酶14基因在木薯抗病性中的功能研究
葡萄醇酰基转移酶编码基因遗传变异研究
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
一种肿瘤甲基化谱纯化的统计方法朱宜静
氨基转移酶升高真有这么可怕吗
5-氮杂胞苷调节植物基因表达研究进展与应用展望
甲基苯丙胺改变成瘾小鼠突触可塑性基因的甲基化修饰
Streptomyces sp.DJ菌株产生的角蛋白酶的序列分析
氨基转移酶升高代表肝脏受损吗