黄粉虫纤溶酶基因生物信息学初步分析
2016-10-11陈建兴萨如拉康玉洁马晓东王彩霞
陈建兴,萨如拉,李 静,康玉洁,马晓东,王彩霞
(1.赤峰学院 生命科学院,内蒙古 赤峰 024000;2.平度市农业局,山东 青岛 266700)
黄粉虫纤溶酶基因生物信息学初步分析
陈建兴1,萨如拉1,李静1,康玉洁2,马晓东1,王彩霞1
(1.赤峰学院生命科学院,内蒙古赤峰024000;2.平度市农业局,山东青岛266700)
通过对黄粉虫(Tenebrio molitor)纤溶酶基因序列进行生物信息学分析,结果发现黄粉虫的纤溶酶基因共包含6个外显子和5个内含子.整个CDS区共翻译出258个氨基酸,这些氨基酸以丝氨酸的比例最高,其次为甘氨酸,最低的为谷氨酸.黄粉虫纤溶酶基因的编码存在明显的密码子使用偏好,其偏倚程度从天冬酰胺(N)的0%到谷氨酸(E)的100%.预测黄粉虫纤溶酶肽链的等电点pI在8.34左右,相对分子质量为26KD.黄粉虫纤溶酶多肽链是以亲水区和疏水区相互交错出现构成的.另外,黄粉虫纤溶酶蛋白质的二级结构多为β折叠,其次为无规卷曲,螺旋结构所占比重较轻.
黄粉虫;纤溶酶基因;生物信息学分析;密码子使用偏好
黄粉虫(Tenebrio molitor)俗称面包虫,属于昆虫纲,鞘翅目,拟步甲科,粉甲属.原本是一种仓库和贮藏害虫,但因其营养成分高,营养含量居各类活体动物蛋白饲料之首(被誉为“蛋白质饲料宝库”),被作为饲料或食品用虫为人工所饲养.黄粉虫具有生存能力和适应能力强、生长发育快、养殖成本低等优点,已成为当今世界上仅次于养蚕、养蜂业发展最快的养虫业之一.国内外均有近百年的饲养记录,是一种饲养技术较为成熟的昆虫.近年来,黄粉虫幼虫活虫逐步开发为蝎子、守宫、蛙类、禽类、鱼类等各种宠物饲料,幼虫干粉正在逐步替代家畜家禽饲料中的鱼粉,也有部分被开发为蛋白粉等适用于人类的高级营养品等产品.
黄粉虫体内不仅含有丰富的蛋白质、脂肪、氨基酸和其它小分子次生代谢物,同时还含有丰富的纤维蛋白溶解酶类,分离纯化这些纤溶活性蛋白并研究它们的性质对于开发新型溶栓药物具有重要的意义.为研究昆虫类胰蛋白酶的提取和性质,黄明星分别从地鳖虫和黄粉虫体内分离纯化得到了各自的纤溶活性蛋白,并对这些蛋白的理化性质进行了研究[1].余磊和韩雅莉利用生物信息学方法分析了地鳖虫纤溶酶成熟肽编码序列,模拟了该酶的三维结构,为今后进一步研究该类酶的纤溶机理提供了一定的参考[2].为了深入研究黄粉虫纤溶酶的作用机理,余磊和韩雅莉利用生物信息学方法对黄粉虫纤溶酶进行了三维结构模拟与序列分析,认为该酶的活性中心是His(组氨酸)、Ser(丝氨酸)和Asp(天冬氨酸)三个氨基酸残基,底物结合部位是Ser(丝氨酸)、Asp(天冬氨酸)和Gly(甘氨酸),从微观分子水平上确认了该酶水解纤维蛋白的机理是催化Arg(精氨酸)-Lys(赖氨酸)肽键的水解[3].冼永权等以干黑蚂蚁为原料,通过(NH4)2SO4分段盐析、离子交换和层析纯化得到一种纤溶活性蛋白,并对该蛋白理化性质进行了相关研究[4].叶韵等通过RT-PCR和RACE得到了黄粉虫幼虫胰蛋白酶样丝氨酸蛋白酶基因cDNA全长序列,为胰蛋白酶样丝氨酸蛋白酶的提取及深入研究奠定了基础[5].吴艳玲对分离纯化得到的黄粉虫幼虫纤溶活性蛋白的酶学性质进行了研究,并发现该蛋白在体外能快速选择性抑制肿瘤细胞A549的生长[6].张冰研究发现黄粉虫纤溶活性蛋白具有一定的免疫原性,并且在血栓模型小鼠体内显示出了良好的体内抗血栓作用[7].
本研究通过生物信息学方法初步分析了黄粉虫纤溶酶基因的序列特征、密码子使用、氨基酸构成、肽链疏水性、蛋白质二级结构等信息,为深入研究该酶奠定了一定的基础.
1 数据与方法
1.1数据
本研究应用的数据是从GenBank中查找到的黄粉虫纤溶酶基因序列信息:GenBank Accession Number:JN662461[5].
1.2方法
本研究采用DNAMAN软件,分析黄粉虫纤溶酶基因序列的密码子使用情况、氨基酸构成和各氨基酸位点的疏水性情况,并对该基因编码多肽的二级结构进行了预测.
2 结果和分析
2.1黄粉虫纤溶酶基因基本构成
图1 黄粉虫纤溶酶基因和mRNA结构模式图[3]
黄粉虫纤溶酶基因的外显子和内含子的大小构成情况如图1,从图中可看出,黄粉虫纤溶酶基因共包含6个外显子和5个内含子,CDS区共编码258个氨基酸.另外,图1中显示出了72(His)、117(Asp)、212(Ser)这三个Active sites(活性部位)和207(Asp)、228(Ser)、230(Gly)这三个Substrate binding sites(底物结合部位).
2.2黄粉虫纤溶酶基因的密码子使用情况分析
通过对黄粉虫纤溶酶基因密码子使用情况进行分析,发现黄粉虫纤溶酶基因CDS区共翻译出由258个氨基酸构成的多肽,图2中共含有259个密码子,包含一个终止密码子UAA.从图2可看出,除UAG、UGA两个终止密码子未被使用外,亮氨酸的两个密码子(UUA和CUA)、苏氨酸的两个密码子(ACA和ACG)、精氨酸的两个密码子(CGA和CGG)、脯氨酸的一个密码子(CCG)、谷氨酸的一个密码子(GAA)、丝氨酸的一个密码子(AGU)和甘氨酸的一个密码子(GGG)也未被使用.而这几种氨基酸都是由其余密码子进行编码的,说明黄粉虫纤溶酶的编码存在明显的密码子使用偏好.除这几种明显的密码子使用偏倚外,其余密码子的使用上也存在不同程度的偏好.在其余52个使用过的密码子中,使用次数最多的是编码甘氨酸(G)的GGU 15次(58‰),其次为编码丝氨酸(S)的AGC和编码甘氨酸(G)的GGA都为12次(46‰),而出现次数最少的是编码精氨酸(R)的AGA、丙氨酸(A)的GCA(G)、缬氨酸(V)的GUG、谷氨酸(E)的GAG、组氨酸(H)的CAU(C)、赖氨酸(K)的AAG、谷氨酰胺(Q)的CAG和苯丙氨酸(F)的UUU,都分别为1次(4‰).单纯从各密码子占同义密码的百分率来看,甲硫氨酸(M)和色氨酸(W)都是单密码子编码,必然都为100%,但仅存的一个谷氨酸(E)由GAG来编码,则其也占100%;其次为编码谷氨酰胺(Q)的CAA,占91%.除了单密码子的M和W,其余18种氨基酸用偏倚值即各自密码子的最高百分率减去最低百分率来度量密码子使用偏倚程度,发现偏倚最小的是天冬酰胺(N),两种密码子各占50%,偏倚值为0%,偏倚最大的即为谷氨酸(E),偏倚值为100%.
图2 黄粉虫纤溶酶基因密码子使用情况
由表1可以看出,密码子3个位置各个碱基所占的比例差异较大,密码子第一位以G的比例最大(35%),C的比例最小(16%);密码子第二位以C的比例最大(30%),A比例最小(18%);密码子第三位以C的比例最大(40%),G比例最小(12%).
表1 密码子各位置碱基使用统计(%)
2.3黄粉虫纤溶酶氨基酸构成分析
从表2可看出,黄粉虫纤溶酶基因翻译的氨基酸种类中丝氨酸(Ser)的比例最高(17.05%,出现44次),其次为甘氨酸(Gly,13.56%,出现35次),最低的为谷氨酸(Glu,0.39%,出现1次).作为水溶性球形蛋白,亲水值较低的氨基酸,趋向于堆积在蛋白质的内部,亲水值较高的氨基酸,趋向于构成蛋白质的外部.预测的黄粉虫纤溶酶的相对分子质量(MW)为26093.2(≈26KD),等电点pI为8.34,在人体内正常生理环境下,该酶带正电,而纤维蛋白通常带负电荷,所以黄粉虫纤溶酶很容易靠近纤维蛋白,并与之结合.因此,黄粉虫纤溶酶对血栓有一定的靶向作用.
表2 黄粉虫纤溶酶氨基酸构成情况
2.4黄粉虫纤溶酶疏水性分析
对黄粉虫纤溶酶基因编码的258个氨基酸进行了疏水性统计分析,结果见图3,纤溶酶的多肽链是以亲水区和疏水区相互交错出现构成的.考虑到纤溶酶是一种水溶性蛋白,疏水性较高的区域估计趋向于堆积在蛋白质内部,疏水性较低的区域,趋向于构成蛋白质的外部.
图3 黄粉虫纤溶酶氨基酸序列各位点的疏水性
2.5黄粉虫纤溶酶基因氨基酸序列二级结构分析
图4 黄粉虫纤溶酶氨基酸序列的二级机构预测
从图4可看出,在对黄粉虫纤溶酶氨基酸序列进行二级结构预测时发现,β片层结构(Strands,图4中蓝色曲线)占的比重明显较高,并且,其概率值普遍较高,多数在8分以上;其次为红色的无规卷曲结构(Coils,图4中红色曲线),而出现频率最小的是α螺旋结构(Helices,图4中黑色曲线).
3 讨论和结论
3.1讨论
纤溶酶(plasmin)是一种能够专一降解纤维蛋白凝胶的蛋白水解酶,是纤溶系统中的一个重要组份.体内凝血和纤溶两系统是相互依存紧密相联的.机体一旦产生凝血反应,也几乎同时激活了纤溶系统,使体内多余的血栓移去,从而避免纤维蛋白的过多凝聚,从而引起血栓.本研究主要是通过生物信息学技术分析黄粉虫纤溶酶基因的相关信息.核酸序列分析是生命科学研究中的重要部分.利用生物信息学对核酸序列的结构和功能进行研究,可以充分利用现有的核酸及蛋白质数据库中的庞大资源,并能够有效减少进一步试验的盲目性.
对黄粉虫纤溶酶基因的研究虽然已有相关的生物信息学研究报道,但他们研究的重点在黄粉虫纤溶酶的三维结构预测,并进行了该酶作用机理的研究[3],本研究重在分析黄粉虫纤溶酶基因的密码子使用情况、二级结构预测等分析.
通过对黄粉虫纤溶酶基因密码子使用情况进行分析,发现黄粉虫纤溶酶基因存在明显的密码子使用偏倚,其偏倚程度为天冬酰胺(N)的0%到谷氨酸(E)的100%.驴生长激素基因密码子编码的偏倚程度为半胱氨酸(C)的20%到异亮氨酸(I)、组氨酸(H)和天冬酰胺(N)的100%[8];驴另一个基因朊蛋白基因密码子编码的偏倚程度为苯丙氨酸(F)的0%到半胱氨酸(C)和天冬氨酸(D)的100%[9].说明基因密码子使用偏倚不仅与物种有关,而且与基因也有关系.
黄粉虫纤溶酶基因翻译的氨基酸种类中丝氨酸(Ser)的比例最高(17.05%,出现44次),其次为甘氨酸(Gly,13.56%,出现35次),这与余磊和韩雅莉[3]认为该酶的活性中心是His、Ser和Asp三个氨基酸残基,以及底物结合部位是Ser、Asp和Gly不谋而合.
3.2结论
黄粉虫纤溶酶基因共包含6个外显子和5个内含子,CDS区共编码258个氨基酸.黄粉虫纤溶酶基因的编码存在明显的密码子使用偏好,其偏倚程度从天冬酰胺(N)的0%到谷氨酸(E)的100%.黄粉虫纤溶酶基因编码的氨基酸以丝氨酸的比例最高,其次为甘氨酸,最低的为谷氨酸.黄粉虫纤溶酶的等电点为8.34,相对分子质量为26KD.黄粉虫纤溶酶多肽链是以亲水区和疏水区相互交错出现构成的.黄粉虫纤溶酶的二级结构形式以β片层结构为主,其次为无规卷曲,螺旋结构所占比重较轻.
〔1〕黄明星.地鳖虫和黄粉虫纤溶活性蛋白的分离纯化、性质研究及其基因克隆[D].广州:广东工业大学,2012.
〔2〕余磊,韩雅莉.地鳖虫纤溶酶的三维结构模拟与序列分析[J].湖北农业科学,2014,53(5):1185-88.
〔3〕余磊,韩雅莉.黄粉虫纤溶酶的三维结构模拟与序列分析[J].化学与生物工程,2013,30(9):32-34,50.
〔4〕冼永权,谭竹钧,韩雅莉.黑蚂蚁纤溶活性蛋白的分离纯化及其性质研究[J].基因组学与应用生物学,2015,34(2): 284-289.
〔5〕叶韵,韩雅莉,黄明星,等.黄粉虫胰蛋白酶样酶基因TMTLSP全长cDNA的克隆和序列分析[J].中国生物化学与分子生物学报,2012,28(2):169-176.
〔6〕吴艳玲.黄粉虫纤溶活性蛋白的酶学性质和抑癌作用研究[D].广州:广东工业大学,2011.
〔7〕张冰.黄粉虫纤溶活性蛋白免疫原性与抗血栓作用的研究[D].广州:广东工业大学,2014.
〔8〕陈建兴,孙玉江,潘庆杰,等.驴生长激素基因序列初步分析[J].湖北农业科学,2015,54(7):1751-1754.
〔9〕陈建兴,王银朝,张庆蛟,等.驴朊蛋白基因序列分析[J].赤峰学院学报,2014,30(12):14-16.
Q967
A
1673-260X(2016)07-0005-03
2016-03-24
马晓东主持2014年赤峰学院实践创新教育项目(1402382)