草鱼GHR2基因生物信息学分析
2023-02-10李雅靖王进千韦姗姗刘丽霞
李雅靖,王进千,韦姗姗,刘丽霞
( 西北民族大学生命科学与工程学院,甘肃 兰州 730030 )
生长激素(GH)对动物生长发育和基础代谢起到非常关键的作用。作为一种生物大分子,GH发挥作用的条件是必须和位于其靶细胞膜表面上的受体(GHR)进行结合。GHR是细胞因子受体超家族成员之一,属于一种跨膜糖蛋白,需要以二聚体作为形式与GH结合,并启动下游的磷酸化作用信号级联反应和基因的表达[1]。GHR最初于兔子的胚肝细胞膜表面被发现,并通过试验分离自动物体,现已成功克隆并从人类、小鼠、牛和羊的胚胎中获得了该基因。钟欢等[2]对奥尼罗非鱼肝脏组织进行提取,转录测序得到相应的GHR2基因序列,并进行了表达特征分析,结果显示,该基因与奥尼罗非鱼的表达优势和快速生长的杂种优势密切相关。刘媛等[3]应用生物信息学与比较基因组的方法对GHR基因结构进行分析,将GHR基因作为候选基因研究其对牛生长特征产生的变化。吴雪等[4]发现,威宁绵羊各细胞中GHR基因均具有不同水平的表现,在不同年龄、不同发育时期的相同组织上的表现也不同。
生物信息学是将计算机与信息科学技术等手段运用至生命科学中,对生物的内部信息进行处理、归纳,并分析其变化规律。对生物学数据反映的生物学意义进行挖掘,可实现对生命系统的科学理解[5]。本研究对草鱼GHR2基因进行生物信息学分析,并且以结果和相联系的理论为依据,结合试验对象的特征,在大数据的对比下对该基因的高级结构与表达特征进行预测,对阐明草鱼快速生长的机制具有重要意义,为更深入地研究草鱼GHR2基因提供参考。
1 材料与方法
1.1 序列来源
从Ensembl网站获得草鱼GHR2基因编码区序列(登录号:ENSOABT00000046389.1)。
1.2 生物信息学软件
对草鱼GHR2基因全长序列编码蛋白质进行生物信息学分析。所用全部网址及软件见表1。
表1 GHR2基因生物信息学分析软件Tab.1 Bioinformatics analysis software for GHR2 genes
2 结果与分析
2.1 草鱼GHR2基因编码蛋白质的理化性质预测与分析
蛋白质理化性质分析结果显示,共599个氨基酸被草鱼GHR2基因编码,分子式为C3015H4674N774O909S31,相对分子质量为673 02.78 Da,理论等电点(PI)为4.89。
将该基因各氨基酸数量通过计算机以柱状图形式呈现,结果见图1。
由图1可知,含量最多的氨基酸是亮氨酸(Leu),所占氨基酸总量的11.0%;含量最少的氨基酸是色氨酸(Trp),在总数量中所占比例为1.7%。负电荷残基总数(Asp+Glu)为75,正电荷残基总数(Arg+Lys)为46。
图1 草鱼GHR2基因编码蛋白质的氨基酸组成Fig.1 Amino acid composition of proteins encoded by grass carp GHR2 gene
该基因编码产物半衰期显示是30 h,此外由于不稳定指数为59.45(大于40.00),可知该基因编码蛋白质属于不稳定蛋白。
2.2 草鱼GHR2基因编码蛋白质疏水性、亲水性分析
通过软件对检测序列中每种氨基酸的氨基酸标度数值进行分析。氨基酸标度为正值,表明氨基酸具有较大的疏水性;氨基酸标度为负值时,值越小,表明氨基酸的亲水性越强。软件分析结果图中正值区域表示疏水区域,0值以下区域表示亲水区域。通过对亲水性氨基酸与疏水性氨基酸数量统计分析,可判断该基因编码的产物是以亲水性还是疏水性为主的蛋白,还可通过软件检测GRAVY值的正负,对氨基酸残基的亲水性/疏水性进行判断。
草鱼GHR2基因编码蛋白质亲水性及疏水性分析结果见图2。
由图2可知,草鱼GHR2基因编码蛋白质位于第259位的异亮氨酸(Ile)呈疏水性最大值,为+3.178;亲水性最大值为-3.133,是位于第472位的苏氨酸(Thr)。
图2 草鱼GHR2基因编码蛋白质疏水性/亲水性预测分析Fig.2 Analysis of hydrophobic / hydrophilic prediction of GHR2 gene
统计整个编码产品中两种不同类型的氨基酸,亲水氨基酸在全部氨基酸数量中占61.85%,疏水氨基酸所占比例是全部氨基酸数的39.15%,通过检测的平均分呈现负值为-0.182,可预测结果显示出亲水性,草鱼GHR2基因编码中的蛋白质是亲水性蛋白质。
2.3 草鱼GHR2基因编码蛋白质的N-糖基化位点预测(见图3)
蛋白质的N-糖基化是一种常见的、涉及多种生理和病理过程的蛋白翻译后修饰,对蛋白质功能具有调节作用。因为其对蛋白质的功能发挥非常重要,一旦出现状况则会引起如肿瘤、自身免疫性疾病、感染等多器官系统疾病。对N-糖基化位点的鉴别是认识N-糖链功能的重要前提[6]。因此,对糖基化位点及该位点糖型分析具有十分重要的意义。
由图3可知,草鱼GHR2基因编码蛋白存在7个潜在的N-糖基化位点,分别为Asn57、Asn80、Asn100、Asn141、Asn146、Asn376和Asn540。
图3 草鱼GHR2基因编码蛋白质的N-糖基化位点预测Fig.3 N-glycosylation site prediction of grass carp GHR2 protein
2.4 草鱼GHR2基因编码蛋白质的磷酸化位点预测(见图4)
蛋白质磷酸化作为非常关键的一种蛋白质翻译后修饰,参与调节生物体内的绝大多数细胞内部的生物学过程[7]。
由图4可知,利用相应的生物信息学软件对草鱼GHR2进行磷酸化位点预测,对预估结果进行分析,统计共有73个潜在的磷酸化位点,其中包含43个丝氨酸(S)、22个苏氨酸(T)、8个酪氨酸(Y)。
图4 草鱼GHR2基因编码蛋白质磷酸化位点预测Fig.4 Phosphorylation site prediction of grass carp GHR2 protein
2.5 草鱼GHR2基因编码蛋白质跨膜结构域预测(见图5)
由图5可知,运用TMPRED和TMHMM2.0软件对草鱼GHR2蛋白跨膜结构进行分析,结果显示,草鱼GHR2基因蛋白整体序列多数位于细胞膜表面,为跨膜蛋白。
图5 草鱼GHR2基因编码蛋白质的跨膜结构域分析Fig.5 Transmembrane domain analysis of protein encoded by GHR2 gene in grass carp
2.6 草鱼GHR2基因编码蛋白质的信号肽分析(见图6)
图6 草鱼GHR2基因编码蛋白质信号肽分析Fig.6 Signal peptide analysis of proteins encoded proteins in GHR2 gene
信号肽是一种保守的氨基酸序列,在不同的、新产生的蛋白质N末端均存在。将新合成的蛋白转移到具有不同膜结构的亚细胞器中,并在生物体中调控蛋白的分泌和运动[8]。通常信号肽的长度介于13~36个氨基酸残基范围内,以环状构象存在的信号肽使由内质网膜中蛋白质形成的孔道打开。在信号肽的引导下,多肽链进入内质网中,随后由腔表面的信号肽酶水解。
由图6可知,GHR2基因编码产物在第25位的得分值曲线比较有代表性,其中C值为0.33,Y值为0.562并且S值曲线较陡,表明草鱼GHR2基因编码蛋白是一种具有信号肽的蛋白,且第25号位置为信号肽剪切位点。
2.7 草鱼GHR2基因编码蛋白质二级结构和三级结构预测与分析(见图7、图8)
由图7可知,草鱼GHR2蛋白是由16.69%的α-螺旋(Hh),25.38%延伸链(Ee)和57.93%无规则卷曲(Cc)组成,以无规则卷曲为主。在二级结构的基础上,多肽链通过盘旋、折叠,在次级键维系的基础上产生的特定空间结构称为三级结构[9]。
图7 草鱼GHR2蛋白质二级结构预测Fig.7 Secondary structure prediction of GHR2 protein in grass fish
由图8可知,草鱼GHR2蛋白三级结构主要由无规则卷曲构成,与对GHR2基因编码产物的二级结构结论相符。
图8 草鱼GHR2蛋白质三级结构预测Fig.8 Prediction of triple structure of GHR2 protein in grass carp
蛋白质复杂的分子结构决定其生物学功能,而对蛋白质高级结构的定量预测研究与定量分析对进一步了解蛋白质的结构和作用关系具有十分关键的作用,对深入认识蛋白结构与功能之间复杂的关联机制具有极其重要的意义[10]。
3 讨论
鱼类的生长受神经内分泌调节,调节鱼类生长的相关激素利用激素发挥作用的特异性与位于靶细胞膜上的激素受体进行结合,在该过程中所发生的复杂反应可实现GH作用的发挥。鱼类中已通过克隆得到GHR1和GHR2等两种基因全序列,其中从奥利亚罗非鱼中只获得含有典型跨膜结构的GHR2基因序列[11]。鱼类GHR基因的表达水平与自身生长、营养状况密切相关。早期研究发现,禁食3周的大马哈鱼肝脏GHR基因的转录水平明显下降,血液中GH水平显著升高。尼罗罗非鱼则主要通过与肝脏GHR1的结合促进其自身生长[12]。
大多研究通过RT-PCR的方法在不同物种的不同组织中检测到GHR的表达。有研究显示在鱼类所有组织中,以肝脏中GHR表达量最高[13],间接表明了GHR2基因在功能上的保守性。通过对蓝太阳鱼生长激素全长cDNA的克隆与序列分析,曹运长等[14]将推导出的氨基酸序列与其他动物生长激素进行了同源性比较;研究结果显示,蓝鳍鲷与大多数鲈形目鱼类的生长激素具有高度的同源性(85%以上),而与其他鱼类如鲇形目和鱼类的同源性较低(低于70%)。刘臻等[12]利用DNAMAN软件对13种脊椎动物的GH cDNA编码区序列进行同源性分析,结果显示,所克隆的鳜GH cDNA序列与同属鳜鱼的同源性高达90%以上,与不同目的鱼种的同源性较低,该结果也反映了生长激素在鱼类之间的高度保守性。此外,宋兴超等[15]在梅花鹿GHR基因的研究中将梅花鹿与反刍动物和部分哺乳动物、鸟类、鱼类进行序列相似性分析,结果也证实了这一说法。综上所述,不同物种GHR基因编码氨基酸序列的相似性具有相同的趋势。
4 结论
本研究结果表明,草鱼GHR2基因编码蛋白质是由599个氨基酸组成的不稳定可溶性蛋白,PI为4.89,属于可溶性的不稳定酸性蛋白。草鱼GHR2蛋白是一种跨膜蛋白,存在信号肽,其二级结构以无规则卷曲为主,具有较多的膜信号传导外点,影响草鱼某些细胞的代谢与信号传导过程,并且可能影响蛋白质对丝氨酸蛋白水解酶的钝化或抑制的作用。