APP下载

人TM9SF1 基因的生物信息学分析

2021-03-06沈小芳王晓军梁炜耀姚劲松周兰庭翟立红

科学技术创新 2021年4期
关键词:跨膜信号肽亲水性

沈小芳 王晓军 赵 鑫 梁炜耀 姚劲松 周兰庭 翟立红 肖 娟*

(湖北文理学院医学院,湖北 襄阳441053)

九次跨膜超家族蛋白(Transmembrane 9 superfamily protein,TM9SF)是一类含有9 个跨膜区以及1 个非胞质区的蛋白,并且该类蛋白在生物的进化过程中保守性较高[1]。九次跨膜超家族蛋白1 (TM9SF1)又称为MP70,位于人类第十四号染色体长臂,全长6 594 bp,编码606 个氨基酸,属于九次跨膜超家族成员之一。王成东在TM9SFl 基因的研究中发现,该基因在破裂的颅内动脉瘤中表达量较高,因此推测颅内动脉瘤的形成和破裂过程相关的炎性以及血管壁蛋白质降解过程与持续高表达的TM9SFl 基因有关,但并未揭示其具体机制[2]。TM9SF1 于1997 年被初次克隆,在人体组织中和多种细胞系广谱表达。目前,仅有少数相关研究报道,TM9SF1 与癌症、神经退行性疾病和心肌病等疾病有关,关于TM9SF1 蛋白在多种细胞或组织内的功能研究尚未见报道,现阶段关于TM9SF1 的研究多数集中在表达方面,总体上来说,关于该基因功能的研究性文章较少,该基因潜在的功能及其具体机制还有待发现。

本研究将对TM9SF1 基因的结构、蛋白的理化性质等结构与功能采用生物信息学的方法进行分析预测,通过软件预测,以便更好地了解该基因,同时也为在该基因上进行的后续研究提供帮助。

1 研究对象与方法

1.1 研究对象

人的TM9SF1 基因、核酸序列、蛋白序列以及基因的外显子序列等基本信息从NCBI 数据库中获取,且以此数据为研究材料。

1.2 分析方法

利用Bioedit 中的ProtParam 进行TM9SF1 氨基酸组成分析;利用ExPASy 网站中的PrortScale 软件预测TM9SF1 蛋白的亲水性和疏水性;通过Signal P 4.1 在线工具对人TM9SF1 蛋白质信号肽进行预测;从NCBI 网站上获取人TM9SF1 蛋白质在不同组织中的表达数据。

2 结果与分析

2.1 人TM9SF1 的基本信息及理化性质预测

人TM9SF1 基因位于14 号染色体14q12,全长6 594 bp,含6 个外显子。通过 ExPASy ProtParam 在线软件(https://web.expasy.org/protparam/)对TM9SF1 蛋白氨基酸序列进行分析,分子量为68 860.65 kD,分子式为:C3197H4823N811O848S21,等电点(pI)为6.70。人TM9SF1 基因由606 个氨基酸组成,其中亮氨酸占整个序列的11.7%,是序列含量最高的氨基酸(图1)。酸性氨基酸包括谷氨酸(Glu)和天冬氨酸(Asp)总共有50 个,碱性氨基酸包括赖氨酸(Lys)和精氨酸(Arg)总共有47 个,因此推测TM9SF1 为酸性蛋白质分子;TM9SF1 在哺乳动物网织红细胞中的半衰期为30 h,不稳定系数为42.99,脂肪系数为101.75;TM9SF1 蛋白的平均亲水性系数为0.256,因此推测该蛋白为疏水蛋白质。

利用ExPASy 网站中的PrortScale 在线软件工具对TM9SF1蛋白的亲水性和疏水性进行预测并分析,可以发现位于第218位的天冬氨酸(Asp)和位于第219 位的精氨酸(Arg)是亲水性最强的氨基酸,其亲水性分值为-3.411;位于第504 位的缬氨酸(Val)是疏水性最强的氨基酸,其疏水性分值为3.444。TM9SF1 序列中疏水性的区域多于亲水性的区域,表明该多肽属于疏水蛋白。

图1 氨基酸组成分析

2.2 预测人TM9SF1 的信号肽

运用Signal P 4.1 在线软件工具预测TM9SF1 基因的蛋白质信号肽(图2),人TM9SF1 蛋白质的C(剪切位点)得分0.509,Y(综合剪切位点)得分0.613,S(信号肽)得分0.944。当C、Y、S 值计算的结论是“YES”时表明预测结果较好。该蛋白的信号肽位于1~32 位氨基酸,其切割位点在第32 位和第33 位氨基酸之间。

图2 人TM9SF1 信号肽预测

2.3 人TM9SF1 跨膜区和亚细胞定位预测

利用TMHMM Server v.2.0 在线工具对TM9SF1 进行跨膜区域分析,人TM9SF1 蛋白存在9 个跨膜区结构由此推测该蛋白可能是跨膜蛋白。并采用PSORT II 在线软件预测人TM9SF1蛋白的亚细胞定位,发现人TM9SF1 蛋白有65.2%位于质膜上,26.1%位于内质网中,4.3%位于空泡中,4.3%位于线粒体内。

2.4 人TM9SF1 在不同组织中的表达预测

从NCBI 上获取人TM9SF1 基因在不同组织中的表达,可以得出人TM9SF1 基因在甲状腺、前列腺、胆囊、肾脏等组织中表达量较高,在骨髓、胰腺、心脏、脑等组织中表达量较少,这为接下来进一步研究TM9SF1 基因提供了基础。

3 讨论

通过利用生物信息学的方法对TM9SF1 基因核酸序列和蛋白质序列等方面进行预测和分析发现,TM9SF1 基因位于染色体14q12,大小为6 594 bp;TM9SF1 蛋白由606 个氨基酸组成,含有9 个跨膜区的疏水蛋白,主要定位于细胞内,通过在线工具预测人TM9SF1 蛋白质在不同组织中的表达,人TM9SF1 在甲状腺、前列腺、胆囊、肾脏等组织中表达量较高。TM9SF1 蛋白65.2%位于质膜上,26.1%位于内质网中,4.3%位于空泡中,4.3%位于线粒体内。

TM9SF1 基因是TM9 超家族的成员,在人体组织中广泛表达,并且可能与多种疾病的发生发展机制有关。作为帕金森病模型的PC12 细胞应用神经毒素处理时可诱导TM9SF1 基因的表达[3]。且TM9SF1 在颅内破裂动脉瘤血管壁组织蛋白中表达量高,随后王宝龙在组织中对其进行染色验证,推测其可能参与了颅内动脉瘤的发病机制[4]。张国英等采用实时荧光定量PCR(qPCR)检验特异性siRNA 对TM9SF1 基因的干扰效果,证明了干扰内源性TM9SF1 可明显抑制HUVEC(人脐静脉血管内皮细胞)中炎症因子ⅠL-1β(白介素1)、IL-8(白介素8)及血管收缩相关基因ACE1(血管紧张素转化酶抑制剂)的表达[5]。李良忠等发现氟作用于成骨细胞后能够影响TM9SF1 mRNA 基因表达的含量,低剂量可以促进其表达,高剂量可以抑制其表达[6]。目前对于TM9SF1 在疾病的发生发展中的分子机制还不太清楚,因此,明确TM9SF1 的生物学信息对深入研究该基因的功能有着很重要的意义。

猜你喜欢

跨膜信号肽亲水性
本期英文缩略语名词解释
信号肽筛选优化提高耐热α-环糊精酶在枯草芽胞杆菌中的表达
西湖大学:首次实现跨膜孔蛋白的精确从头设计
一种亲水性温敏聚合物荧光探针的制备及用于农产品中铝离子的检测
木本油料文冠果APETALA2基因全长cDNA序列与生物信息学分析
城市公共游园中对人亲水性的安全性思考
全基因组预测褐环乳牛肝菌的分泌蛋白
谈信号肽及蛋白质分选转运
蒸馏沉淀法制备扑热息痛亲水核—壳分子印迹微球及其吸附性能研究
例析图形法在高中生物学读题中的应用