绵羊MXD3基因的生物信息学分析
2024-04-15张晏铭韩玉玲马延龙张小雪
张晏铭 韩玉玲 马延龙 张小雪
摘要:MAX二聚化蛋白3(MAX dimerization protein 3, MXD3)在肿瘤的增殖、凋亡、侵袭和转移过程中起重要作用,广泛存在于多种动物体内。为探究MXD3基因在绵羊体内的功能,运用生物信息学数据库及其软件,分析了该基因及其编码的产物。结果发现,绵羊MXD3基因总共编码了206个氨基酸残基,所编码的蛋白质分子式为C1000H1650N332O315S6,分子质量为23 556.50 KDa,理论等电点pI为9.32,半衰期为30 h,不稳定指数为88.30。通过基本理化性质分析可知,绵羊MXD3主要在细胞核发挥作用,不属于分泌蛋白,不存在信号肽序列,不存在跨膜结构,是亲水性蛋白。该蛋白的二级结构主要是以无规卷曲、α螺旋组成,而三级结构预测结果与二级结构相符。
关键词:绵羊;MXD3基因;生物信息学分析
中图分类号:S826 文献标志码:A 文章编号:2097-2172(2024)03-0217-05
doi:10.3969/j.issn.2097-2172.2024.03.005
Bioinformatics Analysis of Ovine MXD3 Gene
ZHANG Yanming, HAN Yuling, MA Yanlong, ZHANG Xiaoxue
(College of Animal Science and Technology, Gansu Agriculture University, Lanzhou Gansu 730070, China)
Abstract: MAX dimerized protein 3(MXD3) gene plays an important role in tumor proliferation, apoptosis, invasion and metastasis, which is widely present in a variety of animals. In order to explore the function of MXD3 gene in sheep, bioinformatics analysis of MXD3 gene and its encoded products was conducted by using bioinformatics databases and software. The results showed that MXD3 gene encoded 206 amino acid residues, the protein molecular formula was C1000H1650N332O315S6, the molecular weight was 23 556.50 KDa, isoelectric point pI was 9.32, the half-life was 30 h, and the instability index was 88.30. Sheep MXD3 protein subcells were mainly located in nucleus, which was not a secreted protein and therefore no signal peptide sequence was detected. No transmembrane structure was found and was regarded as a hydrophilic protein. The secondary structure of the protein was composed of random coil and α helix, and the predicted results of tertiary structure were consistent with the secondary structure.
Key words: Sheep; MXD3 gene; Bioinformatics analysis
MXD3基因是Mad基因家族的一員,MXD3基因的转录组和蛋白质在细胞增殖过程中发挥一定作用。研究发现,人MXD3基因在肝癌细胞中的表达要高于正常肝细胞中的表达,且高表达MXD3基因的肝细胞肝癌患者生存率低于低表达MXD3基因的肝细胞肝癌患者,表明MXD3是肝细胞肝癌的潜在生物学标志物和独立的预后指标[1 ]。人MXD3基因在髓母细胞瘤细胞中异常高表达, 在髓母细胞瘤生物发生、维持和增殖中起重要作用[2 - 5 ]。据相关报道,该基因的siRNA已被用于神经母细胞瘤和急性B淋巴细胞白血病的治疗,而且癌细胞的增殖明显受其抑制[3 ]。MXD3基因在许多人类肿瘤中有表达,特别是在中枢神经系统肿瘤中,在胶质母细胞瘤中最为显著[4 ]。MXD3基因在小鼠成神经管细胞瘤模型中也有表达,敲除MXD3基因后,会减少小鼠成神经管细胞瘤的增生[6 ]。小鼠MXD3基因在小脑中的增殖作用及其在小脑肿瘤中的过表达一致。MXD3 基因在过渡性 IgD 中表达-脾脏中的B细胞,其表达在小鼠成熟过程中降低。因此,前体 B 细胞急性淋巴细胞白血病样品中的高MXD3基因水平可能反映了白血病细胞的不成熟性质[5 ]。MXD3 基因在小鼠髓母细胞瘤模型表达水平增多,过多的MXD3蛋白与Max异二聚体竞争结合DNA结合位点,抑制Myc蛋白的作用,由此致使细胞增殖失控和抑癌作用的下降[7 - 9 ]。目前,关于MXD3基因及其蛋白的结构与功能的研究主要集中于人和小鼠,而对绵羊的研究很少。本文利用NCBI数据库等,结合生物信息学手段对绵羊MXD3 基因及其编码产物理化性质、蛋白质结构、生物学功能等进行了研究,以探究该基因及其编码产物的结构与生物学功能。
1 材料与方法
1.1 序列来源
数据资料来源于NCBI网站的GenBank数据库,其中包括绵羊(XM_042250364.2, XP_042106298.1)、人(NM_000044.6, NP_000035.2)、兔子(XM_00271 0426.4, XP_002710472.1)、狗(XM_038663261.1,XP_038519189.1)、牛(NM_001193259.1, NP_0011 80188.1)、猪(NM_001244104.1, NP_001231033.1)、马(XM_023617137.1, XP_023472905.1)、山羊(XM_ 018050624.1,XP_017906113.1)等8个物种的mRNA序列与氨基酸序列。括号内为GenBank登录号。
1.2 方法
采用NCBI的ORF Finder程序分析绵羊MXD3基因的开放阅读框,使用Bioedit及ProtParam软件分析绵羊MXD3基因的理化性质,通过PSORTⅡ软件预测绵羊MXD3蛋白进行亚细胞定位,选择SignalP 3.0软件预测绵羊MXD3蛋白潜在信号肽剪切位点,采用TMHMM程序预测绵羊MXD3蛋白跨膜螺旋区域,通过Smart软件分析绵羊MXD3蛋白保守结构域,使用Prot Scale在线工具分析绵羊MXD3蛋白亲疏水性,采用Jpred软件预测绵羊MXD3蛋白质二级结构,通过Swiss-model在线软件预测绵羊MXD3蛋白三级结构,采用DNAMAN软件分析多序列比对及同源性[10 - 17 ]。
2 结果与分析
2.1 绵羊MXD3基因开放阅读框分析
对开放阅读框分析得知(图1),绵羊MXD3基因中含有1个最长621 bp的 ORF,起始密码子位于604 bp处,终止密码子位于1 224 bp处,编码了206个氨基酸残基。
2.2 绵羊MXD3基因编码产物理化性质分析
蛋白质的基本性质包括相对分子质量、氨基酸组成、亲水性平均值、等电点等。采用Prot- Param和 Bioedit软件对绵羊MXD3基因编码产物的理化性质分析可知,绵羊MXD3基因分子式为C1000H1650N332O315S6,编码206个氨基酸残基,相对分子质量为23 556.50 KDa,理论等电点pI为9.32。该蛋白共含31个负电荷残基数(Asp+Glu)、36个正电荷残基数(Arg+Lys)。其氨基酸组如图2所示。其中Arg(精氨酸)和Leu(亮氨酸)含量最高,所占比例为13.59%; Trp(蛋氨酸)含量最少,所占比例为1.20%。该基因编码产物半衰期为30 h,不稳定指数为88.30,属于不稳定蛋白质。
2.3 绵羊MXD3蛋白亚细胞定位
通过PSORTⅡ软件预测得知,绵羊MXD3基因编码蛋白的亚细胞分布于细胞核的可能性最大(69.6%),分布于细胞骨架的可能性次之(13.0%),分布于高尔基体、细胞质、质膜、分泌囊泡系统的可能性最小(4.3%)。由此推断,绵羊MXD3基因主要在细胞核中发挥生物学作用,其次在细胞骨架中发挥作用。
2.4 不同物种MXD3蛋白的同源性分析
采用DNAMAN软件将人和绵羊、兔子、牛、狗、山羊、猪、马7个动物的氨基酸序列进行序列比对。结果表明,MXD3氨基酸序列在物种间的表达相对保守,山羊和绵羊的同源性趋于一致,为100%;牛与绵羊同源性次之,为98%;猪和马仅与绵羊同源性有少量不同,均为95%;兔子与绵羊同源性为91%;狗与绵羊同源性更低,为86%;而人和其余7种动物的同源性最低,为17%(图3、图4)。
2.5 绵羊MXD3蛋白潜在信号肽剪切位点预测
通过SignalP 3.0软件对绵羊MXD3蛋白分析可知,绵羊MXD3基因编码产物的原始剪切位点(C值)、综合剪切位点估计值(Y值)、 信号肽位点估计值(S值)分别在第26位、第3位、第1位,最大值分别为0.124、0.037、0.217(图5)。由此推测,绵羊MXD3基因编码产物不存在信号肽,是非分泌性蛋白,为不具跨膜区域的非跨膜蛋白。
2.6 绵羊MXD3蛋白跨膜螺旋结构预测
通过TMHMM Server v.2.0在线软件进行分析表明,绵羊MXD3基因编码产物在膜外无任何序列,该蛋白无跨膜结构,为非跨膜蛋白(图6)。
2.7 綿羊MXD3蛋白保守结构域分析
结构域的位置位于超二级结构和三级结构,有独特的空间构象,是蛋白质三级结构的基本单位。保守结构域是基因的核心,有重要的功能。采用Smart软件对绵羊MXD3蛋白保守结构域分析的结果(图7、表1)表明,绵羊MXD3蛋白的第11~26位、第122~138位、第148~167位氨基酸残基均为低复杂性区域(Low complexity region)。
2.8 绵羊MXD3蛋白亲疏水性分析
通过Prot Scale软件判断绵羊MXD3蛋白亲疏水性发现,绵羊MXD3蛋白疏水性在氨基酸第14位表现最大值1.667,在第46位表现最小值 -3.444,在0以下的氨基酸更加密集(x < 0为亲水性氨基酸),且|3.444| > |1.667|(图8),可知绵羊MXD3蛋白是亲水性蛋白。
2.9 绵羊MXD3蛋白结构预测
2.9.1 蛋白二级结构预测 采用Jpred在线软件对绵羊MXD3蛋白二级结构分析预测(图9)可知,α螺旋占比为39.32%,β折叠占比为5.34%,无规卷曲占比为55.34%,无规卷曲占主要地位。
2.9.2 蛋白三级结构预测 蛋白质的三级结构(tertiary structure)是指多肽链借助各种作用力,其进一步折叠卷曲成为复杂的球形分子。利用Swiss-model在线软件对绵羊MXD3蛋白三级结构空间构象进行预测分析发现,绵羊MXD3基因编码蛋白的三级结构主要由无规卷曲与α螺旋折叠卷曲构成(图10)。
3 小结
绵羊MXD3基因中有1条全长为621 bp的ORF,编码206个氨基酸残基。该蛋白分子质量为23 556.50 KDa,亮氨酸、精氨酸含量最多,均为13.59%,理论等电点pI为9.32。绵羊MXD3基因编码蛋白属不稳定蛋白质。亚细胞定位分析,绵羊MXD3基因主要在细胞核中发挥生物学作用,均为69.6%。绵羊MXD3基因的氨基酸序列与多种动物高度相似。绵羊MXD3基因编码产物中不存在信号肽,不是跨膜蛋白,也不是分泌性蛋白。绵羊MXD3蛋白为亲水性蛋白。绵羊MXD3基因编码产物的二级结构由无规卷曲、α螺旋和β折叠构成,其中无规卷曲占主要地位,三级结构主要由无规卷曲和α螺旋折叠卷曲而成。MXD3基因在细胞增殖过程中发挥一定作用,对于肿瘤增殖和癌症患者中表达异常,对于肿瘤和癌症预防,治疗有重要意义,而其在小鼠和人相关方面研究较多,对于绵羊相关MXD3基因的相关研究有待进一步探索。
参考文献:
[1] 王 宇. MXD3在肝细胞肝癌中的表达及临床意义[D]. 荆州:长江大学,2023.
[2] BARISONE G A, NGO T, TRAN M, et al. Role of MXD3 in proliferation of DAOY human medulloblastoma cells[J]. PLoS One, 2012, 7(7): e38508
[3] BARISONE G A, SATAKE N, LEWIS C, et al. Loss of MXD3 induces apoptosis of Reh human precursor B acute lymphoblastic leukemia cells[J]. Blood Cells Mol Dis, 2015, 54(4): 329-335.
[4] DUONG C, YOSHIDA S, CHEN C, et al. Novel targeted therapy for neuroblastoma: silencing the MXD3 gene using siRNA[J]. Pediatr Res, 2017, 82(3): 527-535.
[5] SATAKE N, DUONG C, CHEN C, et al. Targeted therapy with MXD3 siRNA, anti-CD22 antibody and nanoparticles for precursor B-cell acute lymphoblastic leukaemia[J]. Br J Haematol, 2014, 167(4): 487-499.
[6] 郝 丹. 三個黄牛品种生长性状选择的Mxd3基因标记研究[D]. 杨凌:西北农林科技大学,2016.
[7] 黄 艳,张艳亮,段 勇. MXD3基因与肿瘤相关性的研究进展[J]. 实验与检验医学,2017,35(5):635-637;641.
[8] NAIR S K, BURLEY S K. Structural Aspects of Interactions Within the Myc/Max/Mad Network[J]. Curr Top Microbiol Immunol, 2006, 302: 123-143.
[9] BERNHARD L?譈SCHER. Function and regulation of the transcription factors of the Myc/Max/Mad network.[J]. Gene, 2001, 277(1-2): 1-14.
[10] 张小雪,李发弟,王维民. 绵羊ANXA10基因生物信息学分析[J]. 甘肃农业科技,2016(6):1-4.
[11] 刘 佳,王 祯,代友超,等. 绵羊HTR4基因的生物信息学分析[J]. 甘肃农业科技,2020(10):35-40.
[12] 陈倩玲,何亚鹏,张引弟,等. 绵羊RPS20基因的生物信息学分析[J]. 甘肃农业科技,2022,53(8):39-43.
[13] 李 娜,王维民,张德印,等. 绵羊ADRA1B基因生物信息学分析[J]. 甘肃农业科技,2019(9):42-48.
[14] 张小雪,赵利明,刘 佳,等. 绵羊ELOVL5基因的生物信息学分析[J]. 甘肃农业科技,2022,53(4):24-29.
[15] 陈占玉,黄永亮,王维民,等. 绵羊HSPA1L基因的生物信息学分析[J]. 甘肃农业科技,2022,53(7):83-88.
[16] 靳泽希,冯 芬,邓晓银,等. 绵羊NRCAM基因的生物信息学分析[J]. 甘肃农业科技,2020(12):19-24.
[17] 代淇佳,马 博,谢 凡,等. 绵羊ANO5基因的生物信息学分析[J]. 寒旱农业科学,2024,3(1):37-42.