APP下载

斑马鱼TATA结合蛋白的生物信息学分析

2015-04-29杨少斌冯婧文赵文铖王兆松许世磊

生命科学研究 2015年2期
关键词:谷氨酰胺斑马鱼结构域

杨少斌 冯婧文 赵文铖 王兆松 许世磊

摘要:斑马鱼TATA结合蛋白(TBP)是转录过程中的重要起始因子。利用生物信息学方法对斑马鱼TBP的理化性质、物种间同源性、保守结构域、跨膜区、亲水性/疏水性,蛋白质二级结构、蛋白质三级结构、蛋白质相互作用进行预测分析 分析表明,斑马鱼TBP全长302个氨基酸,等电点9.8,属于TATA结合蛋白超家族,不含跨膜区.属于亲水蛋白;二级结构以无规则卷曲为主,含5个α螺旋区和8个β折叠区,三维建模空间结构可信度98.9%,进一步分析建模结果可靠:与斑马鱼TBP相互作用的蛋白质均为转录因子或TFⅡD复合物组分。分析结果对于深入研究斑马鱼TBP在基因转录中的作用具有一定的理论指导意义。关键词:斑马鱼;TATA结合蛋白;生物信息学中图分类号:Q811.4

文献标识码:A

文章编号:1007-7847(2015)02-0119-05Bioinformatic Analysis of TATA-binding Protein of ZebrafishYANG Shao-bin, FENG Jing-wen, ZHAO Wen-cheng, WANG Zhao-song, XU Shi-lei*(Tianjin Medical University Cancer Institute and Hospital, National Clinical Research Center for Cancer, Tianjin Key Laboratory of Cancer Prevention and Therapy, Tianjin 300060, China)Abstract : TATA-binding protein (TBP) is important in the process of transcription initiation in zebrafish. By means of bioinformatic methods, TBP of zebrafish is illustrated and analyzed by physicochemical property, sequence homology among different species, conserved domains, transmembrane structures, hydrophilici ty/hydrophobicity, protein secondary structure, protein tertiary structure, as well as protein-protein interactions. The results showed that zebrafish TBP consists of 302 amino acids, with isoelectric point of 9.8. This protein belongs to the TBP superfamily without transmembrane structure, and it is a hydrophilic protein. The secondary structure analysis showed that it contained 5 a. helices and 8 f3 sheets and random coil was the major structure element. The reliability of predicted three-dimensional structure of zebrafish TBP was up to 98.9%. Further analysis proved that the predicted protein structure was stable. It showed that the 10 most relevant interaction proteins with the zebrafish TBP were all transcription factors or TF II D complex members. Therefore, the results provided great information about zebrafish TBP in transcription regulation for further research.Key words: zebrafish; TATA-binding protein; bioinformatics(Life Science Research, 2015,19(2): 119?123)

TATA结合蛋白(TATA-binding protein,TBP)址一种特异性结合DNA序列上TATA框的转录因子。TATA序列存在于真核细胞基因启动子中转录起始位点上游30个bp左右[1]。TBP与其他一些TBP相关蛋白共同组成厂TFⅡD复合物,TFⅡD是一种常见的转录因子,它是RNA聚合酶Ⅱ起始复合体的组成部分。TBP能够帮助RNA聚合酶Ⅱ跨过转录起始位点。TBP在DNA双链解链(double strand separation)的过程中也起到一定的作用,这是通过其能够使DNA弯曲80°来实现[2-4]。TBP的另一个特点是含有一长串谷氨酰胺氨基酸残基。这个区域调节TBP的C端和DNA的结合能力、转录复合体形成的比率以及转录的起始。斑马鱼属于鲤科,鲤目。由于再生能力强的特性,斑马鱼经常被当作研究脊椎动物的生物模型[5]。分析研究斑马鱼TBP有助于更好地理解斑马鱼基因转录过程。到目前为止,对斑马鱼TBP的生物学研究已经有一定的进展,但是对其生物信息学分析还未见报道。为此,本研究采用生物信息学方法,对斑马鱼TBP的理化性质、保守结构域、跨膜区、亲水性/疏水性、二级结构、三级结构、与其他物种亲缘关系等进行预测和分析,为其后续研究奠定全面的理论基础。1材料与方法1.1材料数据资料来源于UniProt网站已经注册的TBP氨基酸序列。其中TBP:斑马鱼zebrafish(Q7SXL3)、非洲爪蛙Xenopus laevis( P27633)、小鼠Mouse( P29037)、牛Bos taurus (Q2HJ52)、人Human( P20226)。1.2方法利用ProtParam分析蛋白质理化性质;蛋白序列同源性、多序列比对及序列系统进化树分别由NCBI protein blast .ClustalX2.0、njplot等软件实现;利用TMHMM、ProtScale分析蛋白质的跨膜区和疏水性;NCBI Conserved Domains数据库用来分析保守区域;Jpred、Swiss-Model和Structural Analysis and Verification Server分别预测蛋白质二级、三级结构及其合理性。String则用来预测蛋白质的相互作用。各软件、数据库的相关信息如表1。2结果与分析2.1斑马鱼TBP的理化性质预测和分析使用ProtParam蛋白质理化性质预测网站对5种TBP进行理化性质预测,得到结果如表2。结果显示,TBP基因在5个不同物种中编码的氨基酸个数在297~339之间;相对分子质量在32702.8~37698.1之间;各物种TBP等电点差异其微,均在9.8附近,说明TBP是碱性蛋白质;TBP在5个物种中的半衰期均达到了30h;5种蛋白的不稳定系数均大于40,表明它们不是稳定蛋白;各TBP的脂肪族系数在76.58~88.65之间;5种蛋白的平均疏水性均为负值,表明它们都是亲水蛋白质。2.2斑马鱼TBP的同源性预测和分析

使用Protein Blast软件对斑马鱼TBP进行同源性分析,数据显示,非洲爪蛙、小鼠、牛、人TBP与斑马鱼TBP进行比较时,比对序列覆盖范围(Query cover)分别是100%、100%、100%、75%;在此基础上的序列相似性(Identity)分别为88%、86%、85%、93%,;利用ClustalX2.1程序对斑马鱼TBP与非洲爪蛙、小鼠、牛、人TBP序列进行多重比对,发现各物种问多聚谷氨酰胺区如图1。结果显示,由低等物种到高等物种,TBP多聚谷氨酰胺区谷氨酰胺氨基酸残基数量在进化过程中不断增加,推测谷氨酰胺区的长度与TBP的转录调节能力呈正相关。

同时在斑马鱼、非洲爪蛙、小鼠、牛、人的TBP比对结果中发现一个长保守区,该保守区位于斑马鱼TBP肽链的C端(114-281aa),其序列为:PATPASESSGIVPQLQNIVSTVNLGCKLDLKTIALRARNAEYNPKRFAAVIMRIREPRTTALIFSSGKMVCTGAKSEEQSRLAARKYARVVQKLGFPAKFLDFKIQNMVGSCDVKFPIRLEGLVLTHQQFSSYEPELFPGLIYRMIKPRIVLLIFVSGKVVLTGAKVR。使用njplot软件对Clusta1X2.1比对结果产生的系统进化树进行可视化分析,结果如图2。结果显示小鼠、牛、人之间进化距离小于0.012,它们与非洲爪蛙和斑马鱼的进化距离分别为0.043和0.049。2.3斑马鱼TBP保守结构域预测和分析使用NCBI提供的蛋白质保守结构域分析数据库(Conserved domains database)对斑马鱼TBP进行保守结构域分析,结果如图3。结果表明斑马鱼TBP属于TATA结合蛋白超家族,只含有一个保守结构域(125-298aa),此结构域用于识别转录调控区DNA的TATA框,并且此保守结构域与ClustalX2.1分析得到的保守区位置基本一致(114-281aa)。2.4斑马鱼TBP跨膜区预测和分析使用在线蛋白质跨膜区分析工具TMHMM软件对斑马鱼TBP进行跨膜区分析(图4) 结果显示,斑马鱼TBP不含跨膜区,说明斑马鱼TBP不是跨膜蛋白质。TBP蛋白家族是在DNA转录起始过程中发挥作用,属于细胞核定位,而非膜蛋白,预测结果与这一描述相符。2.5斑马鱼TBP亲水性/疏水性预测和分析利用蛋白质亲水性/疏水性在线预测工具ProtScale对斑马鱼TBP进行亲水性/疏水性分析(图5)。结果显示,斑马鱼TBP亲水性最强位点出现在57、58、59三个连续的位点,分值为-3.611,这3个位点的氨基酸分别是精氨酸(Arginine,R)、谷氨酰胺(Glutamine,Q)、谷氨酰胺(Glutamine,Q);斑马鱼TBP疏水性最强位点出现存267位,分值为2.956,这个位置的氨基酸是异亮氨酸(Isoleucine,I)。ProtParam对斑马鱼TBP的预测结果显示其平均疏水性(GRAVY)为-0.177,ProtScale的预测结果显示斑马鱼TBP的泉水肽链分布在整个氨基酸序列中,且明显多于疏水肽链,两个预测结果均证明TBp是亲水蛋白质,是一种水溶性蛋白质:2.6斑马鱼TBP二级结构预测和分析

Jpred由Barton Group创建于1998年,现在版本为3.0。Jpred采用Jnnet神经网络算法来预测蛋白质二级结构,平均准确率大于81% 使用Jpred3在线预测软件对斑马鱼TBP的二级结构进行预测,结果如图6。结果显示,斑马鱼TBP含有5个α螺旋区和8个β折叠区。α螺旋区和β折叠区氨基酸比率分别占到19.2%e和19.8%,说明斑马鱼TBP绝大部分氨基酸(71.0%)处于无规则卷曲状态。2.7斑马鱼TBP三级结构预测和分析蛋白质三级结构预测与分析对了解蛋白质的结构与功能之间的相关性至关重要,也对理解该蛋白质与其他分子的相互作用机理及位点大有帮助。Swiss-Model是一款采用同源建模的方法预测蛋白质三级结构的在线软件,此外它还能够预测蛋白质电荷分布、原子间距离和角度等。将斑马鱼TBP的氨基酸序列提交到Swiss-Model,网站给出了3个预测结果,结果如图7。结果显示A、B、C3个结果之间的差异非常微小,与模型蛋白比对覆盖率A~C依次为分别为98.90%,98.90%,97.83%。分析斑马鱼TBP氨基酸序列与同源建模蛋白相似性波形图,结果显示,预测结果A的波形更加稳定并趋近于最高值。表明预测模型A更趋近于真实情况。为了进一步验证模型A的可靠性,采用拉曼图(Ramachandranplot)的方法分析A模型中蛋白质各氨基酸残基二面角角和$角的合理性。使用美国国立卫生研究院(NIH)提供的拉曼图分析网站StructuralAnalysisandVerificationServer对模型A进行拉曼图分析,结果如图8。结果显示,预测的蛋白质残基二面角位于黄色核心区域,表明该蛋白空间结构稳定,所以Swiss-Model的预测结果A可靠。2.8斑马鱼TBP相互作用蛋白预测和分析使用Strmg蛋白质相互作用预测网站对斑马鱼TBP进行蛋白质相互作用预测,结果如图9。与斑马鱼TBP相互作用最紧密的10个蛋白质及预测结果得分(可靠性)见表3。结果显示,与与斑马鱼TBP相互作用最紧密的10个蛋白质均为DNA转录因子[6-8]或TFⅡD的组成部分[9-12],这与斑马鱼TBP参与转录起始的事实相符合。3讨论TBP蛋白主要在DNA转录的起始阶段发挥作用,一方面它帮助DNA双链解旋,另一方面它结合到TATA框,并与后续转录因子相互作用形成转录起始复合物,由于斑马鱼身体透明、繁殖能力强、养殖费用低等特点,斑马鱼被认定为是研究脊椎动物的理想生物模型。本研究主要从生物信息学角度解析了斑马鱼TBP的部分信息。经研究发现,斑马鱼TBP全长302个氨基酸,属于TATA结合蛋白超家族,不含跨膜区。其N端保守性相对较低,氨基酸序列在各物种之间变化明显,在靠近N端的位置存在一个多聚谷氨酰胺重复区,能够调节C端保守区域结合DNA的能力,这种对自身与DNA结合能力的调节能够影响转录起始复合物的形成,并目.多聚谷氨酰胺区谷氨酰胺的数量增加脊髓小脑的共济失调等疾病相关113];在不同物种间,多聚谷氨酰胺区的长度不同,其基本规律遵循由低等动物到高等动物多聚谷氨酰胺区不断增长的特点斑马鱼TBP的C端保守性较高,它含有两个长77个氨基酸的重复序列,组成一个马鞍状维结构跨坐在DNA链上,这个区域与DNA相互作用并结合其他转录因子,突变将导致其对转录起始调节能力的丧失114]。数据显示,斑马鱼TBP与DNA相互作用的保守区(114-281aa)碱性氨基酸(精氨酸+赖氨酸)数量高达26个,而酸性氨基酸(谷氨酸+天冬氨酸)数量只有11个,这种特点可能促进其自身与DNA链酸性核苷酸的结合有关,具体作用机理有待进一步研究。分析斑马鱼TBP的二级结构和三级结构,两种分析结果中a螺旋和yS折叠的数量及出现位置基本一致,拉曼图分析进一步验证了三级结构预测模型的稳定性,说明建模结果可靠,分析结果有助于阐明斑马鱼TBP与其他转录因子相互作用的空间结构基础「在斑马鱼TBP与其他蛋白的相互作用结果中,研究发现与斑马鱼TBP相互作用的蛋均为转录起始复合物和转录因子,其预测结果全部有文献和数据库两方面的证据,结果真实可靠:本研究的分析结果对于深入研究斑马鱼TBP在转录起始过程中的作用具有一定的指导意义。参考文献(References):[1J KORNBERG R D. The molecular basis of eukaryotic transt-rip- tion[J]. Proceedings of the National Academy of Sc iences , 2007, 104(32):55-61.[2] HOCHHEIMER A, TJIAN R. Diversified transcription initia?tion complexes expand promoter selectivity and tissue-specific gene expression[J].Genes & Development, 2003, 17(1 1): 1309- 1320.[3]PUGH B F. Control of gene expression through regulation of the TATA-binding protein[J]. Gene.2000.255(1):1-14.[4]LEE T I, YOUNG R A . Transcription of eukaryotic protein- coding genes[J]. Annual Review of Genetics, 2000.34:77-137.[5]GOLDSHMIT Y, SZTAL T E,JUSUF P R,et al. Fgf-dependent glial cell bridges facilitate spinal cord regeneration in ze-brafish[J]. Journal of Neuroscience, 2012, 32(22): 7477-7492.[6]TAO Y, GUERMAH M,MARTINEZ E,et al. Specific interac?tions and potential functions of human TAFII100 [J]. Journal of Biological Chemistry,1997, 272(10): 6714-6721.[7]BUSHNELL D AWESTOVER K D,DAVIS R E, et al. Structural basis of transcription: an RNA polymerase II -TFIIB cocrysta at 4.5 Angstroms [J]. Science, 2004, 303(5660): 983- 988.[8]DEJONG J, BERNSTEIN R, ROEDER R G, et d. Human general transcription factor TFIIA: characterization of a cDNA encoding the small subunit and requirement for basal and activated transcription[J]. Proceedings of the National Academy of Sciences,1995, 92(8): 3313-3307.[9] SIEGERT J L, ROBBINS P D. Rb inhibits the intrinsic kinase activity of TATA-binding protein-associated factor TAFII250[J]. Molecular and Cellular Biology, 1999, 19(1): 846-854.[10]RUPPERT S, WANG E H, TJIAN K. Cloning and expression of human TAFII250: a TBP -associated factor implicated in cell-cycle regulation[J]. Nature, 1993, 362(6416): 175-179.[11]POINTUD J C,MENQUS G,BRANCORSINI S, et al. The in-tracellular localization of TAF7L, a paralogue of transcription factor TFIID subunit TAF7, is developmentally regulated during male germ-cell differentiation^. Journal of Cell Science , 2003, 116(Pt 9): 1847-1858.[12]FERG M, SANGES R, GEHRIG J. et al. The TATA-binding protein regulates maternal mRNA degradation and differential zygotic transcription in zebrafish[J].The KMBO Journal, 2007, 26 (17): 3945-3956.[13]HART D 0, RAHA T, LAWSON N D, et al. Initiation of ze-brafish haematopoiesis by the TATA-box—binding protein-re?lated factor Trf3[J]. Mature, 2007,450 (7172): 1082-1085.[141 NIKOLOV D B,HU S H,LIN J, et al. Crystal structure of TFIID TATA-box binding protein[J]. Nature, 1992, 360(6399): 40-46.

猜你喜欢

谷氨酰胺斑马鱼结构域
斑马鱼天生就能辨别数量
小斑马鱼历险记
蛋白质结构域划分方法及在线服务综述
瓜蒌不同部位对斑马鱼促血管生成及心脏保护作用
离子选择电极法测定谷氨酰胺酶活力研究
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
组蛋白甲基化酶Set2片段调控SET结构域催化活性的探讨
精氨酸联合谷氨酰胺肠内营养对烧伤患者的支持作用
谷氨酰胺在消化道肿瘤患者中的应用进展
泛素结合结构域与泛素化信号的识别