APP下载

蛋白质间相互作用的研究策略

2011-08-15李志群李培建

实用肝脏病杂志 2011年1期
关键词:信息学酵母基因组

李志群 祝 杨 李培建

对于一种新基因,同时把其编码的新蛋白的结构与生物学功能、生物学和临床医学之间的相互关系、以及新基因表达调节的机制阐明,是目前基因的分子生物学研究领域中最具挑战性的工作。首先利用酵母双杂交(yeast two-hybrid)技术、酵母单杂交技术(yeast one-hybrid)、抑制性消减杂交(SSH,suppression subtractive hybridization)技术、基因芯片(DNA chip)技术、噬菌体表面展示(phage display)技术等获得蛋白结合蛋白的编码基因、差异表达的基因、DNA/RNA结合的蛋白基因等,或利用生物信息学技术获得推测的编码基因。然后,利用分子生物学技术和生物信息学技术相结合的手段,阐明新基因的功能、基因表达启动子的结构和调节机制基础,最终阐明新基因的结构和新蛋白的生物学功能,以及这种基因研究的可能临床医学意义。生物信息学技术与分子生物学技术的结合,是目前基因的分子生物学研究领域中的重要、有效的研究技术和方法[1,2]。

一、蛋白质组学研究的意义

蛋白质组(proteome)最早见诸于1995年7月的“Electrophoresis”杂志上[3],它是指一个有机体的全部蛋白质组成及其活动方式。蛋白质组研究虽然尚处于初始阶段,但已经取得了一些重要进展。当前蛋白质组学的主要内容是,在建立和发展蛋白质组研究的技术方法的同时,进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面,通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱,相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱建立的意义在于为进一步的分析工作提供基础。蛋白质组分析的另一方面,是比较分析在变化了的生理条件下蛋白质组所发生的变化[4]。如蛋白质表达量的变化,翻译后修饰的变化,或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。研究蛋白质间的相互作用有多种方法,常用的如酵母双杂交系统、亲和层析、免疫沉淀、蛋白质交联等。其中,酵母双杂交系统是当前发展迅速、应用广泛的主要方法。通过分析一个蛋白质是否跟功能已知的蛋白质相互作用可得到揭示其功能的线索。因为经验告诉我们,如果两个蛋白质相互作用,那么它们一般参与相同或相关的细胞活动[4]。从近期国际上蛋白质组学研究的发展动向可以看出,揭示蛋白质之间的相互作用关系,建立相互作用关系的网络图,已成为揭示蛋白质组复杂体系与蛋白质功能模式的先导,业已成为蛋白质组学领域的研究热点。

二、酵母双杂交系统的建立与发展

酵母双杂交系统(yeast two-hybrid system)自建立以来已经成为分析蛋白质相互作用的强有力的方法之一。该方法在不断完善,如今它不但可用来在体内检验蛋白质间的相互作用,而且还能用来发现新的作用蛋白质,在对蛋白质组中特定的代谢途径中蛋白质相互作用关系网络的认识上发挥了重要的作用。

双杂交系统的建立得力于对真核生物调控转录起始过程的认识。细胞起始基因转录需要有反式转录激活因子的参与。80年代的工作表明,转录激活因子在结构上是组件式的(modular),即这些因子往往由两个或两个以上相互独立的结构域构成,其中有DNA结合结构域(DNA binding domain,简称为DB)和转录激活结构域(activation domain,简称为AD),它们是转录激活因子发挥功能所必需的。单独的DB虽然能和启动子结合,但是不能激活转录。而不同转录激活因子的DB和AD形成的杂合蛋白仍然具有正常的激活转录的功能。如酵母细胞的Gal4蛋白的DB与大肠杆菌的一个酸性激活结构域B42融合得到的杂合蛋白仍然可结合到Gal4结合位点并激活转录[5]。

Fields等人的工作标志双杂交系统的正式建立[6]。他们以与调控SUC2基因有关的两个蛋白质Snf1和Snf2为模型,将前者与Gal4的DB结构域融合,另外一个与Gal4的AD结构域的酸性区域融合。由DB和AD形成的融合蛋白现在一般分别称之为“诱饵”(bait)和“猎物”或靶蛋白(prey or target protein)。如果在Snf1和Snf2之间存在相互作用,那么分别位于这两个融合蛋白上的DB和AD就能重新形成有活性的转录激活因子,从而激活相应基因的转录与表达。这个被激活的、能显示“诱饵”和“猎物”相互作用的基因称之为报道基因(reporter gene)。通过对报道基因表达产物的检测,反过来可判别作为“诱饵”和“猎物”的两个蛋白质之间是否存在相互作用。在此Fields等人采用编码β-半乳糖苷酶的LacZ作为报道基因,并且在该基因的上游调控区引入受Gal4蛋白调控的GAL1序列。这个改造过的LacZ基因被整合到酵母染色体URA3位上。而酵母的GAL4基因和GAL80基因(Gal80是Gal4的负调控因子)被缺失,从而排除了细胞内源调控因子的影响。已经知道在Snf1和Snf2之间存在相互作用。结果发现只有同时转化了Snf1和Snf2融合表达载体的酵母细胞才有β-半乳糖苷酶活性,单独转化其中任何一个载体都不能检测出β-半乳糖苷酶活性。

在酵母的有性生殖过程中涉及到两种配合类型:a接合型和α接合型,这两种单倍体之间接合(mating)能形成二倍体,但a接合型细胞之间或α接合型细胞之间不能接合形成二倍体。根据酵母有性生殖的这一特点,他们将文库质粒转化α接合型酵母细胞,“诱饵”表达载体转化a接合型细胞。然后分别铺筛选平板使细胞长成菌苔(lawn),再将两种菌苔复印到同一个三重筛选平板上,原则上只有诱饵和靶蛋白发生了相互作用的二倍体细胞才能在此平板上生长。单倍体细胞或虽然是二倍体细胞但DB融合蛋白和AD融合蛋白不相互作用的都被淘汰。长出来的克隆进一步通过β-半乳糖苷酶活力进行鉴定[7]。

三、生物信息学技术与新基因的研究

新基因的克隆化无异是生物医学领域创新知识源泉的重要组成部分。这一任务,不仅是人类基因组计划(HGP)的核心内容,同时也是后基因组计划(post-HGP)的重要内容.多年来,随着以人的基因克隆化为主的不同生物类型基因克隆化研究的进展,已然积累了大量的不同生物的基因序列、蛋白质的氨基酸残基序列,同时对于不同生物种属之间基因序列、蛋白质以及结构序列的保守结构位点也积累了丰富的资料,并据此建立了庞大的数据库系统。对于这些数据的分析,必须依靠计算机分析技术。计算机分析技术的不断发展,为这些资料和数据的分析建立了一些有效的分析技术。因此,自然而然就将基因和蛋白质结构的资料与计算机分析技术结合起来,形成了目前极具潜力的新兴交叉学科-生物信息学(bioinformatics)技术。生物信息学技术的形成和发展,大大促进了以基因的分子生物学为核心内容的现代生物医学的发展,以基因的分子生物学为核心内容的理论和技术,已经成为生物学领域、医学领域重要的创新知识源泉[8]。

四、生物信息学在蛋白质研究中的应用

随着后基因组时代的到来,阐明基因组所表达的全部蛋白质的表达规律和生物功能,即蛋白质组的研究,成为我们研究的最终目的,因为蛋白质才是生命活动的真正执行者[9]。现有的蛋白质研究方法,如双向电泳等电聚焦、色谱分析、质谱分析等,都需要特殊设备且价格昂贵;体外翻译表达系统可研究蛋白质的加工、释放和亚细胞定位,但操作繁琐,而生物信息学为我们提供了一条可以直接由基因或蛋白质序列进行蛋白质功能预测和结构分析的捷径。

生物信息学(bioinformatics)是生物与计算机科学以及应用数学学科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,达到解释数据所蕴含的生物学意义的目的。

由于基因组和蛋白质组研究提供了极为丰富的数据,因而需要我们对这些数据进行高度自动化管理,建立严谨的数据库并编写相应的软件,这项工作本身也极大地推动了生物信息学的发展,而生物信息学在蛋白质的研究中将发挥特殊作用[10]。下面将介绍生物信息学技术在蛋白质功能预测和结构分析中的作用。

五、生物信息学发展趋势

生物信息学内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。它研究的是揭示基因组信息结构的复杂性及遗传语言的根本规律,解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。随着人类基因组计划(Human Genomic Project,HGP)的完成和功能基因组计划的实施,积累了大量的关于核苷酸、蛋白质一级结构和高级结构的数据,人们的注意力和工作重点已从基因组测序转向对基因组表达、蛋白质结构与功能的预测和分析。为了解释和理解这样大量的数据,自然地引进了信息科学与技术、物理、数学及计算机学科的理论与技术,从而出现了生物信息学这一崭新的交叉学科。虽然独立的生物信息学技术在世界各地广泛运用,并已经形成产业,但各种核苷酸和蛋白质一级结构和高级结构数据库的建立,以及因特网的联系与数据库资料的共享,代表了生物信息学的主流内容和工具。生物信息学的逐渐形成和发展,对于生物医学各个学科都产生了革命性的影响[8,11~15]。

[1]ALTSCHUL SF,GISH W,MILLer W,MEYERS EW,LIPMAN DJ.Basic local alignment search tool[J].J Mol Biol 1990;215:403-410.

[2]成军.新基因结构与功能研究的策略[J].世界华人消化杂志.2003,11(4):373-377

[3]WASINGER V C,CORDWELL S J,CERPA-POLJAK A et al.Progress with gene-product mapping of the mollicutes:Mycoplasma genitalium[J].Electrophoresis,1995,16:1090-1094.

[4]潘竹林,李津婴,闵碧荷.蛋白质组在医学研究中的进展[J].国外医学临床生物化学与检验学分册,2002,23(1):43-44.

[5]MA J,PTASHNE M.A new class of transcriptional activators[J].Cell,1987,51:113-119.

[6]FIELDS S,SONG O.A novel genetic system to detect proteinprotein interactions[J].Nature,1989,340:245-246.

[7]BENDIXEN C,GANGLOFF S,ROTHSTEIN R.A yeast matingselection scheme for detection of protein-protein interactions[J].Nucleic Acids Res,1994,22:1778-1779.

[8]成军,刘妍,陆荫英,等.生物信息学技术与新基因的研究[J].世界华人消化杂志,2003,11(4):474-477.

[9]成军.新基因结构与功能研究的策略[J].世界华人消化杂志,2003,11(4):373-377.

[10]成军,杨倩,刘妍,等.小鼠和大鼠NS5ATP4同源基因序列的生物信息学分析[J].世界华人消化杂志,2004,12(7):1582-1587.

[11]成军,李克,陆荫英,等.丙型肝炎病毒核心蛋白结合蛋白6基因和蛋白的生物信息学分析[J].世界华人消化杂志,2003,11(4):378-384.

[12]LUSCOMBE NM,GREENBAUM D,GERSTEINM.Whatis bioinformatics A proposed definition and overview ofthe field[J].Methods Inf Med,2001,40(4):346-358.

[13]BONETT L.Bioinformatics-from genes to pathways[J].Nat Methods,2004,1(2):169-176.

[14]ANDRADE MA,SANDER C.Bioinformatics:from genome data to biological knowledge[J].Curr Opin Biotechnol,1997,8(6):675-683.

[15]BICHET A,POLVERARI D,MALPERTUY A.Gene regulation and bioinformatics[J].Bull Cancer,2005,92(1):97-107.

猜你喜欢

信息学酵母基因组
牛参考基因组中发现被忽视基因
鸡NRF1基因启动子区生物信息学分析
初论博物馆信息学的形成
酵母抽提物的研究概况
酵母魔术师
人CyclinD1在毕赤酵母中的表达
生物量高的富锌酵母的开发应用
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组