APP下载

寄生性吸虫谷胱甘肽过氧化物酶生物信息学分析*

2010-06-07蔡国斌蒋明森

中国人兽共患病学报 2010年4期
关键词:血吸虫吸虫内含子

章 莹,蔡国斌,何 立,蒋明森

谷胱甘肽过氧化物酶(glutathione peroxidase,GPx)是生物体内广泛存在的一种重要的过氧化物分解酶,以谷胱甘肽作为还原剂催化还原H2O2、有机氢过氧化物和脂氢过氧化物等活性氧分子(ROS)〔1〕,从而保护细胞膜的结构及功能不受过氧化物的干扰及损害,对维持细胞膜结构的完整性具有重要的意义。迄今发现GPx是一个至少包含6种不同同工酶(isoenzyme)的大型酶家族,包括经典/胞浆型谷胱甘肽过氧化物酶(GPx1/c-GPx)、胃肠型谷胱甘肽过氧化物酶(GPx2/GPx-GI)、血浆型谷胱甘肽过氧化物酶(GPx3/p-GPx)、磷脂氢谷胱甘肽过氧化物酶(GPx4/PHGPx)、附睾特异性谷胱甘肽过氧化物酶(GPx5/e-GPx)和气味代谢谷胱甘肽过氧化物酶(GPx6/o-GPx)。其中PHGPx被认为是一种独特的抗氧化酶,能直接保护生物膜免受过氧化损伤〔2〕。Cookson等(1992)和 Zelck 等(2004)认为GPx在感染性寄生虫中是组成酶防御系统的主要前线,以确保它们暴露在宿主代谢产生的有害ROS环境中得以生存〔3-4〕。

本文旨在通过网络资源,搜寻到包括几种重要医学吸虫在内的不同生物GPx的cDNA、基因组DNA序列,然后通过生物信息学和比较基因组学方法,分析吸虫GPx基因及其所编码蛋白的分子特性、探讨吸虫GPx与其他生物体GPx的相关性,以及吸虫GPx在生物系统发育中的进化地位等。

1 材料与方法

1.1 医学吸虫GPx的cDNA(包括EST)和基因组DNA序列检索 以华支睾吸虫(Clonorchis sinensis)PHGPx1 cDNA序列(EF056481)作为查询词(query)用于BLASTx,获得从GenBank数据库中已注册的吸虫GPx序列。然后,为了获得更多常见寄生性吸虫GPx的核酸序列,一些常用的寄生虫学专业的基因组或EST数据库用来作进一步的检索:如Sanger institute配备的数据库网站http://www.sanger.ac.uk/Projects/Helminths可检索曼氏血吸虫(Schistosoma mansoni)、埃及血吸虫(S.haematobium)、肝片形吸虫(Fasciola hepatica)等的序列;上海生命科学和生物技术信息中心配备的日本血吸虫数据库(Shanghai Center for Life Science and Biotechnology Information,http://lifecenter.sgst.cn/sj.do)可检索日本血吸虫(S.japonicum)的序列等。

1.2 6大GPx家族DNA和氨基酸序列的检索以华支睾吸虫PHGPx1氨基酸序列(ABK58679)作为query进行BLASTP,获得从GenBank数据库中的许多相近GPx序列。此外,人 c-GPx/GPx1(CAA68491)和p-GPx/GPx3(AAP50261)以及线虫Brugia pahangi GPx3(CAA48882)也用来进行BLASTP以获得其他家族的GPx氨基酸和DNA序列。考虑到相似值和分类学上的分布,共107个成员(分别处在不同GPx家族和不同等级生物体)的氨基酸或cDNA序列用来作生物信息学分析。

1.3 一般生物信息学分析 cDNA序列所编码的开放阅读框(ORF)和同源性分析用美国生物技术信息中心(National Center for Biotechnology Information,NCBI:http://www.ncbi.nlm.nih.gov)网站下的ORF Finder和基本局部比对搜索工具(basic local alignment searvh tool,BLAST)进行分析。使用SECISearch程序(版本2.19,http://genome.unl.edu/SECISearch.html)推测 cDNA 3'-端非翻译区(3'-UT R)是否含有硒半胱氨酸插入序列(selenocysteine insertion sequence,SECIS)。利用SignalP程序(http://www.cbs.dtu.dk/services/SignalP)推测所编码的蛋白质是否含有疏水信号肽,和用ScanSite pI/Mw程序(http://scansite.mit.edu/calc_mw_pi.html)计算理论分子量(Mr)和等电点值(pI)。

1.4 氨基酸序列比对(Amino acid sequence alignment)和系统进化树(Phylogenetic tree)分析 根据相似值和分类学上的分布,各家族成员的氨基酸先用ClustalX工具进行对比,然后用GeneDoc程序优化。首先对所有检索到的医学吸虫GPx序列进行比对,并计算所检测序列的相似值。然后对所有6大GPx家族成员进行比对,并用PHYLIP工具包(版本,ver 3.6b)中的 PROTPARS程序、或NEIGHBOR程序通过最大简约法则(maximum parsimony algorithm,MP)、或邻近归并聚类法则(又名邻接法则,neighbor-joining algorithm,NJ)进行系统学分析。系统树用 TreeView显示,每个分支上的数值用100个随机样品作为输入序列、通过SEQBOOT程序算出有统计意义的数值。

1.5 比较基因组学分析 从基因组和/或EST数据库,利用网络资源检索获得各分类学上不同位置GPx代表成员的cDNA和基因组DNA,通过比较它们之间的碱基序列,得到各成员的基因结构:包括外显子(exon)和内含子(intron)的数量、外显子和内含子的序列长度以及内含子的剪接插入位置(intron phase)。然后进行比较基因组学分析,探讨医学吸虫GPx基因家族在分类学上的进化关系。

2 结 果

2.1 医学吸虫GPx序列分析、及与其他GPx家族氨基酸比对分析 通过检索,共获得吸虫 12个GPx序列,包括华支睾吸虫(Cs)4个、卫氏并殖吸虫(P.westermani,Pw)2个、曼氏血吸虫(Sm)2个、日本血吸虫(Sj)2个、埃及血吸虫(Sh)1个和肝片形吸虫(Fh)1个。各序列分别设定为:CsGPx1(EF056481)、CsGPx2(EF056482)、CsGPx3(EF056483)、CsGPx4(EF056484)、PwGPx1(DQ454159)、PwGPx2(DQ454160)、SmGPx1(L37762)、SmGPx2(AY729668)、SjGPx1(CV689936)、SjGPx2(AY223160)、ShGPx1(Shaem32f07.q1k)和FhGPx1(Fhep45e11.q1k)。各基因编码的氨基酸序列所预测的理论分子量均为20 kDa左右,部分基因N-末端含有疏水信号肽序列(图1中5'-端底划线处)。各氨基酸序列之间具很高的相似度,尤其在活性区高度保守。GeneDoc程序检测的这些吸虫GPx基因的氨基酸序列同一性值从35%到87%,如表1。

表1 寄生性吸虫GPx基因编码的氨基酸之间的同源性值(%)Tab.1 Identities of the GPXs from different parasitic trematodeds

吸虫GPx与哺乳动物宿主人(Homo sapiens,Hs)和鼠(Musmusculus,Mm)6大GPx家族成员氨基酸序列比对结果如图1所示。从图中可见:各家族之间具有较高的同源性,尤其在3个特征区域(即酶活性区,图中方框A、B和C)和3个保守活性残基(图中箭头所示,硒半胱氨酸(U或X)/半胱氨酸(C)、谷氨酰胺(Q)、色氨酸(W)/酪氨酸(Y))具有高度的保守性,非常相似。此外,比对图也显示,有2个区域仅存在于GPx1(c-GPx),GPx2(GPx-GI),GPx3(p-GPx),GPx5(e-GPx)和GPx6(o-GPx)家族,而在GPx4(PHGPx)家族的成员中缺失(图2中用虚线盒I和II表示)。吸虫GPx氨基酸一级结构中缺失这2个插入序列,表明吸虫GPx均属于PHGPx家族成员。

2.2 医学吸虫GPx SECIS、及与其他GPx家族SECIS分析 在分析常见医学吸虫(包括华支睾吸虫、卫氏并殖吸虫、日本血吸虫、曼氏血吸虫、埃及血吸虫和肝片形吸虫等)12个GPx核酸序列是否存在硒半胱氨酸(Sec)和SECIS时发现,除PwGPx1外,其他11个基因在其开放阅读框内均含有一非寻常“TGA”密码子,编码第21个稀有氨基酸Sec(见图1,U),同时在这些基因的cDNA 3'-UTR均含有相对应的SECIS区(如图2B,Trematode GPx)。在其他GPx4家族成员中,Sec和相关SECIS序列仅发现在哺乳动物宿主的mRNA序列中存在,而在被检测的节肢动物中,仅发现一种牛蜱(Boophilus)GPx4(ABA25916)含有Sec和SECIS。其他节肢动物和所有植物中PHGPx均无Sec和SECIS结构。而GPx1,GPx2,GPx3家族仅高等哺乳动物有此特征。所有这些GPx基因的SECIS均含有几个保守的结构域包括:由一个内环隔开的2个螺旋,一SECIS核心结构,一四集体位于第二个螺旋的基部和一个顶环等(图2A)。

2.3 GPx家族系统发育树分析 当用CsGPx1的氨基酸序列进行BALSTP同源性检索时,几百个GPx蛋白能从GenBankTM数据库中获得,它们与CsGPx1有不同程度的相似性(序列同源性identities值在44%~67%之间,E值小于4e-26)。但是,由于其中绝大部分蛋白质的氨基酸序列是PHGPx-样蛋白,因而用人的GPx1(CAA68491)和GPx3(AAP50261)及线虫CAA48882 GPx3-like再进行一次BLASTP搜索,即获得更多其他GPx的成员信息。另外配备在Sanger和 TIGR的各种医学蠕虫的EST数据库也用GPx1和GPx3及GPx4进行筛选,最后有选择性地挑选一批代表各家族成员共107个进行系统发育树分析。

系统发育树所选择的GPx成员包括从真菌(Fungi)、节肢动物(Arachnida)、医学吸虫(Trematoda)、营自生生活线虫(Soil nematoda)、寄生性线虫(Parasitic nematoda)、无脊椎动物(Invertebra-ta)、脊椎动物门(Vertebrata)和植物(Plant)等各分类层次代表。结果显示:根据在生物学分类上不同的地位,各类生物的GPx均一般聚集在一起。迄今Fungi的GPx属哪个家族不是很清楚,GenBank数据库中有的认为是PHGPx家族,有的没有具体分类。包括人和鼠等高等脊椎动物的GPx被分为至少6大家族,而且发现每个基因在其基因组内均以单拷贝形式存在。在较低等的动物中,GPx蛋白存在明显的偏向分布:除蛛形纲(Arachnida)的Ixodes scapulans(AAY66814)外,其他节肢动物、吸虫以及植物等的GPxs蛋白与脊椎动物(包括哺乳动物和人)的PHGPx分布在同一分枝,具有同源性。线虫的GPx基因具有较复杂的分布:Parasitic nematoda的GPx蛋白显示与脊椎动物的GPx1/GPx3 lineage具有更相近的拓扑关系,而Soil nematoda中Caenorhabditiselegans有两种情况,有些GPx分布在GPx3 lineage,有些分布在GPx4 lineage。此外,系统发育树亦显示:吸虫和昆虫的PHGPxs均单独分成了两个不同的亚类。如在吸虫中,CsGPx2、SmGPx1、PwGPx1和PwGPx2被归类在吸虫I亚类 ,而 CsGPx1、CsGPx3、CsGPx4 与 SmGPx2 被归类在吸虫II亚类。

图1 寄生性吸虫GPx与哺乳动物宿主(人和鼠)6大GPx家族成员的氨基酸多重比对分析Fig.1 Multiple sequence alignment of parastic trematodes GPxs with members of six GPx families from Mammalian host(Homo sapiens and Musmusculus)

2.4 医学吸虫GPx基因结构及与其他GPx基因结构分析 通过网络数据库和信息学分析,共获得8个吸虫GPx基因的完整基因组结构,见图3。除CsGPx4是由5个外显子和4个内含子组成外,其他几种吸虫GPx基因均被5个内含子剪接为6个外显子,且所有这些吸虫GPx基因结构高度保守。

各吸虫GPx与不同等级生物(包括高等脊椎动物、线虫、昆虫和植物)PHGPx的基因组结构比较结果如图3所示:根据它们的内含子的数量和位置,各不同等级生物代表物种GPx4基因分享相对比较保守的基因组结构;外显子—内含子的结构在吸虫和哺乳动物宿主之间存在高度相似性。在吸虫GPx基因的 5个内含子中,有 4个跟哺乳动物GPx4基因在位置和ORF剪接插入位置均相同(图中横线上数字所示);从营自由生活的线虫C.elegans和C.briggsae分离的GPx4基因的第1个内含子跟吸虫和哺乳动物的第2个内含子类似,具有一定程度的同源性;从昆虫分离的PHGPx基因与吸虫和脊椎动物的基因没有显示任何结构上的关系,反而与从植物分离的GPx基因存在某种程度的同源性。

图2 寄生性吸虫GPx与其他GPx家族相关成员mRNA中3'-UTR的SECIS分析Fig.2 Analysisof SECIS motif fromdifferent parastic trematodes and other related members of mRNA3'-UTR regions

图3 寄生性吸虫 GPx和其他相关PHGPx“外显子-内含子”基因组结构比较分析Fig.3 Exon-intron structures analysis between the parastic trematode GPx genes and other related PHGPx genes from various organisms

3 讨 论

在所有生物体中(包括细菌、植物和动物),GPx被认为是在抗-ROS防御机制中重要的关键酶〔2〕。PHGPx由于其不仅能降解H2O2,而且还能直接降解整合在细胞膜上的磷脂化合物,因而被认为是一种独特的抗氧化酶〔5〕。本研究通过网络资源,搜寻到多种重要医学吸虫GPx序列。通过氨基酸比对、系统发育树和Sec/SECIS的分析,证明医学吸虫GPx分子均为PHGPx家族成员。一般认为PHGPx在其3个催化区域中,有一个位点含有Sec。Sec插入蛋白质的合成过程受其mRNA的框内UGA密码子和它的下游链的茎-环(stem-loop)结构所控制,这种特殊的茎-环结构称为硒半胱氨酸插入元件(SECIS)。在生物学上,把含有Sec的蛋白称为硒蛋 白 (selenoprotein)〔6〕。分 析 发 现,吸 虫 除PwGPx1基因外,其它均为含硒蛋白(如图1和图2)。不同生物体内,硒-依赖PHGPx(sPHGPx)和硒-非依赖PHGPx(siPHGPx)存在严重的偏向分布特征。图2显示,除一节肢动物Boophilus microplus外,仅在脊椎动物和吸虫的PHGPx mRNA中检测到含有Sec和SECIS序列。以往研究报道认为,sPHGPx比siPHGPx酶的活性要更高,其原因是由于在生理条件下sPHGPx(pKa=5.2)比siPHGPx(pKa≥8.0)更容易使还原状态转变为氧化状态〔7〕。因此,siPHGPx酶可能存在另外的机制以一种新的方式发挥其在细胞内抗氧化的功能〔8〕。或者,也有可能siPHGPx作为抗氧化酶在特殊的细胞器中发挥作用,这些细胞器内可能受半胱氨酸的巯基基团离子能的作用,使得其有特殊的pH微环境。

在分析基因组结构时,内含子的获得或丢失、以及内含子的数量和长度大小均可反应生物体之间的进化关系〔9〕。在吸虫GPx基因中,内含子1、4和 5存在明显的长度多态性现象。CsGPx1、CsGPx3、CsGPx4和SmGPx2的第5内含子(长度分别为6,768、2,960、4,851和 1,438bp)明显地大于哺乳动物基因(如人CAA50793为 80bp,鼠 BAA22780为86bp);而 PwGPx1、PwGPx2、CsGPx2 和 SmGPx1的第1内含子(长度分别为 1,772、2,497、2,082和1,290bp)和第4内含子(长度分别为3,018、5,889、2,054和1,609bp)均明显地大于哺乳动物基因(如人CAA50793为1,058和432bp,鼠BAA22780为798和803bp),因而吸虫GPx基因分成了2亚类。总的来说,内含子的长度和数量还是展现出一定的规律,即与生物体基因组的复杂性相关〔10〕,并且这些延长的内含子是与转座子插入有关〔11〕。在寄生性吸虫基因组中,如存在最大长度多态性现象的CsGPx1和CsGPx2基因的第5内含子就整合了一非长末端重复序列反转座子(non-LTR retrotransposons),其与曼氏血吸虫的SR2非长末端重复序列反转座子同源。PwGPx1和PwGPx2基因的第4个内含子也分别整合了一与曼氏血吸虫的penelope-like LT R retrotransposon,Perere-10同源的反转座子和一与曼氏血吸虫non-LTR retrotransposon,Perere-6同源的非长末端重复序列反转座子。

比较基因组学分析表明,吸虫PHGPx基因结构与哺乳动物PHGPx具有更高的同源性(图3),表明寄生虫与宿主之间PHGPx基因可能是从共同的祖先基因逐渐进化而来,此基因含有6个外显子和5个内含子。在进化过程中,哺乳动物PHGPx基因获得一内含子,而吸虫 PHGPx基因通过复制(duplication),然后形成分支(divergence)。第一分支(Trematode I)保留了祖先基因结构,而第5个内含子的长度得到延伸(如CsGPx2,PwGPx1,PwGPx2和SmGPx1)。第二分支(T rematode II)内含子1和内含子4的长度则变短(如CsGPx1,CsGPx3,CsGPx4和SmGPx2)。另外,在生物进化过程中,一些PHGPx基因在祖先基因的第1和第2外显子之间丢失了1个内含子(如CsGPx4),而有些PHGPx基因保持了祖先基因的结构或者丢失了信号肽序列(如CsGPx3)。更复杂的分析包括昆虫、线虫和植物等在内的所有不同分类等级生物体的PHGPx基因的进化方式需更进一步的分析。

〔1〕A rthur,JR.The glutathione peroxidases〔J〕.Cell Mol Life Sci,2000,57(13-14):1825-1835.

〔2〕Imai H,Nakagawa Y.Biological significance of phospholipid hydroperoxide glutathione peroxidase(PHGPx,GPx4)in mammalian cells〔J〕.Free Radic Biol Med,2003,34(2):145-169.

〔3〕Cookson E,Blaxter M L,Selkirk ME.Identification of the major soluble cuticular glycoprotein of lymphatic filarial nematode parasites(gp29)as a secretory homolog of glutathione peroxidase〔J〕.Proc Natl Acad Sci USA,1992,89(13):5837-5841.

〔4〕Zelck UE,Von Janowsky B.Antioxidant enzymes in intramolluscan Schistosoma mansoni and ROS-induced changes in ex pression 〔J〕.Parasitology,2004,128(Pt 5):493-501.

〔5〕U rsini F,Bindoli A.T he role of selenium peroxidases in the protection against oxidative damage of membranes〔J〕.Chem Phys Lipids,1987,44(2-4):255-276.

〔6〕Kryukov GV,Castellano S,Novoselov SV,et al.Characterization of mammalian selenoproteomes〔J〕.Science,2003,300(5624):1439-1443.

〔7〕Stadtman TC.Selenocy steine 〔J〕.Annu Rev Biochem,1996,65:83-100.

〔8〕Utomo A,Jiang X,Furuta S,et al.Identification of a novel putative non-selenocy steine containing phospholipid hydroperoxide glutathione peroxidase(NPGPx)essential for alleviating oxidative stress generated from polyunsaturated fatty acids in breast cancer cells〔J〕.J Biol Chem,2004,279(42):43522-43529.

〔9〕Jeffares DC,M ourier T,and Penny D.The biology of intron gain and loss〔J〕.Trends Genet,2006,22(1):16-22.

〔10〕Lynch M,Conery JS.The origins of genome complexity 〔J〕.Science,2003,302(5649):1401-1404.

〔11〕Drew AC,Minchella DJ,King LT,et al.SR2 elements,nonlong terminal repeat rctrotransposons of the RTE-1 lineage from the human flood fluke schistosoma mansoni〔J〕.M ol Biol Evol,1999,16(9):1256-1269.

猜你喜欢

血吸虫吸虫内含子
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
犬体内两种人兽共患棘口吸虫的分子鉴定
枝睾阔盘吸虫凉山分离株18S rRNA基因部分序列测定与种系发育分析
血吸虫的种类:并非固定不变
枝双腔吸虫的形态学鉴定及分子进化研究
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
“垃圾DNA”不“垃圾”
陆地棉GhDHN1基因结构及内含子生物信息学分析
新疆南疆规模羊场片形吸虫的基因鉴定及分析
血吸虫并非“吸血虫”