瘟病毒属3种病毒多聚蛋白酶基因同义密码子偏爱性分析
2015-02-21王国超孟庆玲刘昱成杨海波贺志昊彭叶龙陈创夫
王国超,乔 军,孟庆玲,刘昱成,杨海波,贺志昊,彭叶龙,谢 堃,陈创夫
(石河子大学 动物科技学院 预防兽医学重点实验室,新疆 石河子 832003)
瘟病毒属3种病毒多聚蛋白酶基因同义密码子偏爱性分析
王国超,乔 军,孟庆玲,刘昱成,杨海波,贺志昊,彭叶龙,谢 堃,陈创夫
(石河子大学 动物科技学院 预防兽医学重点实验室,新疆 石河子 832003)
【目的】 分析黄病毒科瘟病毒属的猪瘟病毒(CSFV)、牛病毒性腹泻病毒(BVDV)和羊边界病毒(BDV) 3种病毒多聚蛋白酶基因密码子的使用特点,初步探讨3种病毒多聚蛋白酶基因的进化及对不同宿主的适应策略。【方法】 运用EMBOSS软件的CHIPS和CUSP程序及CodonW在线分子生物学软件,分析CSFV、BVDV和BDV的有效密码子数(ENc),碱基GC含量(Gcall),密码子第1、2、3位GC含量(GC1、GC2、GC3),相对同义密码子使用度(RSCU)及同义密码子第3位的GC含量(GC3s),并对3种病毒多聚蛋白酶基因的ENc进行绘图分析。【结果】 CSFV、BVDV、BDV 3种病毒多聚蛋白酶基因的ENc值分别为51.205,51.323和52.580,表明3种病毒多聚蛋白酶基因的密码子偏好程度均较低;上述3种病毒多聚蛋白酶基因的GC含量分别为46.84%,45.99%和45.71%,均不超过50%;除BDV多聚蛋白酶基因同义密码子含量表现为GC1>GC3>GC2外,CSFV和BVDV均表现为GC3>GC1>GC2,且除CSFV的GC3为52.02%外,所有病毒的GC1、GC2、GC3均小于50%,可见3种病毒间的碱基组成(GC含量)及ENc值差异较小。RSCU 分析表明,与CSFV偏爱使用G/C结尾的密码子不同,BVDV和BDV更偏爱使用以A结尾的密码子,这可能与病毒对宿主的适应策略有关。ENc绘图分析(Nc-plot)说明,碱基组成对密码子使用模式影响较小。【结论】 CSFV、BVDV、BDV 3种病毒多聚蛋白酶基因密码子的偏好性较低,这可能是病毒进化过程中对宿主的一种适应策略。
黄病毒科瘟病毒属;多聚蛋白酶基因;同义密码子;偏爱性
猪瘟病毒(Classical swine fever,CSFV)、牛病毒性腹泻病毒(Bivine viral disease virus,BVDV)和羊边界病毒(Border disease virus,BDV)是对养猪业、养牛业和养羊业危害严重的重要病毒,这3种病毒同为黄病毒科(Flaviviridae)瘟病毒属(Pestivirus)成员[1]。该属病毒有囊膜,基因组为单股正链RNA,长约12.3 kb,包含一个大的开放性阅读框架(ORF),该ORF翻译成含3 898个氨基酸残基、分子质量约438 ku的多聚蛋白,在病毒和宿主细胞酶的作用下加工形成 C、Erns、E1和E2 4种结构蛋白及 Npro、p7、NS2-3(NS2和NS3)、NS4A、NS4B、NS5A和NS5B 7 种非结构蛋白[2]。为了探讨黄病毒科瘟病毒属这3种病毒多聚蛋白酶基因密码子的使用特点,本研究利用EMBOSS和CodonW在线软件,对CSFV、BVDV和BDV 3种不同病毒多聚蛋白酶基因的密码子使用特点进行了初步分析,以期为进一步研究该属病毒的遗传进化及其对宿主的适应机制奠定基础。
1 材料与方法
1.1 CSFV、BVDV和BDV多聚蛋白酶基因序列的获取
在GenBank下载CSFV、BVDV和BDV全基因组序列,截取各个病毒多聚蛋白酶基因序列(CDS)用于分析,在本研究中各病毒基因组信息见表1。
1.2 CSFV、BVDV和BDV多聚蛋白酶基因密码子的偏爱性分析
将CSFV、BVDV和BDV多聚蛋白酶基因序列分别递交到EMBOSS (http: //genopole.toulouse.inra.fr/apps/emboss),运行CHIPS程序和CUSP程序,在线分析各病毒多聚蛋白酶基因的有效密码子数(Effective number of codon,ENc)、碱基GC含量(Gcall)、GCi含量(密码子第1、2、3位GC含量,即GC1、GC2、GC3)及同义密码子第3位的 GC含量(GC3s)。利用在线软件 CodonW,计算相对同义密码子使用度(Relative synonymous codon usage,RSCU)。
有效密码子数(ENc值)是一个基因的密码子使用频率与同义密码子平均使用频率偏差的量化值,其范围在20(每个氨基酸只使用一个密码子的极端情况)到61(各个密码子均被平均使用的情况)之间,ENc值越低表示密码子偏爱性越大,值越高表示密码子偏爱性越小。所有密码子均衡使用时ENc取值为61,即密码子使用不存在偏好性。当ENc≤35时认为密码子使用具有显著偏好性,当ENc≥50时认为偏好性较低[3]。
RSCU用以检测基因中全部密码子使用的变化,其值等于同义密码子的实测值与同义密码子平均使用时期望值的比值。对于同义密码子家族中的密码子来说,如果这个同义密码子的RSCU值大于1,则表明该密码子的使用频率高于期望值[4-5]。
1.3 CSFV、BVDV和BDV多聚蛋白酶基因的ENc绘图分析
绘图分析ENc值和GC3s分布间的关系,标准曲线(即ENc与GC3s的函数关系曲线(Nc-plot))表示在不存在选择压力时,密码子偏好性完全取决于突变压,即序列本身核酸组成的偏好性。若1个基因的密码子使用模式受到GC碱基组成的影响,那么这个基因将落在Nc-plot期望曲线的上面或较近的位置,否则该基因将落在距离期望曲线比较远的位置。ENc期望值可以通过以下公式计算:ENc期望值=2+S+{29÷[S2+(1-S)2]},其中S代表GC3s[6]。
2 结果与分析
2.1 3种病毒多聚蛋白酶基因的ENc值分析
3种病毒多聚蛋白酶基因ENc值、GC含量和同义密码子各位置的GC含量计算结果见表2。表2显示,CSFV、BVDV、BDV 3种病毒多聚蛋白酶基因的ENc值分别为51.205,51.323和52.580,均大于50,表明它们不具有较明显的密码子使用偏爱性,即密码子偏好程度较低。
2.2 3种病毒多聚蛋白酶基因GC含量分析
CSFV、BVDV、BDV 3种病毒多聚蛋白酶基因GC含量偏低(CSFV为46.84%,BVDV为45.99%,BDV为45.71%),均不超过50%(表2)。从密码子3个位置的GC含量来看,在CSFV和BVDV多聚蛋白酶基因中GC含量表现为GC3>GC1>GC2(表2)。通过SPSS15.0软件对3种病毒多聚蛋白酶基因碱基组成的分析发现,GC1与GC3含量差异不显著,GC1与GC2含量、GC2与GC3含量差异均极显著。这3种病毒多聚蛋白酶基因中GC含量相对偏低,而密码子的使用特性与基因的碱基组成密切相关,主要受编码区GC含量及GC3含量的影响,据此推测碱基组成不是决定3种病毒多聚蛋白酶基因密码子用法的主要因素。
分析GC12(GC1与GC2均值)与GC3含量的相关性可研究密码子使用的影响因素,若GC12与GC3含量的相关性有统计学意义,则密码子使用受突变影响;若GC12与GC3含量相关性无统计学意义,则第1、2位和第3位碱基组成不同,密码子使用更多地受到翻译选择的影响。分析表2结果显示,GC12与GC3含量无显著相关性,这说明3种病毒多聚蛋白酶基因密码子使用特点也受到了翻译选择的影响。
2.3 3种病毒多聚蛋白酶基因同义密码子的使用频率分析
为了解这3种病毒多聚蛋白酶基因密码子的具体使用情况,用CodonW软件计算相对同义密码子使用度(即RSCU值),用CUSP程序计算密码子比例和频率,其中密码子比例(Fract) 表示各个密码子在编码该氨基酸的密码子中所占的比例(各比例相加总和=1),密码子频率(1/1 000)代表该密码子在编码基因总密码子中出现的频率(即在1 000个密码子中出现的次数),结果见表3。由表3可知,CSFV多聚蛋白酶基因有25个RSCU值大于1的密码子,其中以A、T、G、C结尾的各有9、1、5、10个,偏爱密码子有8个;BVDV多聚蛋白酶基因有29个RSCU值大于1的密码子,其中以A、T、G、C结尾的各有13、1、6、9个,偏爱密码子有8个;BDV多聚蛋白酶基因有31个RSCU值大于1的密码子,其中以A、T、G、C结尾的各有12、8、5、6个,偏爱密码子有9个。在CSFV和BDV的多聚蛋白酶基因中,分别以G/C和A/T结尾的密码子占RSCU值大于1密码子的绝大部分, 而在BVDV多聚蛋白酶基因中,以A/T、G/C结尾的密码子数量十分接近。从表4可以看出,BVDV和BDV在偏爱密码子的使用上尤其偏爱使用以A结尾的密码子,这一点则与CSFV有所不同(偏爱使用以C结尾的密码子),3种病毒的宿主不同,这可能与病毒对宿主的适应策略有关。
注:下划线数据为同一氨基酸密码子的最高频率;“*”表示终止密码子。
Note:Underlined are the upmost frequency of codon for same amino acid;“*” denotes termination codon.
注:“-”表示该氨基酸无密码子偏爱性。
Note:“-” denotes the amino acid without codon preference.
2.4 3种病毒多聚蛋白酶基因的ENc绘图分析
ENc期望值不仅可以探讨密码子使用的偏好性,而且可以用来检测碱基组成对密码子偏好性的影响。如果ENc实测值接近ENc期望值,则密码子偏好性由碱基组成决定;如果ENc实测值偏离ENc期望值,则密码子使用模式主要受翻译选择的影响。根据GC3s含量和ENc期望值计算3种病毒多聚蛋白酶基因的ENc期望值,结果显示,CSFV的ENc期望值为60.501,BVDV的ENc期望值为60.291,BDV的ENc期望值为59.967,均高于各自的实际计算值(CSFV为 51.205,BVDV为51.323,BDV为52.580),这说明碱基组成对密码子使用模式影响较小。
3 讨 论
由黄病毒科瘟病毒属CSFV、BVDV和BDV 3种病毒引起的疾病在世界范围内广泛流行,导致大量家畜发病死亡,造成巨大经济损失,严重制约着畜牧业的健康发展。近年来,关于CSFV和BVDV研究已经成为热点,开展与其相关的研究都必须对病毒的基因组进行详细分析。然而,本研究选择的这3种病毒的基因组大小差异较小(全基因组大小约12.3 kb,都只含1个ORF),使不同病毒间碱基组成及ENc值的比较等指标分析较易准确进行,因此本研究着重分析了3种病毒多聚蛋白酶基因密码子偏好性使用的差异。在分析每种病毒时用到多个参考序列,其中还涉及到一些具有代表性的标准毒株序列,同时这3种病毒属于同一个科同一个属,使得本研究所获得的分析结果具有一定的可借鉴性。
本研究分析结果显示,CSFV、BVDV和BDV 3种病毒多聚蛋白酶基因密码子的偏好性较低,这符合RNA病毒基因组容易变异的特性,较弱的密码子偏好性是病毒进化中对宿主的一种适应策略[7];同时这3种病毒密码子偏好性受碱基组成影响较小,与病毒密码子偏好性较低这一特点相一致,且3种病毒间相同偏好性的密码子也较少。ENc绘图分析(Nc-plot)结果进一步证明,碱基组成对密码子使用模式影响较小,进行病毒与宿主密码子使用模式相关性分析能够进一步揭示病毒进化与宿主的适应机制[8]。有报道认为,密码子偏好是基因突变和选择的结果,受进化过程中多种因素的影响[9]。本研究首先从ENc值初步推断了3种病毒在密码子的使用上不存在明显的偏向性。基于CUSP程序和CodonW软件的分析结果也表明,3种病毒多聚蛋白的编码序列在每个氨基酸不同密码子的使用上均存在一定的差异性,明显偏爱的密码子也不尽相同。由于存在同义密码子,大多数氨基酸不只由一种密码子进行编码,因此不同的生物必然存在编码同一种氨基酸的不同密码子(同义密码子)的选择作用,组成限制和翻译选择是目前认为导致密码子偏爱性的主要原因[9]。此外,在对人类RNA病毒的研究中发现,密码子的偏爱性主要是因为翻译选择而导致的[10]。还有一些研究则认为,密码子的偏爱主要是由基因的功能决定的,不同的功能需要就决定了不同密码子的用法[10]。同时近几年的研究表明,影响密码子使用偏爱性的可能因素包括基因表达水平[11-12]、翻译起始效应[13-14]、基因碱基组分[15]、某些二核苷酸的出现频率[16-17]、GC含量[18-19]、基因长度[20]、tRNA丰度[21-22]、编码蛋白的结构和功能[23]及密码子-反密码子间结合能的大小[24]等,其中基因组的碱基组分在同义密码子偏爱性的产生方面占有较大的优势。但是密码子用法对这3种病毒各自宿主的适应策略还有待于进一步研究。
[1] 殷 震,刘景华.动物病毒学 [M].2版.北京:科学出版社,1997.
Yin Z,Liu J H.Animal virology [M].2nd ed.Beijing:Science Express,1997.(in Chinese)
[2] Tao P,Dai L,Luo M,et al.Analysis of synonymous codon usage in classical swine fever virus [J].Virus Genes,2009,38(1):104-112.
[3] Wright F.The “effective number of codons” used in a gene [J].Gene,1990,87(1):23-29.
[4] Wang M, Zhang J,Zhou J H,et al.Analysis of codon usage in bovine viral diarrhea virus [J].Arch Virol,2010,156(1):153-160.
[5] Sharp P M,Li W H.Codon usage in regulatory genes inEscherichiacolidoes not reflect selection for “rare” codons [J].Nucleic Acids Res,1986,14(19):7737-7749.
[6] Burns C C,Shaw J,Campagnoli R,et al.Modulation of poliovirus replicative fitness in HeLa cells by deoptimization of synonymous codon usage in the capsid region [J].J Virol,2006,80(7):3259-3272.
[7] Chantawannakul P,Cutler R W.Convergent host-parasite codon usage between honeybee and bee associated viral genomes [J].J Invertebr Pathol,2008,98(2):206-210.
[8] 周晓明,赵慧芳,陆嘉良,等.甲型流感病毒基因变异与生存选择压力相关性分析 [J].中华传染病杂志,2005,23(4):221-223.
Zhou X M,Zhao H F,Lu J L,et al.Correlation analysis of type A inlfuenza virus genetic variation characteristic with survival selective pressure [J].Chinese Journal of Infectious Diseases,2005,23(4):221-223.(in Chinese)
[9] 杨 丽,郭万柱,殷华平,等.伪狂犬病病毒基因组密码子用法特点分析 [J].预防兽医学报,2007,29(2):103-106.
Yang L,Guo W Z,Yin H P,et al.Analysis of characteristic codon usage in pseudorabies virus genome [J].Chinese Journal of Preventive Veterinary Medicine,2007,29(2):103-106.(in Chinese)
[10] Jenkins G M,Holmes E C.The extent of codon usage bias in human RNA viruses and its evolutionary origin [J].Virus Res,2003,92(1):1-7.
[11] Duret L,Mouchiroud D.Expression pattern and,surprisingly,gene length shape codon usage inCaenorhabditis,DrosophilaandArabidopsis[J].Proc Natl Acad Sci USA,1999,96(8):4482-4487.
[12] Carlini D B,Chen Y,Stephan W.The relationship between thi-rd-codon position nucleotide content,codon bias,mRNA secondary structure and gene expression in the drosophild alcohol dehydrogenase genes Adh and Adhr [J].Genetics,2001,159(2):623-633.
[13] Sakai H,Washio T,Saito R,et al.Correlation between sequence conservation of the 5′untranslated region and codon usage bias in Mus musculus genes [J].Gene,2001,276(1/2):101-105.
[14] Stenström C M,Jin H,Major L L,et al.Codon bias at the 3′-side of the initiation codon is correlated with translation initiation efficiency inEschemchiacoli[J].Gene,2001,263(1/2):273-284.
[15] Fedorov A,Saxonov S,Gilbert W.Regularities of context: Dependent codon bias in eukaryotic genes [J].Nucleic Acids Res,2002,30(5):1192-1197.
[16] Ohno S.Universal rule for coding sequence construction:TA/GC deficiency-TG/CT excess [J].Proc Natl Acad Sci USA,1988,85(24):9630-9634.
[17] Karlin S,Campbell A M,Mrazek J.Comparative DNA analysis across diverse genornes [J].Annu Rev Genetics,1998,32:185-225.
[18] 石秀凡,黄京飞,柳树群,等.人类基因同义密码子偏好的特征以及与基因GC含量的关系 [J].生物化学与生物物理进展,2002,29(3):411-414.
Shi X F,Huang J F,Liu S Q,et al.The features of synonymous codon bias and GC-content relationship in human genes [J].Progress in Biochemistry and Biophysics,2002,29(3):411-414.(in Chinese)
[19] Rodríguez-Trelles F,Tarrío R,Ayala F J.Switch in codon bias and increased rates of amino acid substitution in theDrosophilasaltansspecies group [J].Genetics,1999,153(1):339-350.
[20] Moriyama E N,Powell J R.Gene length and codon usage bias inDrosophilaraelanogaster,SaccharomycescerevisiaeandEscherichiacoli[J].Nucleic Acids Res,1998,26(13):3188-3193.
[21] Moriyama E N,Powett J R.Codon usage bias and tRNA abundance inDrosophila[J].J Mot Evoi,1997,45(5):514-523.
[22] Moszer I,Rocha E P C,Danchin A.Codon usage and lateral gene transfer inBacillussubtilis[J].Current Opinion in Microbiology,1999,2(5):524-528.
[23] 顾万君,马建民,周 童,等.不同结构的蛋白编码基因的密码子偏性研究 [J].生物物理学报,2002,18(1):81-86.
Gu W J,Ma J M,Zhou T,et al.Condon usage in genes coding for proteins with differen tertiary structures [J].Acta Biophysica Sinica,2002,18(1):81-86.(in Chinese)
[24] 石秀凡,黄京飞,梁宠荣,等.人类基因中同义密码子的偏好与密码子-反密码子间的结合强度密切相关吗 [J].科学通报,2000,45(23):2520-2525.
Shi X F,Huang J F,Liang C R,et al.Is there a close relationship between synonymous codon bias and codon-anticodon binding strength in human genes [J].Chinese Science Bulletin,2000,45(23):2520-2525.(in Chinese)
Analysis of synonymous codon preferences of poly protease genes in three viruses of FlaviviridaePestivirusgenus
WANG Guo-chao,QIAO Jun,MENG Qing-ling,LIU Yu-cheng,YANG Hai-bo, HE Zhi-hao,PENG Ye-long,XIE Kun,CHEN Chuang-fu
(KeyLaboratoryofPreventiveVeterinaryMedicine,DepartmentofAnimalScienceandTechnology,ShiheziUniversity,Shihezi,Xinjiang832003,China)
【Objective】 This study analyzed the application characteristics of poly protease gene codons of classical swine fever virus (CSFV),bovine viral diarrhea virus (BVDV) and sheep boundary virus (BDV) and discussed their evolution and adaptive strategies for different hosts.【Method】 Effective number of codons (ENc),GC contents,GC contents of synonymous codons at 1st,2nd,and 3rd positions,relative synonymous codon usage (RSCU) and GC3s of CSFV,BVDV and BDV were analyzed using CHIPS and CUSP programs of EMBOSS (European Molecular Biology Open Software Suite) and CodonW software.Meanwhile,poly protease genes of the three viruses were analyzed by ENc plotting.【Result】 The ENc values of poly protease genes of CSFV,BVDV,and BDV were 51.205,51.323 and 52.580,respectively,indicating that the codon preferences of poly protease genes of the three viruses were all low.GC contents of them were 46.84%,45.99%,and 45.71%,respectively.Synonymous codons contents of BDV poly protease gene were in a decreasing order of GC1>GC3>GC2,while those of CSFV and BVDV were in a decreasing order of GC3>GC1>GC2.All GC contents of GC1,GC2,and GC3 were lower than 50%,except GC3 of CSFV (52.02%).The differences in base compositions of the three viruses and ENc values were small.RSCU analysis showed that CSFV was different from BVDV and BDV,CSFV preferred to use G or C ending codons,while BVDV and BDV preferred to use A ending codons.This may be related to virus host adaptation strategies.ENc plots (Nc-plot) showed that base composition had little effect on the codon usage patterns.【Conclusion】 The condon preferences of poly protease genes of CSFV,BVDV,and BDV were low,which may be related to their host adaptation strategies.
Pestivirusgenus of the family Flaviviridae;poly protease gene;synonymous codon;prefere nce
2013-09-09
新疆生产建设兵团国际科技合作计划项目(2012BC006);公益性行业(农业)科研专项子课题项目(201303037-5)
王国超(1985-),男,陕西韩城人,在读硕士,主要从事病原分子生物学研究。E-mail:xjwangguochao@sina.cn
乔 军(1971-),男,陕西榆林人,教授,博士,主要从事分子病毒学研究。E-mail:qj710625@yahoo.com.cn
时间:2014-12-12 09:30
10.13207/j.cnki.jnwafu.2015.01.022
S852.65+9.6
A
1671-9387(2015)01-0007-07
网络出版地址:http://www.cnki.net/kcms/detail/61.1390.S.20141212.0930.022.html