非洲猪瘟病毒的基因特征
2020-03-04谢春芳于瑞嵩董世娟陈冰清
谢春芳,于瑞嵩,董世娟,陈冰清
(1.上海市农业科学院畜牧兽医研究所,上海 201106;2.上海市农业遗传育种重点实验室动物遗传工程实验室,上海 201106)
非洲猪瘟病毒(African Swine Fever Virus,ASFV)是非洲猪瘟病毒科(Asfarviridae)非洲猪瘟病毒属(Asfivirus)唯一的成员,是双链DNA大分子病毒,基因组长度介于170 kb~193 kb,编码150~167个蛋白,其基因组从DNA的两条链上读取,基因紧密间隔,病毒基因组末端由碱基不完全配对的发夹环共价闭合。发夹环以两种形式存在,互补并相互反转,与终端相邻的是多种串联的反向重复序列。大多数ASFV毒株的基因组GC含量*为38%,GC含量相对较低的区域位于基因组两端的左可变区(Left Variable Region,LVR)和右可变区 (Right Variable Region,RVR), 容易发生基因变异的多基因家族(Multigene Family,MGF)分布于LVR和RVR[1-2]。
1 与复制和转录相关的基因
细胞被ASFV感染后,病毒DNA开始在细胞核周围复制,F1055L蛋白在复制的起始时结合DNA,并与DNA起始酶融合。病毒基因组编码病毒基因转录和复制所需的酶、参与DNA碱基切除修复(Base Excision Repair,BER)途径的酶、逃逸免疫的酶、多基因家族蛋白(MGF360、MGF110、MGF100、MGF505)、功能性蛋白、结构蛋白和许多目前未知的蛋白。ASFV编码基因有150多个,ASFV基因编码早期表达的蛋白主要包括与基因组复制相关的蛋白、后期转录因子及与免疫逃逸相关的MGFs蛋白;ASFV结构蛋白主要在感染后期表达[3-6]。
ASFV的转录机制类似于真核RNA聚合酶Ⅱ(RNA polymerase Ⅱ,RNAPⅡ)系统,包括一个(8-亚基)ASFV RNAP和TATA结合蛋白(TATA Binding Protein,TBP)、转录起始因子Ⅱ B(Transcription Initiation Factor Ⅱ B,TFⅡB)、延伸因子(Transcription Elongation Factor Ⅱ,TFⅡ)以及DNA结合蛋白pA104R和拓扑异构酶Ⅱ pPⅡ92R[3,7-9]。
在感染ASFV的细胞中,病毒颗粒包含早期基因转录所需的所有酶和因子,病毒基因组转录不依赖宿主RNA聚合酶。在ASFV基因组中,与转录起始位点(Transcription Start Site,TSS)重叠的起始子(Initiator,Inr)元件是区分早期和晚期基因启动子的一个特征。早期基因Inr是一个TANA四核苷酸基序,其中N没有核苷酸偏好,ASFV基因的Inr与TSS重叠,早期表达基因启动子的特征序列是TA(TSS);而晚期基因Inr表现出对序列TATA的强烈偏好,晚期表达基因启动子的特征是序列TATA(TSS)。早期基因和晚期基因与5’-非翻译区(5’Untranslated Regions,5’-UTRs)的长度有关,即mRNA N端与翻译起始密码子之间的距离,晚期基因的5’-UTR比早期基因的5’-UTR短,晚期基因的AT含量高于早期基因的;在TSS的上游有一个保守区,分别对应早期启动子基序(Early Promoter Motif,EPM)和晚期启动子基序(Late Promoter Motif,LPM),早期保守区的序列比晚期保守区的有更高的保守性。ASFV启动子没有一致的序列,但是编码链中7个或更多个连续的胸腺嘧啶残基(7 thymidylate residues,7T motif)是mRNA C端的形成信号 [3,11-13]。
为了维持ASFV基因组的完整性,ASFV进化出了自己的碱基切除修复(Base Excision Repair,BER)系 统。该系统包括abasic(AP)核酸内切酶(AP endonuclease)、修复聚合酶(repair Polymerase,PolX)和 连 接 酶 (Ligase,LIG)。这些酶的主要功能是维持病毒基因组的完整性,还在ASFV的基因突变和基因型形成中发挥重要作用,修复细胞内环境对ASFV产生的病毒DNA损伤。ASFV PolX包含5’-磷酸基团(5’-P)结合囊的结构域,ASFV LIG N端包含DNA结合域,其中ASFV AP是BER系统中的关键酶,ASFVpE296R基因编码病毒的AP。AP属于Ⅱ类AP内切酶家族,主要催化无碱基位点AP 5’端的DNA裂解反应,生成3’-羟基和5’-脱氧核糖磷酸(deoxyRibose Phosphate,dRP)。ASFV AP具有3’→5’核酸外切酶、3’-磷酸二酯酶和核苷酸切割修复(Nucleotide Incision Repair,NIR)活性,对ASFV在宿主细胞中的存活起着至关重要的作用,pE296R基因的缺失极大地降低了ASFV在细胞中的生长[14-19]。
2 与结构蛋白相关的基因
ASFV的形态为二十面体,病毒粒子分核心、内衣壳、内膜、外衣壳和外膜共五层,目前已知有19个基因编码结构蛋白。
ASFVA104R基因编码pA104R核蛋白,细胞被ASFV感染后2 h,转录病毒A104R基因,在感染后期细胞表达pA104R。pA104R是病毒的组蛋白样蛋白,与DNA高度亲和,与DNA结合位点长约11 nt~20 nt,pA104R上的精氨酸69残基和脯氨酸74残基对pA104R结合DNA的活性起关键作用[20-22]。
ASFVCP2475L基因编码病毒的多蛋白 220(polyprotein 220,pp220),其水解产物是病毒核壳的主要结构蛋白p150、p37、p34和p14;CP530R基因编码病毒的另一个多蛋白pp62,其主要水解产物是蛋白 p35和 p15。p150、p37、p34和 p14、p35和p15是形成核壳的主要蛋白[23]。
ASFVD117L基因编码p17蛋白,其既是内膜蛋白又是衣壳蛋白;二十面体衣壳蛋白(Capsid protein)包括p72、M1249L、p17、p49和 H240R,其中 p72是主要的衣壳结构蛋白,编码基因B646L是晚期表达的蛋白;B438L基因编码另一个衣壳蛋白p49,其位于二十面体衣壳的顶点,是一个顶点蛋白;M1249L基因编码的蛋白连接了二十面体中两个相邻的五边体,形成了三边体的边[24-26]。
p54蛋白是一个免疫原性衣壳结构蛋白,编码P54蛋白的基因在编码区有两组串联重复序列(tandem repeat sequence),第一组由15个核苷酸的六次重复组成,第二组由12个核苷酸的二次不完全重复组成[27]。
3 与酶相关的基因
ASFV基因编码转录并加工mRNAs需要的蛋白和酶,其中EP1242L、C147L、NP1450L、H359L、D205R、CP80R编码 6个与RNAⅡ型多聚酶类似的亚基。NP868R基因编码mRNA帽酶的3个结构域:三磷酸酶、胍基转移酶和甲基转移酶。I226R基因和I243L基因在独立启动子的控制下,在ASFV感染的多个阶段能转录多种mRNA[28-29]。
ASFVP1192R基因编码病毒的Ⅱ型拓扑异构酶(topoisomerase Ⅱ),pP1192R酶能够通过去乙酰化作用松弛DNA的超螺旋结构,P1192R基因在病毒感染后2 h开始转录,在感染后16 h转录达到高峰。ASFVB318L基因编码反式丙烯酰胺转移酶,反式丙烯酰胺转移酶在体外催化法尼基二磷酸和异戊烯基二磷酸缩合合成二磷酸或二磷酸长链,B318L基因包含一个氨基末端疏水序列和所有异戊二烯转移酶的特征区域[30-31]。
ASFVG1211R(G1207R)基因位于96 365 nt~99 997 nt,该基因阅读框内的起始密码子是第2个ATP,而不是第1个ATP,基因序列具有串联重复,对磷乙酸敏感。该基因在病毒感染的早期和晚期都表达蛋白,表达α样DNA螺旋酶,蛋白大小为 139.8 KDa, 等 电 点 pI为 8.2。ASFV RNA螺旋酶pQP509L和pQ706L在病毒感染的中晚期出现。ASFVC962R基因编码NTP酶,ASFVG1211R基 因编 码DNA多聚酶,E301R基因编码增殖细胞核抗原样蛋白(Proliferating Cell Nuclear Antigen,PCNA-like protein), 该 蛋 白与DNA多聚酶直接作用于ASFV DNA,钳住DNA酶到DNA链[32-35]。
ASFVO174L基因编码DNA聚合酶β样蛋白,一个属于X族DNA聚合酶的修复性DNA聚合酶。聚合酶X在病毒感染时能有效通过碱基切除修复(Base Excision Repair,BER)修复单核苷酸DNA断裂,随着猪巨噬细胞突变频率的增加,ASFV聚合酶X基因的缺失导致DNA损伤的累积,这种特殊的基因对维持病毒的遗传信息至关重要。ASFVI1215L基因编码病毒的泛素结合酶,调节宿主细胞的泛素-蛋白酶体系统(ubiquitin-proteasome system,UPS)。pI1215L泛素结合酶能在pH 4~9、4 ℃~42 ℃环境中始终保持活性。I1215L基因在细胞感染ASFV的早期开始转录,在感染后2 h和16 h分别达到转录高峰,pI1215L泛素结合酶可能参与病毒生命周期的不同阶段。在病毒感染的中后期,即病毒DNA复制、转录和翻译的活跃时期,pI1215L泛素结合酶在细胞质内的“病毒工厂”内可以被检测到[36-39]。
4 与免疫相关的基因
ASFV的免疫抑制及免疫逃避主要与其多基因家族基因编码的蛋白相关。ASFV基因组内的多样性主要分布于基因组左右两端区域,左端35 kb和右端15 kb的两个区域包含了多个多基因家族,包括MGF360、MGF505、MGF110、MGF100、MGF530等。MGF505和MGF360是 ASFV的毒力因子,可用于疫苗的设计;MGF360和MGF505/530能抑制诱导和影响Ⅰ型干扰素的作用;MGF360和MGF505拷贝数的减少不影响病毒的复制,但能减弱病毒的毒力;MGF505-7R(A528R)基因编码的蛋白抑制Ⅰ型和Ⅱ型干扰素信号途径,抑制细胞内JAK激酶(一类信号分子)和信号转导与转录激活因子(Signal Transducer and Activator of Transcription,STAT)(一类信号分子)的通路途径(JAK-STAT passway)以及干扰素刺激基因(Interferon Stimulated Gene,ISG)的 表 达;MGF110基因包含一个信号肽,是一个多样性基因,位于基因组LVR,容易发生基因缺失;MGF基因受其自身启动子的控制[40-45]。
多基因家族具有相似的序列特征,在不同的基因组中,多家族基因的数量和序列是可变的。多基因家族成员MGF100、MGF110、MGF300、MGF360、MGF505/530和p22家族成员的得失是ASFV基因组变异最常见的原因,它们位于左端40 kb和右端20 kb内。MGF505和MGF360开放阅读框(Open Reading Frame, ORF)的突变与ASFV的毒力密切相关;ASFVMGF110基因在LVR中的缺失与衰减表型相关。MGF110-7L、MGF505-5R、K145R、I267L、DP60R第一个基因发生G→A突变,但突变是沉默的,对蛋白质氨基酸序列没有任何影响;在MGF505-5R基因中检测到其他G→A突变,导致缬氨酸突变为异亮氨酸,MGF-505-4RORF的天冬氨酸突变为天冬酰胺;MGF360-16RORF插入A后引起与下游编码DP63R的阅读框融合;单个碱基非同义突变导致MGF505-9R(赖氨酸突变为谷氨酸)单一氨基酸替换和NP419L(天冬酰胺突变为丝氨酸);MGF505-5R的缬氨酸突变为异亮氨酸[46-48]。
5 基因突变和变异
ASFVp72基因最早用于基因分型。p72基因中A、C、G和T所占的比例分别为:0.273 3、0.240 8、0.187 4和 0.298 6,根据C端p72基因分类法,ASFV的基因变异多达22种以上。感染基因Ⅱ型ASFV的猪会出现临床症状,感染基因Ⅸ型ASFV的猪则无临床症状。EP402R基因编码的CD2v是ASFV血红素吸附及抑制相关的蛋白,是ASFV血清学分型的依据[49-51]。
2014年至2018年,在欧洲和中国的ASFV分离株中发现了许多不同基因的累积突变。在不同基因和基因间区域的ASFV分离株中已经发现了多个单核苷酸的变化,包括一些预测翻译蛋白的移码和截短的变化。K145R基因内C→A突变导致另一种替代,即丝氨酸突变为酪氨酸。在I267L基因中发现了T→A突变,导致异亮氨酸突变为苯丙氨酸。在DP60R基因中检测到了其序列特有的最后一个变异,单个A的插入引起了阅读框移位,导致开放阅读框延长14 nt,编码O174L的ORF基因序列中有14个碱基插入;在QP383R、KP177R、CP204L和MGF360-16RORFs之间的基因间区域(位置21 588 nt~24 589 nt)也容易有碱基的插入;QP383RORF一个碱基的缺失或者一个A的插入使12个连续密码子移码;KP177RORF中插入A导致了阅读框移位,从而导致假定的蛋白质截短(基因缺失);CP204LORF中双重TT插入引起了阅读框移位,导致终止密码子的过早出现,并导致蛋白质C端最后几个残基的截短;E184L基因中还检测到其他独特的G→A突变;B602Ll基因中的小规模串联重复序列数量增加[52-58]。
6 小结
综上所述,ASFV基因组有150多个开放阅读框,编码150多个蛋白,其中50多个是结构蛋白;基因组两端主要编码与免疫相关的多基因家族,两端可变区LVR和RVR以及中央可变区的基因容易发生基因碱基突变和变异。ASFV基因组的数量庞大而且复杂、易变,导致对ASFV的研究充满了挑战。目前科技界对ASFV的认识还非常有限,还有许多未知基因等待去探索了解。