禽呼肠病毒基因组及其编码蛋白研究进展
2018-04-14谢丽基谢芝勋
谭 伟,谢丽基,谢芝勋
(广西壮族自治区兽医研究所,广西兽医生物技术重点实验室,广西南宁 530001)
呼肠病毒科有12个病毒属,其中正呼肠病毒属(Orthoreovirus)是其成员之一。正呼肠病毒属的典型代表是哺乳动物呼肠病毒,而禽呼肠病毒(Avian reoviruses,ARV)也是正呼肠病毒属中的重要成员。禽呼肠病毒能感染鸡、火鸡和番鸭等禽类,主要引起雏鸡病毒性关节炎和腱鞘炎、矮小综合征和吸收障碍综合征及免疫抑制,以及雏番鸭肝坏死等。禽呼肠病毒与哺乳动物呼肠病毒虽有不少相似之处,但它们在感染的宿主范围、致病性、血凝特点、融合细胞的作用以及病毒基因组编码蛋白的能力等方面则存在明显的差异。与哺乳动物呼肠病毒相比,人们对禽呼肠病毒分子生物学方面的研究起步相对较晚。本文叙述了禽呼肠病毒的基因组结构及其所编码蛋白的结构与功能,为禽呼肠病毒的研究提供参考。
1 禽呼肠病毒基因组结构及特点
ARV是不含囊膜的双链RNA病毒。病毒粒子呈球形20面体对称结构,直径约为70 nm~80 nm。成熟的病毒粒子含有双层蛋白衣壳,即外层衣壳和内层衣壳[1]。内层衣壳又叫核心衣壳,其包裹着病毒的全部遗传信息,即病毒基因组。病毒基因组由10个呈线性排列、长短不一的病毒双链RNA分子组成[1]。
根据病毒RNA片段在电泳中迁移速率的不同,可将ARV的10个RNA基因片段分成三类,即L(large)类、M(middle)类和S(small)类[1]。L类RNA的分子质量较大,包括病毒的3个基因片段L1、L2和L3;M类RNA的分子质量居中,所含病毒的3个基因片段为M1、M2和M3;S类RNA的分子质量较小,在电泳胶中的泳动速率较快,由S1、S2、S3和S4共4种病毒基因片段所组成。此外,禽呼肠病毒粒子中还有一些富含腺嘌呤的寡聚单链核苷酸,但它们的具体功能目前仍不十分清楚[1]。
ARV的重要代表性毒株有ARVS1133株、ARV138株及ARV176株等[2]。ARVS1133株是从美国康州患病毒性关节炎的肉鸡群中分离的[3-4],ARV138株是在加拿大的New Brunswick从感染了ARV的鸡跗关节(hock joint)中分离出来的[5];而ARV176株则是在美国佐治亚州从感染了ARV的鸡跗关节中分离得到的[6]。ARV全基因组测序结果显示,ARVS1133株、ARV138株和ARV176株的10个RNA基因片段有以下基本特点[1,7]:①ARV的RNA基因正链与病毒mRNA分子的碱基序列相同;②ARV mRNA的5′末端含有甲基化的帽状结构,但其3′末端缺少由多聚腺苷酸所构成的尾巴;③ARV的10个RNA正链基因5′末端和3′末端的非翻译区中,均含有保守序列:5′末端的碱基序列是GCUUUU,3′末端的则为UCAUC[7]。据推测病毒基因片段中的这些保守序列可能在感染细胞内参与病毒基因的复制、转录及包装等过程;④S3基因5′末端的非翻译区最长,含有30个核苷酸;而M1基因和L3基因5′末端的非翻译区最短,均为12个核苷酸[7];⑤M2基因3′末端的非翻译区最长,为98个核苷酸;而S1基因3′末端的非翻译区最短,仅为33个核苷酸;⑥S2基因的核苷酸序列非常保守,而L3基因的序列则变化很大[7]。
ARV RNA基因的复制及转录均发生在病毒的核心衣壳内,由病毒自身编码的、依赖于RNA的RNA聚合酶 (RNA-dependent RNA polymerase,RdRp) 所介导。具体来说,ARV基因的复制和转录是在细胞浆中的包涵体(inclusions)内进行的。此类包涵体又称为病毒加工厂(viral factories or viroplasms)[1]。包涵体内有病毒的结构蛋白和非结构蛋白,但缺少膜样结构或细胞器。
2 禽呼肠病毒合成的蛋白种类
ARV含有10个双链RNA基因片段,可编码12种病毒蛋白[1,7]。其中的8种病毒蛋白(λA、λB、λC、μA、μB、σA、σB和σC)为结构蛋白,参与构成病毒粒子;其余4种蛋白(μNS、p10、p17和σNS)为非结构蛋白,它们虽能在病毒感染的细胞内表达,但它不是成熟病毒粒子的组成部分。此外,若将ARV μB蛋白和μNS蛋白翻译后加工的裂解产物(μBN、μBC、μNSN和μNSC)也计算在内的话,则在ARV感染的细胞中能检测到16种病毒蛋白产物。ARV的外层衣壳主要由μB蛋白及σB蛋白所构成,同时还含有λC、μBN、μBC及σC蛋白;而病毒的内层衣壳则主要由λA蛋白和σA蛋白所组成,且含有λB、λC和μA蛋白[1]。在ARV所有的蛋白中,只有λC蛋白为病毒外层衣壳和内层衣壳所共有。ARV的转录酶复合物由病毒的RNA聚合酶λB及其辅助因子μA所组成[1,7]。
3 禽呼肠病毒蛋白的结构与功能
ARV的L1、L2及L3基因可依次编码病毒的结构蛋白λA、λB和λC;而M1、M2及M3基因则分别编码病毒的结构蛋白μA、μB及非结构蛋白μNS;S2、S3及S4基因可分别编码病毒的结构蛋白σA、σB及非结构蛋白σNS。以上这9个RNA基因片段均为单顺反子(monocistron)结构,只能编码1种蛋白产物。与此相反,S1基因片段比较特殊,为多顺反子(polycistron)结构,含有3个部分重叠,并能分别指导蛋白质翻译的开放阅读框(open reading frame,ORF),分别编码病毒的2种非结构蛋白 p10、p17和1种结构蛋白σC[1,2,8]。下面将逐一介绍ARV基因组所编码的8种结构蛋白和4种非结构蛋白。
3.1 ARV L类基因的L1、L2和L3片段分别编码λA、λB及λC蛋白
ARV L1基因由3 958个核苷酸所组成,其5′末端和3′末端的非翻译区分别含有20个及56个核苷酸[7]。L1基因所编码的λA结构蛋白含有1 293个氨基酸(amino acids,aa),分子质量约为142 ku[7]。λA蛋白参与构成病毒内层衣壳的基本骨架。在ARV138分离株和ARV176分离株所编码的蛋白中,λA蛋白的氨基酸序列非常保守[7]。病毒内层衣壳中不仅含有病毒基因组的10个RNA片段、同时还含有病毒RNA聚合酶λB以及辅助因子μA蛋白。在ARV感染的细胞中,λA蛋白能在μNS蛋白的介导下进入包涵体或病毒加工厂[9]。病毒加工厂的形态在ARV及哺乳动物呼肠病毒中有所不同,前者呈圆球状[10],而后者则大多以线状方式排列[11]。
ARV L2基因由3 829个核苷酸组成,编码含有1 259个氨基酸、分子质量约为140 ku的λB结构蛋白[7,12]。λB蛋白不是病毒内层衣壳的主要成分,但具有依赖于RNA的RNA聚合酶(RdRp)活性,能与μA蛋白一起构成ARV的转录酶复合体。在已知的禽呼肠病毒和哺乳动物呼肠病毒所编码的蛋白中,RdRp的氨基酸序列保守性很强[12]。λB蛋白可分为6个区:①N末端区;②指状功能区;③指状/手掌交界区;④手掌功能区;⑤拇指功能区;⑥C末端功能区。值得指出的是,在禽呼肠病毒、哺乳动物呼肠病毒以及水生动物呼肠病毒(Aquareovirus)的RdRp所含的手掌功能区中,均可找到在所有RNA病毒的RdRp中都存在的、由甘氨酸-天冬氨酸-天冬氨酸(GDD)3个氨基酸所组成的保守序列[12]。
ARV L3基因由3 907个核苷酸组成,其5′末端的非翻译区仅含12个核苷酸,而其3′末端的非翻译区含有37个核苷酸[7]。L3基因所编码的λC结构蛋白由1 285个氨基酸所组成,分子质量约为142 ku[7]。在ARV138分离株和ARV176分离株所编码的蛋白中,λC蛋白的氨基酸序列保守性较差[7]。λC蛋白直接贯穿ARV病毒粒子的内层衣壳及外层衣壳。λC蛋白N末端的384个氨基酸残基具有鸟苷酸转移酶的活性,其C末端则具有甲基化酶的活性[10]。5个相同的λC蛋白聚集后可形成角塔状结构,当转录合成的、且尚未完全成熟的病毒mRNA前体经角塔状结构溢出病毒衣壳时,病毒mRNA的5′末端可获得甲基化的帽状结构[10]。
3.2 ARV M类基因的M1、M2和M3片段分别编码μA、μB及μNS蛋白
ARV的M1基因含有2 283个核苷酸,可编码由732个氨基酸组成、分子质量约为82 ku的μA蛋白[7]。μA蛋白是病毒内层衣壳的组成成分,并且是RdRp的辅助因子[13]。M1基因5′末端和3′末端的非翻译区分别含有12个及72个核苷酸。蛋白二级结构的分析结果显示,μA蛋白可分成4个区域:①N末端区(aa 1-149);②可变区 (aa 150-462);③富含α-螺旋的区域(aa 463-615);④C末端区(aa 616-732)。μA蛋白中的α-螺旋结构约占38%,而β-片层结构大致占20%[13]。
ARV的M2基因全长为2 158个核苷酸,其5′末端和3′末端的非翻译区分别含有29个及98个核苷酸。M2基因编码的μB结构蛋白含有676个氨基酸、分子质量约为73 ku[7]。μB蛋白是病毒外层衣壳中的主要成分,参与病毒进入细胞的过程。μB蛋白的N末端含有肉豆蔻酰化序列[14]。细胞内的蛋白水解酶能作用于μB蛋白的第42位天门冬酰胺与第43位脯氨酸残基的连接部位,将一部分μB蛋白水解成μBN和μBC,这两种裂解产物参与构成ARV的外层衣壳[1]。μBC蛋白的C末端在病毒感染的细胞内经过连续水解之后,可分别形成两种裂解产物δ及δ′,它们可以促进具有转录活性的病毒衣壳释放到细胞浆中[15]。
ARV的M3基因含有1 996个核苷酸,其5′末端和3′末端的非翻译区分别含有24个及64个核苷酸。M3基因所编码的μNS非结构蛋白由635个氨基酸所组成,分子质量约为71 ku[7,13,16]。μNS蛋白经细胞蛋白水解酶裂解后,可进一步形成μNSN(15 ku)及μNSC(55 ku)两种蛋白产物。μNS蛋白可分成5个区域[13]:①N末端区(aa 1-68);②第1个富含α-螺旋的区域(aa 69-209);③可变区 (aa 210-349);④第2个富含α-螺旋的区域(aa 350-603);⑤C末端区(aa 604-635)。μNS蛋白中的α-螺旋结构约占52%,而β-片层结构仅占13%[13]。
μNS蛋白之间相互作用可形成同种蛋白寡聚物或与ARV的其他蛋白形成杂合蛋白寡聚物[1]。μNS是ARV中唯一有能力形成包涵体的病毒蛋白,提示μNS蛋白是构成“病毒加工厂”的重要组分[17]。μNS蛋白能与病毒正链RNA相结合,参与病毒mRNA的转录过程[1]。此外,μNS蛋白还能与病毒的非结构蛋白σNS及病毒内层衣壳蛋白λA相互作用,帮助它们进入病毒加工厂。在病毒感染的细胞中,μNS蛋白是形成病毒加工厂的必要组分,而且它在ARV早期形态发生过程中发挥着重要的作用[17]。
3.3 ARV S类基因的S1、S2、S3和S4片段分别编码p10、p17、σC、σA、σB及σNS蛋白
ARV的S2基因含有1324个核苷酸,其5′末端和3′末端的非翻译区分别含有15个及58个核苷酸[7]。S2基因可以编码由416个氨基酸组成、分子质量约为46 ku的σA结构蛋白[7]。σA是组成病毒内层核心衣壳的结构蛋白,能与双链RNA非特异性结合,通过抑制蛋白激酶R(protein kinase R,PKR)的活性而起到拮抗干扰素的作用[18]。同时σA蛋白还具有三磷酸核苷-磷酸水解酶的活性[19]。σA蛋白在ARV感染早期通过激活PI3K/Akt信号通路,促进细胞的复制,从而有利于ARV的复制[20]。同时,σA蛋白还与p17蛋白相互作用抑制mTORC2与CDK2/cyclin A2和上调PSMB6蛋白酶,进而下调Akt的表达诱导自噬和细胞周期阻滞,从而有力于ARV的复制[21]。
研究表明,σA蛋白介于外层衣壳μBC蛋白和内层衣壳λA蛋白之间,参与稳定ARV内、外层衣壳的结构以及病毒粒子的装配过程[22]。虽然S2基因复制、转录和翻译发生在细胞浆,但其所编码的σA蛋白却能够进入细胞核。关于σA蛋白在细胞核中发挥何种作用仍有待于进一步研究[23]。
ARV的S3基因含有1 202个核苷酸,其5′末端和3′末端的非翻译区分别含有30个及68个核苷酸[7]。S3基因编码由367个氨基酸组成、分子质量约为41 ku的σB结构蛋白[7]。σB蛋白是病毒外层衣壳的主要成分。ARV感染细胞后,σB蛋白能很快地与等量的μB蛋白及μBC蛋白相结合,装配形成病毒外层衣壳前体[9,17]。关于σB蛋白的确切功能目前仍不十分清楚。
ARV的S4基因含有1 192个核苷酸,其5′末端和3′末端的非翻译区分别含有23个及65个核苷酸[7]。S4基因可以编码含有367个氨基酸的非结构蛋白σNS[7,24]。σNS蛋白在体外能与单链DNA或含有部分双链结构的RNA分子相互作用[25],同时还能自身聚合形成同源二聚体或三聚体[1]。ARV感染细胞后,表达的σNS蛋白能很快与μNS蛋白结合,积聚在病毒加工厂中。研究表明,σNS蛋白能与病毒RNA基因片段结合,促进病毒RNA基因之间的相互作用,并有可能参与病毒RNA基因节段的复制、遴选及装配等过程[1]。
ARV的S1基因片段由1 643个核苷酸所组成,其5′末端和3′末端的非翻译区分别含有24个及33个核苷酸[7]。有趣的是,该基因含有3个相互重叠的ORFs,可分别编码p10、p17 及σC 3种蛋白[2,7]。这是有效扩大基因编码容量的一个非常典型的例子,即在病毒mRNA的有限长度范围内,通过几个ORF之间发生相互重叠来充分扩展病毒基因的编码能力[2]。
p10是由98个氨基酸所组成的非结构蛋白,由S1基因中的ORF-1所编码,分子质量约为10.3 ku[1]。p10蛋白为跨膜蛋白,存在于病毒感染的细胞表面。其位于细胞膜外的N末端含有一融合序列,能使病毒感染的细胞与其周围未感染的正常细胞发生融合,形成含有多个细胞核的巨型合胞体[2]。p10蛋白的C末端位于细胞浆内,并富含碱性氨基酸。p10蛋白的第9位及21位的氨基酸残基均为半胱氨酸,可形成分子内二硫键,有助于稳定融合序列的环状结构。p10蛋白还能提高细胞膜的通透性 ,但此功能似乎与p10蛋白的融合序列无关[1]。研究表明,E3泛素连接酶Siah-1通过与 P10作用,能抑制禽呼肠病毒在宿主细胞的复制[26]。
p17蛋白含有146个氨基酸,也是ARV的非结构蛋白[7],由S1基因中的ORF-2所编码。其C末端含有细胞核内定位信号及细胞核外转运信号,因此p17蛋白可以在细胞核与细胞浆之间来回穿梭,但p17蛋白进入细胞浆的过程并不依赖于染色体区维持蛋白CRM1[27]。p17蛋白的细胞核内定位信号位于其蛋白氨基酸的残基119-128之中,即119IAAKRGRQLD128[28]。禽呼肠病毒p17蛋白通过抑制CDK1和PLK1进行影响G2/M期细胞周期,从而有利于病毒的复制[23]。
p17蛋白可以通过不同的方式来促进ARV的繁殖。其一,p17蛋白能通过调控宿主细胞内蛋白翻译的起始因子及延长因子,通过与CDK1激酶相互作用来阻碍从细胞周期的G2期进入M期,从而有利于ARV在细胞内复制和扩增[23]。其二,p17蛋白能诱发并激活细胞内的自噬途径(autophagic pathway),提高自噬蛋白Beclin 1及LC3-Ⅱ蛋白的表达,促进病毒在细胞内的复制和增殖[23,29]。p17蛋白的这一作用主要是通过激活细胞内的PTEN(phosphatase and tensin deleted on chromosome 10)、AMPK(AMP-activated protein kinase)及 PKR/eIF2α等信号传导途径来加以实现的[6,28]。然而,p17蛋白激活PKR的详细机制目前仍不清楚。
σC蛋白含有326个氨基酸,分子质量约为35 ku,由S1基因中的ORF-3 所编码。σC参与构成ARV外层衣壳,但它不是主要成分。σC蛋白在每个病毒粒子中的拷贝数仅为36个[30]。虽然其含量很低,但它仍属于ARV的结构蛋白,能起到中和抗原的作用,可刺激机体产生抑制病毒活力的特异性中和抗体,因此它是制备ARV疫苗的首选免疫原之一[31]。 在ARV编码的蛋白中,σC蛋白的变异程度较高,其高变区分别位于σC蛋白的氨基酸残基1-122及196-326两个区域[32]。
σC蛋白能以同源三聚体的形式吸附于易感细胞表面的受体,是ARV中唯一能吸附易感细胞的病毒蛋白[33]。由σC蛋白三聚体所形成的蛋白三维结构含有两个功能区,分别位于茎部和头部。茎部区在σC蛋白的N末端,而头部区则位于σC蛋白的C末端。位于σC蛋白头部区的C末端对产生针对ARV的特异性中和抗体至关重要[31]。研究表明,σC蛋白的C末端在原代鸡胚成纤维细胞及部分传代细胞系中能诱发细胞凋亡[34-35]。
4 展望
ARV是引起鸡病毒性关节炎、腱鞘炎、矮小综合征和吸收不良综合征、免疫抑制,雏番鸭肝坏死和火鸡肠炎等疾患的致病因子。在ARV感染的宿主细胞中,能检测出ARV编码的蛋白产物多达16种。尽管研究人员已对ARV的基因组结构、所编码的蛋白及功能有了较为深入的研究,但目前仍未有ARV与宿主细胞受体相互作用的研究报道。有关ARV病毒蛋白与宿主细胞之间相互作用的研究也十分有限,其详细的分子作用机制也有待于进一步阐明。因此,深入研究ARV编码的蛋白在病毒生活周期中所起的作用以及弄清哪些病毒蛋白参与感染并诱发疾病的过程,将有助于揭示ARV在禽类的致病机理,发现新的抗病毒治疗靶位,对今后研发ARV的高效疫苗及抗ARV新药具有重要意义。