G-四链体及其配体在病毒复制中的功能研究进展
2019-01-10井汇源孙彦婷
井汇源,孙彦婷,张 艳,董 望
(河南牧业经济学院动物医学院,河南郑州450046)
与经典的双链DNA 的双螺旋结构不同,富含鸟嘌呤碱基(G)的核苷酸序列,能够形成四链体结构(G-quadruplex)[1]。4 个 G 通过 Hoogsteen 氢键配对先形成 G 四分体平面(G-tetrad);在含阳离子(K+、Na+等)的缓冲溶液中,或G- 四链体稳定剂(G-quadruplex ligand,G- 四链体配体)诱导条件下,两个以上的G 四分体平面堆叠形成G- 四链体结构[2]。G- 四链体的构成公式为 GxN1-7GxN1-7GxN1-7Gx(x≥3),其中的N 为任意碱基[2]。根据该标准,目前有多个算法可以用于筛选目标核酸中的潜在G- 四链体,包括quadparser、G4P calculator、QGRS mapper 和 QuadBase[3]。
G- 四链体发现于1962 年,早期研究表明G- 四链体结构广泛存在于真核生物染色体DNA 末端富含G 序列的端粒区[3]。端粒区核酸序列形成G- 四链体后,抑制端粒酶的延伸,从而发挥维持端粒长度的作用。接近50 %的人类基因启动子区域中存在G- 四链体基序。G- 四链体配体具备稳定端粒区域的G- 四链体结构的功能,为癌症等疾病的治疗提供潜在靶标。最近,位于RNA 序列上的G-四链体结构及其功能受到研究人员的关注[2]。研究发现G-四链体在RNA 的剪接、核糖体移码、mRNA 的定位、miRNA 的成熟等过程中均发挥重要的作用[2,4]。
G- 四链体作为重要的调控元件,首先在哺乳动物的基因组中被报道,随后在细菌、真菌、原生动物和病毒中也相继发现了G- 四链体的存在[3]。在过去的几年中,大量病毒G- 四链体被报道,为新型抗病毒药物研发提供了潜在靶标。本文重点讨论G- 四链体在病毒中的存在以及发挥的功能,并对G- 四链体配体:包括小分子化学药物和G- 四链体结合蛋白在病毒感染中的作用相关研究进展进行综述。
1 病毒G-四链体结构的生物学功能
研究人员最早从人类免疫缺陷病毒(Human immunodefciency virus,HIV)中发现了G- 四链体结构在病毒中的存在[5]。随后,陆续在双链环状DNA 病毒中的猴空泡病毒40 (Simian virus 40,SV40)和人乳头状瘤病毒(Human papillomaviruses,HPV)[5];双链线状DNA 病毒中的疱疹病毒如人类疱疹病毒 4 型(Human herpesvirus 4,又称 Epstein-Barr virus,EBV)[6]、人类单纯疱疹病毒Ⅰ型(Herpes simplex-1,HSV-1)[7]和卡波氏肉瘤相关疱疹病毒(Kaposi's sarcoma associated herpesvirus,KSHV)[8]的基因组中发现了G- 四链体结构。此外,在DNA 病毒中的乙肝病毒(Hepatitis B virus,HBV)[9]、RNA 病毒中的丙肝病毒(Hepatitis C virus,HCV)[10]、寨卡病毒(Zika virus,ZIKA)[11]和埃博拉病毒(Ebola virus,EBOV)[12]也有G- 四链体的报道。G-四链体作为特殊二级结构核酸,在病毒复制中的生物功能也被不断解析。现将病毒G- 四链体已阐明的生物学功能概括如下:
1.1 负调控病毒基因的启动子活性 HIV LTR (Long terminal promoter)启动子U3 区域包含3 个Sp1 结合位点和两个NF-κB 结合位点,该区域(-105 bp~-48 bp)富含G,可以形成多个G- 四链体结构[13-14]。G- 四链体结构的存在对该启动子活性发挥负调控作用。此外,LTR 启动子区域的G- 四链体能够和两个细胞核定位蛋白:nucleolin 和ribonucleoprotein (hnRNP) A2/B1 发生相互作用。其中,nu-cleolin 与G-四链体的结合起稳定该结构的功能[15],而hn-RNP A2/B1 则发挥解旋G- 四链体结构的功能[16]。在进化过程中,LTR 的G- 四链体序列在所有灵长目动物慢病毒中高度保守,从而发挥调控病毒启动子活性以及病毒蛋白表达的作用[17]。
人疱疹病毒(Human herpesviruses,HHVs)基因组为线性双链DNA。其中HSV-1 基因组G+C %达到68 %,存在大量的G- 四链体结构,如UL2、UL24 和K18 启动子区域均发现G- 四链体结构的存在。稳定G- 四链体结构可以抑制病毒启动子活性[7,18]。
1.2 抑制病毒基因组复制 已有研究表明,在DNA 病毒基因组复制中,G- 四链体结构发挥负调控功能。例如,已有研究提出G- 四链体配体(c-exNDI)能够识别并稳定存在于HSV-1 基因组中的大量G- 四链体结构,抑制病毒DNA 聚合酶活性和基因组复制,该过程呈明显剂量依赖性[19]。同时,研究发现稳定G- 四链体结构也能抑制EBV和KSHV 基因组的复制[8]。此外,在HIV-1 基因组复制过程中,LTR 启动子区域的多个G- 四链体序列在配体BRACO-19 的作用下,形成稳定的G- 四链体结构,从而抑制HIV-1 逆转录过程和基因组复制[1]。
与DNA 病毒相比,基因组为单链RNA 的病毒,更易于形成G- 四链体结构[2]。2016 年,武汉大学周翔等的研究团队发现HCV 的core 基因中存在高度保守的RNA G-四链体结构[10]。HCV 复制过程中,首先合成负链RNA,再以该负链RNA 为模板,合成新的子代正链RNA[10,20]。HCV 负链RNA 3' 末端的G- 四链体结构抑制了HCV 编码的RNA 依赖的RNA 聚合酶活性,从而抑制病毒基因组的复制。同时,国外的研究人员Fleming 等人在寨卡病毒基因组中发现了多个保守的G- 四链体序列,分别位于NS3、NS5-A、NS5-B 和 3'-UTR 区域,均为平行构象[11]。其中位于3'UTR 的G- 四链体对于病毒的负链RNA 合成起负调控作用。很快,研究人员在单股负链RNA 病毒埃博拉病毒的L 基因[12]和马尔堡病毒(Marburg,MARV)[21]中也发现了G- 四链体结构。G- 四链体结构阻碍了RNA 聚合酶合成子代病毒的基因组[12]。
1.3 参与病毒基因组包装 疱疹病毒基因组末端包含保守的包装信号(Packaging signals,pac1 和pac2)。在病毒复制过程中,这些基序参与串联剪切(Concatemer cleavage)。pac1 和pac2 位于疱疹病毒基因组相反的两端,大部分疱疹病毒剪切发生在pac1 和pac2 之间。pac1 富含T 和G,研究人员发现所有8 种疱疹病毒基因组该区域均能够形成分子间G-四链体结构,表明疱疹病毒基因组包装受到G-四链体结构的影响[22]。
1.4 参与病毒基因重组 HIV 属于逆转录病毒科(Retroviridae),基因组为二倍体单链RNA。通过逆转录酶,合成双链DNA,整合到宿主染色体上,形成前病毒基因组[14]。RNA 基因组和前病毒DNA 基因均包含G- 四链体基序[13]。存在于HIV RNA 基因组的U3 区域的G- 四链体表现为平行构相。该区域可以形成分子间G- 四链体,不仅为病毒二倍体基因组间的相互作用提供接触点,也增加了U3 区域发生基因重组的概率。HIV 反转录过程中,逆转录酶需要在两个RNA 基因组之间多次穿梭。G- 四链体区域表现出更频繁的RNA 模板转换,该核酸序列所在区域也是发生重组的热点区域。
1.5 调控病毒潜伏感染与免疫逃逸 EBV 的生活周期包括潜伏期和裂解期。病毒基因组为双链DNA,长约172 kb。EBV 编码的基因组维持蛋白EBNA1,能够和病毒复制起始区的富含G 的序列结合,招募复制复合体,参与细胞有丝分裂中期染色体的结合[23]。由于EBNA1 蛋白也具有抗原性,刺激机体产生针对EBNA1 抗原表位的CD8+T 细胞,所以在满足复制的条件下,EBNA1 的表达必须维持在较低水平,以减少对内源性抗原MHC-I 递呈途径的激活[24]。编码EBNA1 甘氨酸丙氨酸重复(Glycine-alanine repeats,GAr)区域的mRNA 核酸序列,能形成平行构相的G-四链体结构,负调控病毒的mRNA 翻译,减少EBNA1抗原蛋白的合成[6]。Nucleolin 作为一种G- 四链体结合蛋白,能够稳定EBNA1 mRNA 区域的G- 四链体构相,从而帮助EBV 实现免疫逃逸[25]。
1.6 构成HBV 基因型特异性致病力 HBV 可以分为10个基因型(A~J)。其基因组为部分双链的DNA,复制过程需要借助RNA 中间体。由于逆转录过程缺乏校对机制,HBV 各个基因型之间差异较大,致病力也不同。在B 型的HBV preS2/S 基因的启动子区域发现存在分子内G-四链体结构[9]。与其他病毒启动子区域的G- 四链体功能不同,该G- 四链体结构对病毒转录起正调控作用。将G-四链体突变后,病毒复制能力下降,HBsAg 乙肝表面抗原表达水平下降[9]。
2 G-四链体相关抗病毒药物
由于病毒的高致病性,有效疫苗的缺乏和病毒的耐药性变异,病毒感染严重危害人类和动物健康。G- 四链体配体通过稳定G- 四链体结构,发挥抗病毒作用,是今年来的研究热点。对G- 四链体配体的研究不仅拓宽了对G-四链体功能的认识,同时也为抗病毒药物的研究提供了新的方向。目前研究最充分的G- 四链体配体包括BRACO-19 和 TMPyP4[25]。
2.1 BRACO-19 三取代吖啶化合物3,6,9-trisubstituted acridine 9-[4-(N,N-dimethylamino)phenylamino]-3,6-bis(3-pyrrolodinopropionamido) acridine, (BRACO-19, B19)在纳摩尔浓度能够抑制端粒酶,B19 与G- 四链体的亲和力高于双链DNA,其和第一代的多聚芳香非环化合物吖啶相比,毒性更小,在体内实验中表现出抗癌活性[1]。B19 最早用于抗EBV 的研究,研究表明在Raji 细胞中加入B19 可以降低EBV 基因组拷贝数,从而抑制EBNA1 依赖的DNA复制[23]。在其他疱疹病毒感染过程中,B19 处理细胞能够抑制HSV-1 的DNA 合成和晚期蛋白表达,IC50=8 μmol/L[7]。在HHV-6A 感染的细胞中,B19 也能阻碍病毒整合到宿主染色体[26]。类似的,在HIV 感染中,B19 下调LTR 启动子活性达到 70 %,BRACO-19 抗 HIV IC50<7.9 μmol/L[27]。
2.2 TMPyP4 实验发现卟啉衍生物TMPyP4,即[5,10,15,20-tetrakis-(N-methyl-4-pyridyl)porphine]能够抑制端粒酶,下调原癌基因c-myc的表达[1]。TMPyP4 与HIVnef编码区G-四链体结合,从而抑制病毒复制[28]。同时,TMPyP4与 RNA 病毒 HCV core 基因,EBOV L 基因区域的 G- 四链体结合,抑制病毒编码蛋白的表达[10,12]。但是TMPyP4与G- 四链体 DNA 结合的能力和与双链DNA 结合的能力接近,因而影响其临床应用。
2.3 其它化学药物 PIPER,即N,N'-bis[2-(1-piperidino)-ethyl]-3,4,9,10-perylenetetracarboxylic diimide) 能够稳定HIV-1nef编码区G-四链体结构[28]。c-exNDIs (core extended naphthalene diimide)溶解性较好,其与HIV LTR 启动子G-四链体结合的亲和力强于与人类的端粒结合的亲和力,在纳摩尔浓度(IC50<25 nmol/L)表现出抗病毒活性[29]。c-exNDIs 也能结合HSV-1 基因组,具备显著的抗病毒功能(IC50=18.3±1.4 nmol/L)[19]。PDS (Pyridostatin)结合 EBV EBNA1 mRNA 区域的 G- 四链体,下调 EBNA1 表达[6]。PDP 是PDS 类似物,在HCV 感染细胞内下调core 蛋白的表达[10]。PhenDC3 通过靶向KSHV 末端重复区的G- 四链体抑制病毒DNA 复制[8]。PhenDC3 也能下调EBV 感染的B 细胞中EBNA1 蛋白的表达水平[25]。
3 G-四链体结合蛋白的功能
一些病毒编码的蛋白,如SARS-CoV 编码的蛋白Nsp3 包含了一个SARS 独特结构域(SARS unique domain,SUD),在病毒复制和转录过程中发挥重要作用[30-31]。该区域能够选择性的结合核酸G- 四链体结构,参与调控宿主细胞的抗病毒反应。
另外,研究显示很多宿主蛋白可以和病毒G- 四链体发生相互作用,其中一类能够促进和稳定G- 四链体结构,如nucleolin[4]。另一类能够解旋G- 四链体结构,如解旋酶DExD/H helicases 9 (DHX9)和DHX36[2,4,32]。本实验室研究发现DHX36 能够和猪繁殖与呼吸综合征病毒(Porcine reproductive and respiratory syndrome virus,PRRSV)编码的核衣壳蛋白发生相互作用,促进PRRSV 诱导的炎症反应[33]和PRRSV 增殖,并且在PRRSV 的基因组负链RNA 区域发现两个G- 四链体序列。近期有研究发现,解旋酶DDX1 和DDX21 参与结合并解旋宿主RNA G- 四链体结构[34-35],这些G- 四链体解旋酶在病毒感染中的功能值得进一步研究。这种宿主与病原之间的相互作用将为病毒致病机制和治疗策略的研究提供新的思路。
4 总结与展望
作为一种非经典的核酸高级结构,近年来G- 四链体的功能研究被引入到病毒学领域。目前的研究成果集中于危害人类健康的逆转录病毒和DNA 病毒,发现其在基因的转录、基因组复制和重组等多种生命过程中发挥调控作用。相比之下,RNA 病毒G- 四链体的功能相关研究尚处于起步阶段。此外,G- 四链体在动物病毒和植物病毒中的功能还有许多空白留待探索。
以G- 四链体为靶标的抗病毒药物具备潜在的广谱抗病毒效应。并且,对HIV、HPV 和EBV 这样具备潜伏感染的病毒也有抑制效果[1,36]。G- 四链体配体既可以结合病毒G- 四链体,也可以结合宿主G- 四链体,如端粒区等。这是目前G- 四链体配体作为抗病毒药物研发面临的最大障碍[1,37]。未来病毒G- 四链体/ 配体复合物结构的解析,将有助于研发高效、低毒、选择性好的药物。通过噬菌体展示技术,一种高亲和力的能够特异性结合G- 四链体的单链抗体被研发出来,为观察在细胞内的G- 四链体结构和G-四链体配体的药物开发提供了新的工具[38]。