APP下载

小鼠APOBEC3的结构与功能分析

2021-05-06吴小霞许天委李国寅

生物信息学 2021年1期
关键词:脱氨酶胞嘧啶逆转录

吴小霞,许天委,李国寅

(琼台师范学院 琼台儿童认知与行为发展研究中心,海口 571127)

2002年,Sheehy等[1]通过消减克隆方法首次发现了宿主限制因子CEM15(即APOBEC3G,简称A3G),作为生命体重要的防御蛋白,APOBEC3(简称A3)胞嘧啶脱氨酶家族也就成为研究的热点,随后的研究中又陆续发现了位于人体22号染色体上的其他A3成员。哺乳动物A3可利用其胞嘧啶脱氨酶活性将慢病毒负链DNA上的C脱氨基成为U,从而导致正链DNA上的G→A超突变而抑制慢病毒复制,可通过引起病毒基因组中的突变和阻断逆转录来限制逆转录病毒感染,虽然这两种限制方法在体外都起作用,但在体内感染期间它们的作用知之甚少[2]。

哺乳动物A3基因在一个CBX6和CBX7两侧的染色体位点复制,A3基因的数量和A3复制过程的历史在每个哺乳动物谱系都是不同的[3]。小鼠只有一个A3(mA3)基因,mA3可诱发CTL免疫应答并产生针对Friend逆转录病毒感染的中和抗体[4]。人类有七个A3基因,而hA3G是A3家族中最明确的抗HIV-1蛋白[4]。Wang等[5]认为靶向hA3G可通过减弱DNA修复途径的激活而使癌细胞对辐射诱导的细胞死亡敏感。癌症基因组学的最新进展以及A3酶的生物化学表征现在已经暗示至少两个家族成员在肿瘤发展期间进行体细胞诱变[6]。Huff 等[7]认为B16细胞中A3基因的敲除降低了体外抵抗水疱性口炎病毒(vesicular stomatitis virus,简称VSV)感染的能力,提高了体内VSV的治疗效果。

总之,A3家族是抗逆转录病毒、逆转录元件的抑制因子具有重要的免疫功能,最近A3在癌症发生中的作用也被发现[8]。因此,研究hA3G与mA3的结构有助于进一步了解其功能及其在生物进化中的作用。本文利用生物信息学方法对mA3和hA3G的结构进行分析,以进一步加深对其抗病毒等功能的了解,为研究其作用机制、设计疫苗、治疗癌症等提供思路。

1 材料与方法

1.1 材料

本文在NCBI数据库收集hA3G及mA3蛋白的序列信息,选择hA3G(检索号:AAH24268.1 )与mA3(检索号ACH89412.1)进行研究。

1.2 方法

1.2.1 蛋白质序列比对

输入网址https://www.ebi.ac.uk/Tools/msa/,点击Launch Clustal Omega,分别将hA3G与mA3的蛋白序列fasta格式输入,对二者的蛋白质序列进行比对。

1.2.2 理化性质分析

输入网址https://www.expasy.org/proteomics,在ExPASy数据分析系统选择ProtParam工具,分析hA3G和mA3的分子量、分子式、酸碱性和稳定性等理化性质。输入网址https://www.expasy.org/proteomics,点击Protscale,使用Protscale工具,点击输入hA3G和mA3蛋白序列,分析hA3G和mA3的亲疏水性。

1.2.3 亚细胞定位预测

输入网址http://psort.hgc.jp,PSORTⅡPrediction,分别输入hA3G与mA3的蛋白序列,点击submit,进行亚细胞定位预测。

1.2.4 二级结构和高级结构分析

输入网址http://www.cbs.dtu.dk/,选择Prediction Servers,利用TMHMM2.0工具,将hAG和mA3的蛋白序列分别输入,对hA3G和mA3的跨膜区域进行分析。输入网址https://npsa-prabi.ibcp.fr-/cgi-bin/secpred_sopma.pl,分别将A3G和mA3的序列输入,采用SOPMA工具对hA3G与mA3的二级结构及各成分所占比例进行预测。在NCBI数据库https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi,利用Consrved Domain数据库分析hA3G与mA3的结构域。

输入网址http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index,选择Phyre2工具,预测hA3G和mA3的蛋白质三维结构。

1.2.5 相互作用蛋白分析

输入网址http://string-db.org/,利用STRING数据库构建与hA3G及mA3相互作用的蛋白网络。

2 结果与分析

2.1 蛋白序列比对分析

hA3G编码384个氨基酸,mA3编码396个氨基酸,表1显示了hA3G与mA3的cov为93%,pid为28.6%。

表1 hA3G与mA3的Clustal Omega比对结果Table 1 Sequence alignment results of hA3G and mA3 using Clustal Omega %

2.2 理化性质分析

通过ExPASy数据库中的在线工具ProtParam,预测hA3G与mA3蛋白相应理化性质,见表2。可以看出,hA3G蛋白与mA3 蛋白均为碱性的不稳定蛋白质,二者含量最高的氨基酸也都是Leu。

利用ExPASy数据库中的ProtScale在线工具预测,结果见表3,hA3G与mA3属于亲水性蛋白质(见图1)。

2.3 蛋白亚细胞定位分析

利用PSORTⅡ分析hA3G与mA3蛋白的亚细胞定位,结果见表4,可看出hA3G和mA3蛋白均可能定位在细胞质、线粒体和细胞核,而最可能的细胞定位是在细胞质。

图1 hA3G与mA3蛋白的亲疏水性分析Fig.1 Analysis of hydrophilic and hydrophobic properties of hA3G and mA3

表2 hA3G与mA3的理化性质Table 2 Physical and chemical properties of hA3G and mA3%

表3 hA3G和mA3蛋白的亲疏水性分析Table 3 Analysis of hydrophilicity and hydrophobicity of hA3G and mA3

表4 hA3G和mA3蛋白的亚细胞定位Table 4 Subcellular localization of hA3G and mA3 %

2.4 跨膜结构域分析

经TMHMM2.0工具预测结果如图2和表5所示,hA3G和mA3均为不跨膜蛋白。红色细线表示跨膜区域hA3G和mA3位于膜外(粉色细线)的概率几乎为100%,位于膜内(蓝色细线)和跨膜区域(红色细线)的概率几乎为0,粉色粗线代表多肽链中跨膜区域所在位置,因没有跨膜区域,所以不显示相应标记。

表5 hA3G与mA3的TMHMM分析结果Table 5 TMHMM analysis of hA3G and mA3 %

图2 hA3G和mA3的跨膜结构分析Fig.2 Analysis of transmembrane structure of hA3G and mA3

2.5 空间结构分析

利用 SOPMA工具分析hA3G和mA3蛋白的二级结构如图3,与相应二级结构占比见表6。由此可见,hA3G和mA3的二级结构主要为α螺旋和无规卷曲,二者的二级结构比例相差不大,结构非常相似。

表6 hA3G和mA3二级结构类型及占比Table 6 Secondary structure types and proportions of hA3G and mA3 %

图3 hA3G和mA3蛋白二级结构分析Fig. 3 Secondary structure analysis of hA3G and mA3

通过NCBI的Conserved Domain数据库预测hA3G和mA3都属于APOBEC超家族,都具有两个保守的结构域。APOBEC超家族都包含串联的一个或两个胞嘧啶脱氨酶结构域。APOBEC的C末端结构域(CD2)具有催化活性,而N末端结构域(CD1)不具有使底物脱氨基的能力,即使它们维持核心胞苷脱氨酶折叠,CD1与ssDNA和RNA的结合可以上调或下调相邻CD2的催化活性[9]。

图4 hA3G和mA3蛋白的结构域分析Fig.4 Conserved domain analysis of hA3G and mA3

利用Phyre2工具,进行hA3G和mA3进行蛋白质三维结构预测,结果如图5所示,三维结构中的二级结构预测结果如图6。hA3G的模板为c2kboA,可信度100%,覆盖面为50%,一致性为99%;mA3的模板为 c6bwyA,可信度100%,覆盖面为45%,一致性为36%。

2.6 蛋白质相互作用分析

利用STRING数据库预测hA3G和mA3的蛋白相互作用网络,结果如图7所示。与hA3G相互作用的蛋白质包括APOBEC3F(简称A3F)、SAMHD1(Sterile alpha motif and HD domain-containing protein 1,简称SAMHD1)、BST2(bone marrow stromal antigen 2)、A1CF(APOBEC1 complementation factor,简称A1CF)、COX5A(cytochrome c oxidase subunit 5A,简称COX5A)、COX5B(cytochrome c oxidase subunit 5B,简称COX5B)以及CDA(cytidine deaminase,简称CDA)等。hA3F和hA3G属于A3蛋白质,已被确认为有效的抗病毒因子,可限制Vif缺陷的HIV-1复制[10]。SAMHD1是人类细胞中唯一已知的dNTP酶,含有经典的核定位序列(NLS),抑制逆转录病毒和逆转录病毒的复制[11]。BST-2是一种Ⅰ型干扰素(IFN-I)诱导的细胞蛋白,最初被视为HIV-1释放的抑制剂,随后被证明可抑制多种包膜病毒的细胞释放,在先天抗病毒防御系统中起重要作用[12]。人们一直认为APOBEC1介导的编辑活性依赖于RNA结合蛋白A1CF,在成人肝脏、小肠或肾脏中正常的C→U编辑不需要A1CF[13]。COX5A是线粒体呼吸链复合物IV(细胞色素c氧化酶)的核编码亚基[14]。COX5B是电子传递链的末端酶,可将电子从还原的细胞色素c转移到氧气,并且在此过程中,在线粒体内膜上产生电化学梯度[15]。CDA是嘧啶补救途径的酶,可分别通过胞苷和2'-脱氧胞苷的水解脱氨作用催化尿苷和2'-脱氧尿苷的形成[16]。hA3G可能涉及到的生物过程包括病毒生命周期的负调控(GO:1903901)、病毒防御应答(GO:0051607)、胞嘧啶代谢过程(GO:0046087)、碱基转换或替换编辑(GO:0016553)以及胞嘧啶脱氨基(GO:0009972)。hA3G可能具有水解酶活性(GO:0016814)、胞嘧啶脱氨酶活性(GO:0004126)、锌离子结合功能(GO:0008270)、细胞色素c氧化酶活性(GO:0004129)以及相同蛋白结合功能(GO:0042802)。hA3G可能构成载脂蛋白BmRNA编辑酶复合物Ⅳ(GO:0030895)、P-小体(GO:0000932)及线粒体呼吸链复合物(GO:0005751)。hA3G的KEGG通路主要是心肌收缩(hsa04260)、亨廷顿氏病(Huntington’s disease,hsa05016)、帕金森病 (Parkinson’s disease,hsa05012)、阿尔茨海默病(Alzheimer’s disease,hsa05010)及非酒精性脂肪性肝病(hsa04932)。hA3G的反应途径包括编辑体的形成(HSA-75094)、干扰素信号传递(HSA-913531)、TP53调节代谢基因(HSA-5628897)及核酸代谢(HSA-15869)等。

与mA3相互作用的蛋白质包括A1CF、COX5A、COX5B、APOBEC1、APOBEC2、Gm11273(一种细胞色素C氧化酶)、细胞色素C1(cytochrome c1,简称Cyc1)以及Uqcrfs1(ubiquinol-cytochrome c reductase, Rieske iron-sulfur polypeptide 1,简称Uqcrfs1)等。Uqcrfs1是线粒体呼吸链细胞色素bc1复合物的关键亚基,产生与ATP合成偶联的电化学势,以将电子从泛醇转移至细胞色素c[17]。mA3涉及到的生物过程包括C→U编辑(GO:0016554)、胞嘧啶代谢过程(GO:0046087)、胞嘧啶脱氨基(GO:0009972)、含核碱基的小分子代谢过程(GO:0055086)及mRNA修饰(GO:0016556)。mA3可能具有水解酶活性(GO:0016814)、脱氨酶活性(GO:0019239)、胞嘧啶脱氨酶活性(GO:0004126)、锌离子结合功能(GO:0008270)、电子转移功能(GO:0009055)以及结合金属离子的功能(GO:0046872)。mA3可参与构成细胞色素复合物(GO:0070069)、呼吸链复合体(GO:0098803)、线粒体呼吸链复合物Ⅳ(GO:0005751)及线粒体内膜蛋白复合物(GO:0098800)。mA3的KEGG通路主要是心肌收缩(mmu04260)、帕金森病 (Parkinson’s disease,mmu05012)、非酒精性脂肪性肝病(mmu04932)、氧化磷酸化(mmu00190)以及阿尔茨海默病(Alzheimer’s disease,mmu05010)。mA3参与的反应途径有编辑体的形成(MMU-75094)。

图5 hA3G和mA3蛋白的三维结构Fig.5 Three-dimensional structure of hA3G and mA3

图6 hA3G和mA3蛋白三维结构下的二级结构Fig.6 Secondary structure of hA3G and mA3 in three-dimensional model

图7 与hA3G和mA3相互作用的蛋白网络Fig.7 Protein network interacting with hA3G and mA3

3 讨 论

mA3是胞苷脱氨酶,其可作用于逆转录病毒的单链DNA逆转录物,导致前病毒DNA的G→A超突变,其对Vif缺陷HIV-1的限制与hA3G一样强大[3,18]。通过序列比对发现hA3G编码384个氨基酸,mA3编码396个氨基酸,hA3G与mA3的cov为93%,pid为28.6%。本文利用ExPASy数据库中的ProtParam和ProtScale在线工具预测hA3G和mA3均为碱性的不稳定亲水性蛋白质,二者含量最高的氨基酸也都是Leu。PSORTⅡ分析hA3G和mA3定位于细胞质。TMHMM2.0工具预测hA3G和mA3为不跨膜蛋白。

hA3G和mA3的二级结构主要为α螺旋和无规卷曲,属于APOBEC超家族,具有两个保守的结构域。已有研究显示hA3G C末端结构域具有脱氨酶活性,N-末端结构域是进入病毒粒子所必需的,mA3C末端结构域是进入病毒粒子所必需的,而N-末端结构域具有胞苷脱氨酶活性[3]。

利用STRING数据库发现与hA3G相互作用的蛋白质包括A3F、SAMHD1、BST2、A1CF、COX5A、COX5B。hA3G可能参与病毒生命周期的负调控、病毒防御应答、胞嘧啶代谢过程、碱基转换或替换编辑以及胞嘧啶脱氨基。与mA3相互作用的蛋白质包括A1CF、COX5A、COX5B、APOBEC1、APOBEC2、Gm11273、Cyc1以及Uqcrfs1等。mA3涉及到的生物过程包括C→U编辑、胞嘧啶代谢过程、胞嘧啶脱氨基、含核碱基的小分子代谢过程及mRNA修饰。hA3G和mA3具有水解酶活性和脱氨酶活性,具有锌离子结合功能。可以看出,与hA3G和mA3均相互作用的蛋白有A1CF、COX5A和COX5B;二者都可构成线粒体复合物,KEGG通路都是心肌收缩、帕金森病以及阿尔茨海默病。

哺乳动物APOBEC3蛋白是体内限制慢病毒的重要因子。为了克服APOBEC3介导的抗病毒作用,慢病毒在进化上获得了辅助蛋白——病毒感染因子Vif,而Vif通过泛素/蛋白酶体依赖性途径降解宿主APOBEC3蛋白。尽管Vif-APOBEC3相互作用及其进化意义已得到很好的研究,特别是灵长类动物慢病毒(包括HIV)和灵长类动物(包括人类)的相互作用,但对非灵长类慢病毒和非灵长类动物的研究很少。

啮齿动物仅编码一个APOBEC3家族成员,大鼠和小鼠均为APOBEC3Z2Z3基因融合并且缺失APOBEC3Z1基因[19-20]。mA3限制ΔVifHIV-1的能力与hA3G相似,并且在ΔVifHIV-1中诱导了非常高水平的G→A突变。mA3与hA3G的结构分析可能对进一步揭示哺乳动物APOBEC3的功能及其在治疗艾滋病和癌症等疾病中的作用有重要意义。

猜你喜欢

脱氨酶胞嘧啶逆转录
腺苷脱氨酶在肝脏疾病中的临床应用
电化学法检测细胞中的胸腺嘧啶和胞嘧啶
抗逆转录病毒治疗对艾滋病患者脑灰质体积的影响
病毒如何与人类共进化——内源性逆转录病毒的秘密
结核性脑膜炎脑脊液腺苷脱氨酶检测的临床意义及应用价值
鲤春病毒血症病毒逆转录环介导等温扩增(RT—LAMP)检测方法的建立
遗传密码知多少?
高中生物教材中几个疑难点的解读
质子化胞嘧啶碰撞诱导解离的实验和理论研究
DNA中甲基、羟甲基、醛基与羧基胞嘧啶的化学检测方法进展