新型冠状病毒刺突糖蛋白氨基酸序列特征分析
2020-09-07杨春伟孙海燕崔大伟丁伟浙江大学医学院附属第一医院a病理科输血科杭州310003绍兴第二医院检验科浙江绍兴31000
杨春伟,孙海燕,崔大伟,丁伟(1.浙江大学医学院附属第一医院a.病理科,b.输血科,杭州310003;.绍兴第二医院检验科,浙江绍兴31000)
新型冠状病毒又称为严重急性呼吸综合征冠状病毒2(SARS-CoV-2),导致人类严重呼吸综合征(称为COVID-19)[1-3]。根据WHO疫情通报显示:截止2020年3月31日,我国累计确认82 554病例,死亡3 314例,全球205个国家发生确认病例,累计确认750 890例,死亡57 610例(https://www.who.int/docs/default-source/coronaviruse/situation-reports/
20200331-sitrep-71-covid-19.pdf?sfvrsn=4360e92b_8)。SARS-CoV-2与SARS-CoV的基因组同源性约为80%,与蝙蝠冠状病毒(SARS-CoV-RaTG13)的同源性约为96%[4-6]。冠状病毒表面的刺突糖蛋白(spike glycoprotein, S)通过其受体结构域(RBD)识别并结合宿主细胞表面受体血管紧张素转换酶2(ACE2),在介导病毒包膜与细胞膜融合导致细胞感染的过程中发挥关键作用,这使S蛋白成为中和抗体和疫苗的主要抗原靶点[6-8]。S蛋白的变异严重影响SARS-CoV-2对宿主的感染,因此探讨S蛋白的变异情况将有助于SARS-CoV-2流行的控制。
1 资料与方法
1.1资料 从全球共享禽流感数据库(GISAID)和GenBank数据库收集2019年12月至2020年3月27日中国大陆255株SARS-CoV-2的S蛋白基因序列,同时下载SARS-CoV、MERS、蝙蝠冠状病毒和穿山甲感染的冠状病毒序列共12个,作为参考株:Human SARS coronavirus BJ01-2003(AY278488.2)、Human SARS coronavirus GZ02-2003(AY390556.1)、MERS coronavirus(NC-019843.3)-2012、bat-SL-CoVZC45-2018(MG772933.1)、bat-SL-CoVZXC21-2018(MG772934.1)、bat-coronavirus-RaTG13-2020(MN996532.1)、hCoV-19/pangolin/Guangxi/P5L/2017/EPI-ISL-410540、hCoV-19/pangolin/Guangxi/P5E/2017/EPI-ISL-410541、hCoV-19/pangolin/Guangxi/P4L/2017/EPI-ISL-410538、hCoV-19/pangolin/Guangxi/P2V/2017/EPI-ISL-410542、hCoV-19/pangolin/Guangxi/P1E/2017/EPI-ISL-410539、hCoV-19/pangolin/Guangdong/1/2019/EPI-ISL-410721。
1.2方法 利用MEGA 6.0分子进化遗传分析软件,用邻接法(Neighbour-Jioning, N-J)对下载的冠状病毒S氨基酸序列构建氨基酸种系分子进化树,自展值(Bootstrap)设置为1 000,同时对S氨基酸序列的分子变异特征进行分析。
2 结果
2.1S糖蛋白同源性和种系进化分析 中国大陆SARS-CoV-2的S蛋白氨基酸系统进化树分析显示:从GISAID和GenBank数据库收集的255株SARS-CoV-2的S蛋白氨基酸序列相互间差异较小,处于同一分支,其同源性为96.8%~100%。其中,hCoV-19/Shanghai/SH0104/2020/EPI-ISL-416395与其余254株SARS-CoV-2的S蛋白序列的氨基酸同源性仅为89.9%~93.7%;12株参考株S蛋白氨基酸序列的差异较大,同源性为34.1%~99.9%,其中MERS coronavirus(NC-019843.3)与其他11株的同源性最差,为34.1%~39.1%;12株参考株中,bat-coronavirus-RaTG13(MN996532.1)的S蛋白序列与255株SARS-CoV-2的氨基酸同源性最近,为86.6%~93.4%,而bat-SL-CoVZC45(MG772933.1)和bat-SL-CoVZXC21(MG772934.1)与255株SARS-CoV-2的S蛋白同源性分别为70.3%~75.6%和69.6%~75.1%;MERS coronavirus(NC-019843.3)与255株SARS-CoV-2的氨基酸同源性最远(34.9%~39.1%);2株Human SARS coronavirus BJ01和Human SARS coronavirus GZ02,与255株SARS-CoV-2的S蛋白同源性均为66.2%~71.8%;6株穿山甲感染的冠状病毒与255株SARS-CoV-2的S蛋白同源性为76.9%~84.8%。见图1。
2.2S糖蛋白氨基酸位点变异分析 255株SARS-CoV-2病毒S蛋白的关键位点L455、F486、Q493、S494、N501和Y505均未发生变异,且S蛋白RBD受体结合域关键位点N439,V483和Q493也均未发生变异;255株SARS-CoV-2病毒S蛋白的变异情况如下:5株发生H49Y突变,3株为D614G突变,2株为M153T突变,2株为V1040F突变,2株为I1216T突变,Y28D/N突变各1株等。此外,在255株病毒的RBD(306~543aa)域中,仅有hCoV-19/Shenzhen/SZTH-004/2020/EPIISL406595发生N354D和D364Y突变,hCoV-19/Shanghai/SH0017/2020/EPIISL416328发生S359N突变,hCoV-19/Shanghai/SH0007/2020/EPIISL416320发生K378R突变, hCoV-19/Guangdong/GD2020087-P0008/2020/EPIISL413863发生Q409E突变。见表1。
表1SARS-CoV-2病毒S蛋白氨基酸变异分析
3 讨论
冠状病毒科(CoV)是已知的最大的单股正链RNA病毒,根据血清学与基因组的结构特点,冠状病毒通常被分为α、β、γ和δ 4个属,SARS、SARS-CoV-2和MERS均属于β-CoV属[4-5]。目前,对于SARS-CoV-2感染人群的治疗,除了有效隔离和常规的对症治疗以外,特效药物和疫苗的研发仍在进行中。SARS-CoV-2的基因特征特别是S蛋白的分子特征对于药物和疫苗的研发至关重要[6-7]。本研究从GISAID和GenBank数据库下载255条SARS-CoV-2的S蛋白序列,其由1 273个氨基酸组成。通过系统发育树显示发现,255株SARS-CoV-2的S蛋白处于同一分支,且同源性为96.8%~100%,表明中国大陆SARS-CoV-2 S蛋白的氨基酸序列高度同源,相互间变异较小,与近期的研究结果相似[9-11]。初步表明在我国流行的SARS-CoV-2 S蛋白序列并未发生明显变异。进一步分析显示,255株SARS-CoV-2的S蛋白序列与参考株之间存在一定差异,与bat-coronavirus-RaTG13 (MN996532.1)的S蛋白序列的氨基酸同源性最近且高达93.4%,与近期的研究结果相一致[10-13]。
研究表明,SARS-CoV-2通过S蛋白受体结构域RBD与宿主细胞表面受体结合,介导病毒包膜与细胞膜融合,促进病毒的侵入,而RBD域是SARS及其相关冠状病毒基因组种最容易变异的区域,特别是关键氨基酸对与人体ACE2受体结合及确定宿主类型至关重要[6-8]。本研究显示,S蛋白的关键位点L455、F486、Q493、S494、N501和Y505均未发生变异,且S蛋白RBD受体结合域中的关键位点N439、V483和Q493也均未发生变异,提示SARS-CoV-2容易通过RBD域与人体ACE2结合,导致病毒的感染与流行,这与之前报道的结果相一致[10-11]。此外,我们的研究还发现,S蛋白中某些位点氨基酸发生变异,如5株发生H49Y突变,3株为D614G突变等,重要的是部分SARS-CoV-2的S蛋白区RBD域发生变异(如N354D、D364Y、S359N、K378R和Q409E),但这些变异是否影响S蛋白及RBD域的结构和功能仍需进一步深入研究。
总之,本研究初步探讨了在我国暴发流行的SARS-CoV-2病毒S蛋白区的分子特征,显示该病毒的S蛋白并未发生明显的变异,这为针对SARS-CoV-2病毒的药物研发、特异性抗体的制备及疫苗的设计提供参考依据,且S蛋白区分子特征的持续监测有助于SARS-CoV-2病毒的预防和控制。