中国内地和香港地区新型冠状病毒刺突蛋白的基因序列特征及进化分析
2023-09-12王炎钦赵瑜
王炎钦 赵瑜
【摘要】 目的 通過分析中国内地和香港地区新型冠状病毒(SARS-CoV-2)刺突蛋白的基因序列及突变特征,了解两地的新冠病毒进化特征,为新冠疫情防控提供技术支持。方法 选取公共数据库中Pango支系、毒株属地、宿主、采样时间等4种指标具有显著性差异的代表性新冠病毒基因序列,采用MEGA软件进行比对和亲缘相似度分析,将参比序列的S片段与2组不同特征序列A和B组基于氨基酸水平进行比对分析并绘制亲缘关系图谱。结果 中国内地和香港地区的132个人源SARS-CoV-2全基因组序列呈现时空差异性;香港BA.2.3支系序列ON026861存在44处位点的独特突变,包含1处位点氨基酸缺失以及2处位点的N、L氨基酸插入;B组序列的S蛋白共有41处突变位点。结论 中国内地和香港地区新冠病毒流行图谱呈现显著的时空层次;相比家养宠物这些动物群体,人依然是发生病毒变异的主要宿主载体,须密切关注果子狸、马蹄蝠等稀有物种,尤其注重海关检疫、动物病毒防控等工作领域。
【关键词】 严重急性呼吸综合征冠状病毒2; 刺突蛋白(S蛋白); 突变
Gene sequence characteristics and evolutionary analysis of SARS-CoV-2 spike protein in mainland of China and Hong Kong
Wang Yanqin1,Zhao Yu2.1 The Center for Disease Control and Prevention of Taiyuan City,Taiyuan,Shanxi 030001;2 The Third People's Hospital of Taiyuan City,Taiyuan,Shanxi 030012
【Abstract】 Objective To investigate the evolutionary characteristics of novel coronavirus(SARS-CoV-2)spike protein in mainland of China and Hong Kong and to provide technical support for the prevention and control of the novel coronavirus.Methods The representative novel coronavirus gene sequences with significant differences in four indexes including Pango clade,strain location,host and sampling time were selected from the public database,and used with MEGA software for comparison and genetic similarity analysis.The S fragment of the reference sequence was compared with two groups of different characteristic sequences A and B based on amino acid levels,and the genetic relationship map was drawn.Results And analysis Spatiotemporal differences of full genome sequence of SARS-CoV-2 from 132 individuals in Mainland of China and Hong Kong were analyzed.44 unique mutations were found in ON026861 of Hong Kong BA.2.3 clade,including an amino acid deletion and two insertions at N and L amino acids.There are 41 mutation sites in S protein of group B sequence.Conclusion The epidemic map of the COVID-19 in Mainland of China and Hong Kong presents a significant spatio-temporal hierarchy. Compared with domestic pets and other animal groups,humans are still the main host vector for virus mutation.Therefore,close attention should be paid to rare species such as civet cats and horseshoe bats,especially in customs quarantine and animal virus prevention and control.
【Key Words】 Severe acute respiratory syndrome coronavirus 2; Spike protein(S protein); Mutation; Evolution analysis
中图分类号:R373.1 文献标识码:A 文章编号:1672-1721(2023)23-0016-04
DOI:10.19435/j.1672-1721.2023.23.006
自2019年12月下旬新冠疫情暴发以来,新型冠状病毒快速进化、持续变异,形成多种变异株,伴随着高度的传染性和一定的致死率,对全球的健康、社会和经济造成严重危害。截至2022年8月底,已造成全世界共计601 939 035人确诊,6 474 537人死亡,死亡率达到1.1%。新型冠状病毒(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2),由核蛋白(N)、病毒包膜(E)、基質蛋白(M)和刺突蛋白(S)和RNA 依赖性的RNA聚合酶(RdRp)5个必需基因组成,前4种为结构性基因,核蛋白(N)包裹 RNA 基因组构成核衣壳,病毒包膜(E)包绕在外,而基质蛋白(M)和刺突蛋白(S)则被包埋在包膜里[1]。
SARS-CoV-2感染人体的第一个关键步骤是由S蛋白催化,与血管紧张素转换酶-2(angiotensin converting enzyme,ACE2)受体结合,并进行大的结构重组以促进膜融合,并作为主要抗原装饰病毒颗粒表面并诱导中和抗体反应。ACE2受体广泛分布于呼吸道的气管、支气管、支气管浆液腺和肺泡的上皮细胞上[2],因而引起肺炎等呼吸道疾病。刺突上ACE受体识别位点的突变是引起免疫逃逸的重要原因[3]。S蛋白突变是SARS-CoV-2研究中普遍认同的变异最频繁片段。因此,研究S蛋白突变特征对病毒感染阻断、疫情防控、治疗新冠病毒肺炎病和疫苗研发至关重要。
国际上一般采用Pango命名规则以凸显毒株的溯源及进化关系,世界卫生组织(WHO)推荐使用Alpha(α),Beta(β),Gamma(γ),Delta(δ),Omicron(ο)等希腊字母来命名重要毒株[4],并依据这些变异株的传播力、致病力不同,将其分为关切变异株(variant of concern,VOC)和关注变异株(variant of interest,VOI)。其中Omicron是广泛传播的一种变异株,包括B.1.1.529、BA.1、BA.2和BA.3等4个支系,其感染力更强,传播速度更快,对免疫机制的敏感性降低[5]。
2020年1月7日,中国科学家率先提交了新型冠状病毒全基因组序列[6],该序列将作为本研究的参比序列(NCBI编号:NC045512)。本文从NCBI公共数据库中选取2019—2022年4年间的新冠病毒基因序列,选取依据为Pango支系、毒株属地、宿主、采样时间等4种指标具有显著性差异的中国内地和香港地区代表性新冠病毒基因序列2组共142株。将wuhan-Hu-1参比序列的S蛋白序列分别与这些序列基于氨基酸水平进行比对分析,找出分子水平上的基因组特征及亲缘关系,并分析当下流行株Omicron毒株中S蛋白基因的变异特性特征及趋势。
1 材料与方法
1.1 材料 序列来源:截至2022年8月底,Genbank上SARS-COV-2数据库(http://www.ncbi.nlm.nih.gov/sars-cov-2/)中142株完整新冠病毒基因组序列。A组序列:人SARS-COV-2完整基因组序列共132株(NCBI编号依次是:NC_045512、MN908947、MT291829、MT019532、MN996528、OL980269、OL980515、OL980575、OL980657、OL979777、OL980513、OL980581、OL979895、OL980270、OL979760、OL980596、OL980656、OL980584、OL980566、OL980868、OL980638、OL980603、OL980655、OL980875、OL980273、OL980653、OL980610、OL980479、OL980857、OL980866、OL980509、OL980512、OL980586、OL981152、MN988669、MT034054、MT093631、MT259226、MN975262、MT049951、MW011762、MT226610、MT039873、MT407651、MT079849、MT079847、MT039874、MT622319、MT253696、MT291832、MT407652、OM065343、MT135044、MT123291、MT121215、OM065362、MZ824623、MT446312、MZ266377、MT510728、MT412134、MT412338、MT568639、MT568638、MT627325、MZ824662、MT396241、MT281577、MW301121、MW181704、MW181705、MZ266418、MW181706、MT407654、MT407656、MT407657、MT407659、MT407655、MW181708、MT412340、OM714600、ON259949、MW181737、MW691151、MZ578003、MW691226、MZ266493、MZ664556、MZ267538、OM098414、OM098419、OM098424、OM403308、OM061695、OM108132、OM108163、ON063347、ON600209、ON600210、ON600211、ON600211、ON600217、ON600222、ON600232、OM095411、ON600242、ON600250、ON600253、ON600259、ON600264、ON600269、OL988214、ON600273、ON600286、ON600303、ON600059、ON600338、ON026861、ON600372、OM475729、OP143800、OM698369、OM698371、ON599941、ON599986、ON599980、OP143802、ON965361、ON965371、ON965479、ON965523、ON965797);B组序列:A组中Omicron代表序列与动物源新冠病毒基因组序列共35株(NCBI编号依次是:OM475741、OL913103、OL913104、MT835140、MT628700、MT835143、MT270814、OM062573、MT835142、MT215193、ON600242、ON600059、OM095411、ON600338、ON600253、ON600286、ON600303、ON600273、OL988214、ON600259、ON600269、ON600372、OM698369、OM698371、OP143802、OP143800、ON599941、ON599980、ON599986、ON965361、ON965371、ON965479、ON965523、ON965797、ON026861)。S蛋白基因参比序列:NCBI蛋白ID:YP_009724390.1。
1.2 方法 用MEGA 11.0中的kimura-2-
parameter模型,将wuhan-hu-1的S蛋白参比序列分别与序列A、B比对并构建Neighbor-joining系统进化树,绘出A、B两组亲缘关系图谱。每个节点表示通过1 000个重复数据集估计的Bootstrap值。比例尺表示每个位点的核苷酸替换数量,设置值为0.001。
2 结果与分析
2.1 A组序列的S蛋白基因序列特征和进化关系 总体上,132个人SARS-COV-2完整基因组序列呈现时空差异性。2020年、2021年、2022年三个年度的序列在亲缘关系上相近,同年度的相似性接近于100%;每个年度序列亲缘关系相近,但也有例外,如2021年度的大陆地区的3株B.1.1.317支系的OM098414、OM098419、OM098424和A支系MZ664556、B.1.36支系MW691226、B.1.36.27支系MZ578003这6个序列接近2020年度序列群;2022年度的香港地区AY.127毒株OM475729与2021年度Delta关切变异株B.1.617.2的OM108132、Delta毒株AY.122的OM108163接近,与2021年度序列群接近;2020年1月湖南怀化市B支系的MW011762与2022年1月香港BA.2.3的ON026861相近。B组序列亲缘关系图谱中,动物源序列与大部分人源Omicron序列相近,ON026861是唯一与其他序列群较远的序列。从氨基酸序列比对结果得出,香港BA.2.3的ON026861存在24~54、56~65、70、211、212共44处位点的独特突变,包括70位点氨基酸缺失,和211、212位点的N、L氨基酸插入。
从时间线上梳理,A支系序列主要集中在2020年1—3月,A.6支系序列MW181705和A.1支系MZ266418与wuhan-hu-1参比序列亲缘关系相近;B支系序列的生物演变时间跨度最大,从2019年12月—2021年5月,以2020年1—3月高发;以AY支系为主的Delta株型序列集中在2021年6—12月;以BA支系为主的Omicron序列集中在2021年12月—2022年4月,其中2021年12月—2022年1月Delta和Omicron株型均有不同程度检出,分别占比43.5%和56.5%[7]。
2.2 B组序列的S蛋白突变特征 B组序列的S蛋白共计41处有特征意义的突变位点。其中T95I、D614G、H655Y、A701V 4种突变型在2020年8月NCBI亚洲样本库中发现,L981F、I1221T 2种突变型在以往北美洲样本中发现,未在亚洲发现[7]。
213位和417位2处位点存在多类型突变。213位点存在两种突变型,分别是V213G和V213P,B.2支系突变为G,B.1支系突变为P,动物源序列均保守不变。在417位点,动物源序列除OL913104由K突变为T,OM062573由K突变为N,其余动物源序列保守不变,人的序列均由K突变为N。
这些突变根据人与非人宿主突变的不同特点,分为三大类。第一类为动物源序列均保守不变,人源序列发生部分或全突变,这些位点共29个,339、373、375、477、493、501、505、655、679、764、796、954、969等13个位点的人源序列全发生突变;70、212、213、214、346、371、376、405、408、440、446、496、547、856、981、1 221等16个位点的人源序列发生部分突变。在这16个位点中,213、371的2处位点人源序列发生的突变型BA.1与BA.2支系各不同;70、212、214、446、496、547、856、981等8处位点只有BA.1突变;376、405、408等3处位点都只有BA.2突变;346位点处发生突变的有ON600059、OM095411、ON600338、ON600253等4个序列;440位点人源序列未发生突变的仅有ON965797,其余均为N440K;1221位点处仅BA.2.3支系ON026861不变,其他12个BA.2支系序列都突变。
第二类为动物源和人源序列均发生部分或全突变的共10个位点,包括19、95、142、417、478、484、498、614、681、701。這些位点中,19、95和701位点处,人源序列未全突变,19和95位点在动物源序列中仅OM475741突变,人源序列中二者恰好相反,19位点仅BA.2突变,95位点仅BA.1突变;701位点最为保守,仅动物源OM062573和人ON600259突变,为A701V型;其余7个位点处,人源序列全存在突变,142、478、681等3个位点只有OM475741突变,417、484、614等3个位点都有OM062573突变,417、498等2个位点都有OL913104突变。
第三类为人源序列未改变,动物源序列仅个别毒株改变。包括215位点的OM062573为D215G,950位点的OM475741为D950N。
综上,OM475741共7处突变是动物源序列中突变位点最多的序列,OM062573有5处,OL913104和OL913103各有2处。OM475741为2022年1月从香港仓鼠口鼻咽部提取的Delta毒株AY.127,此前未在人体内发现[8]。OM062573为2021年5月从小家鼠肺内提取的Beta变异株B.1.351,Beta变异毒株B.1.351的5处突变215、417、484、614、701,其中D215G在Lori A.Rowe等灵长类动物非洲绿猴直肠拭子研究实验中被发现[9],该突变在多个病毒谱系中检测到的频率较低,是B.1.351的最显著突变型。
3 讨论与建议
3.1 中国内地和香港地区新冠病毒流行特征及进化讨论 通过分析132株A组序列亲缘关系图谱,发现2019年12月—2020年12月流行的主要毒株为B支系,尤其以B.1支系最多;在2021年下半年,开始与AY.122等主要支系的Delta株型交叉流行,很快被Delta株型替代;2021年12月Delta株型开始与Omicron株型交叉流行,很快又被Omicron株型替代。整个病毒图谱呈现明显的时间节点和地域特征,体现了时空差异性。
从人源Delta株型AY.127序列OM475729与2021年B支系序列群的高度相似性,推测出AY.127可能是终末流行的Delta株型,为2022年1月香港宠物店的进口仓鼠传染到店员,进而引发人与人之间的传播[10]。
对于2022年1月香港人源BA.2.3系序列ON026861,目前关于该支系报道甚少,只有Tracie J.Haan等人报道了BA.2.3于2022年2月首次在美国阿拉斯加发现,且超过了BA.1.1,达到了已测序病例的48.5%[11],香港地区该株型序列为中国首次提交,预示着BA.2.3及子代可能成为未来的新优势毒株。
动物源序列与wuhan-hu-1参比序列相比,只有498、614位点发生2个以上的突变,大部分序列保守,614位点突变是S蛋白极为重要的典型突变,D614G可能通过组装更多功能性S蛋白到病毒粒子来增强感染能力[12]。动物源序列中与人源Omicron序列一样发生突变D614G的宿主涵盖仓鼠、小家鼠、家犬、猫等4种动物,498位点除了2个啮齿动物的肺内新冠病毒序列检出突变外,其他37个位点的动物源序列均保守未突变。这些现象说明仓鼠、啮齿动物、家犬、猫等动物不易携带突变病毒体,相比这些常见的家养宠物,人依然是病毒发生变异的主要宿主载体;须密切关注果子狸、马蹄蝠等物种,减少人类与携带非典相关冠状病毒活体动物之间的接触;并注重海关检疫、动物病毒防控等工作领域。
3.2 香港仓鼠中Delta变异株AY.127的变异特征及溯源探讨 从动物源序列与人源Omicron整体亲缘关系看,OM475741与其他动物源序列及人源Omicron的相似度很高,达到99%以上。从突变数量来看,AY.127支系的OM475741在19、95、142、478、614、681、950等7处位点突变,有着很强的进化性,其中关于19位点的突变型T19R报道甚少。95、142位点的突变型在2020年亚洲突变型中已发现[7],95、142、478、614这4处位点的突变型在人源Omicron序列中也有发现,然而681位点却与人突变型不同,与以往报道中的亚洲P681-不同,为P681R。ZHANG L P等[12]用Vero E6细胞证实了P681R通过降低galnt1介导的糖基化,导致S蛋白中furin切割,从而驱动了细胞-细胞融合。此外,OM475741中的D614G突变使S蛋白具有结构灵活性,增强了上呼吸道适应度并显著增强了病毒复制,以及可能影响某些单克隆抗体的中和效力,这些效能都使得人更易感病毒并减轻疫苗本身的效力[14]。OM475741的这些突变性能表明其具备了比以往毒株更强的感染和适应宿主能力。
从时间顺序看,OM475741在95、142、478、614、950等5处突变均接近或早于人源Omicron序列的突变,说明仓鼠携带的Delta新冠病毒时间早于人类,这个结论与Hui-Ling Yen等人研究结果一致,即Delta变种AY.127是从宠物仓鼠传播给人类[10]。
另外值得注意的是,OM475741呈现出的T19R、T478K、P681R、D950N等4种突变型,是2021年7—8月巴基斯坦第四波疫情期间检出的Delta变异株中的特征性刺突突变,这一特征说明OM475741这一感染源很可能来自于巴基斯坦。
3.3 人源Omicron BA.1与BA.2序列存在各自独特且共同的突变规律 在213、371这2处位点,BA.1为V213P和S371L,BA.2为V213G和S371F,分别呈现不同的突变型,证实可能与各支系自有的毒理性能有关。V213G比V213P可显著减少紧密结合的刺突肽的数量[15];S371L为负责与ACE2受体相互作
用的受体结合域(receptor-binding domain,RBD)的一种突变,借助它使得一部分中和抗体逃逸,增强了宿主对病毒的易感性,加大了疫情防控和疫苗开发的难度。BA.1感染也可诱导产生新的BA.1特异性抗体克隆,这些抗体可有效中和BA.1。然而,S371F突变的BA.2却破坏了最广泛的Sarbe冠状病毒中和抗体,使得BA.2比BA.1更能使得接种疫苗后的人群被感染。
L212E、R214E、G446S、G496S、T547K、N856K、L981F等7处位点只有BA.1具备,与ACE2结合基序重叠的表位在A-D群中和抗体大部分被K417N、G446S、E484A和Q493R所逃逸;T376A、D405N、R408S等3处位点只有BA.2具备。
BA.1和BA.2共同存在的突变有G339D、S373P、S375F、S477N、T478K、E484A、Q493R,Q498R、N501Y、Y505H、D614G、H655Y、N679K、P681H、N764K、D796Y、Q954H、N969K等18处突变,440位点人源序列未发生突变的仅有ON965797,其余均为N440K,可能属于个体差异。
上述G339D,S373P,S375F,N440K,S477N,E484A,Q493R,Q498R,N501Y,Y505H等10处突变都位于RBD区域,负责与ACE2受体相互作用。CAO Y L等人证实与ACE2结合基序重叠的表位A-D组中和抗体大部分被K417N,G446S,E484A,Q493R等的单突变逃逸,E组和F组的一个中和抗体子集通过G339D、N440K、S371L和S375F的单突变逃脱;且這些突变都能不同程度地降低了B群中和抗体与RBD的结合亲和力;其余8处突变也能降低抗体的中和能力。另外,H655Y突变促进了体内侵入。这些突变型的特性足以说明BA.1和BA.2毒株能强力感染人群甚至接种过疫苗的人群。RBD区域S371F/L、S375F和T376A以及铰链1区Q954H和N969K的单独突变降低了感染性,而G339D、D614G、N764K和L981F的单独突变中度增强了感染性,也说明并不是所有的突变都能增强感染性,但总体上依然增强了Omicron的感染性。
參考文献
[1] 国家卫生健康委员会.新型冠状病毒肺炎诊疗方案(试行第九版)[EB/OL].[2023-04-08].http://www.nhc.gov.cn/.
[2] 徐本锦,陈晓聪,宣焱等.新冠病毒受体蛋白ACE2结构与功能的生信分析及原核表达[J].中国免疫学杂志,2023,39(6):1230-1240.
[3] 钟力,朱林,蔡宗苇.新冠病毒蛋白及其细胞受体ACE2翻译后修饰的质谱分析[J].质谱学报,2021,42(5):563-584.
[4] 郑焕琴,张帅,王莹,等.SARS-CoV-2(新冠病毒)变异流行株命名系统[J].病毒学报,2022,38(6):1453-1458.
[5] 赵建楠,宋洋,王英,等.奥密克戎BA.1变异株在全球的流行和刺突蛋白的进化分析[J].病毒学报,2023,39(3):609-
619.[6] GURUPRASAD L.Human SARS CoV-2 spike protein muta-tions[J].Proteins,2021,89:569-576.
[7] YEN H L,SIt T H C,BRACKMAN C J,et al.Transmission of SARS-CoV-2 Delta variant(AY.127) from pet hamsters to humans, leading to onward human-to-human transmission:a case study[J].Lancet,2022,399(10329):1070-1078.
[8] ROWE L A,BEDDINGFIELD B J,GOFF K,et al.Intra-Host SARS-CoV-2 Evolution in the gut of mucosally-infected chlo-rocebus aethiops(African Green Monkeys)[J].Viruses,2022,14(1):77.
[9] WOO CHAN J F,HANG SIU G K,YUAN S F,et al.Probable animal-to-human transmission of severe acute respiratory syn-drome coronavirus 2(SARS-CoV-2) delta variant AY.127 cau-sing a pet shop-related coronavirus disease 2019 (COVID-19) outbreak in Hong Kong[J].Clin Infect Dis,2022,75(1):e76-e81.
[10] 张杨,江亚娟,等.一例境外输入新型冠状病毒奥密克戎BA.2.3突变株的全基因组特征分析[J].口岸卫生控制,2023,28(2):10-13.
[11] 卫紫钰,邵金辉.D614G突变对新型冠状病毒致病性、免疫原性的影响[J].生物技术,2022,32(3):366-372.
[12] ZHANG L P,MANN M,SYED Z,et al.Furin cleavage of the SARS-CoV-2 spike is modulated by O-glycosylation[J].Proc Natl Acad Sci USA,2021,118(47):67-78.
(收稿日期:2023-04-08)