一株鼠冠状病毒的全基因组序列特征分析
2023-12-21马晓华南晓伟柴萨萨李利利段招军
赵 静,马晓华,南晓伟,柴萨萨,李利利,段招军,
冠状病毒(Coronavirus,CoV)是一类单股正链RNA病毒,是RNA病毒中基因组最大的一类病毒,长度约为30 kb左右。冠状病毒是人类和脊椎动物重要病原体,可引起呼吸道、肠道、肝脏和神经系统等多种器官的疾病[1]。冠状病毒目前分为4个属:Alpha冠状病毒、Beta冠状病毒、Gamma冠状病毒和Delta冠状病毒,其中Alpha冠状病毒属和Beta冠状病毒属主要感染哺乳动物,并引起呼吸系统和消化系统的症状;Gamma冠状病毒属和Delta冠状病毒属主要在禽类中发现[2]。Alpha冠状病毒属成员HCoV-229E、HCoV-OC43、HCoV-NL63和HCoV-HKU1已明确为可以感染人类的冠状病毒成员[3];Beta冠状病毒属由A、B、C和D亚群组成[4],多个成员可引起严重疾病,如严重急性呼吸系统综合征冠状病毒(SARS-CoV)、中东呼吸综合征冠状病毒(MERS-CoV)和新型冠状病毒(SARS-CoV-2)均曾经或正在引起全球重大公共卫生事件,尤其是SARS-CoV-2引起全球CoVID-19大流行对人类的影响是空前的。
鼠类(Rats)是一类自然界广泛存在并且数量众多的哺乳动物,属于啮齿目(Rodentia)鼠科(Muridae),是多种病原库的天然储存库之一,也是人兽共患传染病病原体来源之一[5],目前已基本明确啮齿动物是沙粒病毒、汉坦病毒、呼肠孤病毒、黄病毒等多种人兽共患病病原体的自然宿主,其中许多病毒可引起严重的疾病[6]。鼠类携带病毒具有丰富的种类和多样性,而鼠类与人类或家畜等接触密切,这就增加了鼠类病原体跨种传播感染人类的风险。已有研究表明,Alpha属冠状病毒成员人类冠状病毒HKU-1和OC43可能是由鼠类中冠状病毒发生跨种传播到人类并引起传播[6]。
冠状病毒具有极高的基因多样性,在世界各地的啮齿动物、蝙蝠及其他野生动物中均广泛分布[8-9]。已有研究表明SARS-CoV、MERS-CoV以及引起全球大流行的SARS-CoV-2均可能起源于野生动物,这提示了冠状病毒造成人兽共患风险较高[10]。近几年在全球尤其在我国新发现的鼠类冠状病毒不断增加[11-12]。在2021年有研究者系统评估了动物源性病毒的人兽共患潜力以及传播潜力,发现了几种与啮齿动物有关的冠状病毒被列在前50,其中就包括我国学者在我国浙江省鼠中发现的LAMV[13]。因此监测和发现野生动物中冠状病毒对未来可能发生的冠状病毒跨种传播至关重要。本研究在我国内蒙古地区采样的鼠类样本进行病毒组研究的过程中发现一株新型Alpha冠状病毒,并对全基因组的特点和系统进化进行分析,了解病毒的基因组特性和进化地位,丰富了鼠类中病毒组成的种类。
1 材料与方法
1.1 标本 于2016年在我国内蒙古自治区呼伦贝尔市莫力达瓦达斡尔族自治旗的鼠类进行样本采集,依照不破坏种群的前提下,使用野外布鼠夹进行鼠类样本收集,采集后送至当地生物安全二级实验室进行解剖后收集组织样本,最终获得肠组织/粪便样本61份,肝组织样本61份以及肺组织样本61份,干冰运送至中国疾病预防控制中心实验室后置于-80 ℃中保存待用。
1.2 样本前处理、核酸提取和高通量测序 在生物安全柜中取约0.3 g组织样本置于1.5 mL离心管中,加入1 mL预冷的MEM培养基和4-6颗钢珠(预先高压),置于组织研磨仪中70 Hz研磨3 min。研磨液置于8 000 r/min离心10 min,将肠组织样本分别混为4个样本库,肝组织样本混为4个样本库,肺组织样本混为1个样本库,共9个样本库进行下一步处理;取样本库上清用 0.22 μm的滤器过滤去除样本中的细菌和组织碎片以减少样本的背景;取过滤后的173 μL悬液中加入7 μL的DNase I和20 μL的10×DNase Buffer,37 ℃水浴1 h,使用核酸提取试剂盒根据说明书提取核酸,用Qubit2.0定量RNA浓度,将核酸送至深圳华大基因有限公司进行文库构建和高通量测序。
1.3 鼠种类鉴定 根据文献,鼠种类鉴定通过扩增鼠的细胞色素b基因部分片段进行鉴定[14]。通过BLAST比对确认鼠种类。引物序列如下:上游引物L7:5′-ACCAATGACATGAAAAATCATCG-TT-3′,下游引物H15915:5′-TCTCCATTTCTGGTTTACAAGAC-3′。
1.4 病毒逆转录及全基因组的扩增 将提取的核酸用SuperScript Ⅱ试剂盒根据说明书进行逆转录,得到cDNA置于-20 ℃储存。为验证病毒序列,根据高通量测序拼接获得的病毒序列,使用Primer Premier 5设计覆盖全部拼接序列的引物以验证序列的准确性,全基因组扩增引物以cDNA作为模板,使用Premix Taq酶进行PCR扩增验证,5′和3′末端采用RACE的方法进行扩增,用1.5%琼脂糖凝胶电泳对上述PCR产物进行鉴定,送往北京天一辉远公司进行测序。
1.5 序列比对拼接与系统发育构建 将测序结果用DNASTAR的SeqMan子程序进行拼接;利用MEGA11软件进行多序列比对并采用最大似然法构建系统发育树,Bootstrap设置为1 000;采用RDP4.0和SimPlot软件对序列进行重组分析,SimPlot软件Window Size设置为1 000,Step Size设置为100,参数模型设置为Kimura model。
2 结 果
2.1 基因组结构特性 我们在研究内蒙古地区的鼠类样本病毒组成的过程中,在其中一个肠道组织样本库中发现了冠状病毒的reads,组装拼接得到一株新的Alpha属冠状病毒,设计引物验证后该样本库的所有单个样本进行筛查,结果显示一只鼠的一份肠道样本(MCX-13)为阳性,这只鼠类在样本采集时根据解剖形态学鉴定为小家鼠,通过扩增鼠的细胞色素b基因部分片段进行鉴定结果确定该病毒来自于为小家鼠(Musmusculus)。
该病毒组全基因组长度为 27 674 bp,G+C含量为42.31%,暂命名为NMR-13其基因组长度与其最为相近的病毒株FiCoV/UMN2020接近,但较其他鼠冠状病毒的长度较短。该病毒基因组与鼠类Alpha冠状病毒属的基因组结构类似,包含8个常见的开放阅读框(Open Reading Frame,ORF)以及5′UTR和3′UTR区,依次为5′UTR-ORF1ab-S-ORF3-E-M-ORF6-N-ORF8-3′UTR,其中ORF1ab基因编码非结构蛋白,S、E、M、N基因编码结构蛋白,ORF3、ORF6和ORF8编码3个辅助蛋白;此外,5′端包含286 bp的非编码区和3′端包含266 bp非编码区及polyA结构。NMR-13的基因组结构与我国浙江省发现的LRNV及多个相似的变异株以及英国发现的病毒株UKRn3 等鼠冠状病毒相比,在ORF1ab和S基因之间缺少一个编码NS2蛋白的ORF2开放阅读框,该基因目前在多数的鼠类Alpha冠状病毒中存在,而本研究中发现的NMR-13和与之相近的FiCoV/UMN2020 、AcCoV-JC34和Lijiang-170病毒株中未发现ORF2。此外,本研究发现的NMR-13在N基因下游3′非编码区存在一个编码109个氨基酸的ORF8。序列已上传至GenBank,序列号为OQ939561.1。
冠状病毒普遍包含保守的转录调控序列(Transcriptional Regulatory Sequence,TRS),NMR-13包含冠状病毒科成员保守的转录所需的转录调控序列,与鼠类冠状病毒LRNV 、AcCov-JC34及HKU3类似,在NMR-13基因组中5′-AACUAA-3′为主要核心转录调控序列,如表1所示。
表1 冠状病毒基因组特点分析
2.2 同源性分析 同源性分析结果显示,NMR-13与美国发现的FiCoV/UMN2020病毒株具有最高的相似性,为91.3%,各个ORF的核苷酸同源性为84.9%~92.8%,其中ORF8核苷酸和氨基酸同源性最低,仅为84.9% 和74.1%;FiCoV/UMN2020是一株实验室小鼠体内的分离出的病毒。NMR-13其次与我国发现的多株鼠类冠状病毒Lucheng/Lijiang-170、Lucheng/Ruian-83和Lucheng/Lijiang-71等多个病毒株同源性较高,为79.5%~81.0%,但S基因同源性低,仅为50.2%~61.4%,详细分析见表2。根据blast比对结果显示,相近的鼠类Alpha冠状病毒除FiCoV/UMN2020和UKRn3病毒株,其余病毒株均来自于中国,提示了病毒传播的区域性特点。NMR-13编码的ORF8仅与FiCoV/UMN2020以及我国发现的鼠类冠状病毒株和一株犬类冠状病毒具有同源性,其中与FiCoV/UMN2020毒株的氨基酸同源性为74.1%,而与其它我国相近毒株的氨基酸同源性仅为46.4%~53.6%。
表2 NMR-13与参考株序列的相似度分析
2.3 系统发育分析 为确定NMR-13与已知冠状病毒的进化关系,构建全基因组、RdRp区和S基因的最大似然树。全基因组系统发育树显示所有的来自啮齿动物Alpha冠状病毒单独聚为同一进化分支,包括来自我国云南、浙江和山东等地区发现的毒株、英国(UKRn3)和美国(FiCoV/UMN2020)的毒株。NMR-13与来自美国的FiCoV/UMN2020亲缘关系最近聚在一起。基于S基因和RdRp区的构建的系统发育树也显示类似的拓扑结构,详见图1、图2和图3。目前发现的鼠类Alpha冠状病毒多数发现自我国,包括云南、浙江和山东等地区。
注:加粗字体代表本研究的毒株。
注:加粗字体代表本研究的毒株。
注:加粗字体代表本研究的毒株。
2.4 序列重组分析 冠状病毒中重组情况较为常见[15],使用RDP4.0软件和SimPlot软件对NMR-13的全基因组和其他的冠状病毒进行序列相似性分析和重组分析,以NMR-13作为参考序列进行重组分析,未发现该病毒株有重组现象。重组分析发现,NMR-13与我国Lucheng/Lijiang-170、Lucheng/Ruian-83和Lucheng/Lijiang-71等病毒株除S区同源性较低外,ORF1a的部分区域同源性也较低,见图4。
图4 NMR-13与已知冠状病毒序列的重组分析)
3 讨 论
冠状病毒是在鼠类中常见的病毒之一,并且表现出较高的基因多样性,具有广泛的地理分布范围。近年来发生多起冠状病毒跨种传播感染人类的事件发生,因此冠状病毒是一种对人类具有重大威胁的人兽共患病原体。
本研究在鼠类中发现一株Alpha冠状病毒属成员,并获得完整基因组,命名为NMR-13。同源性和系统发育分析表明NMR-13病毒株与发现自美国的FiCoV/UMN2020病毒株最为相近,全基因组及各ORF同源性在90%左右。NMR-13其次与我国发现的多株鼠Alpha冠状病毒病毒株同源性仅为80%左右,根据全基因组、保守的RdRp区以及非保守的S基因构建的系统进化树也支持NMR-13与FiCoV/UMN202最近的亲缘关系而与其余我国鼠类Alpha冠状病毒病毒株进化关系稍远。鉴于中国与美国遥远的地理距离,NMR-13与美国发现的毒株更近而与我国毒株更远的原因可能与病毒在物种间的病毒传播的的关系相关性小,而更可能与病毒在进化过程中的趋同效应有关。鼠类物种繁多,目前已在多种鼠类中发现Alpha冠状病毒[11-12,16],本研究发现的NMR-13与最为相近的FiCoV/UMN2020病毒株均来自于小家鼠,在已有的研究对Alpha冠状病毒是否可能与宿主具有共进化的关系研究中并未发现共进化的相关性,而更可能在鼠类不同物种间跨种传播,形成鼠类Alpha冠状病毒的多样性。
NMR-13的基因组结构与我国浙江省发现的LRNV及多个相似的变异株以及英国发现的病毒株UKRn3 等鼠冠状病毒相比,在ORF1ab和S基因之间缺少一个预测的编码NS2蛋白的ORF2开放阅读框。在以往发现的多个鼠类Alpha冠状病毒,多数的病毒株在ORF1ab与S基因之间包含一个NS2基因,包括我国发现的Lijiang-71、Lucheng-19和Ruian-83以及英国发现的UKRn3,这些病毒株基因组的NS2蛋白均与Beta冠状病毒的NS2基因具有最高同源性,约为40%左右,这可能提示该基因可能来自于未被发现的Beta冠状病毒,且是在较为久远的历史进化中获得。而在本研究中发现的NMR-13、FiCoV/UMN2020、Lijiang-170和AcCoV-JC34病毒株中未发现NS2的存在[11-12]。已发现的鼠类Alpha冠状病毒ORF1ab和S基因之间编码的蛋白有两种形式,即插入NS2或插入NS2和(NS)2b两个假设的蛋白,目前该基因的功能尚不明确[11]。Alpha冠状病毒一般具有相似的基因组结构,包括ORF1ab-S-ORF3-E-M-N,而在一些种或毒株种,存在一些额外的ORF,例如TGEV, BatCoV、HKU2和BatCoV-512等毒株在其近3′末端包含一个ORF7。本研究中的NMR-13在近3′非编码区包含一个额外的编码109个氨基酸的ORF8,该ORF也仅在部分鼠冠状病毒和一株犬冠状病毒中发现,各毒株由于发现前后的区别,目前在GenBank中有些命名为ORF8而有些命名为ORF9,该ORF的功能目前尚不清楚。
本研究丰富了鼠类中冠状病毒多样性,冠状病毒多以引起重大公共卫生事件的身份进入人们视野,Alpha属冠状病毒可以感染许多啮齿动物,而啮齿动物是地球上最多样化的哺乳动物,他们与人类接触密切,是人兽共患传染病重要的病原体来源之一,未来的研究应集中于了解冠状病毒的多样性和宿主间跨越的可能性,因此我们需要对哺乳动物种群的冠状病毒感染进行更广泛的监测。
利益冲突:无