基于冷冻电镜的草鱼呼肠孤病毒对称失配三维重构算法研究
2024-01-11童江杨陈建楠王勖荣
童江杨,陈建楠,2,3,薛 婷,2,3,王勖荣*
(1.福建师范大学生命科学学院, 福建 福州 350117; 2.福建省特色海洋生物资源可持续利用重点实验室, 福建 福州 350117; 3.海洋生物医药与制品产业化开发技术公共服务平台, 福建 福州 350117)
草鱼呼肠孤病毒(Grass Corp Reovirus,GCRV)是呼肠孤病毒科Reoviridae水生呼肠孤病毒属Aquareovirus的原型成员,是中国大陆分离的第1株鱼类病毒[1],在已知的水生呼肠孤病毒属中致病性最强[2-3],能导致草鱼在育种以及培育阶段出现严重的出血热病。该疾病具有流行地区广、流行季节长、发病率高、致死率高、危害性大的特点。GCRV是典型的双链RNA病毒,这类病毒通常都是一种无包膜的颗粒,通过单层或多层外衣壳来包裹住一个分段的双链RNA(double-strand RNA,dsRNA)基因组[4-10]。这类病毒一般有一个由内衣壳蛋白(Inner Capsid Proteins,ICPs)组成的封闭二十面体内核(core)。核内包裹有10~12个RNA依赖的RNA聚合酶复合物(RNA dependent RNA polymerase complexes)以及分段式的RNA。这些聚合酶复合物被内衣壳蛋白固定在内核5次对称轴下方的内表面附近,周围盘绕着按层状分布的基因组。经生化试验鉴定,这些聚合酶复合物的数量应该与分段RNA的数量相对应。包括草鱼呼肠孤病毒在内的双链RNA病毒,他们的转录与复制过程都在内核中完成,特殊的结构保护了病毒RNA在内源转录与复制的过程中免受外部环境的影响,为冷冻电镜三维重构研究处于生命周期中不同状态下的病毒三维结构创造了条件。据研究报道,不同状态下的病毒聚合酶复合物结构会发生变化。这导致病毒聚合酶复合物与病毒衣壳之间存在对称失配的问题,病毒的三维结构在解析过程中被平均。本研究提出了一种利用二十面体点群的特殊子群搜索的对称失配三维重构算法,能够高效地搜索出病毒颗粒图像对应的真实取向,从而消除对称失配问题对病毒三维结构信息的影响。
Liu等[11]率先提出了利用对称失配的方法解析病毒内部的高分辨三维结构,并在2015年最先应用于具有单层外衣壳的质型多角体病毒(CPV)上,成功还原了质型多角体病毒内部呈液晶态层状分布的基因组结构以及呈D3对称的病毒RNA聚合酶(RdRp)结构,终结了双链RNA病毒RdRp与基因组呈线轴状分布的猜想。Li等[12]基于此前研究,系统总结了利用对称失配三维重构病毒衣壳内部蛋白复合物与基因组结构的一般流程。王勖荣等[13]使用对称失配三维重构的方法成功解析了具有双层外衣壳结构的草鱼呼肠孤病毒3.6Å的全病毒结构。然而由于草鱼呼肠孤病毒二十面体衣壳顶点与内部转录酶的对称失配,这些结构仍不是病毒的真实结构。草鱼呼肠孤病毒的内部结构仍然具有D3对称性,对称失配的问题使得在三维重构中部分真实的结构信息被平均。研究还通过分类对比发现,信号平均的情况只发生在赤道组的RdRp上。
本研究提出了一种利用二十面体点群的特殊子群搜索的对称失配三维重构算法流程,使用了成熟态的GCRV病毒颗粒作为本研究对象,利用滤波后的自然退化型GCRV病毒颗粒对称失配三维重构的病毒结构作为初始模型,随后通过特殊子群定位草鱼呼肠孤病毒内部聚合酶复合物缺失的特异性顶点位置,破除了D3对称性对病毒三维结构的影响,并最终得到了病毒颗粒电镜图像对应的取向中心。新算法省略了三维重构过程中利用病毒高分辨结构信息投影拟合减除衣壳电镜图像信号的过程,加入基于低通滤波后的低分辨模板的局部取向搜索,提升了搜索的精度及效率,并成功结合三维分类的方法从6个赤道组顶点中分离出特异性顶点位置,为双链RNA病毒生命周期的分子机制研究提供新方法。
1 材料与方法
1.1 主要仪器和试剂
1.1.1细胞与毒株 草鱼呼肠孤病毒的毒种购自中国典型培养物保藏中心、草鱼肾(Ctenop haryngodonIdellus Kidney,CIK)细胞购自武汉华尔纳生物科技有限公司。
1.1.2试验试剂 胎牛血清(Gibco原装进口,赛默飞世尔科技公司)、PBS缓冲液(阿拉丁试剂公司)、固体氯化铯(西格玛奥德里奇公司)、透析卡(赛默飞世尔科技公司)、Quantifoil R2/1铜网(北京中镜科仪公司)。
1.1.3主要培养基 DMEM培养基:Gibco牌,购自赛默飞世尔科技公司。
1.1.4主要仪器设备 A2型二级生物安全柜(上海贝茵生物科技有限公司)、落地式大型冷冻离心机(艾本德股份公司)、水平离心机(赛默飞世尔科技公司)、恒温细胞培养箱(赛默飞世尔科技公司)、洁净工作台(苏州市安泰空气技术有限公司)、数显三用恒温水浴箱(上海比朗仪器有限公司)、超速离心机(赛默飞世尔科技公司)、FEI Vitrobot Mark IV快速冷冻仪(赛默飞世尔科技公司)、120kV F20 透射电子显微(赛默飞世尔科技公司)、300kV Titan Krios透射电子显微镜(赛默飞世尔科技公司)、K3直接电子检测器(美国Gatan公司)。
1.2 试验方法
1.2.1草鱼呼肠孤病毒的纯化和样品制备 取冻存至液氮中的CIK细胞,于28℃培养箱和含10%胎牛血清的DMEM培养基中复苏传代。待细胞生长至丰度为80%时,用Aquareovirus (reovirus)毒种感染CIK细胞,并在细胞完全病变(100% CPE)的情况下收获细胞及上清液。通过对病变细胞反复冻融3次获取其细胞裂解液,在4℃下以8000 r·min-1离心30 min,以去除细胞碎片。对所有裂解液上清在4℃下以20000 r·min-1离心1 h,将病毒颗粒离心沉淀成团。离心后去除上清,用PBS缓冲液重悬病毒沉淀,然后于4℃下在1.45、1.38、1.36 g·mL-1的氯化铯溶液中以36000 r·min-1超速离心4 h,再通过密度梯度离心法纯化重悬的病毒颗粒。随后收集超离后含有病毒的条带,并置于PBS缓冲液中进行透析脱盐。负染鉴定最终纯化的病毒颗粒形态,将最终病毒样品置于冰上等待冷冻样品制备。
1.2.2冷冻样品制备和冷冻电镜数据收集 样品玻璃化过程采用FEI Vitrobot Mark IV快速冷冻设备来进行,设置样品室内条件:4℃环境及100%湿度,然后在FEI Vitrobot Mark IV设备中加入乙烷(用液氮冷却)。取梯度离心纯化的3.5 μL病毒样品涂在辉光放电后的Quantifoil R2/1网格上,使用滤纸吸附4 s后将载网快速投入至液态乙烷中。对于快速冷冻后载网,使用山西高等创新研究院的配备有K3直接电子检测器(Gatan)的300 kV FEI Titan Krios透射电子显微镜收集样品的多帧图像。数据收集参数如下:放大倍数为110000倍,产生的物理像素大小为1.36 Å,对应的超分辨率像素大小为0.68 Å;所收集的多帧图像,每次曝光7.6秒共计得到32帧图像,总电子剂量数约为28 e/Å2。
1.2.3冷冻电镜数据处理 本试验共收集到电镜多帧图像约4200张,其中有颗粒共4142张,本研究沿用传统的MotionCorr2对每组多帧图像文件进行光束引起样品漂移的对齐校正,再对衬度传递函数(CTF)参数使用Gctf进行估计。完成图像预处理后,使用自己编写的Icosprocess软件对收集到的数据,应用二十面体对称性(I2)进行三维重构,得到病毒颗粒的高分辨三维结构。在二十面体三维重构的基础上,利用自主编写的一系列软件包:proc_icos、local_box、local_refine以及local_reconstruct对病毒的十二个特异性顶点进行了局部重构与精修,最终得到病毒十二个顶点的高分辨三维结构。基于滤波后的先验模型,使用自行编写的软件包symmetry_mismatch_search对十二个顶点进行非对称搜索,得到了RdRp的二十面体对称失配取向,并重构出三维结构。随后利用得到的对称失配取向重构出了一个带有伪D3对称性的病毒对称失配三维结构,以此确定了病毒的D3对称轴,随后RdRp被分成赤道组与两极组。赤道组的颗粒对应的sub_box文件被用于提取出该组对应顶点的图像及对应信息。最后再利用relion 4.0的三维聚类功能分离出特异性顶点的信号。
2 结果与分析
2.1 成熟态GCRV 病毒颗粒的纯化
对GCRV病毒悬浮液进行氯化铯密度梯度离心,最终获得两层乳白色蛋白条带。分别取超离后上下两层蛋白条带的样品进行负染观察,可以初步判断,见图1。上层条带主要为细胞碎片、杂蛋白及少量病毒颗粒,下层条带为成熟态GCRV病毒颗粒。取下层条带进行透析脱盐后并再次负染观察,结果(图2)发现透析后成熟态GCRV病毒颗粒的浓度适中、形态均一,并且负染图中病毒颗粒双层衣壳清晰可见。将成熟态GCRV样品置于冰上等待冷冻电镜样品制备。
注:A图为超离后的上层条带负染图,B图为下层条带负染图图1 CsCl溶液超速离心后的GCRV病毒样品负染结果Fig.1 Negative staining results of GCRV virus samples after the ultracentrifugation of CsCl solution
图2 透析脱盐后的GCRV病毒样品负染结果Fig.2 Negative staining results of GCRV virus samples after the dialysis desalting
2.2 成熟态GCRV病毒颗粒的冷冻电镜三维重构
由于使用超分辨的方法收集电镜图像肉眼无法识别病毒颗粒,对图像施加以Gaussian滤波,使得冷冻电镜图像中的病毒颗粒肉眼可见,见图3A。使用Gctf计算所收集数据的平均最高分辨率可达4.2Å,见图3B。成熟态的GCRV是一种生物大分子,由1500多个分子组成,直径约为820Å,见图3C。先前的研究表明,使用300 kV的低温电镜可以在近原子分辨率下进行数据收集,并得到高分辨三维结构。
注:A图为GCRV病毒颗粒滤波到6Å后的冷冻电镜图像;B图为电镜图像的功率谱,红圈为GCTF预测的效信号分辨率;C图为电镜图像中提取的GCRV颗粒,直径约为82 nm图3 试验收集的GCRV病毒颗粒的冷冻电镜图像及颗粒信息Fig.3 Cryo-EM images and particle information of GCRV virus particles collected in the experiment
试验总共收集了4215张冷冻电子显微图像。三维重构和精修是使用本课题组独立的研究和开发软件包进行的。数据预处理阶段,通过自动颗粒框取和人工复核的方式总共提取了15307个病毒颗粒,并根据相残标准来获取的近原子分辨二十面体三维结构,见图4。
注:左图为GCRV病毒颗粒二十面体三维重构结构;右图为左图结构的局部二级结构图4 GCRV病毒三维结构图及局部二维结构Fig.4 Three-dimensional structure diagram and local two-dimensional structure of GCRV virus
通过观察GCRV病毒颗粒的二十面体三维结构,可以看到明显的二级结构以及较为显著的氨基酸侧链信息,说明该结构分辨率已达到近原子分辨,其病毒颗粒的取向中心参数已完全收敛。对比GCRV病毒颗粒与MRV病毒颗粒可以发现,二者在结构蛋白种类数量与组装结构上并无太大差异,见表1。
表1 GCRV与MRV结构蛋白种类、位置与功能
2.3 局部三维重构及对称失配搜索
二十面体病毒衣壳的三维重构一般都利用该结构的高度对称性。该方法通过对衣壳上一个非对称单元对应的取向施加以60个等价对称操作,得到其他59个等价取向并加以利用,可以使数据得到更有效的利用。这60个对称操作对应了二十面体的60个点群。二十面体上的12个顶点对应了二十面体60个对称操作中的12个。利用这一特性本研究开发了一套针对双链RNA病毒十二个顶点的局部重构算法,流程图见图5。首先使用proc_icos程序将二十面体病毒颗粒的一个顶点转到特殊位置,并得到它在实空间中的坐标。接着通过计算得出了这12个对称操作对应的点群,并利用这些点群得到了12个等价变换操作矩阵。利用这些变换操作,可以得到实空间中病毒颗粒12个顶点的位置坐标。选择合适的sub_box大小并使用local_box程序将这些顶点的信号从病毒颗粒图像中提取出来,随后使用local_reconstruct程序对病毒颗粒进行顶点的局部重构,得到病毒12个顶点的三维平均。由于二十面体的顶点具有C5对称性。利用local_refine应用C5对称性对该结构进行精修后,即可得到一个局部的高分辨结构。
图5 GCRV病毒颗粒顶点局部三维重构流程Fig.5 Flow path of local 3D reconstruction of GCRV virus particle vertex
在此前的研究中,通过病毒衣壳减除、基于高分辨衣壳信号的衣壳图像信号减除以及对称失配信号搜索等方法,已掌握了草鱼呼肠孤病毒自然退化型颗粒(Native Degrad Particle,NDP)的RdRp结构信息。本研究基于先验的结构信息,开发出了一套病毒局部对称失配取向搜索的算法。本研究以滤波到20Å的NDP顶点对称失配结构为模板,利用程序symmetry_mismatch_search作局部取向的搜索,对称性选择C5。等到取向收敛后即可得到GCRV病毒颗粒顶点的对称失配取向,通过迭代精修即可得到高分辨的病毒RdRp。
2.4 GCRV特异性顶点的搜索
草鱼呼肠孤病毒拥有11条分段式的双链RNA,对应有11个RdRp。然而正二十面体共有12个顶点,RdRp与顶点对称失配。先前的研究证明,RdRp呈伪D3对称分布。沿D3对称轴将GCRV的RdRp分成两极组与赤道组,那么通过平均密度判断可知,缺失的RdRp分布在赤道组中。针对这个问题本研究对局部搜索的范围进行了优化,将12个顶点对应的对称操作再次细分为两极组与赤道组两组,分别得到两个分组的对称操作矩阵。随后利用赤道组的对称操作矩阵提取了该分组对应的顶点图像,并编写了取向中心文件转换脚本Icos2RLN.Py将结果接入到relion 4.0中进行不带精修的三维聚类。
由于赤道组共有6个不同的位置,因此对这些图像聚类的时候分成了6组,结果见图6。通过观察这些聚类结构的二维投影发现,6个位置中有一个位置没有RdRp的信号,且该位置的被类似核酸的物质占据。该聚类结果证明了算法的有效性,对基于GCRV对称失配结构的病毒内源转录分子机制研究以及GCRV生命周期的分子机制研究都具有重要意义。
图6 GCRV病毒内部赤道组RdRp的三维聚类结果Fig.6 Three-dimensional clustering results of the equatorial group RdRp within the GCRV virus
3 结论与讨论
此前,研究人员总结过该类病毒的分段RNA数量应与RdRp数量一致的规律。本研究结果指出,GCRV病毒的RdRp数量确实为11个,与其具有的11段分段RNA数量一致。这与先前拥有10个分段RNA的MRV与CPV,具有10个RdRp的研究结果也相吻合。同时,分类结果也证实了本研究提出的算法切实可行。至于病毒的缺失的RdRp为何必须位于D3对称中靠近赤道的一组,本试验无法给出合理推断,且目前也没有相关研究证据可以说明。此类病毒的RdRp的分布规律和组装机制仍有待进一步探明。
GCRV作为典型的双链RNA病毒,其生命周期拥有独特的内源转录机制。在双链RNA病毒中,有致死率极高的轮状病毒(Rotavirus)、作为基因治疗载体的哺乳动物呼肠孤病毒(Mammalian Reovirus)以及能造成对我国水产行业极大冲击的草鱼出血热的草鱼呼肠孤病毒(Grass Carp Reovirus)。这些病毒由于在组装过程中自带有内源转录蛋白,其在侵染细胞后可以在病毒封闭的衣壳内完成RNA的转录与复制,稳定性很高。针对这类病毒的抗病毒药物与疫苗研发需要对其生命周期的分子机制有充分的了解,而获得组成病毒的结构蛋白的高分辨结构信息又是前者的充要条件。本研究成果为GCRV乃至其他双链RNA病毒生命周期的分子机制的探索提供了方法学基础。在此基础上,本研究期望获取其对称失配结构的高分辨信息,并阐明其生命周期的分子机制,为抗病毒药物与疫苗研发提供坚实的理论基础。