免疫信息学方法预测针对中东呼吸综合征冠状病毒的T/B 细胞抗原表位
2023-07-30黄转青李渊源石浩源徐风华
黄转青 孙 琦 杨 森 李渊源 石浩源 张 莹 龚 辉 徐风华
1.解放军总医院医疗保障中心药剂科药学基础研究室,北京 100853;2.解放军医学院,北京 100853
截至2019 年底,全球27 个国家共报道中东呼吸综合征(middle east respiratory syndrome,MERS)患者2 260 例,其中803 例死亡,死亡率高达35.5%[1]。MERS 冠状病毒(middle east respiratory syndrome coro navirus,MERS-CoV)是一种单股正链RNA 病毒,其4种主要结构蛋白分别是刺突蛋白(spike glycoprotein,S)、膜蛋白(membrane glycoprotein,M)、包膜蛋白(envelope protein,E)与核衣壳蛋白(nucleocapsid phospho-protein,N)。其中N、E、M 蛋白参与组装病毒粒子,S蛋白是参与病毒附着和进入宿主细胞的主要免疫性抗原[2]。MERS 具有流行潜力大、病死率高等特点,但暂时没有特异性治疗方法[3],因此迫切需要相应的疫苗和抗病毒策略来应对MERS-CoV 的感染和流行。国内外关于MERS-CoV 的表位预测,大部分针对S蛋白,但缺少对候选表位致敏性或毒性评估[4-5]。为了更深入地对MERS-CoV 致病的S 蛋白进行分析,本研究采用多种生物信息学方法来筛选T/B 细胞抗原表位,以期对设计安全有效的多肽疫苗提供参考。
1 材料与方法
1.1 蛋白序列下载及系统发育树分析
从美国国家生物技术信息中心以FASTA 序列格式下载首例输入中国的MERS 患者分离株S 蛋白(AKL59401.1)氨基酸序列[6],并使用从不同国家鉴定的各种MERS-CoV 分离株获得的所有S 蛋白序列在MEGA11 中进行多序列比对并构建了系统发育树[7]。
1.2 S 蛋白理化性质分析及二级结构预测
使用Expasy Protparam 预测S 蛋白理化性质[8]。S蛋白二级结构特征预测使用SOPMA[9]。
1.3 S 蛋白三级结构建模及验证
通过trRosetta 对S 蛋白进行三维结构建模,并对所建模型采用PROCHECK[10]验证其合理性。
1.4 T 细胞表位预测
1.4.1 细胞毒性T 淋巴细胞(cytotoxic T lymphocyte,CTL)表位预测 CTL 表位预测采用NetCTL-1.2 和NetMHC pan EL 4.1 进行分析。本研究选取世界人口中主要存在的6 种HLA Ⅰ超型(HLA-A×0101、A×0201、A×0301、A×2402、B×0702、B×4403)进行预测[11]。NetCTL-1.2 选择阈值0.75[12]。NetMHC pan EL 4.1 网站默认与MHC Ⅰ类分子强、弱结合肽序列的阈值为0.5%和2.0%[13],本次预测保留排名前1%的预测表位。综合以上两个数据库预测的表位,使用IEDB 的Class ⅠImmunogenicity 分析工具进行免疫原性预测,设置肽段长度为9aa、阈值0.2 来进行免疫原性筛选[14-15]。最后用VaxiJen v2.0[16]、AllerTOP v.2.0[17]和ToxinPred[18]对筛选出来的CTL 表位进行抗原性、致敏性和毒性评估,服务器均选用默认阈值,得到最终的CTL表位。
1.4.2 辅助性T 淋巴细胞(helper T lymphocyte,HTL)表位预测 为准确严谨地预测出HTL 表位,本研究预测结合使用NetMHCⅡpan-4.0、IFNepitope[19]和IL-4pred[20]3 种工具,综合预测到的表位进入后续检验。NetMHCⅡpan-4.0 中最终筛选出排名前2%的强结合肽用于后续检验[13]。等位基因选取世界人口中主要存在的7 种HLA Ⅱ超型(HLA-DRB1×0101、×0301、×0401、×0701、×1101、×1301、×1501)进行预测[11]。最后对筛选出来的HTL 表位进行抗原性、过敏性和毒性评估,此部分方法同“1.2”,得到最终的HTL 表位。
1.5 B 细胞表位预测
本研究中线性B 细胞(linear B lymphocyte,LBL)表位采用ABCpred[21]和BepiPred-2.0 网站[22]预测,其中ABCpred 预测肽长度选择14aa、16aa、18aa;Bepipred中均选择默认值。选取两个网站中重叠的表位进行抗原性、致敏性和毒性预测,预测方法同“1.2”。构象B细胞(conformation B Lymphocyte,CBL)表位预测使用IEDB 中ElliPro 工具[23],预测阈值选择0.5。
1.6 人口覆盖率
所选的等位基因超群覆盖率由IEDB 中人口覆盖工具分析[15]。整体预测流程概要见图1。
图1 抗原表位预测流程
2 结果
2.1 系统发育树
多序列比较结果显示,S 蛋白序列保守性较高,在突变位点中大部分的突变频率仅为1。本研究中获取的所有S 蛋白都可组装成一个系统进化枝,彼此密切相关。见图2。
图2 不同国家的中东呼吸综合征冠状病毒蛋白及其系统发育树
2.2 S 蛋白理化性质及二级结构预测结果
理化性质预测结果显示,S 蛋白具有1 353 个氨基酸,重量为149 479.23 ku,理论PI 值为5.80,消光系数为170 865/(M·cm),不稳定性指数为36.81(为稳定蛋白),脂肪指数为82.79,亲水性总平均值为-0.078(具有亲水性)。其在哺乳动物网织红细胞中估计半衰期为30 h。SOPMA 网站对S 蛋白二级结构预测发现其具有α-螺旋413 个,占比30.52%;延伸链294个,占比21.73%;β-转角53 个,占比3.92%;无规卷曲593 个,占比43.83%。见图3。
图3 S 蛋白二级结构在SOPMA 中的预测结果
2.3 S 蛋白建模及验证结果
trRosetta 对S 蛋白建模结果见图4A。该模型经PROCHECK 验证结果见图4B,其中最合理区残基占比85.9%,其他合理区占12.3%,一般合理区占1.1%,不合理区占0.8%。
图4 S 蛋白的建模结果及验证
2.4 T 细胞表位预测结果
2.4.1 CTL 表位预测结果NetCTL-1.2 和NetMHC pan EL 4.1 的重叠表位136 个,其中具有免疫原性的表位14 个。经抗原性、致敏性和毒性评估后最终得到2个候选CTL 表位,分别为S567-575 和S42-50。
2.4.2 HTL 表位预测结果 NetMHCⅡpan-4.0 预测得到表位46 个;上述表位中IFN-γ 表位共有13 个;其中IL-4 表位7 个,经抗原性、致敏性和毒性评估后最终得到2 个抗原性较强的HTL 表位,分别为S300-314和S1058-1072。
2.5 B 细胞表位预测结果
ABCpred 和BepiPred-2.0 中重叠的LBL 表位38个,经抗原性、致敏性和毒性评分后最终得到15 个LBL表位,分别是S19-32、S66-83、S259-272、S355-370、S412-427、S413-426、S450-463、S581-596、S623-638、S657-667、S685-709、S738-777、S1108-1117、S1198-1213、S1222-1239。ElliPro 预测结果显示共有641 个残基分别位于5 个CBL 表位中,各CBL 具体位置见图5。
图5 五个CBL 表位(黄色)在S 蛋白中的相对空间位置
2.6 人口覆盖率
IEDB 人口覆盖率计算工具显示,本研究中选择用于T 细胞表位预测的HLA 等位基因预计能覆盖世界95.19%的人口。
3 讨论
与传统技术路线比较,多肽疫苗具有安全性高、特异性强、成分简单,可将多个不同抗原表位结合到一起构建合成等优点。生物信息学的发展可以实现在不需要体外培养病原体的情况下,预测各种病毒不同肽段表位的抗原性、免疫原性及免疫相关的其他理化性质,为多肽疫苗设计表位选择提供可靠的指导和参考。
由于MERS-CoV 的致死率高,故其被认为是威胁人类健康最关键的新兴病原体之一。但关于MERS-CoV 流行病学、发病机制和演变方面仍存在很多未知,并且目前还没有任何抗MERS-CoV 治疗药物被批准用于人类[24],亦无保护率高的特异预防性疫苗,因此选择预测MERS-CoV 致病关键蛋白的优选抗原性肽段,对MERS-CoV 多肽疫苗的设计和开发具有重要作用。本研究通过对所选S 蛋白理化性质和二级结构分析发现其为亲水性稳定蛋白。对其三级结构模型验证发现该模型中最合理区域残基占比很高,提示预测模型较为准确。免疫信息学方法预测S 蛋白序列与MHC Ⅰ类分子结合力较强的CTL 表位,进而通过对这些序列进行免疫原性分析;同时还预测了S蛋白与MHC Ⅱ类分子强结合且能分泌IFN-γ 和IL-4 的HTL 表位。由于安全性和有效性是多肽疫苗的基本要求,且只有抗原性强的表位才能刺激产生有效的免疫反应,只有无致敏性和毒性的表位才能用于设计安全的人用疫苗。因此,对上述得到的表位进行抗原性分析、过敏性和毒性评估,最终得到抗原性强、无致敏性和无毒性的CTL 表位2 个,HTL 表位2 个,LBL 表位15 个。此外,大部分B 细胞表位是不连续的,即其由病原体蛋白质序列中分离较远的片段组成,这些片段由于蛋白质的折叠而接近[25],故本研究中采用ElliPro 预测不连续B 细胞表位,得到CBL 表位5 个。人口覆盖率预测结果显示所选等位基因预计能覆盖世界95.19%的人口,提示基于本研究得到的抗原表位设计的表位疫苗具有广谱性。
本研究综合利用多种生物信息学工具,整理出一套适用于MERS-CoV 多肽疫苗候选表位预测分析的流程,这在新型冠状病毒感染等流行病蔓延的当下,具有较大的参考价值和借鉴意义。尽管本研究预测出了MERS-CoV 的优势抗原表位,但所预测的优势表位是否能诱导机体发生先天免疫和特异性免疫反应,还需进一步实验验证。