芝麻主要过敏原Ses i 6抗原表位预测及敏感人群分析
2022-09-19陈慧彬
陈慧彬
(河南工业大学 粮油食品学院,河南 郑州 450001)
芝麻是一种经济效益好、营养价值高的食品。芝麻含油率达45%~57%,蛋白质含量约21%,是优质的不饱和脂肪酸和蛋白质来源。此外,芝麻还富含木脂素及维生素E等抗氧化成分,素有“八谷之冠”的美誉[1]。然而,芝麻蛋白又是一种不容忽视的食品过敏原。2014年,美国公共事务科学中心(CSPI)要求美国食品药品监督管理局(FDA)将芝麻制品纳入食源性过敏原加以管理。
食品过敏原通过胃肠道初次进入机体后,被抗原提呈细胞吞噬消化为小分子肽段,由MHCⅡ(T细胞表位,主要负责提呈外源抗原)提呈到细胞质膜表面,与TH2细胞的TCR结合,形成MHCⅡ-抗原-TCR复合体,被激活的T细胞产生细胞因子,IL4和IL10可刺激B细胞释放IgE抗体(B细胞表位),IgE结合至肥大细胞和嗜碱性粒细胞表面,使机体处于致敏状态,当机体再次接触过敏原,可迅速引发Ⅰ型超敏反应,进而触发过敏症。
芝麻过敏原主要包括醇溶蛋白超家族的Ses i 1和Ses i 2,Cupin超家族的Ses i 3、Ses i 6和 Ses i 7,以及油质蛋白超家族的Ses i 4和Ses i 5[2]。其中Ses i 6和Ses i 7占芝麻蛋白质总量的60%~70%,因其具有较强的热稳定性和抗消化能力,容易通过胃肠道屏障薄弱部位进入循环系统,被免疫细胞识别消化触发Ⅰ型超敏反应,是芝麻中的主要过敏原。国内关于芝麻过敏原的研究仍为空白,为此,探究Ses i 6的致敏表位、致敏机理、检测方法、脱敏加工等尤为重要。本研究采用生物信息学软件对Ses i 6的抗原表位进行模拟预测,以期为后续的研究工作奠定基础。
1 材料与方法
1.1 Ses i 6信息检索及理化性质分析
登录NCBI-Protein数据库,查询Ses i 6的氨基酸序列(编号:Q9XHP0.1),获取如下FASTA序列:MVAFKFLLALSLSLLVSAAIAQTREPRLTQGQQCRFQRISGAQPSLRIQSEGGTTELWDERQEQFQCAGIVAMRSTIRPNGLSLPNYHPSPRLVYIERGQGLISIMVPGCAETYQVHRSQRTMERTEASEQQDRGSVRDLHQKVHRLRQGDIVAIPSGAAHWCYNDGSEDLVAVSINDVNHLSNQLDQKFRAFYLAGGVPRSGEQEQQARQTFHNIFRAFDAELLSEAFNVPQETIRRMQSEEEERGLIVMARERMTFVRPDEEEGEQEHRGRQLDNGLEETFCTMKFRTNVESRREADIFSRQAGRVHVVDRNKLPILKYMDLSAEKGNLYSNALVSPDWSMTGHTIVYVTRGDAQVQVVDHNGQALMNDRVNQGEMFVVPQYYTSTARAGNNGFEWVAFKTTGSPMRSPLAGYTSVIRAMPLQVITNSYQISPNQAQALKMNRGSQSFLLSPGGRRS。Ses i 6共459个氨基酸残基,以此为基础进行接下来的表位分析。
登录UniProtKB,查询Ses i 6(编号:Q9XHP0)的基本信息和功能注释。
将Ses i 6的FASTA格式序列导入EXPASY的ProtParam工具,预测分析Ses i 6蛋白的物理化学性质。
1.2 B细胞表位预测
1.2.1 B细胞线性表位预测
1.2.1.1 基于Ses i 6二级结构的生物信息学预测
将氨基酸序列导入在线预测软件SOPMA,依据二级结构算法预测分析潜在的B细胞线性表位。
1.2.1.2 基于Ses i 6分子特征的生物信息学预测
使用DNAstar子程序Protean分析Ses i 6的蛋白质特性。其中,Kyte-Doolittle Hydropathy方案可以根据氨基酸序列得出Ses i 6的亲水性分布;Karplus-Schultz方案可以通过分析Ses i 6的主链柔性预测潜在的抗原表位;Emini方案可以预测Ses i 6的表面可及性;Jameson-Wolf方案可以直接得出Ses i 6的抗原分布,综合四种方案预测分析Ses i 6潜在的优势表位。
1.2.1.3 基于Ses i 6与已知过敏原的比对预测
登录BepiPred 1.0 Server,输入氨基酸序列,结合氨基酸的性质(亲水性、柔韧性、可及性、极性、暴露表面、转角)和隐马尔可夫模型预测潜在的B细胞线性表位[3]。研究表明,同那些仅依赖于氨基酸性质的预测方法相比,隐马尔可夫模型可提高BepiPred预测结果的准确性。
1.2.2 B细胞构象表位预测
1.2.2.1 Ses i 6三维模型的构建
在SWISS-MODLE中通过序列比对寻找模板,需要注意的是,寻找的模板蛋白与Ses i 6的序列相似性应高于30%[4],以模板结构为基础进行三维建模,下载三维模型的PDB文件以评估其稳定性。
1.2.2.2 Ses i 6三维模型稳定性评价
在Deep View 4.1中导入SWISS-MODLE构建的三维模型PDB文件,获取拉氏图(Ramachandran Plot),评定三维模型的稳定性。
1.2.2.3 基于Ses i 6三维模型的生物信息学预测
DiscoTope 2.0 Server通过计算抗原抗体接触数和氨基酸倾向得出致敏原潜在的构象表位,采用新型的空间可及性算法预估表面暴露的可能性,增加了预测的准确性。导入SWISS-MODLE的PDB文件,分析同源模型中的构象表位。在Pymol软件中标注获取的构象表位,分析其空间位置关系。
1.3 敏感人群分析及T细胞表位预测
人类白细胞抗原(Human Leukocyte Antigen,HLA)是表达于人体免疫细胞质膜表面的主要相容组织复合体(Major histocompatibility complex,MHC)[5],具有广泛的群体多态性,与食品过敏的个体差异性密切相关,根据差异大小,可分为安全群体和敏感群体。因此,根据HLA基因型与Ses i 6的相关关系分析敏感人群分布格外重要。外源抗原(CD4+T细胞呈递)的T细胞表位由12~17个氨基酸残基组成,主要是线性表位,与肽段的空间位置没有关系,可分布于分子内部,研究具体的T细胞表位可为敏感人群提供安全保障。
1.3.1 敏感人群分析
使用在线分析软件NetMHCII 2.3 Server[6]分析Ses i 6与HLA-DR(共25种)、HLA-DQ(共20种)、HLA-DP(共9种)的结合能力,筛选出高亲和性肽段(SB)和低亲和性肽段(WB),并判断敏感人群。
1.3.2 敏感人群的T细胞表位预测
根据1.3.1中敏感人群的高亲和肽段分析其T细胞表位。
2 结果与分析
2.1 理化性质分析
NCBI数据库显示,Ses i 6的1aa-21aa为信号肽,22aa-277aa为酸性亚基,278aa-459aa为碱性亚基,第24位和第67位的Cys形成二硫键,此外,第110位和第284位的Cys形成的二硫键连接酸性亚基和碱性亚基。20aa-454aa属于Cupin蛋白超家族,该蛋白家族拥有β-伴大豆球蛋白、7S豌豆球蛋白及花生主要过敏原Ara h 1等众多致敏原。
UniProtKB数据库显示,Ses i 6是一种同源六聚体贮存蛋白,2007年被世界卫生组织(WHO)和国际过敏协会联合会(IUIS)正式定名为过敏原Ses i 6.0101。
通过ProtParam分析,Ses i 6的分子式为C2246H3560N682O692S20,分子量为51830.33Da,等电点为7.73,脂肪蛋白系数(AI)为74.36,平均亲水指数(GRAVY)为-0.537,AI和GRAVY共同指示Ses i 6具有很强的亲水性。Ses i 6的氨基酸组成如图1所示。
2.2 B细胞表位预测
2.2.1 线性表位
2.2.1.1 基于Ses i 6二级结构的生物信息学预测
根据二级结构预测理论,红色区域和紫色区域因暴露于蛋白质分子的外表面,从抗原抗体的可及性观测,容易被识别,是致敏原分子中的优势表位。Ses i 6酸性亚基含有更多的无规则卷曲片段,而碱性亚基的各种二级结构分散,难以形成稳定的抗原表位。SOPMA分析的Ses i 6的二级结构分布如图2所示。
图2 Ses i 6的二级结构分布
以多于5个氨基酸残基(B细胞线性表位通常含有5-15个氨基酸残基)为标准,SOPMA共预测出图3所示的21个潜在优势抗原表位,其中,12个分布于酸性亚基。另外9个分布于碱性亚基,根据表位分布情况可知,Ses i 6的酸性亚基抗原性略高于碱性亚基。
图3 基于Ses i 6二级结构的预测结果
2.2.1.2 基于Ses i 6分子特征的生物信息学预测
图4展示了DNAstar预测的Ses i 6分子特征。整体上酸性亚基亲水性强于碱性亚基,往往致敏原的亲水性基团暴露在蛋白质表层,易与免疫细胞质膜受体结合,触发过敏症,因此,从亲水性角度观测,酸性亚基抗原性较强。65.6%的肽段抗原指数高于0,部分片段达1.7,显示出较强的抗原性。Ses i 6的表面可及性与亲水性预测结果基本保持一致,酸性亚基环绕在分子外表面的可能性更大,是Ses i 6潜在抗原表位的优势集中区。
图4 DNAstar预测结果分布
DNAstar预测出10个潜在的优势抗原表位(见表1),其中,7个表位分布于酸性亚基,3个表位分布于碱性亚基,前者抗原性强于后者,与SOPMA预测结果一致。
表1 DNAstar预测结果
2.2.1.3 基于Ses i 6与已知过敏原的比对预测
Bepipred预测出13个抗原表位(见表2),其中,8个表位分布于酸性亚基,5个表位分布于碱性亚基,与SOPMA和DNAstar预测结果一致。
表2 Bepipred预测结果
使用单一的数据库或生物信息学软件进行预测,结果往往有较大的偏差,结合SOPMA、DNAstar及Bepipred三款软件的不同算法,得出B细胞线性表位的综合预测结果(见表3)。综合来看,所有潜在的优势抗原表位都分布于酸性亚基。
表3 B细胞线性表位的综合预测结果
2.2.2 构象表位
2.2.2.1 Ses i 6三维模型的构建
在PDB数据库中搜寻模板,得到序列相似度为39.21%的籽粒苋(AmaranthushypochondriacusL.)11S贮存蛋白(3qac),构建Ses i 6三维模型(见图5)。碱性亚基和酸性亚基各自形成一个β-桶结构域,该结构是Cupin蛋白超家族的典型特征,主要由β-折叠构成。图中显示的β-转角结构和酸性亚基向外延伸的无规则卷曲片段已在2.2.1.1中被预测为潜在的线性抗原表位。
图5 Ses i 6三维模型
2.2.2.2 Ses i 6三维模型稳定性评价
Deep View 4.1通过分析相邻氨基酸的二面角(φ,ψ)大小评估Ses i 6三维结构的稳定性。图6中的深绿色区域为允许区,浅绿色区域为不完全允许区,其他区域为不允许区。拉氏图显示93.41%以上的二面角符合稳定性要求。因此,SWISS-MODLE预测结果可用于Ses i 6构象表位的预测,并对Ses i 6的立体结构解析有指导意义。
图6 Ses i 6三维结构的Ramachandran Plot
2.2.2.3 基于Ses i 6三维模型的生物信息学预测
以稳定的三维模型为基础,DiscoTope 2.0分析出10个潜在抗原表位(见表4),其中,8个位于酸性亚基的构象表位,2个位于碱性亚基的构象表位,与线性表位分布一致。
表4 DiscoTope 2.0预测结果
Ses i 6的B细胞构象表位分布如图7所示。使用Pymol标注出10个抗原表位的空间位置,优势表位全部位于Ses i 6表面,容易被免疫细胞识别,其中,表位1、2、5、6、7和8位于酸性亚基的无规则卷曲部位,表位9和10位于碱性亚基的无规则卷曲部位。因为酸性亚基向外延伸较多,表面可及性强,所以与IgE的接触数较多,相反,碱性亚基在形成六聚体时被临近亚基遮挡,只有暴露在表面的位点可被IgE识别。
图7 Ses i 6的B细胞构象表位分布
2.3 T细胞表位预测
2.3.1 敏感人群分析
通过分析445个十五肽段与HLA的亲和性高低得到图8—图10所示结果。25种HLA-DR中有23种(92%)强亲和肽段,20种HLA-DQ中有18种(90%)强亲和肽段,9种HLA-DP中有4种(44.4%)强亲和肽段,其中,HLA-DQ的敏感性整体高于HLA-DR,HLA-DP的亲和性最弱。由此可见,HLA-DQ携带者对Ses i 6有很强的敏感性。其中,HLA-DQA10601-DQB10402的结合能力最强,可强亲和32个十五肽段,携带该基因型的人群极有可能在误食加工不完全的Ses i 6产品后触发过敏症。
图8 Ses i 6与HLA-DR基因型的相关性分析
图9 Ses i 6与HLA-DQ基因型的相关性分析
2.3.2 敏感人群的T细胞表位预测
分析2.3.1中敏感人群的T细胞表位发现,Ses i 6与HLA-DQA10601-DQB10402、HLA-DQA10201-DQB10402、HLA-DQA10303-DQB10402、HLA-DRB1*1601亲和性最强的T细胞表位分别为FVVPQYYTSTARAGN、AGYTSVIRAMPLQVI、FVVPQYYTSTARAGN、AFKFLLALSLSLLVS,其中HLA-DQA10601-DQB10402和HLA-DQA10303-DQB10402的强亲和表位一致,同时含有这两个HLA亚型的人群,对FVVPQYYTSTARAGN过敏的可能性极大。
3 总结与展望
2007年,Beyer等[2]首次证实了Ses i 6可与54%过敏患者的IgE牢固结合反应,但之后关于Ses i 6的致敏性研究一直处于停滞期。本研究成功预测出的Ses i 6 B抗原表位,将为其致敏性研究做出贡献。研究发现,B细胞表位中有90%为构象表位,加工变性的方式可以使一维不连续的构象表位解聚脱敏,但难以通过打断蛋白质一级结构破坏线性表位,因此,Ses i 6致敏性研究的关注点应在其线性表位上。Wallowitz等[7]研究发现,Ses i 6可激活人体嗜碱性粒细胞。在测试的19名患者中,有58%受试者的IgE抗体可与Ses i 6结合反应,并且与核桃过敏原存在交叉反应,即多数对核桃等食物过敏的人群极有可能对芝麻制品也过敏。T细胞表位的成功预测,可以避免临床的皮肤点刺过敏试验,通过HLA的基因型判断即可确诊。敏感人群应该避免摄入Ses i 6制品和与Ses i 6存在交叉反应的过敏原(如核桃),或者食用符合加工标准的Ses i 6制品。