基于PLS-DA的IgG介导的鸡肉不耐受差异蛋白筛选及通路识别*
2023-11-30赵思渊刘美娜
赵思渊 孙 琳 田 伟 刘美娜
哈尔滨医科大学流行病与卫生统计学系(150081)
【提 要】 目的 筛选鸡肉不耐受患者与健康人之间的差异蛋白,富集分析识别差异蛋白的相关通路,为探讨鸡肉不耐受发生机制提供依据。方法 收集鸡肉不耐受患者及健康对照的血清样本,利用DIA技术平台对样本进行蛋白组学检测;PLS-DA结合PPI分析筛选具有相互作用的蛋白质,Cytoscape获得鸡肉不耐受患者与对照组间的差异蛋白;GO和KEGG富集分析获得差异蛋白的生物学通路与代谢通路。结果 血清样本的蛋白表达数据检测结果,共获得2210种蛋白质。PLS-DA分析筛选出和鸡肉不耐受相关的蛋白质786个,结合蛋白互作分析获得PPI网络,聚类后得到两个主要的模块:cluster1和cluster2;cluster1包括18个蛋白质,cluster 2包括12个蛋白质。两模块蛋白质进行重要性排序,筛选出鸡肉不耐受患者与健康对照间的差异蛋白为:ORM1、FGB、SERPINF2、HRG、A2M、ORM2和QSOX1。前五个为上调蛋白质,后两个为下调蛋白质。cluster1评分为10.12,GO富集分析发现差异蛋白主要参与血小板脱颗粒、肽链内切酶活性的负调节、炎症反应等生物学通路,KEGG分析富集到补体和凝血级联通路;cluster 2评分6.00,共包括12个蛋白质,GO富集分析发现差异蛋白与急性期反应、血小板脱颗粒、固有免疫应答等生物学通路有关,KEGG分析富集到补体和凝血级联通路、阮病毒病和系统性红斑狼疮的疾病通路。结论 本研究筛选出7个与IgG介导的鸡肉不耐受相关的差异蛋白,其参与的生物学和代谢通路与机体免疫、炎症过程有关,在免疫、炎症发生发展中可能起重要作用,将为探讨鸡肉不耐受发生机制提供依据。
食物不耐受是一种以IgG介导的变态反应性疾病,人群患病率20%左右[1],其中,鸡肉不耐受的发生较为常见。鸡肉不耐受患者食用鸡肉类食物会引起一系列胃肠道症状及肥胖、高血压、偏头痛等疾病[2],长期食用甚至累及消化、神经、心血管等全身多个系统,呈现出不同的临床症状[3]。鸡肉不耐受的治疗以饮食干预为主,只有部分患者可从饮食干预中获益[4]。食物不耐受的发生是由于未被吸收的蛋白质与IgG结合的免疫复合物引起[5],从蛋白质组学的角度出发,识别鸡肉不耐受差异蛋白及通路,对于鸡肉不耐受发生机制及其治疗有重要意义。因此,本研究利用PLS-DA方法结合蛋白质互作分析筛选鸡肉不耐受患者的差异蛋白,富集分析解释差异蛋白并获得差异蛋白的生物学及代谢通路,为鸡肉不耐受的治疗奠定基础。
方 法
1.研究对象
研究样本来源于某医院过敏反应科患者,根据酶联免疫吸附法(ELISA)检测结果,检测值<50IU/ml为阴性。50~100IU/ml为轻度敏感,100~200IU/ml为中度敏感,超过200IU/ml 高度敏感。排除其他食物IgG抗体阳性患者,选择鸡肉不耐受的患者7例作为病例组;对照组为年龄、性别与患者匹配一致的健康人13例,IgG检测结果见表1。收集研究对象血液样本并离心,取上清液进行蛋白质组学检测。
表1 鸡肉不耐受患者及对照组IgG检测结果
2.蛋白组学检测及数据处理
利用数据非依赖性采集(data-independent acquisition,DIA)技术平台对血清样本进行蛋白质组学检测,DIA技术是目前最常用的蛋白质组学定量分析质谱扫描技术,能够将LC-MS/MS质谱仪的全扫描范围划分成若干个窗口,并将通过窗口的全部肽段离子进行碎裂,利用二级质谱检测碎片离子的信号,获得离子全部信息,有较高的准确性和重现性,适合于大样本的复杂数据。
数据的标准化及标度化处理:采用总离子强度标准化法使得各样本数据有可比性;通过自标度化法,将所有蛋白质强度的标准差都设为1,避免由于蛋白质表达量的绝对差异造成对低浓度代谢物数据的掩盖。
3.差异蛋白筛选及通路识别
偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)[6]是一种有监督的判别分析方法,利用偏最小二乘回归的思想,进行数据降维,并建立回归模型,综合应用相关分析、主成分分析(principal components analysis,PCA)和多元线性回归等方法,建立蛋白表达量与样品类别之间的关系模型,实现对样品类别的预测;绘制PLS-DA评分图,利用PLS-DA模型中变量投影重要度(variable important for the projection,VIP)衡量各蛋白质表达模式对各组样本分类判别的影响强度和解释能力,通过VIP值>1且P≤0.05选择与鸡肉不耐受相关的蛋白质。利用STRING网站绘制蛋白相互作用(protein-protein interaction,PPI)网络图,可观察到蛋白质之间的相互作用关系,筛选与鸡肉不耐受相关的蛋白质。Cytoscape软件进行PPI网络聚类得到重要模块,通过重要性排序获得差异蛋白。
利用DAVID网站对获得的差异蛋白进行GO富集分析[7]和KEGG通路富集分析[8],获得包括生物学过程(biological process,BP)、细胞定位(cellular component,CC)和分子功能(molecular function,MF)在内的差异蛋白注释信息以及机体新陈代谢、遗传、疾病等通路。
结 果
1.差异蛋白筛选结果
鸡肉不耐受患者和健康者的血清样本通过蛋白表达数据检测及标准化、标度化处理,共获得2210种蛋白质。在事先确定样本的类型归属条件下,通过对该数据进行有监督的PLS-DA分析可以最大程度显示组间差异,PLS-DA评分图显示鸡肉不耐受组与对照组明显分离,见图1。
图1 鸡肉不耐受与对照组PLS-DA评分
PLS-DA模型经过200次置换检验,显示其具有较好的解释能力(R2=0.846)和预测能力(Q2=-0.0548),见图2。利用Bonferroni法对两独立样本t检验得到的P值进行校正,火山图见图3。根据P值≤0.05结合VIP值大于1筛选出786个与鸡肉不耐受相关蛋白质,其中,上调蛋白质167个,下调蛋白质619个。
图3 鸡肉不耐受组与对照组的两独立样本t检验P值火山图
2.蛋白质互作分析
利用STRING网站对786个鸡肉不耐受相关蛋白质进行蛋白互作分析,共得到67个具有相互作用的蛋白质。通过Cytoscape进行PPI网络聚类获得两个评分较高的蛋白质模块:cluster1、cluster 2。cluster 1包括18个蛋白质,评分10.12,见图4(a); cluster 2包括12个蛋白质,评分为6.00,见图4(b)。进行重要性排序后,两模块筛选出排名前7位的蛋白质,分别为:ORM1、FGB、SERPINF2、A2M、QSOX1、HRG、ORM2。筛选的7个蛋白质中有5个在病例组上调,分别为ORM1、FGB、SERPINF2、HRG、A2M;2个在病例组下调,即ORM2和QSOX1。
图4 两蛋白质模块鸡肉不耐受组与对照组的蛋白质互作图
3.通路识别结果
两个蛋白质模块分别进行GO和KEGG富集分析。cluster 1共包括18个蛋白质,GO分析表明差异蛋白与血小板脱颗粒、肽链内切酶活性的负调节、炎症反应等生物学通路有关,见图5(a),KEGG分析富集到补体和凝血级联通路;Cluster 2共包括12个蛋白质,GO富集分析结果为急性期反应、血小板脱颗粒、固有免疫应答等生物学通路,见图5(b),KEGG分析富集到补体和凝血级联通路、阮病毒病以及系统性红斑狼疮的疾病通路。
图5 两个蛋白质模块GO富集分析结果
讨 论
鸡肉不耐受的发生在人群中较为常见,饮食干预并非对所有患者有效,从蛋白质组学的角度筛选鸡肉不耐受患者差异蛋白,能够为其发生机制和治疗提供新的思路。蛋白质组学数据具有高维、高噪声、小样本的特点,通过PLS-DA将蛋白数据转换为误差尽可能小的低维空间[9];筛选后得到的特征变量不仅能很好的概括原始变量的信息,而且有很强的解释能力。本研究利用PLS-DA方法,结合蛋白质互作分析,筛选出7个鸡肉不耐受患者差异蛋白,在病例组中上调蛋白质有5个,下调蛋白质有2个。
在上调蛋白质中,一型类黏蛋白(ORM1)在机体遭受感染和炎症等刺激时升高,可作为炎症出现和消退的标志[10],还可以转运药物、调节机体免疫反应,保护毛细血管屏障、调节能量平衡[11],维持内环境的稳定。α2-巨球蛋白(A2M)与细胞因子IL-6结合可参与机体急性期反应、免疫应答等过程[12]。丝氨酸蛋白酶抑制剂(SERPINF2)作为调控物,调节丝氨酸蛋白酶的水解平衡,参与机体免疫反应,对机体补体形成、纤溶、细胞内蛋白水解等生化反应和生理功能有重要作用[13]。富组氨酸糖蛋白(HRG)能够与不同的配体结合发挥不同的功能,包括纤溶、血液凝固、免疫复合物的清除等;另外也可与IgG结合阻止免疫复合物的产生[14]。5个差异蛋白参与了机体免疫反应,提示鸡肉不耐受的发生机制可能与免疫、炎症有关;另外,2个下调蛋白QSOX1和ORM2与免疫的关系还未明确,有待进一步研究。
鸡肉中含有丰富的牛磺酸和尼克酸,能够增加脂质和胆固醇的溶解性,促进脂类在机体的吸收,而脂质代谢对免疫系统和炎症又有一定的影响[15],抑制炎症的发生。机体也可能由于缺乏水解某种蛋白质的酶引起一系列的变化,如激活炎症、免疫调节、凝血等生物学过程,导致鸡肉不耐受。通路富集结果显示,补体系统能够发挥调节免疫和炎症等功能;凝血酶能够将可溶性Fg转变为纤维蛋白凝块,进而在稳态和炎症反应过程中起调节作用,提示鸡肉不耐受的发生与机体识别和排除“异己”的生理反应有关。从富集分析结果中解释了蛋白质的部分生物学功能,还有多种表达不明显的生物学功能,例如纤溶酶原激活的负调节、防御反应、补体激活、血管生成的正调节等。纤溶酶原活性的负调节与血栓的形成有关,研究表明免疫平衡崩溃也可引起血栓[16];补体的激活可引起一系列的炎症反应和免疫反应[17]。虽然这些生物学作用在本研究中未明显表达,但也为探讨鸡肉不耐受的发生机制提供了一定的潜在依据。
综上,本研究针对IgG介导的鸡肉不耐受患者蛋白表达数据,利用PLS-DA方法,结合蛋白互作分析以及富集分析,识别差异蛋白及其通路。筛选获得的差异蛋白可能是鸡肉不耐受发生的关键,生物学和代谢通路提示鸡肉不耐受的发生与机体免疫、炎症等过程有关。本研究为研究IgG介导的鸡肉不耐受发生机制提供了依据。