APP下载

基于WGCNA识别IgG介导的西红柿不耐受枢纽蛋白*

2021-07-07哈尔滨医科大学流行病与卫生统计学系150081王玉鹏刘美娜

中国卫生统计 2021年3期
关键词:共表达补体西红柿

哈尔滨医科大学流行病与卫生统计学系(150081) 张 薇 孙 琳 王玉鹏 刘美娜

【提 要】 目的 基于加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)方法识别IgG介导的西红柿不耐受相关蛋白质共表达模块及枢纽蛋白,为其发生机制研究提供依据。方法 收集IgG介导的西红柿不耐受患者及健康对照血清样本,使用DIA全扫描蛋白质组学定性定量技术获得蛋白质表达数据;利用WGCNA方法构建共表达网络,识别与IgG介导的西红柿不耐受相关的模块,并进行模块GO功能注释及KEGG通路富集分析;利用Cytoscape获得IgG介导的西红柿不耐受相关模块的枢纽蛋白。结果 获得IgG介导的西红柿不耐受相关的蛋白质模块两个,分别为blue模块和turquoise模块。blue模块与IgG介导的西红柿不耐受相关系数为-0.90;GO富集分析发现,该模块中蛋白主要参与脂蛋白重构、脂质代谢等相关生物过程以及蛋白质级联激活、补体激活等免疫调节过程;KEGG分析富集到5条通路,包括胆固醇代谢通路、PPAR信号通路、补体和凝血级联通路、类维生素A代谢和运输通路、维生素和辅酶因子代谢通路。turquoise模块与IgG介导的西红柿不耐受相关系数为0.72;GO富集分析发现,该模块主要与蛋白质级联激活、补体激活经典途径、体液免疫应答、受体介导的内吞,血小板脱颗粒、抗氧化活性等生物过程有关;KEGG分析富集到2条通路,补体和凝血级联通路、吞噬体通路。筛选出IgG介导的西红柿不耐受相关模块中的枢纽蛋白为APOA1、APOA4、APOC3、APOA2、APOC1、C3、HRG、FGB、HP、TF。结论 WGCNA方法进行IgG介导的西红柿不耐受蛋白质表达数据分析发现:脂质、胆固醇代谢等过程的改变可能是其发生的重要环节;获得的载脂蛋白类蛋白质及其他枢纽蛋白是其潜在关键调控蛋白;本研究从系统生物学的角度,为IgG介导的西红柿不耐受发生机制探索提供了依据和研究方向。

食物不耐受是一种常见的由食品或食品添加剂引起的食物不良反应,发生率为5~20%[1]。其中,IgG介导的西红柿不耐受在我国食物不耐受中占较高比例[2-3],患者多伴有荨麻疹、肠易激综合症、偏头痛等全身系统性症状[4-10],但其发病机制尚未明确。加权基因共表达网络分析(WGCNA)是一种常用的系统性网络分析方法,利用WGCNA分析转录组和基因组数据,可识别疾病相关基因模块及枢纽基因,发现疾病诊断、治疗等潜在重要靶点[11-13]。近年来,该方法也被用于分析大规模蛋白质组学数据,从系统生物学的角度,研究疾病相关的蛋白质组学变化[14-15]。本研究利用WGCNA方法进行系统性分析,从调控网络整体出发,识别IgG介导的西红柿不耐受相关蛋白质模块,揭示其蛋白变化情况及参与的生物学过程,获得IgG介导的西红柿不耐受相关模块的枢纽蛋白,为其发病机制研究提供新的思路。

方 法

1.研究对象

研究对象来源于2017年3月至2017年12月在某医院过敏反应科就诊患者及体检中心健康人群,收集血清样本,利用酶联免疫吸附测定法进行14项食物特异性IgG抗体检测:特异性IgG抗体浓度<50U/ml为阴性结果,≥50U/ml为阳性结果。结合临床症状、就诊患者自述饮食情况及酶联免疫吸附检测结果,排除其他食物特异性IgG抗体阳性患者,获得仅为西红柿特异性IgG抗体阳性的患者7例,作为IgG介导的西红柿不耐受患者组;对照组按照年龄±2岁、性别相同与病例组进行1:2匹配,得到检测结果为阴性且无食物过敏史的14例健康人作为对照组。患者及对照的年龄、性别、西红柿特异性IgG抗体浓度信息如表1所示。

表1 IgG介导的西红柿不耐受患者及健康对照基本信息

2.蛋白质组学检测

本研究采用非数据依赖性采集(DIA)技术进行蛋白表达数据检测,将质谱的整个全扫描范围分为若干个窗口,每个窗口中的所有母离子进行选择、碎裂、检测,无遗漏地获得样本中所有母离子的全部碎片信息。

3.WGCNA分析

WGCNA是一种数据驱动的共表达网络构建方法,将表达模式相似的蛋白质聚类于同一模块,该模块中的蛋白质可能共同参与调控某个生物过程,根据模块与性状之间的相关性获得疾病相关模块。主要步骤为:

第一,确定最佳软阈值:蛋白共表达网络应符合无尺度特征,服从幂律分布;将软阈值取值范围设为1~20,以首次出现无尺度拟合指数R2接近0.9,且同时使网络平均连接度不至于太低(需显著大于0)的阈值作为最佳软阈值,用于拓扑重叠矩阵(TOM)的计算。

第二,构建蛋白共表达模块:计算蛋白之间的Pearson相关系数矩阵,利用最佳软阈值计算TOM和蛋白间相异性系数,得到蛋白系统聚类树;按照每个模块中至少包含30个蛋白的原则,混合动态剪切树,初步构建蛋白模块;计算每个模块的特征向量值(ME),对模块进行聚类分析,以高度值0.25作为分割线合并相似度较高的模块,得到最终的蛋白共表达模块。

第三,模块与疾病的关联分析:每个模块的第一主成分作为特征向量蛋白,代表该模块内蛋白表达的整体水平,将模块特征值与是否患病进行关联分析,确定与疾病相关的蛋白共表达模块和模块内蛋白集合。

4.富集分析

在WGCNA分析结果的基础上,利用Metascape对识别出的疾病相关模块中的蛋白集合进行GO功能注释和KEGG通路富集分析,获得包括生物过程(biological process,BP)、细胞组分(cellular component,CC)、分子功能(molecular function,MF)在内的模块功能注释信息和KEGG通路,揭示疾病发生涉及的生物学过程和信号调控转导机制。

5.枢纽蛋白识别

WGCNA分析识别的疾病相关模块中的蛋白集合,在Cytoscape软件中进行网络构建,并借助其中的CytoHubba插件,选择MCC算法,获得每个模块网络中的蛋白重要性排序,筛选模块中的枢纽蛋白。

结 果

1.最佳软阈值选择

利用DIA蛋白质组学检测技术,从血清样本中鉴定并定量出1132个蛋白质,进行WGCNA分析。根据无尺度拟合指数R2和平均连接度在软阈值不同取值时的变化情况,确定了最佳软阈值为3,此时无尺度拟合指数R2首次接近0.9,且网络的平均连接程度相对较高,能够包含足够的信息。

2.蛋白共表达模块构建

利用最佳软阈值3计算得到的网络拓扑重叠矩阵TOM进行聚类分析,最终得到14个蛋白共表达模块,如图1所示。图中聚类树的每个分支代表一个蛋白,每个颜色代表一个模块,模块中的蛋白数目从32到158不等;每个模块内的蛋白间共表达程度高,在功能上具有紧密的关系;不同模块间蛋白的共表达程度低;grey模块代表未分配到任何模块中的蛋白集合,包含95个蛋白。

图1 IgG介导的西红柿不耐受的蛋白聚类树及蛋白共表达模块

3.IgG介导的西红柿不耐受关键模块识别

每个蛋白共表达模块与IgG介导的西红柿不耐受发生的关联性分析结果如图2所示。blue模块与IgG介导的西红柿不耐受的相关系数为-0.9,turquoise模块与IgG介导的西红柿不耐受的相关系数为0.72,二者与IgG介导的西红柿不耐受发生的相关性较高,可以作为关键模块进行后续分析。图3为blue模块和turquoise模块中蛋白显著性与模块隶属度的关系,以及两个模块的蛋白表达量热图与特征值柱状图。模块中蛋白在该模块内的模块隶属度,为该蛋白与本模块特征蛋白的相关系数,与性状高度相关的蛋白也是与性状模块高度相关的蛋白,值得进一步的深入研究。

图2 蛋白共表达模块与性状相关性

图3 (a)blue模块蛋白显著性与模块隶属度关系;(b)blue模块蛋白表达量热图与特征值柱状图;(c)turquoise模块蛋白显著性与模块隶属度关系;(d)turquoise模块的蛋白表达量热图与特征值柱状图

4.关键模块的富集分析

blue模块和turquoise模块的GO功能注释结果分别如图4(a)和图4(b)所示。blue模块中蛋白主要参与血浆脂蛋白颗粒组装、重构,高密度脂蛋白颗粒重构,胆固醇酯化调节等脂蛋白相关过程以及蛋白质级联激活,补体激活,体液免疫应答等免疫过程;turquoise模块中蛋白主要与蛋白质级联激活,补体激活经典通路,体液免疫应答,受体介导的内吞,血小板脱颗粒,抗氧化活性等有关。此外,两个模块的KEGG通路分析发现,blue模块富集到5条通路,包括胆固醇代谢通路、PPAR信号通路、补体和凝血级联通路、类维生素A代谢和运输通路、维生素和辅酶因子代谢通路;turquoise富集到2条KEGG通路,为补体和凝血级联通路、吞噬体通路。

图4 blue模块和turquoise模块GO富集分析结果

5.枢纽蛋白识别

图5为blue模块和turquoise模块的网络构建结果,获得每个模块网络中的蛋白重要性排序后,在两个模块中各选前5个蛋白作为枢纽蛋白,包括APOA1、APOA4、APOC3、APOA2、APOC1、C3、HRG、FGB、HP、TF。这些蛋白在模块中与其他蛋白的关联性较多,发挥重要的作用,可作为IgG介导的西红柿不耐受发生的潜在关键调控蛋白进行深入研究。

图5 blue模块和turquoise模块枢纽蛋白网络图

讨 论

本研究利用WGCNA分析IgG介导的西红柿不耐受蛋白质表达数据,获得了疾病相关的蛋白共表达模块,筛选出枢纽蛋白,为揭示IgG介导的西红柿不耐受潜在的发病机制和调控过程提供依据。番茄红素是西红柿中富含的主要营养素,具有较强的抗氧化性和清除自由基的能力,被联合国粮农组织和世界卫生组织认定为A类营养素,可以调整肠胃功能,增强免疫力,降低血压和胆固醇,促进脂质代谢,抑制胰岛素抵抗和代谢紊乱等[16-17]。因此,IgG介导的西红柿不耐受发病机制及其关键调控蛋白的研究具有重要意义。

西红柿中的番茄红素可以促进脂质代谢,而脂质代谢及相关产物对免疫系统具有重要的影响[18],能够预防自身免疫性疾病的发生,促进皮肤和淋巴结炎性反应。WGCNA分析识别IgG介导的西红柿不耐受相关模块的GO功能注释分析发现,模块中蛋白主要富集于血浆脂蛋白颗粒组装、高密度脂蛋白颗粒重构、胆固醇酯化调节、抗氧化活性、补体激活、体液免疫应答等生物过程;关键模块蛋白的KEGG通路分析也富集到了胆固醇代谢、补体和凝血级联反应等通路,揭示了脂质、胆固醇代谢等过程的改变,引起免疫系统功能变化,可能是IgG介导的西红柿不耐受发生的重要环节。此外,本研究识别出的IgG介导的西红柿不耐受相关模块枢纽蛋白APOA1、APOA4、APOC3、APOA2、APOC1,均为载脂蛋白类蛋白质,参与脂质代谢过程,且与免疫功能有关,提示我们载脂蛋白可能在IgG介导的西红柿不耐受发生中起到了关键作用,是参与其发病机制调控的重要蛋白,但还需要进一步的实验研究,收集更多的临床样本进行验证。

综上,本研究利用WGCNA分析IgG介导的西红柿不耐受蛋白质表达数据,富集到多个有意义的生物学过程和通路。其中,脂质、胆固醇代谢等过程的改变可能是IgG介导的西红柿不耐受发生的重要环节;获得的载脂蛋白类蛋白质是IgG介导的西红柿不耐受发生的潜在关键调控蛋白,为IgG介导的西红柿不耐受发生及调控机制的探索研究提供了参考和依据。

猜你喜欢

共表达补体西红柿
“补体法”在立体几何解题中的妙用
西红柿
补体因子H与心血管疾病的研究进展
抗dsDNA抗体、补体C3及其他实验室指标对于诊断系统性红斑狼疮肾损伤的临床意义
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
西红柿
流感患儿血清免疫球蛋白及补体的检测意义
膀胱癌相关lncRNA及其共表达mRNA的初步筛选与功能预测
西红柿
中国流行株HIV-1gag-gp120与IL-2/IL-6共表达核酸疫苗质粒的构建和实验免疫研究