基于生物信息学分析的呼吸机相关肺损伤免疫因子及信号通路预测
2022-01-04刘欢曹袁媛张雷刘学胜顾尔伟
刘欢,曹袁媛,张雷,刘学胜,顾尔伟
目前,机械通气(mechanical ventilation,MV)作 为重要的生命支持手段之一,在全身麻醉和危重病人的治疗中发挥着重要作用。不恰当的机械通气可能导致严重的肺部并发症,如呼吸机相关肺损伤(ventilator-induced lung injury,VILI)。既往研究表明,长时间的机械通气可诱导局部肺组织产生多种促炎介质,破坏肺泡毛细血管屏障功能,导致肺水肿[1-2]。然而,机械通气所致肺损伤的机制尚不清楚,也无治疗VILI的好方法。VILI引起的严重术后肺部并发症可导致住院时间、ICU住院率、死亡率和经济负担显著增加[3-4]。因此,探讨VILI相关免疫因子和信号通路对于预防和改善呼吸机通气病人术后肺功能具有重要意义。本研究应用生物信息学分析方法对VILI基因表达谱进行分析,筛选VILI发生过程中重要的免疫因子及可能的信号通路。
1 资料与方法
1.1 一般资料在美国国家生物技术信息中心(http:∕∕www.ncbi.nlm.nih.gov∕gds∕)的基因表达总库(GEO)检索2019年12月前与VILI相关的基因表达谱数据,下载GSE86229基因表达谱数据进行后续分析,该芯片表达谱基于GPL6246平台(MoGene-1_0-st)Affymetrix Mouse Gene 1.0 ST Array。选择基因表达谱中两组数据,非机械通气组(对照组)样本5个,高潮气量组样本5个。此外,从Bioconductor(www.bioconductor.org)下 载 探 针 注 释 包(mogen10sttransptcluster.db)用于将数据的探针名称映射为基因名称[5]。
1.2 研究方法
1.2.1数据处理使用R软件中的“affy”包通过RMA算法对基因表达谱原始数据进行预处理,包括背景校正、归一化和表达值计算,并绘制原始数据和处理后数据的箱线图,对数据进行可视化处理。然后,使用R软件的“annotate”包将两组数据探针名称注释为基因名称进行后续分析[6]。对于数据中映射多个探针名称的基因,选择最大探针表达值作为该基因的表达值。
1.2.2差异表达基因分析通过R软件的“limma”包筛选DEGs[7],标准为adj.P.val<0.05和|Log2FC|>1。然后,通过“Pheatmap”包(https:∕∕cran.r-project.org∕package=pheatmap)进行聚类分析和绘制热图,进一步分析DEGs。
1.2.3DEGs的富集分析使用基因本体论(gene ontology,GO)分析对基因进行功能注释[8],包括生物过程(biological process,BP),分子功能(molecular function,MF)和细胞成分(cellular component,CC)三个方面。京都基因和基因组百科全书(KEGG)信号通路数据库包含许多生化通路,可以为生命科学研究提供更多的生物信息。使用在线数据库Database for Annotation,Visualization and Integrated Discovery(DAVID;version 6.8)进行GO和KEGG分析[9]。阈值设置为Bonferroni校正P<0.05,富集计数>2。
1.2.4蛋白质相互作用网络分析在线数据库STRING(string;version11.0;http:∕∕www.string-db.org∕)可从已知和预测的蛋白质数据中获得蛋白质全面相互作用信息[10]。研究中选择高置信系数(>0.7)作为选择标准,通过Cytoscape(3.5.0)软件进行网络可视化[11],并通过插件cytoHubba寻找关键蛋白质以确定与VILI发生相关的关键蛋白质和关键基因。
2 结果
2.1 数据处理本研究中,基于GPL6246平台的GSE86229基因表达谱芯片经过标准化和注释,共获得了20 310个基因。绘制对照组和高潮气量组所有基因标准化前后的对数表达值箱线图(图1)。标准化后,组内和组间数据的中位数水平近似同一水平,表明不同芯片间的数据具有可比性,可以进行后续分析。
图1 呼吸机相关肺损伤基因表达谱的数据预处理:A为标准化前数据;B为标准化后数据
2.2 差异表达基因分析在对照组和高潮气量组之间共筛选出337个DEGs(高潮气量组∕对照组),其中包括279个上调基因和58个下调基因(图2A)。通过构建基因热图进行聚类分析(图2B),结果显示DEGs主要聚类为两组:对照组和高潮气量组,与基因表达谱芯片分组一致,表明纳入的组内样本之间存在较高的同质性。
图2 呼吸机相关肺损伤基因表达谱差异表达基因分析:A为火山图;B为热图
图3 呼吸机相关肺损伤基因表达谱差异表达基因编码的蛋白质相互作用网络中关键蛋白质分析
2.3 DEGs的富集分析337个DEGs主要富集在46个GO和13个KEGG类型中(见表1)。结果表明,DEGs显著分布于细胞外间隙和细胞质膜外侧,主要参与细胞对炎症、脂多糖和中性粒细胞趋化的生物过程,以及具有细胞因子活性、趋化因子活性和脂多糖结合的分子功能。KEGG分析表明DEGs主要富集在肿瘤坏死因子和细胞因子-细胞因子受体相互作用信号通路途径中。
表1 呼吸机相关肺损伤基因表达谱差异表达基因GO和KEGG富集分析(前3位)
2.4 蛋白质相互作用分析使用STRING数据库对DEGs进行分析,将获得蛋白质相互作用网络数据导入Cytoscape。删除网络无连接的节点后,获得158个节点(蛋白质)和745个PPI边。通过cytoHubba插件计算网络中关键蛋白质,不同算法获取的关键蛋白质见表2;取各算法结果交集,最终获得白细胞介素-6(IL-6)、肿瘤坏死因子-α(TNF-α)、整联蛋白αM(ITGAM)、白细胞介素1β(IL-1β)和Toll样受体2(TLR-2)作为关键蛋白质。
表2 cytoHubba不同算法筛选的呼吸机相关肺损伤基因表达谱关键蛋白质
3 讨论
随着目前社会科学技术的飞速发展,基因芯片技术已成为研究生物科学的重要基石。基因芯片利用高通量分子生物学技术同时检测数以万计的基因表达情况,并可以通过生物信息学分析处理大量烦琐的生物数据,为生命科学研究提供一定的帮助[12]。目前机械通气所致肺损伤的机制尚不清楚,因此明确VILI相关免疫因子和信号通路对于预防和改善呼吸机通气病人术后肺功能具有重要意义。本研究利用生物信息学方法对基于GPL6246平台的小鼠VILI肺组织样本基因表达谱(GSE86229)进行分析,筛选了337个DEGs。通过富集分析明确DEGs参与炎症反应过程;KEGG分析表明DEGs主要富集在TNF信号通路途径。最终,通过蛋白质相互作用网络确定IL-6、TNF-α、ITGAM、IL-1β和TLR-2为关键蛋白质,并确定IL-6、TNF-α、ITGAM、IL-1β和TLR-2为VILI发展的关键基因。
机械通气已广泛应用于各种临床环境,但大量的实验和临床证据表明尽管有保护性的小潮量通气,机械通气仍可导致VILI的发生[13]。本研究通过生物信息学分析发现,DEGs主要参与细胞对炎症、脂多糖和中性粒细胞趋化的生物过程,以及具有细胞因子活性、趋化因子活性和脂多糖结合的分子功能。与本研究结果相似的是,虽然很多因素被认为是VILI的可能危险因素,但炎症反应被认为是共同的途径[14-15]。研究普遍认为机械通气所致的损伤,包括气压伤、容积伤和肺不张伤,很可能发展为局部的炎症失衡,甚至全身性炎症反应;表现为中性粒细胞浸润增加、肺泡壁增厚与透明膜形成等[16]。
IL-6作为一种功能广泛的炎性因子,是炎症介质网络的重要组成部分。小鼠高潮气量与低潮气量机械通气相比,可导致IL-6水平显著升高;临床研究也发现给予大潮气量机械通气病人与接受小潮气量机械通气病人相比,血浆中IL-6水平显著升高高[17]。此外,不恰当的机械通气也导致VILI的病人肺泡灌洗液中IL-6水平升高[18]。Meta分析结果显示IL-6基因与急性肺损伤的相关性有统计学意义[19]。
炎症细胞产生高水平的促炎细胞因子(如TNF-α)进一步加重肺损伤[20-22]。在VILI动物模型中,高潮气量及周期性的气道关闭和重新开放都与肺泡灌洗液中TNF-α水平的增加有关。高潮气量机械通气显著增加TNF-α的产生;提示TNF-α的上调在机械拉伸引起的肺部炎症中发挥关键作用[23]。Veldhuizen等[24]对离体小鼠肺脏进行潮气量为20 mL∕kg的机械通气可显著增加支气管肺泡灌洗液中TNF-α水平。此外,通过抗体阻断TNF-α功能可减轻肺泡表面活性物质缺乏大鼠的组织病理学损伤[25]。这些数据提示TNF-α在VILI中的关键作用。
既往研究发现IL-1β与VILI密切相关,肺内IL-1β的水平在机械通气过程中显著升高[26-27]。小鼠使用高潮气量机械通气可导致支气管肺泡灌洗液中IL-1β水平明显升高[28]。此外,高潮气量机械通气增加血浆中炎性因子IL-1β水平[29]。然而,对敲除IL-1αβ基因后的小鼠进行机械通气并没有表现出这种细胞因子的增加[26]。这些数据表明IL-1β参与了VILI的发生和发展。ITGAM为整联蛋白αM,主要在单核细胞、粒细胞和巨噬细胞中表达,并参与吞噬、细胞介导的杀伤、趋化和细胞激活功能[30]。细胞受到刺激时,ITGAM表达量增加。大鼠VILI模型中肺灌洗液发现单个巨噬细胞ITGAM的表达增加[31]。TLR-2作为天然免疫系统中的一种模式识别受体,在VILI模型中表达明显上调,从而导致肺部炎症[32],使用TLR-2单克隆抗体拮抗TLR-2后可减轻VILI模型中肺脏的炎症反应[33]。
本研究中KEGG分析表明DEGs主要富集在TNF信号通路途径。TNF-α是一种主要由感染或伤害的反应激活的巨噬细胞分泌的促炎细胞因子[34],其在炎症、免疫反应和多种病理生理过程中都起到重要的调节作用。TNF-α的这些功能均是通过TNF-α在细胞膜表面的受体介导的。TNF-α的受体有两种,即Ⅰ型TNF受体(TNFR1)和Ⅱ型TNF受体(TNFR2)[35]。这两种受体在不同类型的细胞中均有表达,TNFR1主要在上皮细胞和成纤维细胞中表达,而TNFR2在淋巴细胞和巨噬细胞中表达。TNF-α与TNFR1结合不仅传递细胞毒信号,还传递抗凋亡信号,而TNF-α与TNFR2结合仅传递抗凋亡信号[35]。p-38丝裂原活化蛋白激酶(MAPK)是细胞内广泛存在的丝苏氨酸蛋白激酶超家族,是将细胞质的信号传递至细胞核并引起细胞核发生变化的重要物质。环磷腺苷效应元件结合蛋白(CREB)作为真核细胞核内转录因子,通过磷酸化与去磷酸化的形式来实现其调节细胞转录功能,其与细胞生长、增殖、分化、周期调控等细胞生物活动密切相关。目前已报道CREB在炎症过程的关键作用[36-37]。因此,我们推测TNF-α可能与细胞膜TNFR1结合,通过MAPK途径进行信号转导,最后经核内转录调节因子CREB调控VILI发展的炎症过程。
4 结论
综上所述,本研究采用生物信息学分析方法筛选了VILI发生过程中的337个DEGs,通过蛋白质相互作用分析确定IL-6、TNF-α、ITGAM、IL-1β和TLR-2是VILI发生的关键免疫因子;KEGG分析表明DEGs主要富集在TNF信号通路途径,推测TNFR1-p38-CREB可能是VILI发展的信号通路之一。然而,本文的结果存在一定的局限性,需要未来进一步的研究结果进行验证。
(本文图2,3见插图1-1)