APP下载

树突细胞免疫应答结核分枝杆菌基因调控网络的构建与分析

2021-09-11孙海明徐广宇

关键词:功能模块结核通路

林 妍,孙海明,徐广宇

(1.北华大学基础医学院,吉林 吉林 132013;2.北华大学药学院,吉林 吉林 132013)

结核病(Tuberculosis,TB)是由结核分枝杆菌(Mycobacteriumtuberculosis,M.tb)引起的主要致命传染病,2019年全球约有1 000万人感染结核病[1].先天免疫应答在预防结核病发展中起着至关重要的作用,巨噬细胞和DCs可以感知结核分枝杆菌的存在,是最初被感染的细胞,这些细胞分泌介质,产生炎症信号,通过驱动T淋巴细胞的激活和分化清除感染效应[2-3].结核分枝杆菌除能破坏巨噬细胞的防御机制,还能干扰DCs的功能,DCs是宿主免疫系统的主要抗原呈递细胞,在连接先天免疫和适应性免疫过程中具有核心作用.在被结核分枝杆菌感染后,DCs从肺部迁移到引流淋巴结,在淋巴结向T淋巴细胞呈递抗原,协调抗细菌感染的免疫过程并最终决定疾病的结局[4-5].而在DCs应答结核分枝杆菌感染过程中,宿主基因表达的变化可以影响其庞大的基因调控网络,进而调节宿主免疫应答相关的进程与通路.因此,系统地、深入地挖掘DCs免疫应答结核分枝杆菌致病机制及宿主感染免疫机制具有重要意义.

本研究通过收集NCBI GEO datasets数据库中结核分枝杆菌感染DCs模型的芯片表达谱数据(感染组130例,对照组129例),筛选出感染组相对于对照组DCs中表达差异的基因,初步构建了结核分枝杆菌感染DCs中异常表达的基因调控网络(Gene regulatory network),以筛选可能在结核分枝杆菌感染宿主DCs中存在的重要分子调控模块,挖掘DCs向T淋巴细胞呈递抗原过程中协调抗细菌免疫的显著功能模块,为发现宿主免疫应答结核分枝杆菌的关键特征提供理论依据.

1 实验材料

数据库与分析软件:研究通过NCBI GEO data sets数据库收集结核分枝杆菌感染DCs的实验组与未感染的DCs对照组芯片表达谱数据;通过R语言limma包及ggplot2包分别分析差异基因表达谱数据及其差异基因的统计学特征,并通过DAVID(Database for Annotation,Visualization and Integrated Discovery)[6]在线分析工具对差异表达基因进行GO功能注释分析与Pathway富集分析.通过转录调控元件数据库(Transcriptional Regula- tory Element Database,TRED)[7]筛选转录因子与预测的调控靶基因,应用Cytoscape对筛选出的转录因子与靶基因进行基因调控网络的构建、可视化基因间的调控模式以及分子功能调控模块;通过STRING[8]数据库对基因调控网络做进一步蛋白相互作用(protein-protein interaction,PPI)网络分析,深入洞悉核心调控基因.

2 实验方法

2.1 表达谱数据的收集与分析

2.2 基因调控网络的构建

通过TRED数据库筛选出结核分枝杆菌感染DCs中差异表达的转录因子,并筛选出预测调控的靶基因,应用Cytoscape构建结核分枝杆菌感染DCs中异常表达的基因调控网络,并挖掘分子功能模块,筛选关键基因.

2.3 基因调控网络中差异基因的功能注释与通路富集分析

应用DAVID在线分析工具整合KEGG数据库,对DCs免疫应答结核分枝杆菌基因调控网络中的差异基因进行功能注释与通路富集分析,对分析结果通过R语言ggplot2包进行可视化分析.

2.4 PPI网络分析

对结核分枝杆菌感染DCs中异常表达的基因调控网络的靶基因通过 STRING数据库作基因的蛋白间相互作用分析,即PPI网络分析.结果通过 Cytoscape以网络的形式展示,用不同颜色的节点显示每个基因的相关程度,目的是找到最高程度的节点,以寻找可能在结核分枝杆菌感染宿主过程中对DCs行使免疫功能发挥重要作用的关键基因.

2.5 统计学分析

应用受试者工作曲线(ROC 曲线)分析结核分枝杆菌感染DCs中关键基因表达的特征差异,使用GraphPad Prism 8.0软件绘制 ROC 曲线,计算曲线下面积(AUC),通过ROC曲线判断异常表达的关键基因的特异性与灵敏度,以P<0.05 为差异具有统计学意义.

3 结 果

3.1 结核分枝杆菌感染DCs中差异基因表达谱筛选结果

从NCBI GEO datasets数据库中收集到结核分枝杆菌感染DCs的感染组芯片130例,未感染对照组芯片129例,均来自GSE34151数据集.芯片具体信息见表1.

表1 芯片表达谱数据Tab.1 Data of chip expression profile

通过分析表达谱数据,筛选出结核分枝杆菌感染DCs实验组中差异表达基因共1 398个,其中,上调表达基因739个,下调表达基因659个.表达差异最为显著的20个上调基因及20个下调基因见表2.

表2 结核分枝杆菌感染DCs中部分差异基因Tab.2 Partial differential genes in DCs of Mycobacteriumtuberculosis infection

图1A火山图分析和图1B聚类分析显示:对筛选出的差异基因作统计学分析,差异基因能够区分实验组与对照组,且趋势明显.

A.结核分枝杆菌感染DCs中差异表达基因火山图分析(红色表示上调表达基因,绿色表示下调表达基因);B.结核分枝杆菌感染DCs中差异表达基因聚类分析(橙色颜色深浅表示差异基因表达趋势高低).图1 火山图分析和聚类分析Fig.1Volcano map analysis and cluster analysis

3.2 结核分枝杆菌感染DCs中异常表达的基因调控网络构建

基于以上分析结果,整合TRED数据库获得转录因子及其调控的靶基因共90个,层次聚类分析显示:结核分枝杆菌感染DCs组(TB)中异常表达的90个转录因子及靶基因与未感染DCs组(Control)表达趋势存在差异,上调与下调表达模式清晰,说明样本的重复性较好,能很好地区分实验组与对照组.见图2.应用 Cytoscape对筛选出的90个异常表达转录因子及其靶基因构建基因调控网络见图 3A.网络中共包含 15个 转录因子与 75个靶基因,进一步通过MCODE算法工具将基因调控网络中显著功能模块提取出来.见图3B.结果显示:获得DCs免疫应答结核分枝杆菌过程中的显著功能基因有CREB1、IL6、CEBPA和CCND1.

3.3 基因调控网络差异表达基因功能与通路分析结果

应用DAVID在线分析工具整合KEGG数据库分析基因调控网络中90个差异表达的基因,功能分析显示:这些差异基因与感染应答、免疫应答和蛋白结合功能密切相关.见图4A.通路富集分析显示:这些差异表达基因与TNF信号通路、细胞因子-细胞因子信号通路及结核通路相关.见图4B.网络中差异基因与保护性免疫过程或信号通路相关性较大,其中结核通路显著功能模块分布信息见表3.包含显著功能模块的CREB1与IL6初步确定为关键基因,对网络中90个差异基因作疾病相关性分析,结果显示与免疫方面疾病最为相关.见表4.

每一行代表差异表达基因,每一列代表一个样本(DCs感染组和未感染对照组);红色表示基因表达上调,绿色表示基因表达下调.图2 基因调控网络中90个差异表达基因层次聚类分析Fig.290 differentially expressed genes in gene regulatory network hierarchy clustering analysis

A.基因调控网络(蓝色菱形表示转录因子,红色椭圆表示上调表达基因,绿色椭圆表示下调表达基因);B.关键子网络.图3 结核分枝杆菌感染DCs中基因调控网络及关键子网络Fig.3Gene regulatory networks and key subnetworks in Mycobacterium tuberculosis infected DCs

A.GO 功能分析;B.Pathway通路分析.图4 基因调控网络差异基因前 30 个显著功能与通路分析Fig.4Analysis of the top 30 significant functions and pathways of differential genes in the gene regulatory network

表3 基因调控网络中显著功能模块基因在结核通路中的富集信息Tab.3 Enrichment information of significant functional modules of gene regulatory network in tuberculosis pathway

表4 基因调控网络 90 个基因疾病相关性分析Tab.4 Genetic association db disease class analysis of 90 genes in the gene regulatory network

表4(续)

3.4 PPI网络分析结果

对DCs免疫应答结核分枝杆菌的基因调控网络中的基因进一步行PPI网络分析,并通过MCODE计算工具提取关键子网络.见图5.PPI网络中关键子网络由21个节点组成,节点颜色越深表示其节点度越高,节点度统计结果见表5.其中节点度Degree显著前5位基因依次是IL6、IL1B、STAT1、ICAM1和CCL2,节点度依次是56、45、43、39和37.对PPI网络关键子网络进一步行功能与通路分析,结果见图6A和6B,提示这些异常表达的基因在DCs免疫应答结核分枝杆菌感染过程中与感染应答功能和TNF信号通路相关性最大,其基因列表见表6.而通过分析发现IL6参与多条功能条目与通路,其异常表达可能在DCs免疫应答结核分枝杆菌进程中发挥重要作用.

图5 PPI网络分析结果及关键子网络提取结果Fig.5PPI network analysis results and key subnetwork extraction results

表5 PPI网络关键子网络节点度Tab.5 Key sub-network node degree of PPI network

图6 PPI网络关键子网络GO功能分析与Pathway分析结果Fig.6GO analysis and Pathway analysis results of key subnetworks of PPI network

表6 PPI网络关键子网络显著功能与通路信息Tab.6 Significant function and pathway information of key subnetworks in PPI network

3.5 统计学分析结果

通过综合基因调控网络的显著功能模块分析与其PPI网络的关键子网络分析结果,可以初步确定异常表达调控的CREB1与IL6可能影响宿主DCs免疫应答结核分枝杆菌的过程.在此基础上,进一步采用ROC曲线分析CREB1与IL6表达是否与结核分枝杆菌感染DCs临床病理过程相关.CREB1与IL6作为结核分枝杆菌感染DCs过程显著功能模块中的关键转录因子和靶基因,其ROC 曲线下面积(AUC)分别为 0.911 4和0.963 6,特异性和敏感性均较高,说明 CREB1与IL6表达可能是表征结核分枝杆菌感染DCs进程有价值的标志物.见图7A和7B.

4 结 论

在本研究中,我们通过分析芯片表达谱数据构建了DCs免疫应答结核分枝杆菌过程中异常表达的基因调控网络,并依据MCODE计算工具k-core值提取了该基因调控网络的显著功能模块,包括CREB1、IL6、CEBPA和CCND1 4个差异表达的基因,其中,CREB1与CEBPA为转录因子,与IL6和CCND1均有预测调控关系.通过对基因调控网络中全部基因进行功能分析与通路分析,结果显示:网络中差异基因与保护性免疫过程或信号通路相关性较大,且在结核通路中有显著功能模块基因分布,为CREB1与IL6.进一步对基因调控网络进行PPI网络分析,并提取关键子网络,其中节点度Degree最显著的基因为IL6,且在显著功能与通路(inflammatory response与TNF signaling pathway)上均有IL6的分布信息,而CREB1与IL6有预测调控关系.ROC曲线分析显示:CREB1和IL6与DCs免疫应答结核分枝杆菌临床病理特征相关性较高,并作为结核分枝杆菌感染DCs过程显著功能模块中的关键转录因子和靶基因,其ROC 曲线下面积(AUC)分别为 0.911 4和0.963 6,特异性和敏感性均较高,提示 CREB1与IL6的异常表达可能是表征结核分枝杆菌感染DCs进程有价值的标志物.

DCs是必要的抗原呈递细胞(Antigen presenting cells,APCs),通过直接的细胞-细胞相互作用和/或细胞因子的产生激活T淋巴细胞,协调先天炎症免疫反应和适应性免疫[9-10].在人类和小鼠中DCs有几种亚型,以表面标记物和功能为特征,一般来说,DCs亚群来自骨髓前体,它们通过血液或淋巴系统定植于外周组织[10-12].肺部树突状细胞分布于上皮下、间质和胸膜腔室,通常以未成熟抗原提呈细胞的形式存在,由于DCs具有启动适应性免疫反应的能力,它们被认为是调节免疫反应的主要靶点[13].DCs可以感知结核分枝杆菌的存在,正是由于结核分枝杆菌感染的炎症状态能够诱导引流淋巴结的DCs成熟,DCs通过分泌介质产生炎症信号驱动清除结核分枝杆菌感染所必需的T淋巴细胞的活化与分化[2].

cAMP反应元件结合蛋白(The cAMP response element-binding protein,CREB)是细胞增殖和凋亡所需的基本核转录因子,即CREB1,CREB1在所有器官中广泛表达,是增殖、生长、生存和分化等多个生物过程所必需的转录因子[14-16].CREB1由多种生长因子和炎症信号诱导产生,随后介导包含cAMP反应元件的基因转录.一些免疫相关基因拥有这种cAMP反应元件,包括IL2、IL6、IL10和TNF-α[17-20].Interleukin 6(IL6)是一种多效促炎细胞因子,其表达量的增加是许多人类慢性炎症疾病的标志[21-22].有研究[23]表明:在结核病患者外周血单核细胞经结核分枝杆菌重组蛋白ESAT6/CFP10刺激培养后,在细胞上清液中也可检测到高表达量的IL6;在自噬对DCs成熟与抗结核分枝杆菌免疫影响的研究中,通过BCG(Bacillus Calmette Gue’rin)诱导DCs成熟,CD86 和 HLA-DR表达增加,自噬刺激后发现IL6也随之产生,提示自噬可以促进细胞因子的产生和共刺激分子的表达,而IL6的高表达可能更有效地促进T细胞的免疫应答.

综上所述,本研究初步构建了DCs免疫应答结核分枝杆菌的基因调控网络,并筛选出网络显著功能模块,主要分析了在结核信号通路上具有预测调控关系的转录因子CREB1与其靶基因IL6,推测它们的异常表达调控在DCs免疫应答过程中发挥了关键作用,并分析了CREB1和IL6与DCs免疫应答结核分枝杆菌临床病理特征相关性,其特异性与灵敏度均较高,提示 CREB1与IL6的异常表达可能是结核分枝杆菌感染DCs进程中有价值的标志物,也可能是宿主在感染结核分枝杆菌后由先天免疫过渡到适应性免疫的信号.构建基因调控网络对于DCs免疫应答结核分枝杆菌过程中重要调控因子及其靶基因的鉴定是一个重要的研究渠道与工具,这一系统生物学的研究方法为进一步阐明重要基因调控免疫应答的分子机制提供了理论基础.以上分析结果可以帮助我们在后续开展DCs免疫应答结核分枝杆菌功能的体内体外实验及未来寻找治疗结核病的新策略提供研究方向.

猜你喜欢

功能模块结核通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
基于改进TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
南京地区2017—2020年结核及非结核分枝杆菌菌株分布及耐药情况分析
艾滋病合并结核病患者结核分枝杆菌耐药分析
长得丑?但价值无限!
商业模式是新媒体的核心
基于ASP.NET标准的采购管理系统研究
高校二手交易网络平台功能及技术框架分析与设计
关联通路,低成本破解渠道障碍