基于GEO 数据库筛选慢性乙型病毒性肝炎患者对干扰素α治疗无应答相关的关键免疫基因和通路
2022-05-21吴凤萍刘怡欣石娟娟党双锁
吴凤萍,鲁 瑞,刘怡欣,李 梅,石娟娟,党双锁
(西安交通大学第二附属医院感染科,陕西西安 710004)
慢性乙型肝炎病毒感染仍然是一个主要的公共健康威胁[1]。目前,临床中用于治疗慢性乙型病毒性肝炎(chronic hepatitis B, CHB)的药物主要有核苷(酸)类似物和干扰素α(interferon alpha, IFN-α)两大类。IFN-α 治疗CHB 具有疗程有限、不产生耐药等优点,对于部分优势患者,甚至可以实现临床治愈[2]。然而,CHB 患者对IFN-α 治疗的总体应答率并不高,HBeAg 转 阴 率 为17.7%~38.7%[3-4],HBsAg 转 阴 率为8.5%~37.4%[3,5-6],仍有近50%的患者对IFN-α 治疗无应答。目前,关于CHB 患者对IFN-α 治疗无应答的分子基础及确切机制仍不清楚。
鉴于IFN-α 无细胞毒作用,它主要通过调节免疫功能而发挥抗病毒作用[2]。我们推测,在IFN-α 治疗前,肝脏中某些免疫基因的表达状态可能在IFN-α 治疗CHB 无应答中发挥作用。随着生物医学的发展,高通量基因芯片技术及生物信息学技术在机制探索和潜在生物标志物的鉴定方面开始普及。因此,本研究旨在使用生物信息学方法筛选与IFN-α 治疗CHB 无应答相关的免疫基因和通路,以期探索CHB 患者对IFN-α 治疗无应答的潜在分子机制,以及为IFN-α 治疗CHB 的疗效预测提供可靠的分子标志物。
1 资料与方法
1.1 芯片数据的获取与处理
在GEO 公共数据库(https://www.ncbi.nlm.nih.gov/gds/)中以“hepatitis B virus”和“interferon alpha”作为关键检索词,选取并下载GSE27555 数据集(基于GPL6480 平台)的芯片数据,利用R 软件(Version 4.0.2;https://mirror.lzu.edu.cn/CRAN/)进行数据标准化,根据平台注释信息将探针转化为基因名以便进行后续分析。GSE27555 数据集包含了13 例CHB 患者在使用IFN-α 治疗前的肝脏组织基因表达信息,其中6 例为IFN-α应答者(responders,Rs),7 例为IFN-α非应答者(non-responders, NRs)。
1.2 差异免疫基因的筛选
运用R 软件中的“limma”包对Rs 和NRs 间的差异表达基因进行分析,并按|logFC|>1.2,P<0.05 的阈值标准筛选与IFN-α 治疗CHB 无应答相关的差异基因。从免疫相关基因数据库ImmPort 官网(https://www.immport.org/home)下载包含1 793 个基因在内的标志性免疫基因集。利用R 软件中的“merge”函数提取差异表达基因中的免疫基因,得到差异免疫基因。应用“ggpubr”包和“pheatmap”包绘制差异免疫基因的火山图和热图。
1.3 功能富集分析
为了探索差异免疫基因显著富集的功能以更好地了解这些差异免疫基因所参与的重要信号通路,使用R 软件中的“clusterProfile”包进行基因本体论(gene ontology, GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)分析。应用Fisher 精确检验来评估GO 和KEGG 富集的显著性,q<0.05 表示具有统计学差异。
1.4 PPI 网络构建及枢纽基因筛选
为了探索与IFN-α 治疗CHB 无应答相关的差异免疫基因所编码的蛋白质之间的关系,将上一步得到的差异免疫基因导入蛋白相互作用数据库STRING11.5(https://string-db.org/)中,以互作评分>0.4 为条件来构建蛋白质互作(protein-protein interaction, PPI)网络。进一步利用Cytoscape 软件中的Cytohubba 插件对差异免疫基因按Degree、MCC、MNC、Closeness 算法计算评分位于前10 的基因,再取交集,得到枢纽基因(Hub 基因)。
2 结 果
2.1 差异免疫基因的筛选
运用R 软件对数据集GSE27555 进行分析,按|logFC|>1.2,P<0.05 的阈值标准共筛选出460 个差异基因,其中上调基因203 个,下调基因257 个。从ImmPort 官网下载包含1 793 个基因在内的标志性免疫基因集。使用R 软件中的“merge”函数从上述460个差异基因中提取了88 个差异免疫基因,其中上调的免疫基因为13 个,下调的免疫基因为75 个。差异免疫基因的火山图和热图分别见图1、图2。从热图中可以发现所筛选的差异免疫基因可以很清楚地将Rs 和NRs 区 分 开。
图1 GSE27555 数据集差异表达免疫基因的筛选Fig.1 Screening of differentially expressed immune genes in GSE27555 dataset
图2 GSE27555 数据集差异表达免疫基因的聚类分析Fig.2 Cluster analysis of differentially expressed immune genes in GSE27555 dataset
2.2 差异免疫基因的功能富集分析
GO 功能富集分析显示,上述这88 个差异免疫基因主要富集于T 细胞活化、细胞趋化性、细胞-细胞黏附的调节、粒细胞迁移、粒细胞趋化性、T 细胞活化的正向调控、髓系白细胞迁移、白细胞趋化性、趋化因子介导的信号通路、细胞对趋化因子的应答、通过MHCⅡ类分子对抗原进行加工和提呈等免疫应答过程中(图3)。KEGG 分析显示,上述这88 个差异免疫基因主要富集于细胞因子-细胞因子受体相互作用,Th17、Th1 和Th2 细胞分化,抗原加工和提呈,病毒蛋白与细胞因子和细胞因子受体的相互作用,趋化因子信号通路,T 细胞受体信号通路,IL-17 信号通路,自然杀伤细胞介导的细胞毒性,Toll 样受体信号通路等免疫应答信号通路中(图4)。
图3 差异表达免疫基因的GO 分析Fig.3 GO analysis of differentially expressed immune genes
图4 差异表达免疫基因的KEGG 富集分析Fig.4 KEGG enrichment analysis of differentially expressed immune genes
2.3 差异表达免疫基因的PPI 网络构建及Hub 基因筛选
使用STRING 在线工具构建上述88 个差异免疫基因的PPI 网络,结果显示,在隐藏掉与其他节点无交互作用的节点后,所得到的PPI 网络由84 个蛋白节点和533 条边组成(图5)。
图5 差异免疫基因的PPI 网络Fig.5 The PPI network of differentially expressed immune genes
采用Cytoscape 软件中的Cytohubba 插件中的Degree、MCC、MNC、Closeness 4 种不同算法计算评分位于前10 的基因,再取其交集,最终确定了7 个Hub基因,分别为CD8A、IFNG、CCL2、CCL5、CXCL10、CCL4、FCGR3A(图6),而这7 个Hub 基因在NRs 中表达均为下调(表1,表中展示结果为按Degree 算法所得到的评分)。
图6 使用Cytohubba 插件中4 种不同算法所确定的7 个Hub 基因Fig. 6 Seven Hub genes identified by using four different algorithms in the Cytohubba plugin
表1 使用Cytohubba 插件中4 种不同算法所确定的7 个Hub基因Tab. 1 Seven Hub genes identified by using four different algorithms in the Cytohubba plugin
3 讨 论
IFN-α 是治疗CHB 的一线药物,具有抗病毒和免疫调节双重功效[7]。然而,CHB 患者对IFN-α 治疗的总体应答率并不高,仍有近50%的患者对IFN-α治疗无应答,而且IFN-α 治疗的副作用多,治疗费用较贵。因此,寻找能够准确预测CHB 患者对IFN-α治疗应答情况的生物标志物至关重要。本研究旨在运用生物信息学分析的方法筛选出Rs 和NRs 之间的差异免疫基因,进而探索与CHB 患者对IFN-α 治疗无应答相关的生物标志物及信号通路,从而为IFN-α治疗CHB 疗效的预测提供潜在依据。
本研究利用GEO 数据库中的GSE27555 数据集,对6 例Rs 和7 例NRs 的肝脏组织基因表达数据进行分析,筛选差异表达免疫基因。最终筛选出88 个差异免疫基因,包括13 个上调基因和75 个下调基因。热图显示这些差异免疫基因可以很清楚地将Rs和NRs 区分开,提示这些基因可能参与了CHB 患者对IFN-α 治疗应答的过程,可以作为预测CHB 患者对IFN-α 治疗应答情况的潜在生物标志物。
GO 分析和KEGG 富集分析表明,这些差异免疫基因主要在T 细胞活化,粒细胞的趋化、迁移,细胞因子-细胞因子受体相互作用,Th1、Th2 和Th17 细胞分化,抗原加工和提呈,病毒蛋白与细胞因子和细胞因子受体的相互作用,趋化因子信号通路,T 细胞受体信号通路,IL-17 信号通路,NK 细胞介导的细胞毒性,Toll 样受体信号通路等方面显著富集,提示宿主的免疫反应在IFN-α 治疗CHB 的应答中发挥重要作用。
本研究进一步运用Cytohubba 插件中的4 种不同算法(Degree、MCC、MNC、Closeness)对这些差异免疫基因的评分进行计算,筛选了7 个Hub 基因(CD8A、IFNG、CCL2、CCL5、CXCL10、CCL4、FCGR3A)。CD8A是编码CD8α链的基因,主要在细胞毒性T 淋巴细胞(cytotoxic T lymphocyte,CTL)表面表达,在NK 细胞和DC 细胞中也可检测到表达,因此CD8A 的基因表达可能是免疫细胞浸润的可测量指标[8-9]。CD8+CTL 在细胞免疫系统和细胞介导的免疫反应中发挥关键作用。CCL2、CCL4、CCL5、CXCL9、CXCL10 均属于趋化因子亚家族成员,是一组能够作用于G 蛋白耦联受体的细胞因子超家族成员,参与淋巴细胞的活化和游走、白细胞的吞噬等免疫应答过程[10-13]。IFNG 基因编码生成的IFNγ 蛋白是一种重要的炎症细胞因子,在细胞免疫调节中发挥重要作用[14]。FCGR3A 基因编码Fcγ 受体3A,也称为CD16,是结合IgG 抗体Fc 段的受体,主要表达于免疫细胞膜上,像桥梁一样介导特异性抗体和效应细胞之间的连接,将体液免疫和细胞免疫紧密关联起来[15]。本研究发现,在Rs 和NRs 中,上述这7 个免疫基因的表达水平存在显著差异,表明这些免疫基因具有成为预测CHB 患者对IFN-α 治疗应答情况的生物标志物的潜能。
本研究使用一系列的生物信息学技术来分析Rs和NRs 的肝脏组织基因表达信息。本研究仍存在一些 局 限 性:一 方 面,GSE27555 数 据 集 中Rs 和NRs 的病例数较少,而且GEO 数据库中关于IFN-α 治疗CHB 的数据集较少,因此,本研究所筛选出的Hub 基因有待在后续研究中扩大样本量来进一步验证。另一方面,本研究仅筛选出了7 个Hub 基因,以及富集了一些可能的信号通路,而这些Hub 基因影响CHB患者对IFN-α 治疗应答的具体机制有待后续进一步研究。
总之,本研究基于GEO 数据库运用生物信息学方法筛选出了Rs 和NRs 肝脏组织的88 个差异免疫基因以及与CHB 患者对IFN-α 治疗无应答相关的7 个Hub 基因。这些免疫基因可能成为预测CHB 患者对IFN-α 治疗应答情况的潜在生物标志物,为个体化、精准化使用IFN-α 治疗CHB 提供了科学依据。而这些基因及其确切的分子机制有待在后续大样本研究中进一步探索和验证。