APP下载

肺结节病生物标志物与治疗药物的筛选与分析

2022-08-10郭新劝张云庆

黑龙江医药 2022年14期
关键词:差异基因标志物数据库

郭新劝,张云庆

洛阳新区人民医院检验科,河南 洛阳 471023

结节病是一种原因不明的系统性肉芽肿性疾病,可以累及全身各个器官,以肺结节病最为常见[1]。典型的肺结节病表现为纵膈及双肺门淋巴结肿大,伴或不伴肺内阴影,常累及眼部和皮肤,也可有肝脏、心脏、脾脏、骨骼等病变[2]。结节病的诊断需要整合多学科综合判断,在非干酪样坏死性上皮样细胞肉芽肿的病理基础上,结合患者的临床、影像学表现,排除其他病因后可确诊为结节病[3]。大多数患者预后良好,部分呈自限性病程,约25%的患者表现为慢性、进展性病程,最终导致肺纤维化、肝硬化、失明等。尽管对结节病的发病机制进行了大量研究,结节病发生发展过程中的特异性标志物及分子调控有待深入探讨。

基于基因芯片或高通量测序平台的转录组技术已被广泛用于人类疾病生物标志物的筛选。随着基因芯片和二代测序的应用,产生了大量的生物数据,其中大部分已经上传至公共数据库中,如肿瘤基因组图谱TCGA 数据库、基因表达GEO 数据库[4-5]。对于这些数据的整合和再分析将为研究提供有价值的线索。本研究从GEO中下载肺结节病相关表达谱数据,筛选结节病患者与正常对照之间的差异基因并进行功能分析,以期筛选出肺结节病相关的生物标志物,同时预测具有潜在治疗结节病的药物,为阐明肺结节病发生的分子机制和开发靶向治疗提供参考依据,现将结果报告如下。

1 资料与方法

1.1 资料来源

从GEO 数据库中下载GSE34608 数据集,从该数据集中选择36 个血液样本,包括18 例肺结节病患者样本和18例健康对照样本[6]。肺结节病患者诊断明确,艾滋病、糖尿病、自身免疫性疾病等存在免疫抑制的患者排除在外。提取患者和对照外周血的RNA 样品,采用GPL6480 芯片平台,即Agilent-014850人类基因组4x44K G4112F芯片。

1.2 方法

1.2.1 差异表达基因筛选 将结节病患者样本和健康对照样本的表达谱数据导入在线工具GEO2R 进行差异表达基因(differentially expressed genes,DEGs)的筛选[7]。采用t 检 验 计 算P 值,Benjamini-Hochberg 方 法 对P 值 进 行 校正。DEGs 筛选标准为组间差异倍数≥2 倍,调整后,P<0.05。

1.2.2 富集分析 基因本体(Gene ontology,GO)是国际标准化的基因功能分类体系,京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)数据库整合了基因组、化学和系统功能等信息,以期探索生物系统的高级功能。本研究基于DAVID 数据库进行DEGs 功能模式富集分析[8],包括分子功能富集、生物过程富集和信号通路富集,显著富集条目的阈值设为P<0.05。

1.2.3 蛋白互作网络分析 将筛选出的DEGs 上传至STRING 数据库获得蛋白—蛋白相互作用(protein-protein interaction,PPI)网络图,以综合得分>0.7 作为显著性阈值,然后使用Cytoscape软件进行可视化,采用默认参数计算PPI网络中核心基因的度值。

1.2.4 潜在药物预测 DGIdb 整合了Chembl、DrugBank、PharmGKB等数据库以及PubMed已发表文献等信息[9]。将PPI 网络筛选出的核心基因输入DGIdb 数据库,筛选与此基因集相互作用的药物。

2 结果

2.1 差异基因筛选结果

以健康对照样本为对照组,肺结节病患者样本为实验组,根据筛选标准,从基因表达谱数据中共筛选出2 837个DGEs,其中上调基因1 662 个,下调基因1 175 个,部分差异基因,见表1。

表1 差异基因筛选结果

2.2 GO功能富集分析

DGEs 显著富集的分子功能主要集中在蛋白质结合、信号传导活性、肿瘤坏死因子(tumor necrosis factor,TNF)结合、蛋白激酶活性等。显著富集的生物过程主要涉及NF-κB 信号、细胞周期阻滞、细胞黏附、免疫反应、蛋白磷酸化、内吞、mRNA 加工等,富集水平最显著的前20个条目列于表2。

表2 GO功能富集分析

2.3 通路富集分析

DGEs 显著富集于NF-κB 信号,内吞,TNF 信号,

MAPK 信号,趋化因子信号,Toll 样受体信号,细胞凋亡等,其中富集水平最显著的前10条通路,见表3。

表3 通路富集分析

2.4 蛋白互作网络分析

将筛选出的DEGs 上传至STRING 数据库构建PPI 网络,该网络包含1 729个节点和13 332条边,PPI富集P值小于1×10-16,平均局部聚类系数为0.279,采用Cytoscape可视化如图1A 所示。根据巨型网络中的连通度,对DEGs拥有的PPI 对数量进行统计分析,鉴定出5 个核心节点基因,包括TLR4、JUN、CASP3、PTEN和CXCL8。

图1 蛋白相互作用网络分析

2.5 药物筛选结果

利用DGIdb 数据库在线筛选针对TLR4、 JUN、CASP3、PTEN 和CXCL8 核心基因的药物共计257 种,包括紫杉醇、秋水仙素、西妥昔单抗、甲巯咪唑等。以“Interaction Score”大于1 为阈值共筛选出潜在药物29 种,见表4,这些药物可能与肺结节病存在关联。

表4 靶基因筛选的潜在治疗结节病的药物

3 讨论

结节病尚无客观诊断标准,主要根据临床表现、受累部位病理结果以及影像学特征,排除其他原因后可确诊为结节病[3]。目前,肺结节病尚无特异性的血清诊断标志物。本研究从公共数据库中下载肺结节病表达谱数据,筛选其相关的生物标志物,并对其功能进行挖掘分析。本研究发现2 837 个基因在肺结节病患者和正常对照之间差异表达,富集分析发现,差异基因主要参与信号传导活性、TNF 结合、NF-κB 信号、细胞周期阻滞、细胞黏附、免疫反应、蛋白磷酸化等生物过程,主要涉及内吞,NF-κB信号,TNF 信号,MAPK 信号,趋化因子信号,Toll 样受体信号,细胞凋亡等通路。

免疫病理机制在结节病的发生和发展过程中发挥关键作用,活动性结节病的典型特征是受累组织主要表达干扰素-γ(interferon γ,IFN-γ),同时也高表达白细胞介素2(interleukin 2,IL-2)和TNF-α等细胞因子[10]。TNF-α是形成和维持结节病肉芽肿的关键细胞因子,靶向TNF-α可以作为结节病治疗策略之一。有研究发现,结节病患者肺组织和血细胞中TLR2 表达升高,单核细胞和巨噬细胞中TNF-α表达增加,并且高表达的TNF-α和IFN-γ诱导肺上皮细胞表达TLR2,表明异常的先天免疫活动可能在肺结节病发病中起主要作用,先天和适应性反应协同增强肉芽肿反应[11-12]。炎性因子IL-6参与介导多种炎症和免疫调节反应,IL-6 和转化生长因子-βl(transforming growth factor beta l,TGF-β1)是保护性Treg细胞和致病性Th17 细胞增殖分化的调控因子[13]。当无炎性受损时,IL-6 处于低表达水平,TGF-β1 诱导Treg 细胞增殖,利于免疫耐受。肺结节病患者血清中IL-6 和TGF-β1 水平均明显升高,二者协同诱导Th17 发育,使Treg 分化受限,并驱动Treg 向Th17 转化,提示促炎性Th17 细胞与Treg 细胞之间的平衡对于寻找诊断标志物和针对性药物具有参考意义[14]。

蛋白互作网络分析挖掘出的核心基因包括TLR4、JUN、CASP3、PTEN 和CXCL8,参与病原微生物感染、脂多糖反应、炎症反应、细胞周期与凋亡调控等。肺结节病患者外周血单个核细胞中dectin-1、TLR2和TLR4的基线表达水平较高,真菌细胞壁物质和/或脂多糖刺激后,dectin-1、TLR2 和TLR4 的表达减少,增加了外周血单个核细胞的敏感性,导致过度的炎性细胞因子反应,促进肺结节病的发生或进展[15]。针对核心基因筛选出的药物包括紫杉醇、秋水仙素、西妥昔单抗、甲巯咪唑等,可作为潜在治疗药物。糖皮质激素目前仍然是结节病治疗的一线选择,当糖皮质激素治疗失败或难以耐受毒副作用时,可以选用细胞毒药物以及抗TNF-α药物[16]。

综上所述,本研究对肺结节病相关的候选基因进行了筛选,其功能主要涉及TNF和NF-κB信号通路,扩展了对其分子发生机制的理解,鉴定出的核心基因可能作为肺结节病的诊断标志物,也可能作为研发新型治疗药物的分子靶标。

猜你喜欢

差异基因标志物数据库
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
多项肿瘤标志物联合检测在健康体检中的应用价值
基于TCGA数据库分析、筛选并验证前列腺癌诊断或预后标志物
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
数据库
数据库
数据库
数据库
冠状动脉疾病的生物学标志物