APP下载

基于生物信息学的结直肠癌预后相关候选生物标志物鉴定

2022-12-16王新俊黄伊鑫

世界最新医学信息文摘 2022年77期
关键词:差异基因直肠癌通路

王新俊,黄伊鑫

(1.贵州医科大学附属医院临床医学研究中心,贵州贵阳 550004;2.贵州医科大学附属医院肛肠外科,贵州贵阳 550004)

0 引言

结直肠癌(colorectal cancer, CRC)是世界范围内最常见的肿瘤疾病之一,据估计,2020年发生的新结直肠癌病例超过190万例,死亡93.5万人,约占癌症病例和死亡的十分之一[1]。许多研究表明,结肠直肠癌的发生和发展可能与遗传、生活方式、不健康饮食、缺乏运动和环境因素有关,但确切的病因和机制尚不清楚[2]。手术切除联合放疗和化疗作为辅助或新辅助管理仍然是治疗结肠癌的主要方式[3]。晚期结直肠癌患者的总生存率较低,治疗效果往往不理想,因此,需要探索新的治疗靶点,以提高结直肠癌的疗效和预后。

目前,微阵列技术广泛应用于分子机制的探索,在分子生物学中有着广泛的应用。它为系统筛选肿瘤相关基因和利用生物信息学识别其调控机制提供了一种有效的方法[3]。

本研究采用生物信息学方法筛选CRC差异表达基因,并对差异表达基因进行基因本体(gene ontology,GO)分析和京都基因基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析。构建蛋白相互作用(p r otein- protein interaction,PPI)网络,筛选出与结直肠癌发生密切相关的基因,然后,我们对候选基因进行了生存分析筛选出与结直肠癌预后相关的核心基因。研究结果可能为结直肠癌潜在的治疗及预后相关生物标志物的研究提供新的见解。

1 材料和方法

1.1 数据下载

本研究从GEO数据库(https://w w w.ncbi.nlm.nih.gov/geo/)中下载提取结直肠癌3个基因表达谱数据集(GSE106582、GSE44861、GSE113513),其中GSE106582包括77个肿瘤样本和117个正常样本;GSE44861包括56例肿瘤样本和55例正常样本;GSE113513包括14例肿瘤样本和14例正常样本。

1.2 筛选差异表达基因

通过GEO2R (http s://w w w.ncbi.nlm.nih.gov/geo/geo2r)在线分析工具分析CRC样本与正常样本之间的差异基因(DEGs)。筛选条件为P<0.05和|log(FC)|>1。然后,利用R软件(Version 3.6.3)对3个GEO数据集的DEGs结果进行分析及可视化处理。

1.3 差异表达基因GO功能富集和KEGG通路分析

本研究采用R软件(Version 3.6.3)对差异表达基因进行GO功能富集分析和KEGG通路富集分析。P<0.05认为差异具有统计学意义。并将分析结果进行可视化。

1.4 蛋白质相互作用网络分析

应用在线数据库STRING (version 11.0)对差异基因进行分析,设置交互作用得分≥0.4,构建蛋白质相互作用网络(PPI)。使用Cytoscape软件(3.6.0版本)对PPI网络进行可视化,使用插件CytoHubba识别PPI网络中的中心节点基因,然后将中心节点基因作为候选核心基因进行分析。并通过插件MCODE筛选关键模块进行进一步分析。

1.5 核心基因生存分析

利用在线工具GEPIA 2(http://gep ia2.cancer-pku.cn/)分析筛选出的核心基因表达水平与结直肠癌患者总生存期(overall survival,OS)的相关性。根据结直肠癌患者差异表达基因的表达情况及中位值分为高表达组和低表达组,绘制生存曲线,筛选具有预后价值的基因。

2 结果

2.1 差异基因的鉴定

通过在线分析工具GEO2R进行基因表达谱GSE106582、GSE44861和GSE113513分析(图1A-C),共鉴定筛选出具有显著差异的基因212个(图1D),其中上调基因55个(图1E),下调基因157个(图1F)。

图1 差异基因分析

2.2 差异基因功能富集分析

利用R软件(Version 3.6.3)对获得的DEGs进行功能富集分析。GO富集分析上调差异基因主要与细胞外基质分解、胶原代谢过程,胶原三聚体复合物、趋化因子活性,细胞因子活性等生物学过程有关。下调差异基因主要富集在细胞对铜离子反应、碳酸氢根转运、顶端质膜、微绒毛膜、氧化还原酶活性、氯离子跨膜转运活性等生物学过程中。

KEGG通路分析显示,上调差异基因主要参与IL-17信号通路、NF-κB信号通路、TNF信号通路等信号通路,下调差异基因主要参与在氮代谢、矿物质吸收等信号通路。

图2 差异表达基因功能分析

2.3 PPI蛋白互作网络构建和核心基因筛选

利用S T R I N G数据库对获得的2 1 2个DGEs构建PPI网络,并确定核心基因。使用Cytoscape 3.8.2软件进行分析和蛋白网络可视化,cyto Hubba插件分析筛选出前15个基因(图3)。TIMP1、CXCL8、CXCL1、MMP1、CXCL12、MMP3、CXCL2、CXCL5、MYC、P L A U、M M P 7、M M P 1 2、C O L 1 A 1、COL1A 2、BMP2。使用 MCODE 插件分析出最显著的相互作用的两个模块,其中一个模块由11个关键基因组成(TIMP1、CXCL1、MMP1、CXCL12、MMP3、CXCL2、CXCL5、P L A U、M M P 7、M M P 1 2、C O L 1 A 1、COL1A 2),另外一个模块由4个关键基因组成(MMP3、COL1A1、COL1A2、BMP2)。

图3 差异基因PPI网络和核心基因模块分析

2.4 核心基因预后分析

我们利用GEPIA 2数据库对15个中心基因进行结直肠腺癌的总生存期和无病生存期分析。我们发现,在15个中心基因中,TIMP1、CXCL8和COL1A 2与结直肠腺癌的总生存率相关(P<0.05)。

图4 核心基因的预后基因特征分析

3 讨论

在本研究中,我们从GEO数据库中获得了结直肠癌基因谱GSE113513、GSE106582和GSE44861。通过GEO2R在线分析,筛选出差异表达基因(DEGs)。随后,对这些差异基因进行GO和KEGG通路富集分析、通过蛋白相互作用PPI网络构建筛选出15个核心差异候选基因。然后,我们对核心基因进行了总体生存分析发现CXCL8、COL1A 2和TIMP1在结直肠癌总生存期中发挥重要作用。这些可能是未来临床应用的潜在治疗靶点。

TIMP1是金属蛋白酶(TIMP)家族的组织抑制剂之一,调控基质金属蛋白酶(MMPs)和解离素金属蛋白酶[5]。TIMP1的异常活性与多种癌症的进展有关。TIMPs通过多种机制参与细胞粘附过程及随后的细胞生长调控,包括调节细胞骨架组织、与细胞粘附分子的直接相互作用或调控特定ECM组分的表达[6]。TIMP1表达增加预示喉癌[7]和黑色素瘤[8]的预后更差。通过诱导TIMP1特异性调控的FAK-PI3K/AKT和MAPK通路增加细胞凋亡[9]。TIMP1通过正常结直肠粘膜-腺瘤-癌序列呈现顺序上升的趋势,并且TIMP1的上调表明生存预后不良[10]。TUC338通过靶向TIMP1促进宫颈癌细胞的迁移和侵袭[11]。TIMP1不仅可以通过抑制MMP的表达和激活来抑制肿瘤,还可以通过促进血管生成、细胞生长和肿瘤炎症来促进肿瘤的发生[12]。这些研究都表明TIMP1在癌症发展中发挥着复杂的作用。

COL1A 2是编码Ⅰ型胶原α2链的重要基因,参与细胞外基质的形成,主要通过细胞外基质受体途径和局部粘附途径影响细胞增殖、分化、粘连和转移。COL1A 1和COL1A 2的异常表达水平已被报道在几种类型的癌症中[13]。COL1A 2在原发性CRC组织中显著下调,CRC组织中COL1A 2 m RNA水平与肿瘤分化、侵袭、淋巴结转移相关[13]。COL1A 1和COL1A 2在非小细胞肺癌和食管鳞癌肿瘤中的表达水平高于正常组织,Ⅰ型胶原的低表达与较差的总体生存和癌细胞分化显著相关[15]。COL1A 2通过PI3k/Akt信号通路抑制胃癌细胞凋亡,促进胃癌细胞增殖、侵袭和迁移[16]。COL1A 2基因甲基化是头颈癌的独立不良预后因素[17]。

CXCL8是一种来自CXC组的趋化因子,也称为白细胞介素-8 (IL-8)。一些研究表明CXCL8促进癌症进展,并与不良预后有关[18]。CXCL8通过激活JAK/STAT1/HIF-1α/Snail信号转轴促进胶质瘤的进展[19]。大量研究表明,CXCL8在内皮细胞、肿瘤相关巨噬细胞和癌细胞中均有表达[20]。CXCL8的过表达促进CRC细胞的增殖、迁移和侵袭,与CRC血管生成、转移、预后差、无病生存率差密切相关[21]。在肺癌[22]、胃癌[23]患者中高表达的CXCL8与预后呈负相关,相关研究结果表明CXCL8作为一种重要的多功能趋化细胞因子,与多种肿瘤的发生、转移、耐药及预后相关。

综上所述,我们通过整合生物信息学分析,确定了三个与结直肠癌相关的核心基因,我们的研究发现CXCL8、COL1A 2和TIMP1的表达特征可能对结肠癌具有预后价值,可能成为结肠直肠癌治疗的靶点,它们在结直肠癌中的作用机制有待进一步研究。

猜你喜欢

差异基因直肠癌通路
MRI在直肠癌诊断中的价值及预后的应用研究
多晒太阳或可降低结直肠癌发病率
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
早期结直肠癌患者凝血指标异常及其临床意义
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
基于U-net的直肠癌肿瘤的智能分割
紫檀芪处理对酿酒酵母基因组表达变化的影响
SphK/S1P信号通路与肾脏炎症研究进展