APP下载

基于生物信息学分析结肠癌的预后相关基因及其与免疫细胞的相关性*

2022-07-20顾智文巫殷腾廖存马辉张森张小龙

结直肠肛门外科 2022年3期
关键词:结肠癌直肠癌数据库

顾智文,巫殷腾,廖存,马辉,张森,张小龙

广西医科大学第一附属医院结直肠肛门外科/广西消化道肿瘤加速康复外科基础研究重点实验室 广西 南宁 530021

研究表明,结直肠癌是我国癌症死亡的第五大原因[1]。结肠癌的治疗方法包括传统的手术、化疗和放疗,还包括迅速发展的免疫疗法[2]。尽管结肠癌的治疗已经取得了重大进展,但其发病率逐年上升,5年生存率较低[3-4]。基因突变、吸烟、肥胖,以及各种炎性疾病是发生结肠癌的危险因素[5]。虽然炎症促进肿瘤发展的分子机制有待进一步明确,但是研究发现不同的免疫细胞、细胞因子和免疫介质参与了结肠癌发生的全过程[6]。免疫细胞毒性降低[7]和T细胞浸润缺乏[8]预示着结直肠癌患者的结局不良。Zhang等[9]研究表明,肿瘤免疫浸润程度越高,临床预后越好。近年来,结肠癌分子标志物在诊断、治疗反应评估和预后评估等方面的研究层出不穷[10],但结肠癌预后相关标志物与免疫细胞关系的研究较少。本研究通过生物信息学分析结肠癌的预后相关基因及其与免疫细胞的关系,为结肠癌的诊断和治疗提供理论基础。

1 资料与方法

1.1 数据来源和组织样本收集

在GEO(Gene Expression Omnibus,http://www.ncbi.nlm.nih.gov/gds)数据库中搜索与结肠癌相关的全基因组基因表达数据集,最终纳入GSE21510、GSE18105和GSE20916这三个数据集进行分析。GSE21510、GSE18105和GSE20916数据集的芯片平台都是GPL570。我们使用GSE21510作为训练集,GSE18105和GSE20916作为验证集。收集在广西医科大学第一癌组织及配对癌旁正常组织。排除术前接受化疗或放疗的患者。本研究经医院伦理委员会批准,所有患者均签署知情同意书。附属医院行手术切除且经病理确诊的41例结肠癌患者的结肠癌组织及配对癌旁正常组织。排除术前接受化疗或放疗的患者。本研究经医院伦理委员会批准,所有患者均签署知情同意书。

1.2 差异表达基因(DEGs)的筛选

获取GPL570平台探针名称与基因名称的匹配信息,首先将探针名称转化为正式的基因名称。当多个探针匹配同一个基因名称时,选择最大值的探针作为基因表达水平。利用Limma软件包对GSE21510、GSE18105和GSE20916数据集进行标准化和差异表达分析。筛选DEGs的标准:校正后P<0.05;|log FC|>2,FC为差异倍数。获取GSE21510、GSE18105和GSE20916数据集的上调和下调差异基因之后,将它们的上调和下调差异基因取交集,从而获得三个数据集的共同上调和共同下调差异基因。

1.3 DEGs的功能富集分析

使用R“clusterprofiler”包对交集基因进行基因本体论(GO)功能分析和京都基因与基因组百科全书(KEGG)通路分析。

1.4 蛋白互作网络(PPI)和预后基因的筛选

在线STRING(http://string-db.org)数据库整合了蛋白质之间所有已知和预测的关联,包括物理层面的相互作用及功能关联。通过STRING数据库预测筛选出的DEGs所表达蛋白之间的相互作用关系以及蛋白与蛋白之间联系的紧密程度。将共同上调和共同下调的差异基因输入STRING数据库,选择“智人”作为有机体,设置显著阈值>0.4,其他设置默认,导出结果文件。然后,使用Cytoscape软件绘制PPI图,再使用MCODE插件筛选出具有高度联系的基因簇,从而筛选出与结肠癌相关的核心基因。

1.5 预后分析

GEPIA(http://gepia.cancer-pku.cn/detail.php?gene=&clicktag=survival)数据库中包含了263例结肠癌患者样本数据及预后信息,可用于了解基因对患者生存情况的影响。在对模块基因进行总体生存分析时,以每百万映射读取外显子模型千碱基转录产物(TPM)中位数为截点,将263例有总生存期资料的样本分为高表达组和低表达组。

1.6 预后相关基因表达水平分析和验证

分析GSE21510、GSE18105和GSE20916数据集中筛选出的结肠癌预后相关基因GCNT2的表达情况,并通过qPCR实验检测其表达水平。GCNT2的引物由上海生工生物科技有限公司合成,上游引物为5’-TGTTCCTGGCTCTATGCCAAA-3’;下游引物为5’-TTAGCAAACAGGCTTGGTGAAT-3’。使用 NucleoZol RNA试剂提取结肠癌组织和癌旁正常组织的总RNA,TaKaRa试剂盒逆转录为cDNA,用SYBR Green PCR试剂盒在ABI7500型PCR仪上进行PCR扩增,设定条件为95℃预变性30 s,95℃变性10 s,60℃退火延伸30 s,共40个循环。采用2-△△Ct法计算GCNT2 mRNA相对表达量。

1.7 预后相关基因与免疫细胞的相关性分析

利用cibersort R包处理GSE21510原始表达矩阵,筛选出P<0.05的样本,得到免疫细胞矩阵。对预后相关基因和免疫细胞进行Spearman相关分析,并用ggplot 2软件包可视化结果。

1.8 预后相关基因与免疫细胞的相关性验证

利用TIMER 2.0(Tumor Immune Estimation Re-source)数据库对上一步的预后相关基因与免疫细胞相关性分析结果进行验证。TIMER 2.0数据库使用高通量测序(RNA-Seq表达谱)数据分析肿瘤组织中免疫细胞的浸润情况,主要提供B细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、肥大细胞,以及树突状细胞等6种免疫细胞的浸润情况[11]。

1.9 统计学方法

采用R studio软件处理数据。差异分析采用贝叶斯算法,采用Kaplan-Meier法绘制生存曲线,采用Log-rank检验进行生存分析,计量资料采用t检验进行比较,采用Spearman进行相关性分析。以P<0.05为差异有统计学意义。

2 结果

2.1 结肠癌相关DEGs

在GSE21510数据集发现903个DEGs,其中468个上调基因,435个下调基因(图1A)。在GSE18105数据集发现693个DEGs,其中311个上调基因,382个下调基因(图1B)。在GSE20916数据集发现318个DEGs,其中106个上调基因,212个下调基因(图1C)。三个数据集取交集得到50个共同上调DEGs(图1D)和130个共同下调DEGs(图1E),即180个交集基因。

图1 结肠癌相关DEGs分析结果

2.2 DEGs功能富集分析

对180个交集基因进行GO和KEGG富集分析。GO富集分析结果显示,交集基因主要富集在细胞对无机物质的反应、锌离子反应、细胞锌离子稳态、铜离子解毒、对铜离子的应力响应等生物学过程(BP)上(图2A)。在细胞组成(CC)方面,交集基因主要富集在细胞顶端部分、顶端质膜、质膜的外侧、基底质膜等(图2B)。在分子功能(MF)方面,交集基因主要富集在离子跨膜转运体的活性、G蛋白—偶联受体结合、金属肽酶活性、羧酸跨膜转运体的活性等(图2C)。KEGG富集分析结果显示,交集基因主要参与矿物吸收,胆汁分泌,病毒蛋白与细胞因子及细胞因子受体的相互作用,PPAR信号通路等(图2D)。

图2 GO和KEGG功能富集分析结果

2.3 180个DEGs的PPI和核心基因生存分析

将180个交集基因导入STRING数据库,筛选出了7个具有高度联系性的基因簇,得到GUCA2B、SLC26A3、ASCL2、GCNT2等 38个核心基因(图3A~3G)。经查阅相关文献发现,GCNT2与黑色素瘤、乳腺癌和结肠癌等肿瘤的进展相关,但GCNT2在结肠癌中的具体作用尚不明确[12]。因此,本研究重点研究GCNT2与结肠癌的关系。接下来,我们利用GEPIA数据库对GCNT2进行生存分析并绘制生存曲线,结果显示GCNT2与结肠癌患者预后相关,且GCNT2高表达的结肠癌患者的生存率低于GCNT2低表达的结肠癌患者(P<0.05)(图3H)。

图3 PPI和生存分析结果

2.4 GCNT 2表达水平分析和验证

GCNT2在GSE21510、GSE18105、GSE20916数据集中均为低表达(图4A~4C);qPCR实验结果表明,GCNT2在结肠癌中低表达,与生物信息学分析结果一致(图4D)。

图4 GCNT 2的表达水平

2.5 GCNT 2与免疫细胞的相关性分析

GCNT2与免疫细胞的相关性分析结果显示,GCNT2与幼稚B细胞、调节性T细胞、活化性自然杀伤细胞、滤泡辅助性T细胞和静息性肥大细胞呈正相关,与M1型巨噬细胞、幼稚CD4+T细胞、静息性树突状细胞、中性粒细胞、静息性自然杀伤细胞和活化记忆性CD4+T细胞呈负相关(图5)。

图5 GCNT 2与免疫细胞的相关性分析结果

2.6 GCNT 2与免疫细胞的相关性验证

cibersort算法结果显示,GCNT2与幼稚B细胞、调节性T细胞、活化性自然杀伤细胞、滤泡辅助性T细胞呈正相关,与静息性自然杀伤细胞呈负相关,与上述部分结果一致(图6)。

图6 GCNT 2与免疫细胞的相关性验证

3 讨论

目前,早期诊断、手术技术的改进和系统的综合治疗改善了结肠癌患者的整体预后,但其死亡率仍然较高[13]。有研究表明,免疫微环境会对结肠癌的发展、预后产生影响[14]。因此,探索结肠癌的预后相关基因及其与免疫细胞的相关性对结肠癌诊断和治疗具有指导意义。

本研究通过对GEO数据库中的GSE21510、GSE18015和GSE20916数据集进行差异表达分析,筛选出了180个交集基因,其中上调的有50个,下调的有130个,下调基因明显多于上调基因,提示结肠癌发生时大部分基因的表达下调。对这些交集基因进行GO和KEGG功能富集分析,发现这些基因主要与锌离子和铜离子有关。研究表明,锌离子和铜离子参与细胞增殖、凋亡、基因表达、癌症转移等过程,头颈癌等恶性肿瘤中可见锌和铜的稳态异常[15-16]。Khoshdel等[17]比较了来自伊朗的结直肠癌患者与健康受试者的血清铜和锌的浓度,发现铜和锌水平的失衡与结直肠癌相关,并可能在结直肠癌的发展中发挥重要作用。一项调查机体内铜和锌水平与结直肠癌发生风险关系的病例对照研究的结果显示,机体内较高的铜浓度与结直肠癌发生风险升高相关,而高锌水平与癌症风险呈负相关,表明在结直肠癌发展过程中铜或锌的含量不平衡,但其调控结直肠癌的作用机制尚不明确[18]。这些研究与这180个交集基因富集分析的结果有较好的一致性,提示这些基因中可能存在对结肠癌发生和发展起到关键作用的基因。

我们通过Cytoscape的MCODE插件相关节点算法分析,筛选出了7个具有高度联系性的基因簇,得到GUCA2B、SLC26A3、ASCL2、GCNT2等 38个核心基因。通过GEPIA数据集进行生存分析并绘制生存曲线,结果显示GCNT2高表达的结肠癌患者的生存率低于GCNT2低表达的结肠癌患者。GCNT2(β-1,6 n-乙酰氨基葡萄糖转移酶2)是聚糖相关基因之一[19]。研究表明,GCNT2与前列腺癌[20]、乳腺癌[21]和黑色素瘤[22]的进展相关。Nakamura等[23]研究发现,GCNT2在结直肠癌细胞和组织中低表达,与结直肠癌淋巴结转移相关。目前,癌症相关的聚糖可被用来设计合理的药物或作为免疫治疗靶点[24]。而GCNT2在结肠癌中的作用机制及其与免疫反应的关系尚不清楚,因此本研究进一步探讨GCNT2在结肠癌中的表达及其与免疫细胞的相关性。

通过分析GSE21510、GSE18105和GSE20916数据集中GCNT2在结肠癌中的表达情况,并利用qPCR法检测GCNT2的表达,结果显示GCNT2在结肠癌中低表达,与Nakamura等[23]的研究结果一致。然后,利用cibersort R包处理GSE21510原始表达矩阵,筛选得到免疫细胞矩阵,对GCNT2和免疫细胞进行Spearman相关分析,结果显示GCNT2与幼稚B细胞、调节性T细胞、活化性自然杀伤细胞、滤泡辅助性T细胞和静息性肥大细胞呈正相关,与M1型巨噬细胞、幼稚CD4+T细胞、静息树突状细胞、中性粒细胞、静息性自然杀伤细胞和活化记忆性CD4+T细胞呈负相关。该结果体现了肿瘤浸润先天性免疫细胞和获得性免疫细胞在癌症的发展中起双重作用[25]。此外,有研究在结肠肿瘤组织中发现T淋巴细胞、B淋巴细胞、自然杀伤细胞、单核/巨噬细胞、树突状细胞、肥大细胞和中性粒细胞[26]。研究表明,自然杀伤细胞抑制主要组织相容性复合体Ⅰ类分子,进而促进结肠癌细胞的侵袭[27]。在肿瘤免疫功能方面,CD4+T细胞可以从外周血迅速进入肿瘤组织,杀死癌细胞[28]。M1巨噬细胞激活Ⅰ型辅助性T细胞,促进炎症进程和延缓肿瘤进展[29]。为对GCNT2与免疫细胞相关性分析的结果进行验证,我们利用cibersort算法计算结肠癌中的免疫细胞及GCNT2与免疫细胞的相关性,发现GCNT2与幼稚B细胞、调节性T细胞、活化性自然杀伤细胞、滤泡辅助性T细胞呈正相关,与静息性自然杀伤细胞呈负相关,提示GCNT2可能与结肠癌相关免疫细胞活性有关。本研究结论主要基于为生物信息学的分析,GCNT2与免疫细胞的相关性及其作用机制有待进一步的基础研究。

综上所述,GCNT2与结肠癌预后相关,其可能通过调节免疫细胞的活性参与结肠癌的发展。

利益冲突声明 全体作者均声明不存在与本文相关的利益冲突。

猜你喜欢

结肠癌直肠癌数据库
直肠癌术前分期诊断中CT与MRI检查的应用效果对比
MRI在直肠癌诊断中的价值及预后的应用研究
直肠癌在调强放疗中保持膀胱充盈度一致的重要性研究
结肠癌早期,多有5大表现
助“癌”为虐的细菌
数据库
数据库
数据库
数据库
腹腔镜治疗结肠癌27例临床观察