APP下载

基于GEO数据库筛选胶质母细胞瘤相关差异基因及信号通路*

2023-11-01

国际检验医学杂志 2023年20期
关键词:差异基因母细胞胶质

韩 阳

首都医科大学附属北京友谊医院检验科,北京 100050

神经胶质瘤起源于神经胶质细胞,是目前最常见的颅内恶性肿瘤之一,占原发性中枢神经系统肿瘤的45%左右[1],年发病率在3/10万~8/10万[2]。有研究认为,胶质瘤治疗极其困难,预后尤为不佳,大约77%的恶性胶质瘤患者在确诊后1年内死亡[3-4]。其中,胶质母细胞瘤是最为常见的脑胶质瘤类型,是所有肿瘤中预后最差的类型之一。因此,研究胶质母细胞瘤的早期干预靶点具有重要意义。

随着基因芯片及二代高通量测序技术的不断发展,越来越多的研究利用基因测序技术与生物信息学分析方法,通过筛选与疾病发生发展相关的差异基因,为疾病的机制研究寻找新的靶标和研究思路[5-6]。胶质母细胞瘤属于多基因疾病,其发生和恶性进展与遗传因素密切相关[7]。因此,本研究拟通过基因表达谱数据库(GEO)筛选出胶质母细胞瘤相关的差异表达基因,探讨这些潜在致病基因与胶质母细胞瘤患者诊断、预后的相关性,为寻找新的标志物指明方向。

1 资料与方法

1.1资料来源 本研究对GEO数据库进行检索,选择“human”为物种类别,检索关键词设定为“Glioma”,分析对象为GSE31262基因表达谱数据集,该数据集主要包括5个成人神经干细胞个体样本和9个胶质母细胞瘤干细胞个体样本[8]。

1.2差异表达基因筛选 采用R语言软件中的limma程序包,首先对所得到的全部数据进行标准化处理;其次,对比两组胶质母细胞瘤干细胞样本和正常成人神经干细胞样本得到的基因数据,并从这批数据中寻找差异有统计学意义的差异表达基因。判定标准为|log2(FC)|>1及校正后P<0.05。

1.3差异表达基因的功能富集分析 使用基因本体论(GO)富集分析和京都基因和基因组百科全书(KEGG)通路分析方法预测潜在功能及信号通路。

1.4蛋白质-蛋白质相互作用(PPI)网络构建及差异基因筛选 在STRING在线数据库(https://string-db.org/)中,对筛选出的差异基因所编码的蛋白进行PPI网络构建,筛选combined score>0.4的相互作用蛋白。使用Cytoscape软件分析PPI结果,采用Degree算法和Cytohubba插件,得到评分最高的前10位差异基因。

1.5差异基因的批量生存分析 利用癌症基因图谱(TCGA)数据库检索到666例胶质母细胞瘤患者的转录组测序结果及其临床数据资料。根据基因表达水平差异,将筛选出的差异基因分为高、低表达组。

1.6免疫浸润分析 使用R GSVA程序包中提供的 ssGSEA 算法,通过识别24种免疫细胞标志物[9],评估胶质母细胞瘤组织的免疫细胞浸润情况。结果采用“ggplot2”进行可视化,所有分析和可视化均在 R 4.2.1 中进行。

1.7统计学处理 采用Graphpad Prism 8.4统计软件进行数据分析。采用R语言软件中的ggplot和pheatmap程序包绘制差异表达基因的火山图及热图,采用ClusterProfiler程序包进行基因富集的分析及绘制图谱,两组比较采用t检验,多组间比较采用方差分析。使用R语言软件中的pROC程序包进行受试者工作特征(ROC)曲线分析,分析各差异基因诊断胶质母细胞瘤的曲线下面积(AUC)。分析结果用ggplot2进行可视化。绘制Kaplan-Meier生存分析曲线,比较两组患者生存率的差异并计算风险比(HR),Kaplan-Meier曲线的P和HR(95%CI)通过Log-rank检验和单变量COX回归分析得出。以P<0.05为差异有统计学意义。

2 结 果

2.1差异基因的筛选结果 选取GSE31262数据集为分析对象,分析5个成人神经干细胞个体样本和9个胶质母细胞瘤干细胞个体样本,从上述样本中的全部基因中筛选出|log2(FC)|>1的差异表达基因2 692个,其中表达上调1 182个、表达下调1 510个。差异基因火山图及聚类热图结果见图1。

注:A为差异基因火山图;●代表上调基因,●代表下调基因,●为无差异基因;B为差异基因聚类热图;蓝色为下调基因,红色为上调基因,G1为胶质母细胞瘤干细胞样本,G2为正常成人神经干细胞。图1 差异基因的筛选结果

2.2差异基因的GO富集分析和KEGG通路分析结果 筛选出的上调、下调差异表达基因的相关功能分析结果见图2。KEGG通路分析结果显示,筛选到的差异表达基因主要参与细胞内吞作用、溶酶体、MAPK信号通路、细胞周期、人乳头瘤病毒感染、人类免疫缺陷病毒感染等;GO富集分析结果显示,差异表达基因主要涉及细胞器裂变、核分裂、胚胎器官发育、染色体分离、轴突生成、胶质细胞再生、蛋白质定位于细胞外围等。

注:A为KEGG通路分析;B为GO富集分析。图2 差异基因的KEGG通路分析和GO富集分析结果

2.3差异基因蛋白网络分析 采用STRING在线数据库构建PPI网络,对528个|log2(FC)|大于2的上调基因进行STRING蛋白质关系分析,利用PPI网络筛选出差异基因,评分居前10位的差异基因主要包括CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2和ASPM。见图3。

注:A为差异表达基因编码蛋白的PPI网络;B为评分最高的前10位差异基因。图3 差异基因编码蛋白的PPI网络及差异基因的筛选

2.4生存分析 根据基因表达水平差异,将筛选出的10个差异基因分为高、低表达组,比较两组患者生存率的差异,结果显示,上述差异基因均与疾病预后相关(P<0.000 1),见表1。10个差异基因表达水平越高,HR越大,胶质母细胞瘤患者预后越差;其中,CCNA2基因预测胶质母细胞瘤患者预后的HR最大,为5.563 4(4.073 7,7.598 0),差异有统计学意义(P<0.000 1)。

表1 差异基因表达水平与患者预后的关系

2.5免疫浸润分析 本研究使用ssGSEA 算法探索了胶质母细胞瘤组织的24种免疫细胞浸润水平和10个hub基因的表达水平之间的关系。Th2细胞的浸润水平与10个基因的表达呈明显正相关,巨噬细胞与RRM2的表达呈负相关,与其他9个基因的表达呈明显正相关。肥大细胞与ASPM、BUB1、CDK1、CCNA2、CCNB2、CHEK1、KIF11、TOP2A、RRM2的表达呈明显负相关(|R|>0.2)。树突状细胞与除RRM2外的其他9个基因呈明显负相关(|R|>0.2)。见图4。

注:A~J分别为ASPM、BUB1、CCNB2、CCNB1、CCNA2、CDK1、CHEK1、KIF11、RRM2、TOP2A基因表达相关性分析;*P<0.05;**P<0.01;***P<0.001。图4 胶质母细胞瘤组织的24种免疫细胞浸润水平与10个差异基因表达水平之间的关系

2.6ROC曲线分析 ROC曲线分析结果显示,10个基因诊断胶质母细胞瘤的AUC及95%CI如下:CDK1,0.944(95%CI:0.910~0.978);CCNB1,0.918(95%CI:0.827~1.000);CCNA2,0.904(95%CI:0.841~0.968);BUB1,0.966(95%CI:0.936~0.997);KIF11,0.952(95%CI:0.924~0.980);TOP2A,0.971(95%CI:0.952~0.989);CCNB,20.918(95%CI:0.827~1.000);CHEK1,0.936(95%CI:0.874~0.998);RRM2,0.834(95%CI:0.734~0.934);ASPM,0.905(95%CI:0.858~0.952)。这提示10个基因在胶质母细胞瘤中均有较高的诊断价值。

3 讨 论

现有研究表明约30%左右的脑肿瘤为神经胶质瘤,占恶性中枢神经系统肿瘤的80%[10]。其中,胶质母细胞瘤是最为常见的脑胶质瘤类型,是所有肿瘤中预后最差的类型之一。胶质母细胞瘤的发病机制较为复杂,多数研究针对多种胶质母细胞瘤相关基因进行了研究[11]。然而,胶质母细胞瘤发生的确切机制、表观遗传特征及基因分子特征仍未阐明。随着生物信息学技术的持续发展,通过多种富集分析方法筛选疾病差异基因信息逐渐成为寻找疾病诊断和治疗靶点的新思路[12]。

本研究选取GSE31262基因表达谱数据集作为分析对象,分析了5个成人神经干细胞个体样本和9个胶质母细胞瘤干细胞个体样本,从中筛选出了2692个差异表达基因。通过对这些差异基因进行KEGG通路分析,本研究发现上述差异基因主要参与细胞内吞作用、溶酶体、MAPK信号通路、细胞周期、人乳头瘤病毒感染、人类免疫缺陷病毒感染等。GO富集分析显示这些差异表达基因主要涉及细胞器裂变、核分裂、胚胎器官发育、染色体分离、轴突生成、胶质细胞再生、蛋白质定位于细胞外围等。其次,本研究采用Cytoscape软件分析所得到的各个差异基因之间的关系,并筛选出了可能在胶质母细胞瘤发生发展中发挥关键作用的10个差异基因(CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2、ASPM)。进一步在TCGA数据库中分析上述10个差异基因的表达水平与胶质母细胞瘤患者预后的关系,结果显示,上述10个差异基因均与患者预后有关(P<0.000 1)。与低表达组患者比较,高表达组患者的风险比明显升高,临床预后较差。其中,CCNA2基因预示胶质母细胞瘤患者预后的风险比值最高,该结果提示CCNA2基因可能与胶质母细胞瘤患者预后的关系最为密切。

CCNA2基因定位于人染色体4号染色体,q27区,全长7 489 bp,在人体多种器官组织中表达[13]。GAO等[14]研究发现,CCNA2基因在多种肿瘤中表达上调,SAVIRANTA等[15]研究显示CCNA2基因在癌症转化和进展中发挥关键作用。然而,目前鲜有研究表明CCNA2基因与胶质母细胞瘤患者的不良预后有直接关系。本研究通过生物信息学分析发现,CCNA2基因是胶质母细胞瘤PPI信号通路中的差异基因之一,并与胶质母细胞瘤患者的预后相关。目前,有研究发现,CCNA2基因具有促进胶质母细胞瘤细胞增殖、迁移和侵袭的作用[16]。这提示CCNA2基因在胶质母细胞瘤的发生发展中可能发挥重要作用,为CCNA2与胶质母细胞瘤预后相关提供了理论依据,其更深的潜在机制值得进一步探索。

此外,本研究进一步分析了胶质母细胞瘤组织的24种免疫细胞浸润水平和10个hub基因的表达水平之间的关系,为其在胶质母细胞瘤发生发展中的具体作用和机制提供思路。本研究ROC曲线分析也进一步证实了这10个基因在胶质母细胞瘤中的诊断价值。

综上所述,本研究利用GEO数据库筛选出10个与胶质母细胞瘤密切相关的基因,对其进行深入研究可能有助于进一步阐释胶质母细胞瘤发生、发展的机制,并且10个差异基因有望成为评估胶质母细胞瘤患者诊断和预后的新的标志物。然而,本研究也存在一些局限性,如尚未深入的分子生物学研究验证上述发现。因此,未来研究方向为进一步扩充胶质母细胞瘤样本库,深入分析上述差异基因与疾病进展的关系。

猜你喜欢

差异基因母细胞胶质
成人幕上髓母细胞瘤1例误诊分析
顶骨炎性肌纤维母细胞瘤一例
人类星形胶质细胞和NG2胶质细胞的特性
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
髓外硬膜内软骨母细胞瘤1例
预防小儿母细胞瘤,10个细节别忽视
紫檀芪处理对酿酒酵母基因组表达变化的影响
视网膜小胶质细胞的研究进展
侧脑室内罕见胶质肉瘤一例
SSH技术在丝状真菌功能基因筛选中的应用