APP下载

生信筛选肝癌患者TACE治疗效果相关基因

2023-06-09朱克云王振欣

医学研究杂志 2023年5期
关键词:差异基因关键肝癌

朱克云 张 熠 王振欣

肝癌是一种常见的消化系统肿瘤,并且是致死率最高的5种癌症中唯一一种发生率逐年递增的癌症,肝癌早期患者通常症状不明显,当患者出现明显的不适症状时,往往病情已经发展到了中晚期[1]。肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)是中晚期肝癌的首选治疗方法,通过将导管选择性或超选择性插入到肿瘤供血靶动脉后,以适当的速度注入适量的栓塞剂,使靶动脉闭塞,引起肿瘤组织的缺血坏死。使用抗癌药物或药物联合微粒、微球进行栓塞可起到化疗性栓塞的作用,但部分患者会出现预后不佳[2]。因此筛选出对TACE敏感患者对实现有效的个体化治疗具有重要意义。

本研究通过生物信息学方法筛选出TACE反应组与TACE无反应组的差异基因,富集分析出相关的基因功能和信号通路,寻找可能作为预后基因的关键基因,为肝癌TACE治疗提供新的思路。

资料与方法

1.数据来源和差异基因的筛选:GSE104580微阵列表达数据集包含来自GEO数据库,包括81例TACE有反应患者和66例TACE无反应肝癌患者肝癌组织的数据,命名为为TACE反应组和TACE无反应组。下载数据格式为MINiML。使用R软件的Limma软件包(版本:3.40.2)研究mRNA的差异表达。AdjustedP<0.05且log2FC>1或log2FC<-1定义为mRNA差异表达的筛选阈值。箱线图通过R软件包ggplot2进行绘制;差异表达热图通过R软件包pheatmap进行展示。

2.差异基因的GO和KEGG富集分析:为了更好地了解差异基因涉及的基因功能和信号通路,使用Metascape在线工具对差异基因进行GO分析KEGG通路富集分析,设置P<0.01[3]。

3.差异基因的PPI网络构建分析和关键基因的筛选:使用STRING在线数据库进行蛋白-蛋白互作(protein-protein interaction,PPI)网络构建分析,使用Cytoscape软件进行可视化分析并筛选出degree最高的10个关键基因[4,5]。

4.关键基因在肝癌的差异表达及生存期评估:使用GEPIA在线工具分析关键基因在肝癌和正常组织中的表达差异,使用Kaplan-Meier Plotter在线平台分析关键基因表达量高低与肝癌总体生存期的关联性[6,7]。使用肝细胞癌综合分子数据库HCCDB分析这10个关键基因[8]。

结 果

1.对TACE疗效不同的患者的差异基因筛选:通过对NCBI基因表达综合数据库(gene expression omnibus,GEO)进行检索,发现基因表达芯片“GSE104580”并进行分析。用R软件的Limma软件包(版本:3.40.2)对TACE反应组和非反应组HCC患者的差异基因进行筛选。共筛选出261个差异基因(P<0.01,|log2FC|>1),其中有118个上调基因,143个下调基因(图1)。

图1 基因表达芯片GSE104580的基因表达分布A.数据标准化后箱线图,行代表样本,代表样本中基因表达值;B.差异基因火山图,使用Fold change和校正后P值绘制火山图。图中的X点表示显著差异上调的基因,X点表示显著差异下调基因;C.差异基因表达热图,其中不同颜色代表在不同组中的表达趋势。由于差异基因个数较多,此处分别展示差异改变最大的50个上调基因和50个下调基因

2.GO基因功能分析和KEGG信号通路分析:为了进一步研究引起TACE效果差异可能的基因功能和信号通路,笔者对差异基因进行了富集分析。为了解决将基因按照功能进行分类的问题,研究者开发了很多基因功能注释数据库,基因本体论(gene ontology,GO)和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)在这些数据库中最为有名。利用Metascape在线分析工具对差异基因进行GO基因参与生物过程和KEGG信号通路富集分析,分别展示了富集最多的20个重要的生物过程(图2A)和信号通路(图2D),并分别对上调差异基因(图2中B、E)和下调差异基因(图2中C、F)进行了同样的分析。

图2 差异基因的GO基因功能分析和KEGG通信号路分析柱状图A~C.所有差异基因、上调差异基因、下调差异基因的GO生物过程分析;D~F.所有差异基因、上调差异基因、下调差异基因的KEGG通路分析

笔者发现GO生物过程主要富集于氧化还原酶活性、单羧酸代谢过程、小分子分解代谢过程等,上调差异基因主要富集于有丝分裂纺锤体组织、微管结合、对细菌的反应等,下调差异基因主要富集于氧化还原酶活性、单羧酸代谢过程、小分子分解代谢过程等。KEGG信号通路主要富集于化学致癌作用、胆汁分泌、甾类激素生物合成;,上调差异基因主要富集于IL-17信号通路、醚脂类代谢、氨基酸生物合成、蛋白质消化吸收、糖尿病并发症中的AGE-RAGE信号通路、HIF-1信号通路、Apelin信号通路;下调基因主要富集在化学致癌作用、胆汁分泌、甾类激素生物合成、甘氨酸、丝氨酸和苏氨酸代谢等。

3.PPI网络构建和枢纽基因鉴定:接下来笔者在STRING在线数据库预测差异表达基因之间的蛋白质相互作用,构建了PPI网络(图3A),并使用Cytoscape软件对PPI网络进行可视化分析(图3B),利用插件cytoHubba确定了PPI网络中按degree评估的前10个基因作为关键基因(图3中C、D)。结果表明,细胞色素P450家族成员2E1(CYP2E1)是degree最高的基因,degree=36,其次是细胞色素P450家族成员3A4(CYP3A4,degree=26)、2C9(CYP2C9,degree=22)、1A1(CYP1A1;degree=20)、1A2(CYP1A2,degree=20)、2A6(CYP2A6,degree=20)和Discs大同源相关蛋白5(DLGAP5,degree=20),细胞分裂周期蛋白20(CDC20,degree=18),泛素结合酶E2C(UBE2C,degree=18)、苏氨酸和酪氨酸激酶(TTK;degree=18)。这些关键基因中排名前6位的基因在TACE无反应组中都被下调,而degree后4位则上调。

图3 差异基因PPI网络构建和枢纽基因鉴定A.STRING工具生存的PPI网络;B.Cytoscape对PPI网络进行可视化分析,蓝色为下调差异基因,红色为上调差异基因,圆圈大小代表degree大小;C、D.使用Cytohubba生成的10个关键基因

4.10个关键基因的生存分析:为了研究这10个潜在关键基因的预后价值,选择Kaplan-Meier Plotter在线平台进行分析,共有364例肝癌患者可用于总体生存分析;同时使用GEPIA在线工具分析了这些关键基因在肝癌组织中与正常组织中的表达差异。笔者发现这些关键基因中在TACE无反应组下调的基因,在肿瘤组织中表达量都低于正常组织,并且与患者的总体生存呈正相关;而TACE无反应组上调的基因,在肿瘤组织中表达高于正常组织,并且与总体生存不良有关,提示这些关键基因与总体生存密切相关。使用肝细胞癌综合分子数据库HCCDB分析这10个HUB基因,这10个HUB基因在肝细胞癌中均为有效基因,CDC20、UBE2C、CYP3A4可作为肝细胞癌预后基因(图4)。

图4 关键基因的表达与肝癌总体生存期的关联及在肿瘤中的表达情况A~J.分别展示了10个关键基因表达量与肝癌总体生存期的关联(左),关键基因在肝癌组织和正常组织的表达差异(*P<0.05);K.HCCDB对关键基因的分析。差异:差异表达数据集数量,红/蓝为分别为上调/下调;预后:生存分析中有意义的数据集的数量;红色/蓝色分别表示不利/有利;肝癌/全部肿瘤:通过比较肝癌与所有肿瘤,用红色/蓝色分别表示log2FC的正/负倍变化(TCGA数据);肝癌/全部邻近组织:通过比较HCC与所有相邻样本(TCGA数据),红色/蓝色分别表示log2FC的正/负倍变化;肝癌/邻近组织:通过比较HCC与相邻样本(HCCDB数据),红色/蓝色分别表示log2FC的正/负倍变化;肝/其他正常组织:通过比较肝脏和正常组织(GTEx和TCGA数据),红色/蓝色分别表示log2FC的正/负倍变化

讨 论

我国原发性肝癌的发生率和病死率高于全球平均水平,原发性肝癌是75岁以下人群中癌症死亡的主要原因之一。在中国所有癌症中,肝癌的生存率最低,主要是因为肝癌早期诊断困难,大多数肝癌患者确诊时为中晚期,中晚期肝癌恶性程度高,进展快,治疗难度大,治疗效果通常较差[9]。根据巴塞罗那临床分期系统,TACE为治疗中晚期HCC的首选方式。TACE也可与其他治疗方法如局部消融、药物治疗等进行联合治疗从而提高治疗效果[10,11]。但TACE治疗尚存在一些问题,部分患者预后不佳,部分无响应,有时与其他治疗方法比较并无优势[12]。因此筛选TACE反应效果佳的预后基因对实现肿瘤的个体化治疗有着重要意义。

本研究通过分析GEO数据库中的基因表达芯“GSE104580”,筛选出了TACE反应组和TACE无反应组患者存在261个差异基因,其中有118个上调基因和143个下调基因。通过使用Metascape进行GO分析和KEGG通路富集分析,筛选并展示了20个最重要的GO生物过程和KEGG通路途径,并分别展示了上调差异基因和下调差异基因所富集的生物过程和通路途径,在这些生物过程和通路途径中,有一部分已经有了一些研究证据,例如碳酸氢盐瘤内注射到肝癌组织可以显著增强TACE的抗癌活性[13];IL-17低表达患者联合阿帕替尼治疗的5年总生存率更高,有助于选择可能受益于辅助TACE联合阿帕替尼的患者[14];HIF-1α积累导致假缺氧环境,导致肝癌患者对TACE治疗产生抗性[15]。接着构建绘制了PPI网络并从所有差异基因中筛选出10个关键基因,利用在线工具验证了这些基因可能的预后价值,目前这些关键基因与TACE疗效的研究尚未发现,但已有研究者提出细胞色素P450家族成员CYP2C9、CYP2A6与肝癌的总体生存和预后密切相关[16]。

综上所述,笔者基于生物信息学筛选出TACE反应组与TACE无反应组的差异基因,对这些差异基因参与的生物过程和信号通路进行了富集分析,构建了PPI网络并筛选出了关键基因,这些结果有助于判断肝癌患者行TACE治疗的预后情况,为改善治疗方法、提出新的联合治疗方法具有重要意义,具体机制及原因仍需进一步探索和研究。

猜你喜欢

差异基因关键肝癌
硝酸甘油,用对是关键
高考考好是关键
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
LCMT1在肝癌中的表达和预后的意义
紫檀芪处理对酿酒酵母基因组表达变化的影响
microRNA在肝癌发生发展及诊治中的作用
Rab27A和Rab27B在4种不同人肝癌细胞株中的表达
microRNA在肝癌诊断、治疗和预后中的作用研究进展
SSH技术在丝状真菌功能基因筛选中的应用
生意无大小,关键是怎么做?