APP下载

基于生物信息学鉴定头颈鳞癌预后关键基因

2024-04-11温凌杜张夏睿

医学理论与实践 2024年7期
关键词:生存期关键阈值

温凌杜 张夏睿

1 温德口腔医院,广东省深圳市 518000; 2 宝安中医院口腔科

头颈癌是第七大常见癌症,其中约90%为鳞状细胞癌(Head and neck squamous cell carcinoma,HNSCC)。仅2020一年中全球头颈癌新发病例就高达93万余例,且由于复发和转移的高发生率导致患者的总体生存率依然较低[1]。可见居高不下的发病率及未见明显改善的生存率成为目前研究亟须解决的问题,同时也凸显了发现稳定的预后生物标志物或治疗靶点以改善HNSCC临床诊疗的迫切需求。

本研究使用生物信息学方法筛选GEO中HNSCC和癌旁样本间的差异表达基因(Differentially expressed genes,DEGs),富集分析和建立的蛋白质—蛋白质相互作用(Protein-protein interaction,PPI)网络初步揭示了HNSCC中分子间的调控机制。进一步挖掘PPI网络中预后相关的关键基因,除通过GEPIA、TCGA再次验证外,也对既往研究尚未明确的与HNSCC预后相关的关键基因行临床病理特征分析,期望可为HNSCC的诊疗提供新的生物标志物。

1 材料与方法

1.1 GEO中HNSCC DEGs的筛选 在GEO中以“HNSCC,series,expression profiling by array,homo sapiens”为检索条件获得GSE6631、GSE58911和GSE107591 微阵列数据集。GEO2R以|logFC|>1(Fold change, FC)和FDR<0.05(False discovery rate, FDR)作为具有统计学意义的阈值(以下简称阈值)逐一筛选出3个数据集中HNSCC和癌旁样本间的DEGs。进一步鉴定出三者间交叉的DEGs待后续分析。

1.2 DAVID中DEGs的富集分析 在DAVID中以FDR<0.05为阈值分别行DEGs的分子功能(Molecular function,MF)、细胞成分(Cellular component,CC)、生物过程(Biological process,BP)和通路的生物学富集分析。

1.3 STRING中DEGs PPI网络的构建和关键基因的筛选 在STRING中以interaction score≥0.4为阈值构建DEGs的PPI网络,Cytoscape(v3.8.0)行可视化处理。Cytoscape MCODE(v1.6.1)插件以“degree cutoff=2,max.depth=100,k-core=2,node score cutoff=0.2”为条件对DEGs的PPI网络进行聚类,筛选出中央节点作为关键基因待后续分析。

1.4 GEPIA中关键基因的初次验证和预后分析 在GEPIA中以“HNSCC,gene name”为条件对关键基因在HNSCC和癌旁样本中的差异表达行初次验证。Kaplan-Meier生存分析明确HNSCC中关键基因的表达与患者总生存期(Overall survival,OS)的相关性。筛选出HNSCC中预后相关的关键基因待后续分析。

1.5 TCGA中PLAU的再次验证和临床病例特征的相关性分析 TCGA中检索并整理HNSCC和癌旁样本的PLAU表达数据以及HNSCC患者的临床病理数据。R(v3.6.0)limma包行差异表达分析再次验证PLAU的表达,R wilcox.test和kruskal.test函数对HNSCC样本中PLAU的表达与患者的临床病理特征行相关性分析。

1.6 统计学方法 应用R语言完成统计分析,除文中特殊说明的阈值外,其余均以P<0.05为差异具有统计学意义。

2 结果

2.1 GEO中 HNSCC DEGs的筛选 从GSE6631、GSE58911和 GSE107591中共纳入61例HNSCC和60例癌旁样本,GEO2R分别筛选出168、599和484个DEGs(|logFC|>1和FDR<0.05),鉴定出71个三者交叉的DEGs待后续分析,其中29个上调(MMP1、TNC、SPP1、SERPINH1、SERPINE1、SEMA3C、RBP1、PTHLH、POSTN、PLAU、MMP9、MMP3、MMP13、MMP12、MMP10、LUM、LAMC2、LAMB3、IGF2BP3、FN1、FAP、DFNA5、CXCL8、COL6A3、COL5A2、COL4A2、COL4A1、COL3A1、COL1A1)和42个下调(TGM3、SPINK5、SLURP1、SERPINB1、SCNN1A、SCEL、SASH1、RRAGD、PTN、PPP1R3C、PPL、PGD、NUCB2、MGLL、MAL、LPIN1、KRT4、KRT13、HPGD、HOPX、GPD1L、EXPH5、ENDOU、EMP1、ECM1、DPT、CRYAB、CRISP3、CFD、CEACAM6、CEACAM5、CEACAM1、CD24、BLNK、BARX2、AQP3、APOD、ALOX12、ALDH3A1、ADH7、ACPP、ABLIM1)。

2.2 DAVID中DEGs的富集分析 在DAVID中对71个DEGs行富集分析。结果显示(FDR<0.05),BP中DEGs多富集在细胞外基质组织、细胞黏附和胶原蛋白分解过程等;CC中DEGs多富集在细胞外间隙、细胞外泌体和胞外区等;MF中DEGs多富集在丝氨酸型内肽酶活性、金属内肽酶活性和细胞外基质结构成分等;通路中DEGs多富集在ECM-受体相互作用、PI3K-Akt和癌症等通路。

2.3 STRING中DEGs PPI网络的构建和关键基因的筛选 将71个DEGs导入STRING中,去除无相互作用的DEGs后构建的PPI网络(见图1)包括56个节点和193个连线(interaction score≥0.4)。

图1 DEGs PPI网络的构建与关键基因的筛选

Cytoscape MCODE插件筛选出15个中央节点DEGs(SERPINH1、SERPINE1、SPP1、MMP1、PLAU、MMP13、LUM、MMP3、MMP9、CXCL8、COL4A1、COL4A2、MMP10、COL5A2、COL6A3)作为关键基因待后续分析(见图2)。

图2 关键基因的筛选

2.4 GEPIA中关键基因的初次验证和预后分析 通过GEPIA在519个HNSCC和44个癌旁样本间验证15个关键基因的表达。结果显示(图3展示了其中5个),与癌旁样本相比15个关键基因在HNSCC中均表达上调(P<0.05),验证了GEO中数据分析的结果。15个关键基因的Kaplan-Meier生存分析结果显示(见图4),在HNSCC中仅有5个(SERPINH1、SERPINE1、SPP1、MMP1、PLAU)关键基因的表达与OS相关(P<0.05)。

图3 GEPIA中关键基因的差异表达分析

图4 GEPIA中5个关键基因的生存分析

2.5 TCGA中PLAU的再次验证和临床病例特征的相关性分析 通过TCGA中330个HNSCC和32个癌旁样本验证PLAU的表达。结果无论组间分析或成对分析PLAU均在HNSCC中表达上调(P<0.05,见图5a~b),与GEPIA和GEO的数据分析结果一致。进一步与临床病理特征的相关性分析显示(见图5c~d),HNSCC患者中PLAU的表达水平与患者的组织分化程度和颈部淋巴结转移相关(P<0.05)。

图5 TCGA中PLAU的表达及与临床病理相关性分析

3 讨论

本研究基于生物信息学分析GEO、DAVID、STRING、GEPIA和TCGA数据库,多次对数据分析结果验证后鉴定出5个表达上调的DEGs(SERPINH1、SERPINE1、SPP1、MMP1、PLAU)可作为HNSCC患者预后相关的关键基因。

SERPINH1可调节细胞外基质蛋白和纤维连接蛋白的表达,其发生功能障碍后可刺激细胞外基质蛋白的异常表达从而促进上皮间充质转化[2]。Wang等[3]通过泛癌数据分析同样发现SERPINH1的异常高表达显著降低了包括HNSCC在内的11种癌症的总生存期、疾病特异性生存期和无进展间期。另有实验研究也支持了本研究的结果,发现SERPINH1的表达在OSCC中显著上调,沉默其表达可抑制OSCC细胞的增殖和转移,同时还受到miR-29c的调节[4]。SERPINE1在癌症进展中参与增殖信号维持、血管生成和抵抗肿瘤死亡等重要过程[5]。Minemur等[6]研究表明,在HNSCC的全基因组表达谱中SERPINE1表达上调是HNSCC中的常见事件,其异常高表达可增强HNSCC细胞的迁移和侵袭以及向淋巴结和肺的转移播散,因此导致高表达的HNSCC患者生存期较短。此研究与本文的研究结果均表明了SERPINE1具有成为对HNSCC患者进行预后风险分层的新型预测分子的可能性。SPP1被发现在多种癌症中异常高表达,如SPP1可通过介导Smad4/PTEN通路参与前列腺癌的复发和转移[7],以及抑制SPP1表达可激活ERK1/2通路来抑制食管鳞癌细胞的增殖和迁移[8]。在HNSCC中Liu等[9]研究发现SPP1的异常高表达与患者的生存期呈负相关,这与本研究结果一致。进一步的机制研究发现其过表达同样也影响HNSCC细胞的增殖、迁移、侵袭和存活并抑制凋亡,此外KRAS/MEK通路的激活有助于SPP1诱导的HNSCC恶性进展和对西妥昔单抗的耐药性,可见其在预后预测和治疗靶点中拥有重要价值。

MMP1通过降解细胞外基质的成分来促进恶性肿瘤的侵袭和转移[10]。Liu等[11]已研究表明MMP1可增强HNSCC细胞的转移能力,其表达上调与预后不良相关。PLAU和MMP1在恶性肿瘤中发挥相似的作用,两者与OSCC中的细胞外基质、细胞间黏附和胶原分解代谢有关,表现出高度的关联性[12]。但在查阅国内既往文献中发现仅少数学者同样经数据分析发现PLAU在HNSCC中的差异表达[13],但未对PLAU的临床意义进行分析。本研究结果表明,HNSCC中PLAU呈高表达,使GEO、GEPIA和TCGA分析的结果得到验证,并且还与患者的组织分化程度和颈部淋巴结转移相关。

综上所述,本研究通过对多个数据库行生物信息学分析鉴定出HNSCC中SERPINH1、SERPINE1、SPP1、MMP1和PLAU这5个表达上调且预后相关的DEGs。此分析提供了一个新的角度来鉴定HNSCC中的潜在标志物,但还需深入研究来阐明其中的分子调控机制,而本文数据可为HNSCC的潜在预后生物标志物和治疗靶点的研究提供新的思路。

猜你喜欢

生存期关键阈值
高考考好是关键
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
比值遥感蚀变信息提取及阈值确定(插图)
鼻咽癌患者长期生存期的危险因素分析
室内表面平均氡析出率阈值探讨
胃癌术后患者营养状况及生存期对生存质量的影响
术中淋巴结清扫个数对胃癌3年总生存期的影响
获胜关键
健脾散结法联合化疗对56例大肠癌Ⅲ、Ⅳ期患者生存期的影响