APP下载

基于公共数据库分析头颈部鳞癌中转录因子E2F家族表达及预后意义

2023-11-16刘俊杰石逸凡周秀芝

滨州医学院学报 2023年5期
关键词:共表达细胞周期通路

刘俊杰 石逸凡 俞 玮 周秀芝

1 滨州医学院基础医学院 山东 烟台 264003;2 滨州医学院第二临床学院 山东 烟台 264003

头颈部肿瘤是起源于上呼吸道和消化道上皮细胞的全球第六大常见恶性肿瘤,约占人体所有肿瘤的5%,其中90%以上病例被归为头颈部鳞癌(head and neck squamous cell carcinoma,HNSCC)[1-2]。HNSCC因其异质性高、病变部位特殊,多数患者初诊时已处于中晚期,且临床缺乏个性化治疗,患者5年生存率较低[3-4];为改善HNSCC患者预后,亟需鉴定筛选出更多用于其早期诊断和临床预后评估的新分子标记物[5]。

转录因子E2F家族(E2Fs)在细胞周期调控和DNA合成过程中发挥重要作用,已在真核生物中鉴定出8个E2F(按发现顺序编号E2F1~E2F8)[6]。多项研究显示在人类多种恶性肿瘤中存在E2Fs的异常表达,如肝癌、胃癌、食管鳞癌等[7-9]。E2Fs的异常表达参与HNSCC的致病过程已有报道,但研究多集中于HNSCC中单个E2F的致病作用,尚缺乏应用生物信息学对HNSCC中E2Fs的系统性分析[10]。

本研究通过整合多个公共数据库数据分析E2Fs在HNSCC中mRNA表达及其与患者预后的关系,筛选E2Fs共表达基因构建基因调控网络图,深入探讨E2Fs在HNSCC发病中的作用,为HNSCC临床早期诊治和预后评估提供更多分子靶点。

1 资料与方法

1.1 数据来源 癌症基因组图谱(TCGA)(https://cancergenome.nih.gov/)是由美国国家癌症研究所和国家人类基因组研究所于2006年联合启动的癌症基因组学项目,共收录了33种癌症的20 000多个样本的多种数据。研究从TCGA数据库下载并整理HNSCC测序数据及肿瘤分期、生存状况等临床数据。共获取548例样本信息,其中HNSCC 504例,剔除20例缺失肿瘤分期样本,最终484例HNSCC纳入研究,包括G1期62例,G2期301例,G3期119例,G4期2例;癌旁组织44例。

1.2 研究方法

1.2.1 E2Fs转录水平差异表达 利用ggplot2 R包对TCGA数据库中HNSCC肿瘤及癌旁组织E2Fs转录水平(mRNA)、不同肿瘤分期中E2Fs mRNA水平进行差异分析,对表达数据进行标准化处理并进行可视化绘图,筛选标准为|log2基因差异表达倍数(FC)|>1且P<0.01。GEPIA2数据库(http://gepia2.cancer-pku.cn/)是可以分析TCGA数据的在线交互式分析工具[11]。本研究用GEPIA2数据库验证E2Fs在HNSCC及癌旁组织的mRNA差异表达。

1.2.2 E2Fs相关性分析 本研究利用ggplot2 R包对HNSCC中E2Fs成员的mRNA表达水平,进行两两Spearman相关性比较,评估E2Fs相关性并可视化绘制热图。

1.2.3 E2Fs与其共表达基因生物学功能分析 本研究分析cBioPortal数据库(http://www.cbioportal.org/)中收录的504例HNSCC样本中8个E2Fs的共表达基因,并对8个E2Fs的共表达基因进行筛选;过滤标准为P<0.05且|Spearman相关性系数|>0.6;后将共表达基因输入Sting在线数据库(https://string-db.org/)构建蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络图;后将E2Fs与其共表达基因进行标准ID转换后,用clusterProfiler R包进行富集分析,了解E2Fs与其共表达基因参与的细胞生物过程及信号通路。

1.2.4 E2Fs mRNA表达水平的预后分析 按照各个E2Fs mRNA表达值的中位数依次将TCGA来源的484例HNSCC患者分为低表达组和高表达组[12];使用survival R包对HNSCC患者进行比例风险(Cox)检验,并通过单因素和多因素Cox回归分析E2Fs及其共表达基因与HNSCC患者总生存期时间(overall survival,OS)的关系,将单因素Cox分析中P<0.1变量纳入多因素Cox分析中,使用rms包构建预后类列线图模型并进行可视化展示。

1.3 统计学方法 采用R 4.2.1软件进行统计分析。肿瘤与癌旁组织及不同肿瘤分期间E2Fs家族的差异表达的组间差异采用非参数秩和检验;通过单因素和多因素Cox回归分析E2Fs家族及其共表达基因与HNSCC患者OS的关系;采用Spearman法分析8个E2Fs的相关性;P<0.05为差异具有统计学意义。

2 结果

2.1 HNSCC中E2Fs mRNA差异表达分析 本研究通过多个数据库分析了E2Fs mRNA表达水平。相对于癌旁组织,TCGA数据库中HNSCC肿瘤组织中E2Fs显著高表达,尤其是E2F4在HNSCC中表达量最高,其次是E2F1、E2F6和E2F7(P<0.001)(图1A);研究进一步使用GEPIA2在线数据库验证了HNSCC肿瘤与癌旁组织中E2Fs表达差异,结果一致(图1C)。分析GEPIA2数据库中HNSCC肿瘤组织中E2Fs相对表达量,显示E2F4表达量最高,其次是E2F1和E2F6(图1B)。

研究进一步分析E2Fs在HNSCC不同肿瘤分期中的表达差异,结果显示,随肿瘤分期增高E2Fs表达量升高,其中E2F1、E2F5和E2F8差异最显著(P<0.05)(图2)。

A.TCGA数据库中HNSCC肿瘤与癌旁组织E2Fs mRNA表达情况,*P<0.05,***P<0.001;B.GEPIA2数据库中HNSCC肿瘤组织中E2Fs相对表达量;C. GEPIA2数据库中HNSCC肿瘤与癌旁组织中E2Fs mRNA表达情况。

图2 TCGA数据库中HNSCC不同肿瘤分期中E2Fs差异表达

2.2 HNSCC中E2Fs相关性分析 Spearman分析显示,E2Fs成员间存在正相关性,如E2F1与E2F2、E2F7,E2F2与E2F8,E2F3与E2F6、E2F7,E2F5与E2F6,E2F6与E2F7,E2F7与E2F6,E2F7与E2F8之间存在相关性(图3)。

图3 HNSCC中E2Fs间相关性热图

2.3 E2Fs与其共表达基因的功能分析

2.3.1 HNSCC中E2F家族及共表达基因的PPI相互作用 通过cBioPortal数据库共获得101个与HNSCC中8个E2Fs最相关的共表达基因,利用Sting构建蛋白PPI互相作用图显示,E2Fs家族成员之间存在相互作用(图4)。

图4 cBioPortal数据库中E2Fs及共表达基因PPI互相作用图

2.3.2 HNSCC中E2F家族及共表达基因的功能分析 通过R软件分析基因本体论(GO)的生物学过程(biological processes,BP)、细胞组分(cellular com-ponent,CC)和分子功能(molecular function,MF)显示,HNSCC中E2Fs与其共表达基因主要参与染色体DNA复制和染色体分离等生物学过程。KEGG细胞信号通路分析显示,E2Fs及其共表达基因主要通过DNA复制、细胞周期和范可尼贫血等5条信号通路影响HNSCC的发病(表1)。

表1 E2Fs与癌症相关的功能分析

2.4 E2Fs及其共表达基因mRNA表达水平的预后分析 以HNSCC患者OS为因变量,以E2Fs mRNA表达为自变量进行Cox单因素回归分析,其中分别将8个E2Fs mRNA低表达赋值为0,E2Fs高表达赋值为1。将单因素Cox分析中P<0.1的变量纳入多因素Cox回归分析中。结果显示,E2F4和E2F8的高表达与HNSCC患者预后有关,E2F4高表达患者的死亡风险是低表达患者的1.502倍,而E2F8高表达患者的死亡风险是低表达患者的0.698,二者可以作为HNSCC患者预后预测的生物标记物(P<0.05)。见表2。

表2 TCGA数据中HNSCC患者预后的单因素和多因素Cox回归分析

绘制TCGA数据库中HNSCC患者预后的列线图亦显示,E2F4高表达患者1年生存概率最低,约为0.6,其次为E2F8低表达患者,见图5。

图5 TCGA数据库中构建HNSCC患者预后列线图

3 讨论

转录因子E2Fs在多种肿瘤中异常高表达,在肿瘤致病过程中发挥重要作用[8-10,13]。本研究通过TCGA、GEPIA2和UALCAN公共数据库分析了E2Fs mRNA表达差异及其与HNSCC患者OS的关系,通过cBioPortal数据库分析了E2Fs的共表达基因及其生物学功能。结果显示HNSCC中存在E2F1、E2F4、E2F6、E2F7和E2F8的高表达,且E2F4和E2F8的表达水平与患者预后有关;E2Fs及其共表达基因主要通过DNA复制、细胞周期和范可尼贫血等5条信号通路参与细胞染色体分离和DNA复制等生物学过程。

本研究通过TCGA和GEPIA2数据库分析了HNSCC中E2Fs mRNA的表达模式。结果显示,HNSCC中8个E2Fs成员均存在异常高表达,其中E2F4表达量最高。进一步分析E2Fs与HNSCC患者OS的关系,证实E2F4和E2F8可以作为HNSCC患者预后预测的生物标记物,这也与已有的研究结果[10,14]一致。E2F4是细胞转化、增殖及细胞周期进程中的关键调节因子,其异常高表达与肿瘤患者的预后差有关,这可能与其通过PI3K-AKT和WNT信号通路参与肿瘤的发生有关[10,15]。本研究也显示E2F4高表达患者的死亡风险分别是低表达患者的1.502倍,而E2F8高表达患者的死亡风险是低表达患者的0.698倍,提示在HNSCC中E2F4与E2F8发挥不同的作用[9,16]。E2F8作为新鉴定的E2F转录因子,多项研究提示其参与组织血管生成、淋巴管生成等过程[8-9];但关于E2F4和E2F8在HNSCC肿瘤发生发展中的确切作用仍需进一步深入研究。

转录因子E2Fs是G1期、S期、G2期和M期等细胞周期调控关键检查点的重要调控因子,通过靶向调节其下游靶基因及相关信号通路参与细胞周期的调控[6,15]。Spearman相关性分析显示,E2Fs家族成员之间存在相关性,如E2F1与E2F2、E2F7,E2F2与E2F8,E2F3与E2F6、E2F7,E2F5与E2F6,E2F6与E2F7,E2F7与E2F8等,这些E2Fs及其共表达基因,主要通过DNA复制、细胞周期和范可尼贫血等5条信号通路参与HNSCC的发生发展。

本研究亦存在一定局限性:研究主要通过生物信息学方法来分析E2Fs在HNSCC中的作用,缺乏深入的分子生物学实验验证;E2Fs mRNA高表达在HNSCC预后中的价值,仍需更大、独立样本的研究证实。

本研究通过多个公共数据库系统分析E2F家族在HNSCC中的表达水平、预后价值及可能发挥的生物学功能,为临床HNSCC的早期诊治和预后评估提供了新靶标。

猜你喜欢

共表达细胞周期通路
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
膀胱癌相关lncRNA及其共表达mRNA的初步筛选与功能预测
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
中国流行株HIV-1gag-gp120与IL-2/IL-6共表达核酸疫苗质粒的构建和实验免疫研究
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
proBDNF-p75NTR通路抑制C6细胞增殖
胃癌患者癌组织HIF-1α、TGF-β共表达及其临床意义