基于数据挖掘分析FAM64A在肺腺癌中的表达模式和作用机制
2023-01-07庞倩蒙绪君肖钦晓
庞倩,蒙绪君,肖钦晓
(1.海南博鳌超级医院 呼吸内科,海南 琼海 571437; 2.琼海市人民医院 呼吸内科,海南 琼海 571499)
肺癌是全球癌症相关死亡的主要原因,具有复发率高、早期诊断困难和预后差等特点[1]。作为非小细胞肺癌 (non-small cell lung cancer) 的一员,肺腺癌(lung adenocarcinoma,LUAD) 占所有肺癌病例的约 40%[2]。目前LUAD的主要治疗方式是手术切除、化疗、放疗等,但这些治疗手段在提高患者生存率方面存在局限性[3-4]。因此,迫切需要探索肺癌的致癌作用和治疗方法。靶向治疗是目前最有希望的肿瘤治疗选择之一,新型靶向生物标志物的探索是LUAD研究的重点及难点。
FAM64A (family with sequence similarity 64 member A)定位于19号染色体,具有10个外显子区域,主要分布于胸腺、脾脏和结肠中[5]。早期研究发现FAM64A 可以控制细胞分裂过程中中期到后期的转变,促进细胞增殖,显示了其在癌细胞生长中的作用[6]。有研究人员发现FAM64A蛋白在淋巴瘤、白血病等血液系统肿瘤中高度表达[7]。其次,Jiang等[8]已经证明 FAM64A 可以通过激活 NF-κB 信号来促进乳腺癌的侵袭性。此外,Jiao等[9]报道高表达FAM64A可被视为胰腺癌预后较差的独立危险因素。Jiang等[10]证实,FAM64A可通过调节细胞周期相关标志物进而促进胆管癌细胞的侵袭性发育。Wang等[11]发现胶质瘤组织中FAM64A的表达高于正常脑组织,进一步分析发现FAM64A的过表达增加了细胞周期蛋白 D1、细胞周期蛋白 E、波形蛋白、基质金属蛋白酶 (MMP)-2 和 MMP-9 的表达,但降低了 E-钙黏蛋白的表达。尽管相关研究显示了FAM64A在癌症发生发展中的潜力,但尚未见报道其在LUAD中的表达、预后和潜在的作用机制。随着高通量测序技术的发展和生物学信息方法的应用,我们可以对现有的公开可获取的肿瘤学数据资源进行二次挖掘,以探索FAM64A在LUAD中的表达和作用机制,希望能为后续进行实验验证提供理论依据。
1 材料与方法
1.1 TIMER数据库
TIMER网络服务器是一个用户友好的数据平台,可用于系统地分析不同类型癌症的免疫细胞浸润。此外,TIMER网络服务器允许用户输入特定功能的参数,并动态显示所得到的数字,以方便获取肿瘤的免疫学、临床和基因组学特征[12]。本研究利用TIMER数据库的“Diff Exp”模块探索FAM64A在正常组织和肿瘤组织中的表达差异。
1.2 基因表达谱交互式分析(gene expression profiling interactive analysis,GEPIA)数据库
GEPIA数据库含来自TCGA 和 GTEx 项目的9 736个肿 瘤和8 587个正常样本的 RNA 测序表达数据[13]。通过GEPIA数据库的“Expression DIY”模块分析FAM64A在LUAD中的表达以及FAM64A表达与LUAD临床分期的相关性。
1.3 UALCAN数据库
UALCAN 是一个综合的、用户友好的、交互式的网络资源,用于分析癌症 OMICS 数据。该数据库旨在提供对公开可用的癌症 OMICS 数据(TCGA、MET500 和 CPTAC)的访问和分析[14]。本研究利用UALCAN数据库进一步分析FAM64A表达与LUAD临床分期的相关性。
1.4 Kaplan-Meier Plotter
使用在线数据库Kaplan-Meier Plotter评估FAM64A在LUAD中的预后预测价值,该数据包含基因表达数据和多种人类恶性肿瘤患者的生存数据[15]。为了分析LUAD的OS、RFS,我们将患者样本按最佳截取值分成高表达和低表达组,利用 Kaplan-Meier Plotter生成生存曲线以分析FAM64A在LUAD中的预后预测意义。
1.5 cBioPortal数据库
cBioPortal(www.cbioportal.org)是一个全面的网络资源,可以可视化和分析多维的癌症基因组学数据[16]。本研究基于TCGA-LUAD数据集,从cBioPortal获得了FAM64A的基因改变类型和和突变频率。
1.6 相互作用网络的构建
GeneMANIA (http:∥genemania.org) 是一个开放的、用户友好的在线数据库,在该数据库中提交一个基因, GeneMANIA会使用大量基因组学和蛋白质组学数据查找功能相似的基因并生成基因互作网络图[17]。STRING 数据库旨在收集、评分和整合所有公开可用的蛋白质-蛋白质相互作用信息来源,并通过计算预测来补充这些信息。其目标是实现一个全面客观的蛋白互作网络[18]。本研究分别利用GEMEMANIA和STRING数据库构建FAM64A的基因互作网络和蛋白互作网络。韦恩图在线工具(http:∥bioinformatics.psb.ugent.be/webtools/Venn/)用于获取两个网络中的交集基因。
1.7 LinkedOmics数据库
LinkedOmics数据库是一个基于网络的平台,可用于分析32个TCGA癌症相关的多维数据集[19]。本研究中,FAM64A的共表达使用Pearson相关系数进行统计分析,以火山图和热图的形式呈现。使用LinkedOmics的功能模块并通过基因集富集分析(GSEA)对共表达基因所参与的KEGG通路进行探索,设置参数为FDR<0.05。
2 结 果
2.1 FAM64A在LUAD中显著高表达
TIMER数据库分析显示,与正常组织相比,FAM64A在膀胱癌、乳腺癌、胆管癌、结直肠癌、食管癌、头颈部鳞状细胞癌、肾嫌色细胞癌、肾透明细胞癌、乳头状肾细胞癌、肝细胞癌、LUAD、肺鳞癌、前列腺癌、胃癌、甲状腺癌和子宫内膜癌中显著高表达(图1A)。GEPIA数据库进一步分析显示,与正常组织相比,FAM64A在膀胱癌、乳腺癌、宫颈癌、结直肠癌、食管癌、胶质母细胞瘤、头颈部鳞状细胞癌、低级别胶质瘤、LUAD、肺鳞癌、卵巢癌、胰腺癌、皮肤黑色素瘤、胃癌、睾丸癌、胸腺癌、子宫内膜癌和子宫肉瘤显著高表达(图1B)。图1C表达柱状图显示,与正常肺组织相比,FAM64A在LUAD中显著高表达。
A.与正常组织相比,FAM64A在多数恶性肿瘤组织中显著高表达(TIMER数据库);B. 与正常组织相比,FAM64A在多数恶性肿瘤组织中显著高表达(GEPIA数据库);C.与正常组织相比,FAM64A在LUAD中显著高表达(GEPIA数据库)图1 FAM6A4在肿瘤组织和正常组织中的表达差异A.Compared with normal tissues, FAM64A was significantly higher in most malignant tumor tissues (TIMER database); B. Compared with normal tissues, FAM64A was significantly high expression in most malignant tumor tissues(GEPIA database); C. Compared with normal tissue, FAM64A was significantly high expression in lung adenocarcinoma (GEPIA database)Fig 1 The expression difference of FAM6A4 in tumor tissues and normal tissues
2.2 FAM64A表达与LUAD临床分期以及预后的关系
为了分析FAM64A在LUAD中的临床意义,我们利用GEPIA和UALCAN数据库探索FAM64A表达与LUAD临床分期的关系,结果如图2A、B所示,随着FAM64A表达量的升高,LUAD分期越晚。此外,我们还分析FAM64A表达对LUAD患者的预后影响,通过Kaplan-Meier 数据库绘制了生存曲线以评估FAM64A对LUAD患者5年总体生存率和无复发生存率的影响。研究结果显示,FAM64A高表达组患者的总体生存率明显低于低表达组患者(图2C)。此外,FAM64A高表达组患者同样表现出了较差的无复发生存率(图2D)。以上研究结果提示,FAM64A高表达与LUAD患着的不良临床结局有关。
A、B.FAM64A表达越高,LUAD患者的临床分期越晚;C、D.与FAM64A低表达组LUAD患者相比,高表达组患者的总体生存率和无复发生存率明显较低图2 FAM6A4高表达在LUAD中的临床意义A、B. The higher the FAM64A expression, the later the clinical stage of lung adenocarcinoma patients; C、D. The overall survival and recurrence-free survival rates of patients in the high expression group were significantly worse compared to those in the low FAM64A expression group of lung adenocarcinoma patientsFig 2 The clinical significance of FAM6A4 lung adenocarcinoma
2.3 FAM64A在LUAD中的遗传突变分析
为了研究FAM64A在LUAD中异常表达的原因,我们从遗传突变和基因甲基化方面进行探索。首先cBioPortal数据库显示,FAM64A在LUAD中发生了7.39%的突变(图3A),其中包括mRNA High(5.65%)和Deep Deletion(1.74%)两种突变类型(图3B)。接着我们评估了突变组和非突变组之间的总体生存率,结果显示两者差异无统计学意义(图3C)。
A.FAM64A在LUAD中的遗传突变频率为7.39%;B.FAM64A在LUAD中的两种突变类型分别为mRNA High(5.65%)和Deep Deletion(1.74%);C.生存分析显示,突变组和非突变组之间总体生存率未见差异图3 FAM6A4在LUAD中的遗传突变A. The genetic mutation frequency of FAM64A in lung adenocarcinoma is 7.39%; B. The two mutation types of FAM64A in lung adenocarcinoma are mRNA High (5.65%) and Deep Deletion (1.74%); C. Survival analysis showed that there was no difference in overall survival between the mutant group and the non-mutant groupFig 3 Genetic mutations of FAM6A4 in lung adenocarcinoma
2.4 FAM64A基因互作网络和蛋白互作网络的构建
利用GEMEMANIA和STRING数据库构建了FAM64A的基因和蛋白互作网络,我们发现在基因水平FAM64A主要与PICALM、TDRD7、RBBP7、RBBP4、MTA2、HDAC2、SAPCD2、KIF15、CDT1、HDAC1、PRNP、PHF19、TYMS、ZYG11B、CCNE1、BUB1、UBASH3B、SPC24、BLM和TACC3存在相互联系(图4A)。而在蛋白质互作网络中,FAM64A主要与ASPM、AURKB、BIRC5、BUB1、CCNA2、CCNB2、CDC20、CDCA8、CENPA、CENPF、CEP55、DLGAP5、HJURP、KIF20A、KIF2C、NCAPG、SPAG5、TPX2、TROAP和UBE2C存在相互联系(图4B)。取以上相互作用网络靶点的交集发现,在基因互作网络和蛋白互作网络中FAM64A均与BUB1存在相互作用(图4C)。
A.FAM64A基因互作网络的构建;B.FAM64A蛋白互作网络的构建;C.韦恩图显示FAM64A可能与BUB1存在相互作用关系图4 FAM64A相互作用网络的构建A.Construction of FAM64A gene interaction network;B.Construction of the FAM64A protein interaction network;C. Venn diagram showed that FAM64A might interact with BUBFig 4 Construction of FAM64A interaction network
2.5 FAM64A的共表达分析和功能富集分析
本研究利用LinkedOmics数据库的LinkFinder模块用于获取FAM64A的相关性基因,结果显示有7 139个基因与FAM64A存在负相关关系,有6 233个基因与FAM64A存在正相关关系(图5A)。图5B、C分别显示与FAM64A存在正、负相关关系的前50个基因。其次,我们利用LinkedOmics数据库的Linkinterpreter模块分析FAM64A及其相关基因可能参与的信号通路,结果如图5D所示,FAM64A及其相关基因主要参与细胞周期、DNA复制、RNA转运、同源重组、P53信号通路、氧化磷酸化等信号通路。
A.共表达基因火山图;B、C.与FAM64A存在正、负相关的前50个基因;D.FAM64A及其共表达基因的京都基因与基因组百科全书图5 FAM64A在LUAD中的共表达分析和功能富集分析A.Volcano map of co-expressed genes; B-C. The top 50 genes that are positively and negatively related to FAM64A; D. Kyoto Gene and Genome Encyclopedia for FAM64A and its co-expressed genesFig 5 Co-expression analysis and functional enrichment analysis of FAM64A in lung adenocarcinoma
3 讨 论
肺癌是人类的主要死因,其中,LUAD是肺癌最常见的亚型。尽管包括免疫疗法、放射疗法和无创手术切除在内的多模式治疗策略在近几十年来取得了很大进展,但LUAD患者的临床结局仍然不尽如人意,5年相对总体生存率仅为18%[1,4]。基于近年来新兴的“精准医学”概念,分子病理学检测方法和靶向治疗的改进显着提高了LUAD患者的总生存期[20-21]。然而,由于跨越一系列不同生物学和临床行为的不利因素的组合以及对抗肺癌药物的耐药性的增加,现有的靶向药物显示出不令人满意的疗效[22-23]。因此,有必要为LUAD患者的分子病理学诊断和预后预测寻找更有效的指标。本研究基于数据挖掘探讨FAM64A作为LUAD靶向生物标志物的可能性,希望能为后续进行进一步实验研究提供理论依据。
本研究中我们分析了 FAM64A在人类恶性肿瘤的表达模式,结果发现FAM6A4在包括LUAD在内的多种人类恶性肿瘤中显著高表达;其次我们发现FAM64A高表达与LUAD患者的不良临床结局有关,FAM64A表达水平越高,患者分期越晚、预后越差。这些研究结果提示FAM64A在LUAD中可能充当癌基因的角色。接着本研究试图从遗传学角度分析FAM64A突变在LUAD中的作用,结果发现FAM64A仅仅在少数LUAD患者中发生遗传突变,且突变组和非突变组之间并未发现生存差异。提示遗传突变可能不是FAM64A在LUAD中高表达的原因。然后我们在基因水平和蛋白水平分别构建了FAM64A的相互作用关系网络,发现FAM64A可能与BUB1存在功能联系。多域蛋白激酶 BUB1是纺锤体组装有丝分裂检查点的核心组成部分,在控制细胞染色体分离中发挥着关键的作用[24]。Zhu等[25]报道BUB1可通过激活SMAD2磷酸化进而促进肝癌细胞增殖。Piao等[26]发现BUB1高表达预示胰腺导管腺癌预后不良。这些发现表明,FAM64A可能与BUB1相互作用进而促进LUAD的发生发展。最后,我们获取了FAM64A的共表达基因并对其进行功能分析,以探索FAM64A在LUAD中的潜在作用机制。结果显示FAM64A及其相关基因参与细胞周期、DNA复制、RNA转运、同源重组、P53信号通路、氧化磷酸化等信号通路。这些信号通路在癌症进展中的作用早已得到广泛证实。例如,DNA 复制确保细胞遗传信息被准确复制并正确传递给后代细胞。然而,DNA复制在体内各种压力下容易受到干扰和破坏,导致DNA复制停滞,影响基因组稳定性,甚至诱发细胞凋亡、坏死和癌变[27-28]。p53是一种与DNA特异性结合的转录因子。它可以调节特定基因的表达,诱导细胞周期暂停、DNA修复和细胞凋亡[29-30]。因此,上述结果表明FAM64A通过上述信号通路促进LUAD发生发展并导致LUAD患者的生存率降低,即FAM64A具有作为LUAD新型治疗靶点和预后标志物的潜能。
然而,我们的研究仍然存在一些局限性。首先,本研究是一项回顾性研究,样本量较少,分析偏倚无法避免。其次,本研究缺乏FAM64A在LUAD中的蛋白组学证据,未能在蛋白质水平证实FAM64A在LUAD中的表达。此外,本研究所得结果均来自公开数据库,应通过基础研究和临床试验进一步证实 FAM64A在LUAD中的表达、临床意义以及潜在的调控机制。