鉴定鼻咽癌候选基因及信号通路的研究
2021-07-22郭恒臣孙永刚刘国良
郭恒臣,孙永刚,刘国良
(1.海伦市人民医院耳鼻喉科,黑龙江 海伦 152300;2. 海伦市中医院麻醉科,黑龙江 海伦 152300)
鼻咽癌(Nasopharyngeal carcinoma,NPC)是一种独特的、由鼻咽黏膜病变引起的头颈部鳞状细胞癌,多发生于咽隐窝。鼻咽癌与头颈部肿瘤具有相似的细胞或组织谱系,但其发生机制与头颈部肿瘤不同。鼻咽癌相对不常见。2018 年,全球约有129000 例鼻咽癌新发病例,占新发确诊癌症病例总数的0 ~7%[1]。鼻咽癌具有独特的发病地理格局。超过70%的鼻咽癌新发病例发生在东亚和东南亚。在中国,鼻咽癌的年龄标准化发病率为30/10 万[2]。而在美国和欧洲,鼻咽癌的年龄标准化发病率不到1/10 万[1,3]。男性鼻咽癌的发病率高于女性。鼻咽癌的发生与爱泼斯坦- 巴尔病毒(EBV)感染、遗传易感性和环境因素等多种危险因素相关[4-7]。与未分化癌相关鼻咽癌的发展需要EB 病毒(Epstein-Barr virus,EBV)的参与。鼻咽癌的发生机制一直没有得到很好的阐述。近年来,国际科研机构对肿瘤疾病进行大规模基因表达谱研究[8],获得了一定数量的肿瘤学基础研究数据。整合生物信息学方法与表达谱分析技术分析处理这些临床研究数据,可以更好地探讨鼻咽癌发生、发展的基础机制,为鼻咽癌的医学研究提供有价值的线索。
1 资料与方法
1.1 鼻咽癌基因表达数据集
从Home-GEO-NCBI 网 站(https://www.ncbi.nlm.nih.gov/geo/) 下 载 鼻 咽 癌(Nasopharyngeal carcinoma,NPC)组织Expression profiling 表达数据。实验样品由121 例样本组成(GSE12452、GPL570 实验平台的41 例样本,于2019 年3 月25 日 公 开;GSE13597、GPL96 实 验平台的28 例样本,于2018 年8 月10 日公开;GSE53819、GPL6480 实验平台的36 例样本,于2019 年8 月1 日公开;GSE64634、GPL570 实验平台的16 例样本,于2019 年3月25 日公开;合计86 例肿瘤样本,35 例对照样本)。
1.2 整合高通量功能基因表达原始数据进行分析
用Bioconductor 软件包及GEO2R/GEO query 处理四个芯片数据。用经典t检验确定差异表达基因(differentially expressed genes,DEGs),以统计学差异显著(P<0.05)和[logFC]|> 1 作为筛选标准定义DEGs[9]。
1.3 基因和信号途径富集分析
综合应用多个数据库分析候选DEGs,进行DAVID 基因注释,同时使用Kegg pathway(http://www.genome.jp/kegg)、Reactome(http://www.reactome.org)、Panther(http://www.pantherdb.org/)进行基因(GO)分析和信号通路途径富集分析[8]。
1.4 蛋白质-蛋白质相互作用网络(PPI)、模块分析和重要候选基因的整合及途径鉴定
应 用 数 据 库STRING(http ://string-db.org)、 制 图Cytoscape 软件绘制蛋白质-蛋白质相互作用网络(PPI)[10],分析鼻咽癌分析结果DEGs 的作用图谱。同时,使用蛋白作用分析器插件计算节点蛋白值。
2 结果
2.1 鼻咽癌中DEGs 的鉴定
在NCBI-GEO 免费的微阵列/ 基因谱数据库查询鼻咽 癌 组 织 芯 片(GSE12452、GSE13597、GSE53819 和GSE64634)及对照样本检测数据。分别从对应表达谱数据集中提取1374 个、1524 个、1471 个、3367 个DEGs。与对照正常组织样本相比,从四组芯片中共鉴定114 个共表达DEGs(见图1),其中包括38 个上调基因和76 个下调基因(见表1)。
图1 鉴别GSE12452、GSE13597、GSE53819 和GSE64634 中114 个DEGs
表1 同正常对照鼻咽癌组织相比,从四个数据集鉴定出114 个DEGs
2.2 鼻咽癌DEGs 的GO 分析
使用多个数据库联合进行DEGs 的GO 分析,将DEGs分为三个功能组:分子功能组、生物过程组和细胞成分组(见图2 A)。在生物过程组中,上调表达基因主要集中在蛋白质转运的负调控、细胞对营养水平的反应、细胞胞吐过程中,而下调表达基因主要与蛋白酶体蛋白分解代谢过程的正调控、蛋白酶体泛素依赖蛋白分解过程的调控密切相关;在分子功能组中,上调表达基因主要富集于蛋白质结合、糖胺聚糖结合的过程中,而下调基因同样与蛋白质结合、非共价相互作用相关;在细胞成分组中,上调基因主要富集在细胞部分,而下调的基因主要富集在细胞质、细胞膜、细胞外细胞器。多数DEGs 与蛋白质结合及代谢、细胞骨架蛋白、酶活性反应显著相关。详见图2 B 和表2。
图2 鼻咽癌中DEGs 的基因本体分析(A)经GO 分析将DEGs 分为3 组(即分子功能组、生物学过程组和细胞成分组);(B)经GO 分析居前30 位的DEGs
表2 上调及下调DEGs 的GO 分析
2.3 DEGs 的信号通路富集分析
使 用KEGG PATHWAY、Reactome、Panther 和Gene Ontology 在线数据库进行DEGs 功能和信号通路富集分析。DEGs 主要富集于癌症中的转录失调、细胞粘附分子(CAMs)、代谢途径及PI3K-Akt 信号传导途径(见图3、表3)。
图3 NPC 中DEGs 功能和信号通路富集
表3 NPC 中DEGs 信号通路富集分析
2.4 DEGs 的蛋白质-蛋白质相互作用网络
用鉴定出的114 个DEGs(36 个上调基因和78 个下调基因)绘制蛋白质- 蛋白质相互作用(protein-protein interaction, PPI)网络图,PPI 网络图包含114 个节点和453 作用连线。在114 个节点中,36 个中心节点基因被识别,过滤标准设定为:相互作用关系大于10 标准为中心节点,即每个节点具有10 个以上的连接或相互作用。36 个节点基因 是FN1、CD19、C3、CXCL10、CLU、PROM1、CD22、MMP3、CR2、SCGB1A1、MEF2C、PAX5、PIGR、GAD1、PLAU、MAD2L1、MSLN、VCAN、DST、HOXA10、LTF、MS4A1、MUC16、PTGDS、ANG、SPAG6、TCL1A、TEKT2、TSPAN8、ATP12A、BANK1、CR1、DNAI1、KLF2、KRT7 和NRXN1。同时,从PPI 网络中筛选构建2 个亚信号通路网络,使用MCODE 进行进一步分析。通路富集分析亚网络A 由19 个节点和50 个相互作用关系组成(见图4A),主要与癌症中的转录失调、TNF 信号通路、NF-κB信号通路、Toll 样受体信号通路有关;亚网络B 由19 个节点和45 个相互作用关系组成(见图 4B),其主要与细胞粘附分子(CAMs)、PI3K-Akt 信号通路、氨基酸代谢信号通路相关。
图4. DEGs 的PPI 网络分析(在Orange 中36 个上调基因呈红色,78 个下调基因呈蓝色);(A)亚网络A 由19 个节点和50 个相互作用关系组成;(B)亚网络B 由19 个节点和45 个相互作用关系组成
3 讨论
近年来,鼻咽癌的诊断和治疗都取得了长足的进步。血浆EBV DNA 已被证明是鼻咽癌筛查、诊断、监测和治疗中重要的生物标志物。基于生物大数据分析、筛选及确定相关信号通路的研究已经逐步在科研领域开展。本次研究中利用NCBI-GEO 数据平台,提取4 个基因芯片数据集,筛选DEGs 并富集分析DEGs 功能,发现36 个节点基因(FN1、CD19、C3、CXCL10、CLU、PROM1、CD22、MMP3、CR2、SCGB1A1、MEF2C、PAX5、PIGR、GAD1、PLAU、MAD2L1、MSLN、VCAN、DST、HOXA10、LTF、MS4A1、MUC16、PTGDS、ANG、SPAG6、TC L1A、TEKT2、TSPAN8、ATP12A、BANK1、CR1、DNAI1、KLF2、KRT7、NRXN1),这些节点基因均与鼻咽癌的发生发展密切相关。
前簇蛋白(clusterin,CLU)是一种广泛分布在细胞之间的蛋白质,可参与许多生物学过程,例如组织分化、细胞粘附、细胞间或细胞与基质之间的相互作用等。最近人们发现,CLU 涉及许多病理状态(如神经变性和癌症)的发生发展。CLU 在多种癌症组织中的表达上调[11,12]。CLU的表达由癌基因和癌蛋白共同调节,与转移表型相关,其作用机理是调节MMP-2、MMP-9、VEGF 和E- 钙粘蛋白的表达[13,14]。鼻咽癌是具有高转移性临床病理特征的肿瘤。有研究表明,CLU 与鼻咽癌的转移密切相关。实验发现,DNP 可增加CLU、 基质金属蛋白酶(matrix metalloproteinase,MMP)9 和血管内皮生长因子(VEGF)的表达,DNP 通过上调CLU 可进一步增加MMP-9 和VEGF 的表达。同时DNP 也增加CLU 与MMP-9 或VEGF的结合,CLU、MMP-9 和VEGF 与肿瘤淋巴结转移(TNM)分类呈正相关。这些结果表明,DNP 可能通过上调CLU,MMP-9 和VEGF 的表达来促进鼻咽癌肿瘤组织的转移。因此,升高的CLU 表达可能是鼻咽癌高转移的重要因素,而CLU 可以作为鼻咽癌转移的生物标志物[15]。
MMP3 与肿瘤细胞的转移相关,单独发生MMP3 的异位表达足以增加细胞的运动性。MMP3 可以通过几种方式促进细胞的迁移,例如,MMP3 可以裂解E- 钙粘着蛋白,促进细胞解离,增加细胞的运动性,触发上皮细胞向间充质细胞转化,并可能诱导角质形成细胞生长因子的产生[16]。角质形成细胞生长因子是一种与细胞迁移增强有关的分泌蛋白[17]。Zta 是Epstein-Barr 病毒(EBV)的裂解性反式激活因子,目前已被证明可促进上皮细胞的迁移和侵袭[18]。Zta 因子可直接靶向MMP3 和MMP9 的启动子,还可诱导MMP3 与MMP9 的表达。Zta 诱导细胞迁移的过程需要MMP3,但不需要MMP9。体外实验表明,MMP3 和MMP9都有助于Zta 诱导细胞侵袭。Zta 的表达与鼻咽癌的颈部转移相关[19]。亚网络A 中的PAX5 目前已被证明是EBV 依赖的细胞增殖的主要参与者,并且先前被鉴定为裂解性EBV活化的抑制剂[20],与病毒侵入及增殖密切相关。
亚网络B 中的FN1 基因是ECM 糖蛋白家族的成员,在细胞粘附、迁移极性和组织重塑中可起到关键的作用。FN1也有利于维持微血管的完整性和抗感染性[21]。此外,最近已证实FN1 与各种癌症中的细胞转移、分化和粘附密切相关,并且FN1 的下调会抑制癌细胞的侵袭和转移。FN1 的下调可以抑制食管癌细胞的侵袭、转移和增殖。有人指出,减毒的FN1 可以有效抑制胃癌细胞的转移[22-23]。相关的研究表明,通过抑制FN1 来使AKT 信号通路失活[24],可减少鼻咽癌病灶中发生的肿瘤浸润、转移和血管生成。AKT信号通路在调节正常细胞和癌细胞的存活、增殖、凋亡和营养代谢等过程中均能起到至关重要的作用[25]。先前的研究表明,AKT 信号通路在鼻咽癌的恶化过程中起着关键的作用,而AKT 信号通路的下调可抑制鼻咽癌细胞的发育,抑制AKT 信号通路的激活则可抑制鼻咽癌细胞的侵袭和转移[26]。此外,FN1 的过表达还与潜伏膜蛋白1 的表达有关,对鼻咽癌患者具有独立的预后评估价值[27]。
本研究的结果证实,应用组学技术可以揭示肿瘤发生的复杂分子事件及控制重要的肿瘤行为,如肿瘤的侵袭、转移和对治疗耐受等。鼻咽癌的发生与多种因素密切相关,相关因素包括病毒侵袭、基因表达异常、细胞增殖及信号通路激活。从多基因水平探讨鼻咽癌的可能发病机制,可以为鼻咽癌的早期诊断、治疗研究提供潜在的科研线索。