APP下载

基于生物信息学分析CENPN在肝癌中的预后价值和作用机制①

2022-08-30周艳琳李勇莉李林玉新乡医学院三全学院新乡453003

中国免疫学杂志 2022年13期
关键词:共表达细胞周期甲基化

周艳琳 刘 俊 李勇莉 李林玉 赵 冰 (新乡医学院三全学院,新乡 453003)

肝细胞癌(liver hepatocellular carcinoma,LIHC)是全球最常见的恶性肿瘤之一[1]。LIHC 的病死率在所有癌症中排名第二,接受切除手术或消融术后五年内约有70%的复发率[2]。导致不良预后的主要原因是肿瘤转移和术后复发[3]。越来越多的研究表明,mRNA 可作为癌症预后的潜在生物标志[4-5]。有证据显示,ANLN、ECT2、HMMR、KIF20A、NCAPG、PBK、RACGAP1 和 ZWINT 等 mRNA 均可作为肝癌诊断和治疗的候选靶点,通过基因的异常表达或改变参与LIHC 的发生发展[6]。随着生物信息技术的成熟,现已被广泛用于分析LIHC 相关的差异表达基因和相关信号通路,以此提高LIHC 筛查和治疗的概率[7]。然而,LIHC 具有较高的分子异质性,筛选出新的潜在LIHC 预后生物标志,对降低LIHC 患者病死率、改善预后和实现个体化靶向治疗均有重要意义。着丝粒蛋白N(centromere protein N,CENPN)是着丝粒核小体相关复合物的成分,在激核蛋白组装、有丝分裂进展和染色体分离中发挥核心作用[8]。然而,CENPN 在 LIHC 中的作用及机制研究尚不完全明确。本研究通过生物信息学方法分析CENPN 在LIHC 中的表达及其与预后的关系,并探讨其调控LIHC 的可能机制,为LIHC 的临床诊治和预后提供新思路。

1 材料与方法

1.1 数据的获取和筛选 基于TIMER2.0 数据库(http://timer. cistrome. org/)[9]通 过 Exploration 模块下的Gene-DE 检索CENPN 在TCGA 数据库所有肿瘤组织和癌旁正常组织中的表达。利用GEPIA2 数据库(http://gepia2. cancer-pku. cn/#index)[10]进一步验证CENPN 在TCGA-GTEx-LIHC 中的表达。设定筛选条件为|Log2FC| Cutoff:1、P-value Cutoff:0.05、LIHC,Match TCGA normal and GTEx data,包括369例肝癌组织样本和160例正常对照组织样本。

1.2 CENPN 的表达与肝癌患者病理分期和预后相关性分析 基于GEPIA2.0数据库分析了CENPN的表达与LIHC 患者病理分期和预后的相关性。通过CENPN 表达值的中位数将LIHC 患者分为高表达组与低表达组,根据CoxPH 模型,计算危险比(HR)和P值,并绘制生存曲线,包括总体生存期(overall survival,OS)曲线和无病生存期(disease free survival,RFS)曲线。利用Logistic回归分析检测CENPN表达与LIHC 患者临床分期的相关性,P<0.05 为差异具有统计学意义。

1.3 LIHC 中与CENPN 共表达基因的筛选及功能富集分析 基于LinkedOmics 数据库(http://www.Linkedomics.org)[11]分析 CENPN 在 TCGA LIHC 患者组织共表达基因情况,包括371 例肝癌患者,检索LIHC 中CENPN 相关的上调基因和下调基因。筛选条件为:LIHC、RNAseq、CENPN、RNAseq,Spearman检验进行数据处理,P<0.05 为差异具有统计学意义,选择共表达差异基因最紧密的前50个基因制作热图。将筛选的与CENPN 共表达差异基因最紧密的前 500 个基因载入 DAVID 数据库(https://david.ncifcrf. gov/)[12],以 人 源 基 因 为 背 景 ,进 行 GO 和KEGG 通路富集分析。GO 分析主要用于基因注释,包括生物过程(biological process,BP)、细胞成分(cellular component,CC)和分子功能(molecular func‑tion,MF)。基于 KEGG 数据库(https://www. kegg.jp/)[13],在 KEGG Maper 模块下的 Search&Color Path‑way 中进行检索,将Top 500 关联紧密的基因载入对应框,生成路线图,关键共表达基因在细胞周期中的位置显示为红色。

1.4 CENPN表达与甲基化的关系 通过cBioPortal数据库(http://www. cbioportal. org/)[14]分析 CENPN表达在5 组LIHC 样本中基因组水平的变化。共1 070 例肝癌患者,筛选条件为:拷贝数变异(copy number alterations,CNA)和突变(mutations,Mut),在Plot 模块通过Spearman 和Pearson 检验分析CENPN表达与甲基化的相关性。

1.5 CENPN 与肿瘤免疫细胞浸润的关系 利用TIMER 数 据 库(https://cistrome. shinyapps. io/tim‑er/)[15],通过 Gene 模块检索分析 CENPN 表达与各种肿瘤浸润免疫细胞的相关性,包括B 细胞、CD8+T 细胞、CD4+T 细胞、单核细胞、中性粒细胞和树突状细胞,Spearman 检验处理数据,P<0.05 为差异具有统计学意义。

2 结果

2.1 CENPN 在泛癌中的表达 基于TIMER2.0 数据库分析CENPN 在TCGA 39种肿瘤中的表达情况,结果显示,CENPN 在乳腺癌、食道癌、宫颈癌、LIHC等20 种肿瘤中均显著高表达。在TCGA-LIHC 中,相较于癌旁组织(n=50),CENPN 在 LIHC 组织(n=371)中的表达量显著增多,差异有统计学意义(P<0.001)。

2.2 CENPN 在LIHC 组织中的表达及病理分期分析 基于GEPIA2 数据库进一步验证CENPN 在TCGA-GTEx 529 例 LIHC 中 的 表 达 ,包 括 369 例LIHC 样本和160 例正常对照样本,比较LIHC 癌组织和正常组织中CENPN 的表达情况,结果显示,CENPN 在LIHC 中的表达量显著高于正常组织(图2A),差异具有统计学意义(P<0.05)。进一步基于GEPIA2 数据库分析CENPN 与LIHC 肿瘤分期的关系,结果显示,随着肿瘤分期的进展,CENPN 表达量明显升高[F=6.98,Pr(>F)=0.000 143],差异具有统计学意义(图2B)。提示CENPN 在LIHC 中高表达,可作为LIHC患者晚期预后不良指标之一。

图1 CENPN在TCGA 各种肿瘤组织中的表达Fig.1 Expressions of CENPN in various tumor tissues in TCGA

图2 CENPN 在TCGA-GTEx 肝癌组织表达及病理分期的分析Fig.2 Analysis of expression and pathological stage of CENPN in TCGA-GTEx LIHC tissue

2.3 CENPN 表达与LIHC 患者生存期的关系 基于GEPIA2数据库,可得到各182例CENPN高表达与低表达患者的OS 曲线和RFS曲线。结果显示,LIHC患者中CENPN 高表达的患者[logrankP=0.003 1,HR(high)=1.7,P(HR)=0.003 5]总体生存期明显低于低表达患者(图3A);在LIHC 患者中CENPN 高表达患者[logrankP=0.000 45,HR(high)=1.7,P(HR)=5e-04]RFS 明显低于低表达患者(图3B)。表明CENPN 高表达与 LIHC 患者 OS 和 RFS 均存在相关性,提示CENPN 可作为肝癌患者的预后不良指标之一。

图3 CENPN的表达与肝癌患者生存期的关系Fig.3 Relationship between CENPN expression and sur⁃vival in LIHC patients

2.4 CENPN 在LIHC 中的共表达基因筛选及功能富集分析 基于LinkedOmics数据库分析CENPN 在LIHC 中的共表达基因,筛选出差异显著(P<0.05)且关联最紧密的Top 50 基因绘制热图(图4)。结果显示,在LIHC 中与CENPN 表达关联紧密的基因有TK1、C16orf61、KARS、COX4NB、COG4 等。将差异显著且关联最紧密的Top 500基因载入DAVID 数据库进行GO 分析和KEGG 分析,结果显示,这些关联基因主要富集于细胞裂解、DNA 复制、G1/S 期、G2/M期、核质、蛋白质结合等生物过程(表1),KEGG分析主要富集于细胞周期、DNA 复制、P53 信号等通路(表2),以细胞周期通路的关联度(count=26)和差异性(P=1.02E-15,FDR=1.79E-13)最明显。为进一步探究CENPN 及关联基因在细胞周期通路中的作用和相关基因在细胞周期中的位置关系,将细胞周期通路中的CENPN 相关基因带入与KEGG 通路相关的网站生成路线图(图5),并标出通路中对应基因的相关位置(红色标记),大部分基因与细胞周期的 G1/S 期和 G2/M 期有关。提示 CENPN 在 LIHC 中可能通过调控相关分子影响生物合成,改变细胞周期等相关通路,进而调控LIHC的发生、发展。

图4 CENPN在肝癌中差异共表达Top 50基因Fig.4 CENPN differently co-expressed Top 50 genes in LIHC

图5 CENPN共表达基因在细胞周期中的位置关系Fig.5 Location relationship of CENPN co-expression genes in cell cycle

表1 CENPN差异性共表达基因的GO分析Tab.1 GO analysis of CENPN differently co-expressed genes

表2 CENPN差异共表达基因的KEGG分析Tab.2 KEGG analysis of CENPN differently co-expressed genes

2.5 CENPN 的表达与甲基化的关系 通过cBio‑Portal 数据库分析CENPN 的基因组水平变化,结果显示,在选取的5 组LIHC 研究中,包括1 070 例LIHC样本,CENPN的表达与甲基化呈负相关(图6),差异有统计学意义(Spearmanr=−0.28,P=3.23e-8;Pearsonr=−0.23,P=9.395e-6)。提示CENPN 在LIHC中的高表达可能受甲基化修饰调控。

图6 CENPN的表达与甲基化的关系Fig.6 Relationship between CENPN expression and methylation

2.6 CENPN的表达与免疫细胞浸润的关系 TIMER数据库分析发现,TCGA-肝癌中CENPN 表达水平与6种免疫细胞浸润水平均呈显著正相关(图7),包括B细胞(r=0.362,P=4.11e-12)、CD8+T细胞(r=0.291,P=4.09e-08)、CD4+T 细胞(r=0.13,P=1.58e-02)、巨噬细胞(r=0.291,P=4.28e-08)、中性粒细胞(r=0.275,P=2.04e-07)和树突状细胞(r=0.288,P=6.70e-08),差异均有统计学意义。其中与B 细胞关系最密切,差异性最显著。表明CENPN 可能通过影响免疫细胞浸润调控LIHC的发生和发展。

图7 在TCGA-肝癌中CENPN表达与免疫细胞浸润的关系Fig.7 Relationship between CENPN expression and immune cell infiltration in TCGA-LIHC

3 讨论

LIHC是全球最常见的恶性肿瘤之一,病死率排名第二,筛选出新的LIHC 预后标志物对降低LIHC患者病死率,改善预后和实现个体化靶向治疗均有重要意义。着丝粒蛋白(centromere protein,CENP)包含 18 个亚型,有 CENP-A/C/H/I/K/M/T/W/N/L 等,通过纺锤体微管调节染色体DNA 分离,因此,CENP在细胞周期调控和染色体分离过程中极为重要[16-17]。LIU 等[18]研究发现 TK1、CCNB2 和 NUSAP1在LIHC中过表达,与LIHC的侵袭、转移及预后等密切相关。ZHANG 等[19]研究显示,KARS 通过细胞周期阻滞和诱导细胞凋亡机制介导LIHC 的发展。SHI 等[20]研究显示,CDC20 通过介导 PHD3 的降解,稳定HIF-1α 的表达,以此促进LIHC 的发生与发展。本研究发现,CENPN 在LIHC 中的表达与TK1、CCNB2、KARS、CDC20 等均显著相关,推测 CENPN可能也参与了LIHC 的发生发展。然而CENPN 在LIHC中的调控机制尚不清楚。

本研究通过生物信息学对LIHC 的多个数据库数据进行分析。基于TIMER2.0 数据库,分析CENPN 在TCGA 各种肿瘤中的表达情况,结果显示,CENPN 在TCGA 20 种肿瘤中均高表达,在LIHC中的表达差异具有统计学意义(P<0.001)。基于GEPIA2 数据库进一步验证CENPN 在LIHC 中的表达,CENPN 在369 例LIHC 中的表达量显著高于正常组织,与TIMER2.0数据相符。随后,基于GEPIA2数据库分析CENPN 表达与LIHC患者病理分期及预后的相关性,结果显示CENPN 低表达患者OS 和RFS 均较高,CENPN 可作为判断LIHC 预后的指标;CENPN 随着肿瘤分期的进展表现为升高趋势,由于StageⅣ的患者只有4 例,因此StageⅣ的数据可能存在一定的统计学偏差。以上结果均提示,CENPN 在LIHC 中高表达,可能作为LIHC 预后不良的标志物之一,为LIHC的个体化诊疗提供了新的靶点。

为了进一步探究CENPN 在LIHC 发生发展中的下游调控机制。课题组基于LinkedOmics 数据库分析CENPN 在TCGA-LIHC 表达的互作基因,结果显示,与CENPN 存在互作的差异表达基因有TK1、C16orf61、KARS、CDC20 等,这些基因均参与 LIHC的发展,与既往研究部分相符[18-20],提示 CENPN 在LIHC 发展中存在复杂的分子互作关系。本研究基于DAVID 数据库对Top 500的差异性共表达基因进行GO 和KEGG 富集分析,结果显示,这些共表达基因主要富集于细胞周期、DNA 复制、P53信号通路等过程,可视化参与细胞周期调控LIHC 发展的互作基因位置关系发现,大部分差异基因与细胞周期的S 期和G2/M 期有关,提示CENPN 主要通过细胞周期通路调控 LIHC 发展。OKA 等[21]研究发现,CENPN在口腔鳞癌中高表达,通过阻滞细胞周期G1影响细胞增殖,参与口腔鳞癌发生。CHITTORI 等[22]研究发现,CENPN 与 CENPA、CENPC 相互作用,影响着丝粒核小体结构,调控染色体和有丝分裂中与纺锤体微管相连的动脉管的组装和染色体分离,进而改变细胞周期。WANG 等[23]通过 GSEA 数据库预测CENPN 相关基因主要富集于 P53、Rb1、E2F 靶点等通路,并在 HepG2 和 Huh7 两种 LIHC 细胞系中验证CENPN 可靶向p21-CDK2/cyclin E、p27-CDK4/cyclin D和Rb/E2F1信号通路调控LIHC进展,然而并未显示CENPN与肿瘤微环境的关系。本研究基于TIMER数据库分析CENPN 表达与肿瘤浸润免疫细胞的关系,结果显示,CENPN 的表达与 B 细胞、CD8+T 细胞、CD4+T 细胞、巨噬细胞、中性粒细胞和树突状细胞6 种肿瘤免疫细胞变化均相关,尤其与B 细胞的相关系数和差异性最为显著(r=0.362,P=4.11e-12),提示调控肿瘤免疫反应相关通路可能是CENPN 促进LIHC 进展的重要机制之一,可能与LIHC 显著的免疫炎症驱动有关。CENPN 在免疫调控中的具体作用,以及是否能够作为免疫治疗的生物标志物或联合治疗靶点有待进一步研究。

最后,本研究探究了CENPN 在LIHC 中高表达的上游机制。肿瘤的发生通常与基因的异常表达或改变密切相关,基因扩增情况或甲基化状态或上游非编码RNA(non-coding RNA,ncRNA)的调控均可引起基因的异常表达,进而加速肿瘤进程。本研究通过cBioPortal 数据库分析CENPN 在基因组水平的变化,结果显示,在选取的1 070 例LIHC 样本中不发生基因拷贝数扩增,只有0.3%的LIHC 患者发生CENPN 深度缺失,提示CENPN 在LIHC 中的高表达不是由基因拷贝数扩增引起的;进一步分析CENPN 在LIHC 中表达与甲基化的关系,结果显示,CENPN 的表达与甲基化呈负相关,有研究显示DNA甲基化是一种表观遗传调控机制[24],通过甲基转移酶将甲基(CH3)基团修饰到特定DNA 核酸位点,从而影响基因表达,推测CENPN 可能通过甲基化修饰改变其在LIHC 中的表达,进而参与LIHC 的发生发展。本研究只进行了CENPN 在基因拷贝数扩增和甲基化方面的研究,并未筛选其他调控CENPN 表达的原因,下一步将筛选各种ncRNA(miRNA、circ-RNA等)对CENPN表达的影响。

综上所述,本研究明确了CENPN 在多种肿瘤中的表达情况,其高表达与LIHC 不良预后有关,可作为LIHC 新的潜在预后标志物和靶向治疗的潜在分子靶点。CENPN 在LIHC 中的高表达与甲基化修饰有关,还可能通过调节肿瘤免疫微环境,参与细胞周期调控的相关通路从而影响LIHC 的发生、发展。为了进一步阐明CENPN 在LIHC 中的功能和作用,还需要进行分子生物学实验以验证和探究。

猜你喜欢

共表达细胞周期甲基化
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
甲基苯丙胺改变成瘾小鼠突触可塑性基因的甲基化修饰
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
lncRNA LINC01206调控银屑病角质形成细胞的功能研究
高世代回交玉米矮秆种质的转录组分析
植物细胞周期如何“刹车”?
DNA甲基化与基因活性的调控
两种半纤维素酶在毕赤酵母中的共表达
高危型人乳头瘤病毒单一类型感染和多重感染对宫颈癌中细胞周期蛋白、抗凋亡蛋白表达量的影响
肝癌组织hSulf-1基因表达与其甲基化状态的关系