基于癌症基因图谱数据库分析SNRPEP2在肝细胞癌中的表达及其临床意义
2022-06-11别蓓蓓周亚明严成俊孙晋
别蓓蓓 周亚明 严成俊 孙晋
肝细胞癌(hepatocellular carcinoma,HCC)是最常见的原发性肝脏肿瘤,发病率位居恶性肿瘤第6位,死亡率更是高居恶性肿瘤第4位[1-2]。尽管近年来在HCC诊断和治疗方面取得了一定进展,尤其是分子靶向治疗和免疫治疗[3],但由于病情隐匿且治疗后极易复发和转移,导致患者的预后较差、死亡率居高不下,因此迫切需要开发可用于HCC诊断和预后判断的生物标志物以及新型治疗分子靶标。假基因是指基因组中与正常蛋白编码基因序列相似,但缺乏编码氨基酸能力的DNA拷贝[4]。过去一直认为假基因无生物学功能,但近年来发现假基因可在RNA水平发挥调控作用,参与生物个体发育和疾病发生、发展[5-6]。Han等[7]发现大量假基因在不同肿瘤亚型之间存在差异表达,可对肿瘤组织学亚型进行准确分类且与患者生存期显著相关,提示假基因具有可作为肿瘤诊断和预后判断生物标志物的潜力。小核糖核蛋白多肽E假基因2(small nuclear ribonucleoprotein polypeptide E pseudogene 2,SNRPEP2)位于人类9号染色体,转录本长度为279 bp。研究发现SNRPEP2在结肠癌和乳腺癌中表达上调且与不良预后相关[8-9]。目前,SNRPEP2在HCC中表达是否异常以及是否参与HCC发生、发展仍不清楚。本研究基于癌症基因图谱(the cancer genome atlas,TCGA)数据库探讨SNRPEP2在HCC组织中的表达及其临床意义,以期为SNRPEP2应用于HCC诊断和预后判断等转化研究提供依据。
1 材料和方法
1.1 数据获取及处理 从TCGA数据库(https://portal.gdc.cancer.gov/)下载374例HCC组织样本和50例癌旁正常组织样本的转录组测序(RNA-seq)数据和相关临床资料。将下载的FPKM格式的RNA-seq数据转换为TPM格式,经log2转化处理后即可用于后续分析。
1.2 SNRPEP2在HCC组织中的表达及与临床特征的关系分析 采用R语言ggplot2程序包分析HCC组织和癌旁正常组织中SNRPEP2的表达情况;根据表达量中位数将患者分为高表达组和低表达组,采用二分类logistic回归模型分析SNRPEP2表达水平与性别、年龄、TNM分期、病理分期、肿瘤状态(包括无瘤和荷瘤两种状态,无瘤指通过各种手段去除肿瘤组织后使肉眼或影像学不可见肿瘤组织,荷瘤指有影像学或肉眼可见的肿瘤组织)、组织学分级、血清甲胎蛋白(alpha fetal protein,AFP)水平、血管浸润情况、肝纤维化Ishak评分、邻近肝组织炎症情况、Child-Pugh分级等临床特征的关系。
1.3 SNRPEP2与HCC患者预后的关系 通过R语言survival程序包分析SNRPEP2表达与总生存期(overall survival,OS)、疾病特异性生存期(disease specific survival,DSS)和无进展间隔期(progress free interval,PFI)的关系,并运用Cox比例风险回归模型分析影响预后的危险因素,其中单因素分析结果P值<0.1的临床指标进一步纳入多因素分析。根据影响预后的危险因素采用R语言rms程序包进一步构建Nomogram预测模型,用于预测HCC患者1、3和5年生存率。
1.4 SNRPEP2对HCC的诊断效能分析 利用R语言pROC程序包制作ROC曲线,通过AUC评估SNRPEP2在HCC诊断中的效能。
1.5 统计学处理 采用SPSS 20.0统计软件。SNRPEP2在非配对和配对组织中的表达差异分别采用两独立样本t检验和配对样本t检验。绘制Kaplan-Meier生存曲线并通过log-rank检验分析SNRPEP2表达与患者预后的关系。通过建立二分类logistic回归模型分析SNRPEP表达与临床病理特征的关系。通过单因素和多因素Cox回归分析临床病理特征与患者OS的关系。P<0.05为差异有统计学意义。
2 结果
2.1 SNRPEP2在HCC组织中的表达情况 通过比较374例HCC组织和50例癌旁正常组织中SNRPEP2的表达水平,发现HCC组织中SNRPEP2表达水平明显高于癌旁正常组织(P<0.01,见图1a;进一步比较50例HCC组织和癌旁配对组织中SNRPEP2表达水平,结果显示HCC组织中SNRPEP2表达水平明显高于癌旁配对组织(P<0.01),见图1b。以上结果提示,SNRPEP2在HCC组织中表达上调。
图1 基于TCGA数据库分析SNRPEP2在HCC组织中的表达情况(a:HCC组织与癌旁正常组织中SNRPEP2表达情况比较;b:HCC组织和癌旁配对组织中SNRPEP2表达情况比较)
2.2 SNRPEP2表达水平与HCC患者临床病理特征的关系 通过构建二分类logistic回归模型对374例HCC患者的SNRPEP2表达水平与临床病理特征的关系进行分析,结果显示SNRPEP2高表达与肿瘤的组织学分级(OR=2.539,P<0.01)、血清 AFP水平(OR=2.966,P<0.01)、血管浸润(OR=1.658,P<0.05)和邻近肝组织炎症(OR=1.703,P<0.05)均有关,而与性别、年龄、T分期、N分期、M分期、病理分期、肿瘤状态、肝纤维化Ishak评分和Child-Pugh分级均无关(均P>0.05),见表 1。
表1 SNRPEP2表达水平与HCC患者临床病理特征的关系(例)
2.3 SNRPEP2表达水平与HCC患者预后的关系SNRPEP2高表达患者OS、DSS和PFI均低于低表达患者(均P<0.05),提示SNRPEP2高表达与HCC的不良预后有关,见图2。
图2 SNRPEP2高表达与低表达HCC患者生存曲线的比较
单因素Cox回归分析结果提示,T分期(HR=2.598,P<0.01)、M 分期(HR=4.077,P<0.05)、病理分期(HR=2.504,P<0.01)、肿瘤状态(HR=2.317,P<0.01)和SNRPEP2表达水平(HR=2.024,P<0.01)均是影响HCC患者OS的危险因素;进一步多因素Cox回归分析显示,肿瘤状态(HR=1.816,P<0.05)和 SNRPEP2表达水平(HR=1.970,P<0.01)均是影响 HCC患者 OS的独立危险因素,见表2。
表2 影响HCC患者总生存期的单因素和多因素回归分析
续表2
此外,综合T分期、M分期、病理分期、肿瘤状态和SNRPEP2表达水平等影响预后的危险因素进一步构建Nomogram预测模型,用于预测HCC患者1、3和5年生存率,从Nomogram图可以看出,病理分期、肿瘤状态和SNRPEP2表达水平对HCC患者的生存贡献较大,见图3。
图3 预测HCC患者1、3和5年总生存率的Nomogram图
2.4 SNRPEP2表达水平对HCC的诊断效能 ROC曲线分析显示,SNRPEP2表达水平对于诊断HCC(AUC=0.925)、T1期(AUC=0.913)、M0期(AUC=0.936)、病理分期I期(AUC=0.911)均具有良好的效能。此外,SNRPEP2表达水平对于评估1、3和5年OS(AUC分别为0.659、0.649 和 0.635)、DSS(AUC 分别为 0.672、0.643 和0.604)和 PFI(AUC 分别为 0.615、0.515 和 0.610)同样具有较好的效能,见图4。
图4 SNRPEP2表达水平诊断HCC及评估预后的ROC曲线
3 讨论
越来越多的研究证明,假基因是基因组进化过程中形成的“分子化石”,其可以通过在DNA、RNA及蛋白等层面行使调控作用,进而在各种生理和病理过程中发挥生物学功能,特别是在肿瘤的发生、发展中扮演着重要角色[10-11]。
近年来,假基因在HCC发生、发展中的作用及其调控机制也得到了证实,研究发现一些假基因在HCC中表达异常且与患者的不良预后相关,其可通过调控HCC增殖、迁移、侵袭、血管生成等生物学过程进而发挥促癌或抑癌作用。例如,重组人膜联蛋白A2(ANXA2)的假基因ANXA2P1在HCC中表达上调,与患者的不良预后呈正相关,其可通过miR-376a-3p/ANXA2调控轴促进HCC的增殖、迁移和侵袭[12]。假基因泛素结合酶E2C假基因3(UBE2CP3)被发现其在HCC中高表达且与不良预后呈正相关,其可通过激活ERK1/2/HIF-1α/血管内皮生长因子A(VEGFA)信号增强HCC细胞VEGFA的分泌进而促进血管生成[13]。此外,研究发现磷酸酶与张力蛋白同源物(PTEN)的假基因PTENP1在HCC中发挥抑癌作用,其在HCC中呈现低表达,其过表达可通过失活PI3K/Akt信号通路进而抑制HCC的增殖、迁移和侵袭,诱导细胞发生凋亡和自噬[14]。
位于人类9号染色体p24.1区域的SNRPEP2,为SNRPE基因的加工型假基因。研究发现SNRPEP2在结肠癌和乳腺癌中表达上调且与不良预后相关[8-9],但在HCC中的表达情况及临床相关性目前仍不清楚。本研究利用TCGA数据库HCC临床样本组织的RNA-seq数据及其临床信息进行生物信息学分析,重点围绕SNRPEP2在HCC中的表达情况及临床意义进行探讨。
首先,基于TCGA数据库HCC组织的RNA-seq数据进行表达分析,发现SNRPEP2在配对和非配对HCC组织中的表达水平均高于癌旁正常组织,提示SNRPEP2具有作为HCC诊断分子标志物的潜力。其次,通过对HCC患者的临床信息数据进行挖掘分析,探讨了SNRPEP2表达水平与临床病理特征及患者预后的关系,SNRPEP2的表达水平与肿瘤的组织学分级、血清AFP水平、血管浸润及邻近肝组织炎症均有关,且SNRPEP2高表达患者OS、DSS和PFI均低于低表达患者,是影响HCC患者OS的独立危险因素,提示SNRPEP2有望成为HCC诊断和预后判断的新型分子标志物。此外,通过ROC曲线分析发现SNRPEP2表达水平对HCC的诊断具有良好的效能,并对患者的OS、DSS和PFI均具有良好的判断效果,进一步表明SNRPEP2可作为HCC诊断、患者预后判断和疗效评估的新型分子标志物的潜力。
综上所述,本研究基于TCGA数据库,通过生物信息学手段揭示了假基因SNRPEP2在HCC中异常高表达及其具有作为HCC诊断和预后判断生物标志物的潜在应用价值,同时为后续围绕SNRPEP2开展HCC生物标志物相关研究提供了依据。由于本研究的SNRPEP2表达数据仅局限于HCC组织,后续可进一步对HCC患者血清/血浆游离或外泌体来源SNRPEP2的表达及其临床相关性和临床意义进行研究。