肺癌组织UCHL1高表达与不良预后相关①
2022-08-30阿布都色麦尔热依木戴京京邢应如周武碧安徽理工大学医学院淮南232001
阿布都色麦尔·热依木 戴京京 邢应如 周武碧 (安徽理工大学医学院,淮南 232001)
肺癌是世界范围内的恶性肿瘤之一,主要分为 小细胞肺癌和非小细胞肺癌,其发病率和病死率高,严重威胁人类健康[1]。随着医疗技术的发展,肺癌的诊治取得进步。尽管如此,肺癌患者的平均生存率仍然很低(20%),五年生存率低于15%,且大多数肺癌患者在中晚期得到确诊[2-3]。目前,正在研究基于靶基因的细胞水平个体化治疗,有望改善肺癌患者预后[4-5]。因此,充分阐明肺癌的分子机制具有重要意义。
泛素化和去泛素化是最通用的翻译后修饰,参与多种生物学过程,例如细胞生长,分化,转录调控和致癌作用。去泛素化作用由去泛素化酶介导,去泛素化酶已成为与癌症相关的许多途径的重要调节剂。它们可以调节关键致癌蛋白或依赖泛素的致癌信号传导级联的稳定性[6]。泛素C 末端水解酶L1(UCHL1)是去泛素酶UCH 亚组的成员,主要在正常组织的脑,睾丸,卵巢和胎盘中表达,其在包括肺癌在内的多种癌症中高表达[7-8]。与正常肺组织相比,UCHL1 在肺癌中异常表达。此外,UCHL1 的表达与癌症的病理阶段密切相关[9]。另外,有体内实验证据表明,UCHL1 转基因小鼠具有明显的易发表型,并伴有肺部肿瘤的发展[10]。因此,以上数据表明UCHL1在肺癌的发生发展中具有重要致癌作用。然而,其具体的致癌机制仍然未知。本研究首先采用生物信息方法分析UCHL1基因在肺癌中的表达、相关生物学功能及其与患者生存期的关系,然后采用免疫组织化学法检测40例肺癌组织样本,对生物信息分析结果进行验证。
1 材料与方法
1.1 通过Oncomine 数据库检索目标基因 条件设定:①“分析类型:癌症vs正常分析”;②“癌症类型:肺癌”;③“样品类型:组织标本”;④“数据类型:mRNA”;⑤“设定条件:过度表达”;⑥“临界值(P<0.05,fold change>2)”。
1.2 UCHL1表达谱数据提取 Oncomine 数据库数据提取条件为:①“基因:UCHL1”;②“分析类型:癌症vs正常分析”;③“癌症类型:肺癌”;④“数据类型:mRNA”;⑤“临界值(P<0.05,fold change>2)”。
1.3 UCHL1 蛋白互作网络构建 采用STRING 数据库构建UCHL1 蛋白互作网络,UCHL1 蛋白互作网络的置信水平>0.4,以文本挖掘、实验、数据库、共表达、邻域、基因融合作为蛋白互作来源,聚类法采用Kmeans聚类,集群数量为3。
1.4 UCHL 相关互作蛋白功能富集分析 Cluster-Profiler 是一个支持GO 和KEGG 富集且支持分析结果可视化的R软件包。本研究使用ClusterProfiler软件包对UCHL 相关互作蛋白进行GO 和KEGG 路径富集分析。P<0.05被划定为显著富集截止标准。
1.5 Kaplan Meier-Plotter 生存分析 采用Kaplan Meier-Plotter 数据库对肺癌患者UCHL1 高低表达组与生存预后的相关性进行分析,条件设定:①“基因:UCHL1”;②“癌症类型:肺癌或肺腺癌或肺鳞癌”;③“分类截点:自动选择最佳截断值”;④“生存指标:OS”。
1.6 GEPIA数据库分析UCHL1在肺癌中的表达GEPIA 数据库中,以UCHL1 为目标基因,癌症类型选择LUAD(肺腺癌)和LUSC(肺鳞癌),匹配TCGA正常组织表达数据进行可视化分析。
1.7 免疫组织化学 采集2016 年至2018 年间来自南京医科大学淮安市第一人民医院的肺癌组织标本40 份,癌旁组织标本15 份。病理组织标本连续切片,脱蜡,乙醇水化,抗原在热柠檬酸缓冲液中修复,4 ℃密封于1∶400稀释度的抗UCHL1一抗(Cat:#13179,Cell Signaling technology)中过夜,用HRP 标记的二抗(Cat:KGAA35,凯基生物)密封,DAB 染色,苏木精复染,中性胶密封。
1.8 UCHL1 蛋白表达结果判断 根据染色强度评分:0 分(无染色),1 分(浅棕色),2 分(棕色)和3 分(深棕色)。根据阳性染色占比评分:0 分(0%~5%阳性率),1 分(6%~25%阳性率),2 分(26%~50%阳性率),3 分(51%~75%阳性率),4 分(76%~100%阳性率)。染色强度评分与染色占比结果乘积:0 分为(-),1~4分为(+),5~8分为(++),9~12分为(+++)。
1.9 分组方法 根据TCGA 数据库中肺癌患者组织UCHL1表达值中位数,将患者分为高表达组和低表达组。肺癌患者中,≥60 岁为高年龄组,<60 岁为低年龄组。分期依据为国际抗癌联盟(UICC)第8版TNM分期系统。
1.10 统计学分析 采用SPSS17.0 软件进行统计分析。采用卡方检验分析UCHL1 表达与临床特征的关系。采用Cox 比例风险回归模型,对总生存时间进行单因素和多因素分析,P<0.05表示差异具有显著性。使用ClusterProfiler 软件包对UCHL1 及相关互作蛋白进行GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)路径富集分析,P<0.05被划定为显著富集截止标准。
2 结果
2.1 筛选目标基因 靶基因选择:根据本次筛选条件,在Oncomine 数据库中筛选出差异表达基因,根据中位秩次排序,剔除已报道过的基因,筛选出UCHL1 基因。UCHL1 基因中位秩次为993.5,P<0.001(图1)。
图1 Oncomine 数据库中筛选出基因UCHL1(中位秩次993.5)Fig.1 UCHL1 was screened from Oncomine database(Median Rank 993.5)
2.2 UCHL1 在常见肿瘤类型及肺癌中的表达结果 图2A 所示,Oncomine 数据库中包含359项有关UCHL1 在各种肿瘤和正常组织中表达的相关研究。其中52 项研究显示UCHL1 在肿瘤组织呈现差异性表达,23 项研究表明UCHL1 高表达于肿瘤组织。7 项研究表明,UCHL1 在肺癌组织中表达与正常组织相比,差异具有统计学意义(P<0.001,图2B)。432 个样本及包括小细胞肺癌、肺类癌、鳞状细胞肺癌和肺腺癌,对癌症与正常组织的UCHL1表达水平进行了对比分析。其文章发表在“Proc Natl Acad Sci U S A”和“PLoS One”上。
图2 UCHL1 基因在Oncomine 数据库肿瘤研究中的表达情况Fig.2 Expression of UCHL1 gene in Oncomine database
2.3 UCHL1 基因PPI 网络构建与功能富集 利用STRING 数据库建立了蛋白质互作网络(PPI),筛选出与UCHL1 蛋白密切相关的10 个蛋白(COPS5、PARK2、TP53、UBC、UCHL3、HSPA8、SNCA、UBB、RPS27A、UBA52),互作关系edge=48,局部聚类系数为0.917,蛋白质互作网络富集P值为0.013 6,采用Kmeans 聚类分析将PPI 网络基因分为3 个模块,见图3A。UCHL1 互作蛋白相关信号通路主要富集于泛素介导的蛋白质水解通路,见图3B。UCHL1互作蛋白生物学功能富集显著,生物学过程(BP)主要富集于蛋白去泛素化、蛋白质小分子修饰,细胞成分(CC)主要富集于宿主细胞成分,分子功能(MF)主要富集于泛素结合、巯基依赖泛素特异性蛋白酶活性,见图3C。
图3 UCHL1蛋白互作网络以及相关通路分析Fig.3 Analysis of UCHL1 protein interaction network and related pathways
2.4 UCHL1 及相关互作蛋白在肺癌和正常肺组织中的表达 在GEPIA 数据库中对UCHL1 及相关互作蛋白(COPS5、PARK2、TP53、UBC、UCHL3、HSPA8、SNCA、UBB、RPS27A、UBA52)在肺腺癌及肺鳞癌中的表达数据进行分析。其中,UCHL1、UCHL3 和SNCA 在肺癌与正常肺组织中存在差异表达。在肺腺癌(LUAD,n=483)及肺鳞癌(LUSC,n=486)中UCHL1 表达明显高于正常肺组织(P<0.05),见图4A。UCHL3在肺鳞癌(LUSC,n=486)中的表达明显高于正常肺组织(P<0.05),见图4B。SNCA 在肺腺癌(LUAD,n=483)中的表达明显低于正常肺组织(P<0.05),见图4C。
图4 GEPIA数据库中UCHL1及相关互作蛋白在不同肺癌与正常肺组织间的表达差异Fig.4 Expressions of UCHL1 and related proteins in different lung cancer tissues and normal lung tissues in GEPIA database
2.5 UCHL1 及相关互作蛋白在肺癌中的表达与预后分析 利用Kaplan Meier-Plotter 数据库分析了UCHL1 及相关互作基因(UCHL3、SNCA)表达与肺癌患者预后的关系。UCHL1 低表达组肺癌患者的总生存率(图5A)明显高于UCHL1 高表达患者(P<0.001)。UCHL3 在肺鳞癌患者中的表达水平对总生存率无影响(P>0.05)。SNCA 高表达肺腺癌患者的总生存率(图5C)高于SNCA 低表达患者(P=0.05)。
图5 Kaplan Meier-Plotter 数据库分析肺癌患者UCHL1及相关互作蛋白的表达与预后的关系Fig.5 Kaplan Meier-Plotter database analysis of correlation between UCHL1 and related gene expression and prognosis in lung cancer patients
2.6 UCHL1在肺癌组织中的表达 为验证UCHL1蛋白在肺癌组织中的表达,对肺癌(40 例)及癌旁正常肺组织(15 例)进行免疫组化染色分析,发现正常肺组织中UCHL1表达水平极低或不表达,而在肺癌组织中高表达,见图6。肺癌组织UCHL1 阳性率及强阳性率均高于正常肺组织,差异具有统计学意义(P<0.05),见表1。
表1 UCHL1蛋白在肺癌及正常肺组织中的表达Tab.1 Expression of UCHL1 protein in lung cancer and normal lung tissues
图6 免疫组织化学方法检测肺癌组织中UCHL1的表达Fig.6 Immunohistochemical method for detection of UCHL1 expression in lung cancer
2.7 肺癌UCHL1 表达与临床特征的关系 在TCGA 数据库整理出肺癌患者数据,χ2检验分析UCHL1 表达与肺癌患者性别、年龄、T、N、M 分期以及病理分期等临床特征的相关性。肺癌患者UCHL1 的表达与性别(P=0.036)和病理分期(P=0.028)具有显著性差异,男性肺癌患者UCHL1表达较高,但UCHL1 表达与年龄、T、N、M 分期无明显相关性(P>0.05,表2)。
表2 UCHL1蛋白表达与肺癌患者临床病理特征的关系Tab.2 Relationship between expression of UCHL1 protein and clinicopathological features of lung cancer
2.8 肺癌患者总生存率的单因素和多因素分析采用Cox 回归模型分析各病理因素对肺癌患者生存率的影响。单因素分析显示UCHL1的表达、T、N、M分期以及病理分期是影响肺癌患者总生存率的因素,多因素分析显示UCHL1 表达和N 分期是肺癌患者总生存率的独立危险因素,见表3。
表3 TCGA肺癌数据集肺癌患者OS影响因素的Cox回归模型Tab.3 Cox regression model for influencing factors of OS rate of lung cancer patients in TCGA lung cancer data set
3 讨论
UCHL1 是一种富含223 个氨基酸的神经元蛋白[11]。UCHL1 的功能最为人所知的是其脱氮酶(DUB)活性,它催化泛素(Ub)的C 端酯和酰胺水解生成单体Ub[12]。除了DUB 活性外,UCHL1 还被认为具有二聚依赖的E3 泛素蛋白连接酶活性和/或在体 内 稳 定Ub 单 体 方 面 有 作 用[13]。作 为DUB,UCHL1 促进Ub 循环,因此可以调节可用Ub 的细胞池,赋予UCHL1调节许多依赖泛素的细胞过程的能力[14]。尽管其确切的生理功能尚不清楚,但越来越多的证据表明UCHL1与人类恶性肿瘤的进展有关。目前,UCHL1 在肿瘤发病机制中的具体作用尚不清楚。据报道,UCHL1 在一些肿瘤组织和癌细胞系中表达上调,并被认为在许多癌症的发展过程中发挥癌基因作用,包括淋巴瘤、结直肠癌和非小细胞肺癌[15-17]。然而,一些研究表明UCHL1 在鼻咽癌和乳腺癌的发病机制中是一种肿瘤抑制因子[18-19]。尽管关于UCHL1在肿瘤发生中的确切作用存在争议,但以上研究表明UCHL1 是肿瘤形成和发展的重要调节因子。因此,阐明UCHL1在肺癌中的作用可能会帮助人们更好地了解肺癌的分子发病机制,并促进肺癌治疗和诊断工具的开发。
尽管有UCHL1 在肺癌细胞系细胞功能上的相关报道,由于其实验样本类型和实验方法上的差别,需要进一步验证研究的可靠性以及可重复性。然而,关于UCHL1表达水平对肺癌患者预后的影响还没有强有力的证据。基于本项研究,采用Oncomine 数据库初步筛选肺癌组织中的差异表达基因,涉及的数据涵盖了TCGA 数据库、GEO 数据库中的基因数据集,为新的肿瘤分子标志物的探索提供数据基础。在此数据库中,根据自己的需要设置过滤和挖掘数据的条件。在Oncomine 数据库分析筛选出的UCHL1基因在常见肿瘤中的表达情况,结果显示UCHL1 在52 项肿瘤研究中的表达差异具有统计学意义,23项肿瘤研究中发现UCHL1表达上调。在肺癌表达组研究中,与正常肺组织相比,肺癌组织中UCHL1 表达上调。为了消除个体差异引起的抽样误差,课题组在GEPIA 数据库中进行了大量的验证。在GEPIA 数据库以及免疫组化实验中分析发现,UCHL1 在肺癌中均显高表达,与正常组织相比差异具有统计学意义。这些研究提示UCHL1 可能在肺癌中起癌基因作用,可能与肺癌的临床特点和生存预后有关。有趣的是,在UCHL1互作蛋白的研究中发现,UCHL3在肺鳞癌中高表达、SNCA 在肺腺癌低表达,而SNCA 高表达肺腺癌患者预后较好,说明SNCA 可能是肿瘤抑制基因。与UCHL1 相关的信号通路大多集中在蛋白去泛素上,表明UCHL1参与了关键致癌蛋白或泛素依赖的致癌信号级联调节,可能成为抑制肿瘤有丝分裂症状的重要靶点。
Kaplan-Meier Plotter 在线分析数据库为影响患者生存的因素与患者的预后提供可靠的相关性分析。结果表明,UCHL1 的表达水平与肺癌患者的预后显著相关,UCHL1 的高表达导致患者生存时间缩短,即UCHL1 的表达水平与肺癌患者的OS 呈负相关。
在TCGA 数据库整理出的肺癌患者临床数据分析表明,UCHL1 的表达与性别(P=0.036)和病理分期(P=0.028)显著相关,而与年龄、T、N、M 分期无关(P>0.05)。以上结果提示UCHL1 表达与性别和疾病严重程度有关,UCHL1 在男性患者中的表达高于女性,提示肺癌患者中UCHL1的表达可能存在性别差异,其高表达患者恶性程度更高。上述研究提示UCHL1 可能在肺癌的发生发展中起重要作用,并影响患者的预后,为探索肺癌的分子机制提供了一定的参考。
总之,本研究结合公共数据库分析发现,UCHL1 在肺癌中高表达,并预测其高表达为肺癌患者低生存率的危险因子,提示UCHL1基因可能作为肺癌恶性程度的预测指标以及治疗干预的靶点。