基于数据挖掘分析Elafin在肺癌中的表达及意义
2021-02-27彭旭红蒋静屈佳肴李香凝王丽李佳段丽丽
彭旭红,蒋静,屈佳肴,李香凝,王丽,李佳,段丽丽△
肺癌是最常见的癌症,也是死亡率最高的癌症,大多数的肺癌患者被确诊时已经处于晚期[1]。尽管当前对于肺癌治疗方法的研究有所进展,然而肺癌的总体治愈率和生存率仍然较低[2-3]。寻找有效的分子靶标对肺癌的治疗和预后具有重要的临床意义。弹性蛋白酶抑制因子(Elafin)蛋白是由PI3基因编码的蛋白质。PI3 基因最初编码由117 个氨基酸构成的Elafin 前体蛋白原,前体蛋白原降解前22 个氨基酸(信号肽)形成Elafin 前体蛋白。前体蛋白有N端和C端两个结构域,N端可与细胞外基质中的蛋白组分以及上皮细胞膜相连接,C 端主要抑制弹性蛋白酶[4]。国内外已有一些关于Elafin 在癌症中作用的报道,Elafin 可能参与了肿瘤的发生发展过程,如Elafin 表达水平与肿瘤的分化程度相关,在高分化的食管癌中表达水平更高[5]。Elafin 可通过激活细胞外调节蛋白激酶(extracellular regulated protein kinases,ERK)、蛋白激酶B(protein kinase B,PKB)信号通路刺激卵巢癌细胞增殖[6]。转录因子叉头框蛋白A2(forkhead box A2,FOXA2)在表观遗传学调控下激活Elafin 启动子从而上调Elafin 表达,Elafin 高表达诱导黑色素瘤细胞的凋亡[7]。然而,Elafin在肺癌中的研究报道尚罕见。近年来随着高通量技术与生物信息学技术的发展,多数据库分析Elafin 在肺癌中的表达及其潜在作用与机制成为可能[8]。本研究通过Oncomine数据库、实时荧光定量PCR(qPCR)以及Kaplan-Meier 数据库分析Elafin 在肺癌的表达和预后关系,通过Linkedomics 和string-db数据库分析了Elafin 影响肺癌发生发展的可能分子机制,为后续研究其潜在的临床价值提供参考。
1 材料与方法
1.1 Oncomine 数据库分析Elafin 在肺癌组织中的表达 Oncomine 数据库(https://www.oncomine.org/)设置条件为:(1)“Gene:Elafin”。(2)“Analysis Type:Cancer vs.Normal”。(3)“Cancer Type:Lung Cancer”。(4)“Data Type:mRNA”。探究Elafin在肺癌数据集中的表达情况。
1.2 Kaplan-Meier数据库分析肺癌中Elafin表达与患者预后的关系 Kaplan-Meier 数据库(http://kmplot.com/)设置条件为:(1)“mRNA gene chip:Lung Cancer”。(2)“Gene:Elafin”。(3)“Split patients by:Auto”。(4)“Survival:OS or RFS”。其余设置为默认条件,探究Elafin的表达与患者预后的关系。
1.3 Linkedomics数据库对TCGA LUAD数据集中Elafin相关分析 Linkedomics 数据库(http://www.linkedomics.org/)设置条 件 为:(1)“Cancer Cohort:TCGA_LUAD”。(2)“ Search Dataset:TCGA LUAD Rnaseq”。(3)“Gene:PI3”。(4)“Target Dataset:TCGA LUAD Rnaseq。(5)“Statistical Method:“Pearson Correlation test”。探究Elafin 在肺TCGA_LUAD 数据集中的相关基因并通过GSEA tools 进行基因本体论(Gene Ontology,GO)功能注释、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。
1.4 Elafin蛋白相互作用网络分析 string-db数据库(http://string-db.org)与cytoscape 软件构建Elafin相关蛋白相互作用图,以网站默认设置为设置条件,采取中度置信度(0.400)。
1.5 qPCR 法检测Elafin 在肺癌组织中的表达 取2015 年9月—2016年1月郴州市第一人民医院住院并确诊为肺癌的患者癌组织与配对癌旁组织标本,其中男8例,女2例,年龄50~70岁,平均(60±3)岁。提取组织RNA,利用美国Promega公司的逆转录试剂盒将2 μg RNA逆转录成cDNA,Elafin、GAPDH引物序列设计根据Pubmed基因序列。引物序列:Elafin上游引物5'-TCTTGATCGTGGTGGTGTTCCTCA-3',下 游 引 物 5'-TTTGACTGGCTCTTGCGCTTTGAC-3',产物大小182 bp;GAPDH上游引物5'-TGACTTCAACAGCGACACCCA-3',下游引物5'-CACCCTGTTGCTGTAGCCAAA-3',产物大小121 bp。以GAPDH作为内参基因。反应体系如下:2×TaqDNA聚合酶mix 5 μL,上、下游引物各0.5 μL,cDNA 1 μL,DEPC水3 μL。反应条件:95 ℃预变性30 s;95 ℃20 s,56 ℃20 s,72 ℃30 s(荧光采集),共40个循环,读取每个反应的Ct值,采用2-ΔΔCt法计算Elafin的相对表达量。实验重复3次。
1.6 统计学方法 采用SPSS 20.0 进行统计分析,计量资料以均数±标准差(±s)表示,配对样本比较使用配对t检验;采用Kaplan-Meier 法比较Elafin 表达与预后的关系,应用Logrank检验比较组间生存率,P<0.05为差异有统计学意义。
2 结果
2.1 Elafin mRNA 在肺癌组织中的表达 在Oncomine 数据库的Bhattacharjee Lung 数据集以及Wachi Lung数据集中发现,肺癌中Elafin的mRNA表达显著高于肺正常组织,见图1。本研究qPCR结果显示,肺癌组织中Elafin 的mRNA 相对表达量(3.410±1.056)高于配对正常组织的(0.820±0.119),差异有统计学意义(t=2.644,P<0.05),见图2。以上结果提示Elafin在肺癌中过表达。
2.2 Elafin 表达与肺癌患者预后的关系 Kaplan-Meier Plotter数据库对Elafin表达与肺癌患者预后作生存分析,以Elafin 表达水平高低对肺癌患者进行分组。生存分析纳入1 925 例肺癌患者,Elafin 相对表达量的Cut-off值为303,Elafin相对表达量≥303为高表达组(545例),<303为低表达组(1 380例);高表达组患者的中位生存期低于低表达组(47个月vs.78 个月,P<0.01)。无病生存分析纳入344 例肺癌患者,Elafin 相对表达量的Cut-off 值为33,Elafin 相对表达量≥33为高表达组(192例),<33为低表达组(152 例);高表达组患者的中位无病生存期低于低表达组(10.81个月vs.24.40个月,P<0.01),见图3。
Fig.1 The expression of Elafin in different lung cancer data sets in Oncomine database图1 Oncomine数据库中Elafin在不同肺癌数据集中的表达
Fig.2 The high expressed Elafin in lung cancer tissues图2 Elafin在肺癌组织中高表达
2.3 Elafin 相关基因的GO 分析 通过Linkedomics数据库对TCGA LUAD 数据集中Elafin 的相关基因进行了分析,结果显示共有7 697 个相关基因,其中上调基因3 748个,下调基因3 949个(图4A)。通过GSEA tools 对Elafin 的相关基因进行了GO 功能注释,设置条件为基因最小数目5,1 000 次模拟,以FDR<0.05 为筛选标准。结果显示在GO 生物过程中,Elafin相关基因主要在体液免疫反应、皮肤发育、粒细胞活化、维生素代谢等过程出现富集(图4B);细胞分布中主要富集于囊腔、细胞外基质、核糖体等部位(图4C);分子功能中主要与调节肽酶活性有关(图4D)。
2.4 Elafin 相关基因的KEGG 通路富集分析 进一步通过GSEA tools 对Elafin 的相关基因进行了KEGG 通路富集分析,设置条件与GO 分析条件一致。结果显示,Elafin相关基因高度富集在白细胞介素(IL)-17信号通路、核因子(NF)-κB 信号通路、蛋白酶体形成、鞘糖脂生物合成等通路,见图5。
Fig.3 Relationship between Elafin and the survival and prognosis of lung cancer patients图3 Elafin表达与肺癌患者生存预后的关系
2.5 Elafin 蛋白相互作用网络 Elafin 与Loricrin 角化包膜前体蛋白(Loricrin,LOR)、胱抑素A(cystatin A,CSTA)、丝蛋白(filaggrin,FLG)、小脯氨酸丰富蛋白(small proline rich protein,SPRR)2B、转谷氨酰胺酶1(transglutaminase 1,TGM1)、SPRR1B、整合素(involucrin,IVL)、envoplakin(EVPL)、SPRR3、AKT丝氨酸/苏氨酸激酶1(AKT serine/threonine kinase 1,AKT1)等蛋白存在相互作用,见图6。
3 讨论
由于肺癌起病隐匿,早期可没有任何典型症状,一般难以及时发现,导致治疗效果不理想,预后较差[9]。因此寻找相关的分子标志和靶点为肺癌早期诊断、早期治疗提供依据具有重要意义。Elafin最初被关注是因其抵抗微生物[10]、抑制炎症反应过程、减轻炎症反应等作用[11-12]。近些年有文献报道了Elafin 在癌症方面的作用。例如,Elafin 在乳腺癌中低表达,通过保护细胞周期蛋白E 不被弹性蛋白酶裂解成低分子质量的亚型,从而抑制肿瘤细胞的增殖[13]。Elafin在高级别浆液性的卵巢癌中过表达,通过激活丝裂原活化蛋白激酶-细胞外信号调节蛋白激酶(MEK-ERK)信号通路促进肿瘤细胞的增殖迁移[6]。目前,关于Elafin在肺癌中的研究尚罕见。本研究结果显示,多个数据集中Elafin 在肺癌组织表达上调,qPCR 实验亦证实Elafin 在肺癌组织中高表达,提示Elafin 可能在肺癌的发展中发挥着一定的作用。生存分析结果显示,高表达Elafin 的肺癌患者总生存率和无病生存率均较低表达者降低,提示Elafin 可能是影响肺癌患者预后的因素之一。与本研究结果类似,Caruso等[14]研究显示乳腺癌中Elafin的高表达导致患者总生存期和无病生存期缩短。然而,Liu 等[15]报道在结肠癌中Elafin 的表达与患者预后无显著相关性。在黑色素瘤细胞中,敲降Elafin促进了黑色素瘤的增殖能力[7]。Elafin 作为弹性蛋白酶抑制剂,在肠上皮细胞中多高表达,考虑到肠上皮细胞可能接触的外源物质较多,Elafin在结肠组织中可能更多发挥抗炎症的作用;而在黑色素瘤中,本身作为皮肤细胞表达的分子之一,Elafin在正常皮肤细胞中是否参与增殖调控尚待进一步研究验证。Elafin在不同肿瘤中可能发挥不同的作用。
Fig.4 GO analysis of Elafin-related genes图4 Elafin相关基因GO分析
Fig.5 KEGG analysis of Elafin-related genes图5 Elafin相关基因KEGG分析
Fig.6 The protein-protein interaction network of Elafin proteins图6 Elafin蛋白相互作用网络
持续的慢性炎症反应往往是慢性疾病进展为癌症的重要原因之一[16]。慢性肺炎是肺癌的危险因素[17]。本研究结果显示,Elafin 在GO 的生物过程中参与调节体液免疫反应、中性粒细胞介导的免疫反应、细胞趋化以及细胞氧化还原稳定等,提示Elafin在肺癌中可能参与了癌症的炎症免疫环境以及细胞氧化还原稳态的调控。分子功能中Elafin 主要富集于调节肽酶活性,在细胞定位中Elafin 主要富集于细胞外基质、囊腔等。有研究显示Elafin 可作为分泌蛋白在肿瘤进展中发挥作用[6],结合Elafin在炎症与免疫中的可能作用,其在肺癌中可能通过癌细胞分泌,在胞外利用其肽酶调节活性发挥癌症微环境的调节功能。另外,在关于肺癌中Elafin的GO分析中,Elafin相关基因也显示了对细胞运动、细胞脂质、微管等相关生物过程与分子功能调控的潜质,可能是Elafin在不同肿瘤中功能不同的原因之一。Elafin相关基因对细胞运动、细胞脂质、微管等相关生物过程与分子功能的调控尚无差异可能是设定分析条件的不同所导致的。在KEGG通路富集分析中,Elafin相关基因主要富集在IL-17 信号通路、NF-κB 信号通路以及药物代谢等过程中。IL-17、NF-κB等作为常见的炎症反应信号分子之一,在多种肿瘤中也常出现上调,例如IL-17 上调再通过刺激肿瘤转移相关基因(metastasis-associated protein,MTA1)表达促进宫颈癌细胞的迁移和侵袭[18]。Elafin 在肺癌中的作用是否与IL-17、NF-κB 信号通路有关值得进一步研究。
本研究结果显示,在蛋白质相互作用网络中,Elafin 与 LOR、CSTA、FLG、SPRR2B、TGM1、SPRR1B、IVL、EVPL、SPRR3、AKT1等蛋白存在相互作用。LOR 作为角化细胞膜的主要蛋白质成分,主要与皮肤病有关;IVL、EVPL等主要在皮肤角质细胞中发挥作用;CSTA是半胱氨酸蛋白酶抑制剂超家族成员,已有研究提示该家族可作为某些肿瘤的预后标志物[19];SPRR1B、SPRR2B、SPRR3 等是富含脯氨酸的小蛋白,在口腔鳞状细胞癌中可能发挥一定的作用[20]。TGM1 编码一种膜蛋白,主要参与烷基胺的转移,亦有文献报道了TGM1 在促进胃癌进展中的作用[21]。LOR、IVL、EVPL 等均与皮肤细胞有关,提示Elafin 在上皮细胞调控中发挥着一定作用;CSTA、SPRR1B、SPRR2B、SPRR3、TGM1 等均有作为肿瘤标志物的潜力,结合Elafin 在肿瘤中的研究,Elafin 亦有可能作为肿瘤的潜在标志物。本研究发现相互作用网络中Elafin 与AKT1 存在相互作用。AKT1 是PI3K/AKT 信号的关键信号分子之一,肿瘤中PI3K/AKT 信号的激活可促进肿瘤的增殖、迁移、侵袭 等 多 个 过 程[22]。Labidi-Galy 等[6]已经证实Elafin 可通过增加AKT 蛋白的磷酸化促进卵巢癌细胞的增殖迁移。肺癌中Elafin 的表达与PI3K/AKT信号通路之间的关系值得进一步关注。
综上所述,Elafin 在肺癌中高表达,并与患者预后不良有关。Elafin可能促进肺癌的发生发展,但由于样本以及数据库的研究范围有限,有关Elafin 在肺癌中的作用及其机制尚需进一步研究验证。