KPNA4在胰腺癌中高表达并且与不良预后相关
2022-09-16杜岩姜文凯李昕周文策
杜岩,姜文凯,李昕,周文策,2
(1.兰州大学 第一临床学院,甘肃 兰州 730000;2.兰州大学第一医院 普外科,兰州 730030)
胰腺癌是一种侵袭性和致命性很高的消化系统恶性肿瘤[1]。胰腺导管腺癌是最常见的类型,占所有胰腺癌病例的95%[2]。大多数胰腺癌患者被诊断时已经是晚期阶段,因此只有15%~20%的胰腺癌患者可以接受手术[3]。此外,胰腺癌即使在根治性切除后仍有很高的复发率[1]。因此,探究胰腺癌的发病机制以及寻找用于早期诊断的生物标记物对优化临床治疗、改善患者预后有十分重要的意义。
Karyopherin alpha(KPNA)是一组通过结合核定位信号分子来介导多种转录因子穿梭运动的受体蛋白,KPNA4是其中发挥关键作用的成员之一,既往的研究显示KPNA4与多种肿瘤的发病机制有关,例如在肺癌中,过表达的lncRNA MCM3AP-AS1通过靶向关键的miR-340-5p/KPNA4 轴,促进肺癌的血管生成和肿瘤进展[4];肝癌中KPNA4在mRNA和蛋白水平高表达,具有诊断和预后的价值[5]。但是KPNA4在胰腺癌中发挥的作用尚不清楚。在本研究中,我们利用公共数据库和临床数据分析了KPNA4在胰腺癌组织中的表达差异以及预后价值,并进一步探讨了KPNA4在胰腺癌中潜在的作用机制。
1 材料和方法
1.1 基因表达数据的下载
从基因型和基因表达(Genotype-Tissue Expression,GTEx)数据库中提取167例正常胰腺组织的基因表达数据[6]。从人类癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中提取178例胰腺癌组织和4例正常胰腺组织的基因表达数据[7]。之前的研究表明,可以合并TCGA和GTEx的数据用于基因的差异表达分析[8]。从高通量基因表达数据库(Gene Expression Omnibus,GEO)中提取芯片表达数据[9],GEO数据库芯片ID分别是GSE28735、GSE62165、GSE15471。
1.2 临床数据的下载
从TCGA数据库中提取所有胰腺癌患者的临床资料,选取其中临床数据和生存信息完整的165 个样本用于分析KPNA4表达与临床指标的相关性。将收集的临床基线资料均转换为等级资料,包括年龄(≥60岁vs<60岁)、性别、恶性肿瘤病史、手术方式、肿瘤病理分级(G1/2vsG3/4)、肿瘤TNM分期(T1/2vsT3/4)、肿瘤临床分期(Ⅰ/Ⅱ期vsⅢ/Ⅳ期)。收集患者的随访时间和随访状态用于生存相关的分析。
1.3 本单位临床样本收集
从生物样本库中获取2021年1 月至2022年1 月在兰州大学第一医院接受胰腺癌手术治疗的42例肿瘤组织样本和42 例匹配癌旁组织的石蜡包埋组织。所有的患者术后病理确诊为胰腺导管细胞癌,均未接受化疗或放射性治疗。所有患者签署书面知情同意书,方案由兰州大学第一医院伦理委员会批准。
1.4 评估KPNA4蛋白表达
按照供应商的说明,KPNA4 抗体(proteintech 1∶500)用于PAP法免疫组化。免疫组化结果的半定量评估基于阳性细胞的百分比和染色的强度,由两名经验丰富的病理科专家通过观察完成。阳性细胞百分比(EXT)分为4 级:0、1(<10%)、2(10%~50%)、3(>50%)。染色强度(INT)分为4级:0(无染色)、1(黄色)、2(黄褐色)、3(褐色)。相对表达指数按公式计算:(EXT×INT)。评分分数<4为低表达,评分分数≥4为高表达。
1.5 获取KPNA4关联基因
Linked Omics是基于TCGA的生物信息学分析数据库,其中包括了多种常见恶性肿瘤的测序数据[10]。LinkedOmics数据库包含多种分析功能:其中LinkFinder模块通过相关性分析得到单基因的关联基因集,LinkInterpreter模块通过对关联基因集的富集分析来预测目标基因的生物学功能。我们通过LinkedOmics中的胰腺癌表达谱数据,获取了与KPNA4 表达量有关联的基因列表,并进一步进行了功能分析。
1.6 基因富集分析
基因本体论(Gene Ontology,GO)可以提取基因集的显著生物学功能。生物过程(biological processes,BP),细胞成分(cellular components,CC)和分子功能(molecular functions,MF)是GO分析最重要的三个组成。京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)可以评估基因组所参与的生物学过程和细胞通路。通过ClusterProfiler R包进行KPNA4关联基因的GO分析和KEGG分析,ggplot2 R包用于结果的可视化。
1.7 统计学分析
SPSS 22.0 软件用于统计分析。符合正态分布的计量资料使用t检验进行比较;分类变量的组间比较使用卡方检验;Spearman分析用于临床变量和KPNA4 表达量的相关性分析;Cox回归模型用于分析临床变量和KPNA4 对胰腺癌患者的预后意义;Kaplan-Meier生存曲线用于分析KPNA4与患者总生存期的关系。使用GraphPad Prism 7和R 3.6.0软件进行图形绘制。P<0.05表示差异具有统计学意义。
2 结果
2.1 TCGA胰腺癌组织中KPNA4高表达
通过比较178 例胰腺癌组织和171 例胰腺正常组织,结果显示KPNA4 mRNA水平在胰腺癌组织中显著高表达[(3.486±0.337)vs(2.122±0.353),图1A]。从GEO数据中获取KPNA4 的芯片表达数据,验证这一结果。GSE28735 芯片中,KPNA4 在肿瘤组的mRNA表达量高于正常组[(5.899±0.329)vs(5.675±0.359),图1B];GSE15471芯片也得到了相似结果[(6.856±0.548)vs(6.100±0.829),图1C];GSE62165 芯片中,KPNA4 在肿瘤组mRNA的表达量也高于正常组[(8.311±0.314)vs(7.632±0.151),图1D]。
图1 数据库中KPNA4在胰腺正常组织和胰腺癌组织的表达水平
2.2 TCGA胰腺癌数据中KPNA4 mRNA表达与TN分期相关
提取TCGA数据库中临床信息完整的165 个胰腺癌样本进行分析,按照KPNA4 mRNA表达量的均值将所有样本分为KPNA4高表达组和KPNA4低表达组。通过比较两组间的临床基线资料发现,高表达组患者的肿瘤T分期和N分期均高于低表达组患者(P<0.05),而其他临床变量的组间差异没有统计学意义(P>0.05),如表1所示。通过Spearman分析进一步评估KPNA4 mRNA表达量与T分期和N分期的相关性,结果显示T分期(r=0.261,P<0.001)和N分期(r=0.193,P<0.05)均和KPNA4 mRNA表达正相关,如表2 所示。这些结果提示,KPNA4 可能与胰腺癌的肿瘤大小和淋巴结转移有关。
表1 胰腺癌患者临床基线资料和KPNA4 mRNA表达量[例(%)]
表2 胰腺癌患者临床基线资料与KPNA4表达量的相关性
2.3 本院临床样本验证KPNA4的表达水平
为了进一步验证数据库中的结论,我们采用免疫组化检测了42例胰腺癌组织和42例匹配癌旁组织中KPNA4的蛋白表达水平。结果显示,在42例胰腺癌组织中,KPNA4蛋白表达水平上调(高表达29例,69%),而在42 例匹配癌旁组织中KPNA4 蛋白表达水平下调(高表达18例,42.9%)。与癌旁组织相比,胰腺癌组织中KPNA4的蛋白表达水平异常上调(χ2=5.845,P<0.05,如图2)。
图2 本院临床样本胰腺癌组织和癌旁组织中KPNA4的表达
2.4 KPNA4关联基因的功能分析
通过LinkedOmics 数据库获取胰腺癌中与KPNA4 mRNA表达相关的基因集,符合相关系数≥0.5 和P<0.05 的基因定义为KPNA4 关联基因(n=886个)。GO分析的结果如图3A所示,关联基因的功能主要富集在细胞增殖过程和蛋白激酶活性。KEGG的结果如图3B所示,关联基因参与了多种类型的肿瘤通路,包括胰腺癌、肺癌、前列腺癌等;还参与了一些和肿瘤发生发展密切相关的通路,例如肌动蛋白调节、PI3K-Akt信号通路、ErbB信号通路等。GSEA分析进一步评估KPNA4对于肿瘤通路的调节作用,结果显示高表达的KPNA4促进肌动蛋白细胞骨架、TGF-β信号通路、细胞外基质(extracellular matrix,ECM)受体相互作用等与肿瘤密切相关的通路,如图4。这些结果提示,KPNA4 可能通过参与多种肿瘤相关的生物学过程从而促进胰腺癌的进展。
图3 KPNA4关联基因的GO分析(A)和KEGG分析(B)
图4 KPNA4关联基因的GSEA分析
2.5 KPNA4与患者的不良预后有关
通过Cox单因素分析评估临床基线资料和KPNA4 mRNA表达量对于胰腺癌患者的预后意义,结果显示,患者接受的手术方式、肿瘤N分期和KPNA4是影响患者生存时间的因素(如表2)。将单因素变量纳入Cox多因素分析,结果显示,手术方式、肿瘤N分期和KPNA4 mRNA是胰腺癌患者预后的独立影响因素(如表3)。Kaplan-Meier生存曲线用于评估KPNA4高表达组和KPNA4低表达组之间患者总生存时间的差异,结果显示,高表达组的总生存时间显著少于低表达组(如图5)。
图5 不同KPNA4 mRNA表达水平的患者Kaplan-Meier生存曲线图
表3 胰腺癌不良预后相关因素的Cox回归分析
3 讨论
胰腺癌是最致命的恶性肿瘤之一,寻找潜在的生物标记物和治疗靶点可以为胰腺癌的治疗提供新的角度[11]。最近的研究报道了一些胰腺癌潜在的生物标记物。外泌体ZIP4 可以显着促进胰腺癌的进展,并且血清外泌体ZIP4是新的诊断生物标记物[12]。胰腺癌患者的血浆EVL水平下调,是与患者预后相关的潜在生物标记物[13]。另外,研究发现ZMAT1-SIRT3-p53 信号通路在胰腺癌发生发展过程中发挥重要作用,并且ZMAT1 作为一种肿瘤抑制因子也是胰腺癌的新型生物标记物[14]。在本研究中,通过TCGA、GTEx和GEO数据库的联合分析以及本院临床样本,寻找与胰腺癌患者预后相关的生物标记物。
KPNA4是核转运蛋白家族的成员,在介导细胞成分运输的过程中发挥作用。KPNA4在小细胞肺癌、肝癌、甲状腺癌、卵巢癌、骨肉瘤中均有异常表达,涉及到肿瘤的增殖和侵袭、迁移机制[5,15-18]。但是关于KPNA4在胰腺癌功能和临床价值的研究较少。本研究的结果显示,KPNA4的mRNA表达水平和蛋白表达水平在胰腺癌组织中上调,这与KPNA在其他类型肿瘤中的表达趋势一致。KPNA4的mRNA表达水平与胰腺癌患者的肿瘤大小和淋巴结转移相关,并且高表达KPNA4 组的患者预后不良,Cox多因素分析提示KPNA4是胰腺癌患者的独立预后因素。Feng等[16]报道KPNA4 的mRNA和蛋白在乳头状甲状腺癌的肿瘤组织和细胞中均高表达,其表达量与肿瘤大小、临床分期和淋巴结转移有关。肝细胞癌组织的KPNA4表达在mRNA和蛋白水平均高于正常组织,并且高表达KPNA4的肝癌患者具有较高的肿瘤分期和组织分级,同时也是不良预后的独立影响因素[5]。由此可见,KPNA4在胰腺癌中扮演癌基因的角色,可为胰腺癌的早期诊断提供重要的支持证据。
Hu等[19]提出KPNA4 可以介导NF-κB信号通路中p65和p50二聚体的入核转运,而lncRNA ST7-AS1通过结合miR-181b-5p从而抑制KPNA4在肺癌中的促癌作用。在胶质瘤中,miR-181b通过阻断KPNA4表达来抑制肿瘤的上皮间质转换,从而限制胶质瘤在体内和体外的侵袭能力[20]。另外,KPNA4 还通过介导p53的核转运,参与了白内障的发病机制[21]。KPNA4在胰腺癌中发挥的功能尚不明确,我们通过功能富集分析,显示KPNA4 可以激活与胰腺癌相关的多种通路,包括肌动蛋白细胞骨架、TGF-β信号通路和ECM-受体相互作用。肌动蛋白细胞骨架是肿瘤上皮间质转化(epithelial-mesenchymal transition,EMT)的关键下游环节,EMT通过改变肌动蛋白的形态导致细胞骨架重塑,是肿瘤细胞发生迁移和侵袭的前期准备[22]。TGF-β信号通路和ECM-受体信号通路在胰腺癌中也发挥着重要的促癌作用[23-24],这些富集分析的结果提示KPNA4可能参与了胰腺癌的发生发展机制。
综上所述,KPNA4 在胰腺癌组织中高度表达,是患者预后的独立危险因素。KPNA4 可能通过多种肿瘤相关的信号通路促进胰腺癌进展,表现出癌基因的特征,是潜在的预后生物标记物。但是本研究尚有不足之处:KPNA4在胰腺癌mRNA水平的差异表达和和预后价值虽然得到多组数据库队列的支持,但是没有使用本院样本进行验证。关于KPNA4功能富集分析的结果具有局限性,我们将基于试验进一步阐述KPNA4的作用机制。