CDKN2A基因在非小细胞肺癌中表达及生物学功能生物信息分析
2020-02-19方红
方红
肺癌(lung cancer)根据病理类型分为小细胞肺癌和非小细胞肺癌,其中非小细胞肺癌约占全部肺癌患者的80%左右[1-2]。新近的流行病学数据显示,肺癌在男性发病率和死亡率均占到了第一位,在女性死亡率占到第一位而发病率仅次于乳腺癌占第二位[3]。肺癌患者预后不良,容易早期发生远处转移。然而肺癌的确切发病机制仍不十分清楚,目前的研究结果认为其发病与吸烟、环境和遗传等因素有关。随着分子生物学技术、基因表达谱芯片及二代测序技术的发展,大规模、高通量在基因分子水平上探讨肺癌发病机制成为可能[4]。同时也为肺癌的治疗提供了新的方向[5]。在本研究中,我们采用生物技术方法探讨细胞周期蛋白依赖激酶抑制剂2A在NSCLC中的差异表达、可能生物学功能及与患者的预后关系。
资料与方法
一、相关数据库选择
选择癌症基因组图谱数据库(TCGA)比较NSCLC患者癌组织、正常肺组织的差异表达水平及其与患者预后关系;采用蛋白-蛋白相互作用数据库STRING进行PPI网络分析。David数据库进行功能富集和KEGG信号通路分析。
二、CDKN2A差异表达、功能富集和信号通路分析
TCGA数据库中检索“非小细胞肺癌”和“CDKN2A基因”检索物种为人类,分析比较CDKN2A基因表达水平在NSCLC患者癌组织和正常肺组织中是否存在差异。同时分析了TRIM26基因在多种人体肿瘤中的表达水平,存在差异的条件为基因|Log2FC|>1,P<0.05。CDKN2A基因及相互作用蛋白进行功能富集和信号通路分析。功能包括,细胞定位、分子功能和生物学过程。
三、 蛋白网络构建
CDKN2A基因编码蛋白进行相互作用网络构建,STRING (http://string-db.org/cgi/input.pl)[6],相互作用蛋白网络构建条件为置信度大于0.7。
四、预后分析
CDKN2A基因高低表达按NSCLC患者肿瘤组织中位数进行划分,并绘制高低表达组Kaplan-Meier生存曲线进行log-rank检验,对比总生存和无疾病进展生存有无差异。
五、免疫组化检测CDKN2A表达
回顾性分析我院近5年收治并手术治疗的非小细胞肺癌(NSCLC)患者62例为研究对象。62例患者中男性41例,女性21例,平均年龄68.8±11.2岁,其中腺癌34例,鳞癌28例。采用免疫组化SP法检测患者肿瘤组织和对应的癌旁组织中CDKN2A的表达水平。比较癌组织和癌旁组织中CDKN2A表达水平是否存在差异。同时采用log-ran检验比较CDKN2A阳性和阴性表达组患者生存期是否存在差异。
六、统计学处理
相关聚类、差异表达、蛋白网路等采用在线软件分析,生存数据采用log-rank检验,P<0.05为有统计学差异。
结 果
一、CDKN2A在非小细胞肺癌中的表达
CDKN2A基因在多种实体肿瘤包括乳腺癌、食管癌、肠癌等中表达水平明显上调(图1A)。在NSCLC患者(包括腺癌和鳞癌)癌组织中CDKN2A表达水平均明显高于对应的正常肺组织(pall<0.05),图1B。而CDKN2A表达水平与肿瘤分期无明显相关性,P>0.05(图1C)。
图1 细胞周期蛋白依赖激酶抑制剂2a(CDKN2A)在肿瘤组织与正常组织中的表达比较
A: CDKN2A在多种肿瘤中的表达比较,红色为肿瘤组织,蓝色为癌旁组织; B:NSCLC患者(包括鳞癌和腺癌)癌组织与对应的癌旁组织中CDKN2A表达比较,红色为肿瘤组织,绿色为癌旁组织;C: CDKN2A与NSCLC患者分期关系
二、CDKN2A相关蛋白PPI网络构建
CDKN2A相关蛋白PPI网络中(图2),蛋白之间的相互作用关系指数为24.8,区域聚类指数为0.74,相互作用蛋白呈现明显的聚类表达,P<0.05(见图3)。
图2 CDKN2A相关蛋白PPI网络
图3 CDKN2A相关蛋白聚类分析热图
三、GO和KEGG功能富集和信号通路分析
CDKN2A编码蛋白主要定位在细胞核、细胞膜和囊泡,分子功能主要为蛋白结合、核蛋白结合和铁结合。而生物学过程主要集中于代谢、细胞增殖及对刺激的反应(图4)。KEGG信号通路主要为细胞周期调控、DNA蛋白结合以及Wnt信号通路。
图4 CDKN2A基因功能富集
四、 生存分析
CDKN2A高表达NSCLC患者总生存期明显低于低表达组,且差异有统计学意义(HR=1.3,P=0.02),而CDKN2A高低表达组间,NSCLC患者无疾病进展生存无统计学差异(HR=0.94,P=0.59)(图5)。
图5 CDKN2A高低表达组与NSCLC患者预后关系的生存曲线(A:NSCLC患者总生存比较;B:NSCLC患者无疾进展生存比较)
五、免疫组化CDKN2A表达及其与患者预后
62例NSCLC患者癌组织中CDKN2A阳性表达11例(17.7)而对应癌旁组织中阳性表达49例(79.0%),癌组织中CDKN2A阳性标的率显著高于癌旁组织,且差异有统计学意义(P<0.05)。而CDKN2A阳性组与阴性组患者生存期差异无统计学意义(HR=0.99,P>0.05)(图6)。
图6 CDKN2A阳性组与阴性组患者生存曲线
讨 论
细胞周期蛋白依赖激酶抑制剂2A(CDKN2A)或P16INK4A,在人类定位于9号染色体,21区[7-8]。该基因全场8500bp,包括3个外显子,编码一个由148个氨基酸组成的蛋白。该基因首先在上世纪90年代初由Serrano发现,后续研究中认为其可与CDK4、CDK6结合,抑制周期素与CDK4形成具激酶活性的复合物,从而阻断该复合物对RB蛋白磷酸化,导致细胞停止于G,从而抑制了细胞的增殖,是一个细胞周期依赖的蛋白。1994年(美国冷泉港实室)新发现CDKN2A是一种细胞周期中的基本基因,直接参与细胞周期的调控,负有调节细胞增殖及分裂,在人类50%肿瘤细胞株中发现有纯合子缺失,认为p16是比p53更重要的一种新型抗癌基因有人把它比作细胞周期中的刹车装置,一旦失灵则会导致细胞恶性增殖,导致恶性肿瘤。
后续研究逐渐发现,CNKN2A基因在多种肿瘤组织中呈现差异表达,在肿瘤患者癌组织中表达水平往往上调,并与患者的临床病理特征和预后存在一定的相关性。如杨军[9]等人研究发现CDKN2A在膀胱癌患者癌组织中异常表达并膀胱癌的发生发展密切相关。王勇文等人[10]研究显示CDKN2A基因的变异及其编码蛋白质的失活与小细胞肺癌发生、发展有关。而CDKN2A在非小细胞肺癌(NSCLC)中的研究及其功能相对报道较少,CDKN2A高低表达与NSCLC患者的预后关系也并不明确。因此。我们采用生物技术方法探讨细胞周期蛋白依赖激酶抑制剂2A在NSCLC中的差异表达、可能生物学功能及与患者的预后关系,以期待为临床治疗NSCLC提供新的思路和靶向药物研发方向。
在本研究中,我们发现CDKN2A基因在多种实体肿瘤包括乳腺癌、食管癌、肠癌等中表达水平明显上调。CDKN2A的常高表达可能与多种人体肿瘤的发生发展有关,包括NSCLC。而CDKN2A相关的信号通路也大多集中于细胞周期分裂和细胞增殖,再次证明CDKN2A参与了细胞的周期调控,可能成为抑制肿瘤分裂症状的重要靶点。同时我们研究证明,CDKN2A的高表达与NSCLC患者的预后不良有关,有望成为NSCLC预后的分子标志物。但研究仅从生物信息层面进行了证实,后续仍需要相关分子生物学实验进行验证。