APP下载

小细胞肺癌潜在相关基因的生物信息学分析及功能预测

2023-03-27杨梦霞郭宵飞朱世杰芦殿荣王宁军

河北医药 2023年2期
关键词:关键通路肺癌

杨梦霞 郭宵飞 朱世杰 芦殿荣 王宁军

小细胞肺癌(small cell lung cancer,SCLC)在支气管癌中占比15%,是一种神经内分泌癌,呈高度低分化,死亡率高达所有肺癌死亡率的25%[1,2]。尽管免疫疗法在近几年治疗SCLC中取得了较好的疗效,但仍存在许多挑战,如疗效适中且仅限于一小部分患者[3,4]。此外,由于SCLC缺乏特异性症状和肿瘤生长快速,其早期检测具有一定挑战性,这使目前的筛查方法在疾病早期诊断中无明显效果[3],故我们需要探索一种新的生物标志物来协助SCLC的早期诊疗。在本次研究中,从基因表达综合数据库(gene expression omnibus,GEO)下载SCLC患者的基因表达谱芯片,并使用GEO2R软件将SCLC组织与正常肺组织进行比较,以获得差异表达基因(differentially expressed gene,DEG),并进一步分析其生物功能、相关通路和临床预后价值,旨在为深入研究SCLC发生机制及早期诊疗和预后判断提供新的理论依据。

1 资料与方法

1.1 基因芯片数据来源 GEO(https://www.ncbi.nlm.nih.gov/geo/)是最大的国际公共芯片储存数据库,收录并整理了多种形式的高通量基因组数据,如微阵列芯片和二代测序等。在该数据库中,以“small cell lung cancer”、“normal”为检索词,条目类型和物种分别为“series”、“Homo sapiens”,筛选出数据集GSE149507(由GPL23270 平台提供[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array),包含正常肺组织标本和小细胞肺癌组织标本各18例,患者平均年龄56岁。

1.2 DEG筛选 GEO2R(http://www.ncbi.nlm.nih.gov/geo/geO2r)是GEO数据库提供的在线工具,可用于2组或多组样本的比较,以获得差异性表达基因。在该数据库中,以“adj.P.Val<0.05”、“|log FC|>2(Fold Change,FC)”为条件,筛选DEG。

1.3 富集分析 DAVID(http://david.ncifcrf.gov)是一个关于生物信息学的数据库,为大规模基因或蛋白列表提供系统综合的生物功能注释信息,目前主要用于差异基因的功能和通路富集分析。在该数据库中,上传DEG列表,选择物种为“Homo sapiens”,进行生物功能和通路富集分析。

1.4 PPI构建与模块分析 STRING数据库 (http://string-db.org) 收集、评估和集成了所有公开可用的蛋白-蛋白相互作用信息,并通过计算预测补充这些信息,构建了蛋白-蛋白互作网络(protein-protein interaction,PPI);Cytoscape是一个提供了分子网络展示、布局、查询等基本功能的软件,可用于蛋白-蛋白、蛋白-DNA等相互作用的分析。本次研究,在STRING数据库中上传DEG列表,并以Interaction score=0.9为条件,分析PPI网络,然后将其结果导入Cytoscape软件中进行可视化分析,以“Degree cutoff=2”、 “Node score cutoff=0.2”、 “K-core=2”、“Max depth=100”为条件,运用MCODE插件筛选出重要模块基因。

1.5 关键基因筛选和预后分析 根据节点连接度(Degree),筛选出Degree≥40的关键基因,并使用Cytoscape中BiNGO插件对BP富集结果可视化。Kaplan-Meier Plotter(https://kmplot.com/analysis/)是一个肿瘤在线生存分析数据库,能够针对54 000多个基因、21种癌症展开研究。在本研究中,使用该数据库对关键基因进行预后分析,并绘制生存曲线图。

2 结果

2.1 筛选出614个DEG 在GEO中筛选出GSE149507,包含36个合格样本(正常肺组织和小细胞肺癌组织标本各18例)。GEO2R分析后,得到上调和下调基因分别有328个、286个,见图1。

图1 DEG聚类热图(A)和火山图(B)

2.2 富集分析结果 在DAVID中,以P<0.05为条件,对DEG进行生物功能和通路富集分析。GO生物富集得到BP 22项、CC 6项、MF 13项,筛选出涉及BP、MF的前10条及CC的6条富集结果进行分析。在BP方面,包含微管运动、DNA修复及合成和DNA双链展开等;在CC方面包含驱动蛋白复合物、微管和细胞器膜等;在MF方面包括微管结合、ATP酶活性和趋化因子活性等。通路富集分析得到40条通路,选择前30条做富集分析,相关通路主要有细胞循环、DNA修复和酪氨酸代谢等。见图2。

图2 DEG生物功能(A)和通路(B)富集分析

2.3 PPI网络及重要模块筛选 使用STRING和Cytoscape构建PPI网络并将其可视化,包含275个节点,1 999条边;后运用MCODE插件筛选出重要模块,得分为35.098,包含50个节点,895条边。见图3。

图3 DEG(A)和重要模块(B)的PPI网络图

2.4 筛选出关键基因及预后分析 在重要模块基因中,筛选出Degree≥40的关键基因,分别是KIF2C、CDK1、BUB1、CDC20、CCNB2、CCNB1和BUB1B,Degree均为49;AURKB、 CDCA8和NDC80,Degree均为48;CENPF和 BIRC5,Degree均为47;KIF20A,Degree为40。通过Kaplan-Meier Plotter数据库对关键基因进行预后OS分析,发现在肺癌基因芯片中未检索到CDK1。结果显示,上述关键基因的高表达水平与不良预后相关,表明关键基因在小细胞肺癌整体生存时间上可能发挥一定作用。见图4、5。

图4 SCLC关键基因的BP可视化网络图

图5 关键基因对肺癌患者的预后影响分析

3 讨论

在过去十年中,肺癌患者的五年生存率虽略有提高,但仍保持在10%的低水平[5],其中SCLC仍是主要的全球癌症死亡原因之一。虽然SCLC治疗取得了很大突破,但其发病机制仍不清楚[6],因此我们需要深入探讨 SCLC相关生物标志物、信号通路和分子发生机制,以期能够在SCLC诊疗方面提供新的参考依据,改善患者预后。在本研究中,我们不仅发现了在既往研究中已被证实与SCLC发病机制相关的KIF2C、CDC20、BUB1B和NDC80基因[7],还发现CDK1、BUB1和CCNB2等与SCLC发病机制也有关,为后续SCLC的深入研究提供了更多潜在靶点。

CDK1是细胞周期中G1/S和G2/M转化所必需的重要驱动因子[8],其表达水平异常不仅会导致肿瘤快速生长,还会导致癌细胞增殖[9]。有研究表明指出,抑制CDK1活性可以抑制结直肠癌细胞在体内/外增殖,且CDK1高表达水平可刺激结直肠癌细胞的增殖和迁移,最终导致患者较差生存期[10]。BUB1可通过磷酸化形成BUB1-BUB3复合物以调控其他重要的纺锤体检查点蛋白,改变细胞周期进程[11]。研究认为BUB1在非子宫内膜样癌中表达水平更高,但癌组织中低BUB1阳性表达率,会出现低分化子宫内膜癌和不良预后[12]。在本研究中,BUB1高表达水平与短OS密切相关,这与上述研究中的结果一致,表明该基因在肿瘤的发生发展过程中有重要作用;但尚未查到有关CDK1表达水平对肿瘤患者预后影响,且由于目前关于CDK1表达水平对临床预后的相关临床报道较少,故其预后价值仍有待进一步研究。

CCNB1、CCNB2和AURKB是有丝分裂中的监测蛋白,在G2/M转化中起关键作用。研究表明CCNB1在非小细胞肺癌等多种癌症中过表达,与不良预后密切相关[13]。此外,也有研究指出,CCNB1的mRNA水平和蛋白质下调可减少细胞增殖[14]。而CCNB2在肝癌中表达水平较高,与不良预后相关[15];当CCNB2表达水平降低时,可使膀胱癌细胞的浸润和转移受抑[16]。AURKB能够通过介导CCND1基因启动子处的H3S10ph来激活CCND1的表达,而CCND1是细胞周期中同源细胞周期蛋白依赖性激酶4/6(CDK4/6)的关键变构激活剂,对于启动DNA复制至关重要[17],而高表达的AURKB和CCND1可促进胃癌细胞的增殖,进而导致较短的OS[18]。本次研究结果也表明,CCNB1、CCNB2和AURKB高表达水平也可致SCLC患者较差的预后,与上述研究结果一致。

CDCA8是有丝分裂的重要调节剂,在大多数癌症中都可出现高表达,而在正常组织中表达水平较低[19]。体外实验证明,敲除CDCA8表达可以导致膀胱癌细胞在S和G2/M期停滞,进而使细胞增殖受抑和细胞凋亡加速[20]。CENPF是一种与细胞周期相关的核抗原,在G0/G1细胞中低水平表达,并在S期积累在核基质中,在G2/M细胞中表达最高,且经体外实验证明,CENPF可激活PI3K-AKT-mTORC1信号转导途径,进而使PTHrP分泌增加,修饰骨环境以促进破骨细胞形成和骨定植,为乳腺癌细胞向骨骼的转移创造了有利环境,最终导致不良预后[21]。BIRC5也称为Survivin,可通过影响细胞分裂和增殖以及抑制细胞凋亡在癌变过程中发挥重要作用[22]。大量研究表明,在大多数恶性肿瘤中,BIRC5表达水平均较高,且高BIRC5表达可导致乳腺癌患者更差的总生存期及转移复发风险增加[23]。KIF20A也称为MKLP2和RAB6KIFL,位于染色体5q31.2上,主要聚集在有丝分裂细胞纺锤体的中央区域,可参与有丝分裂过程[24]。大量研究表明,KIF20A在膀胱癌和胃癌等多种癌症中都出现过表达,且高KIF20A表达水平可促进膀胱癌细胞的增殖和转移,导致较差预后;低表达时可诱导胃癌细胞的有丝分裂(G2/M期)停滞,增强化疗药物的敏感性[25,26]。在本次研究结果中,CDCA8、CENPF、BIRC5和 KIF20A表达水平对SCLC患者预后影响与上述报道结果一致。

综上所述,本研究从生物信息学角度分析SCLC发生发展的关键基因及差异表达基因,并进一步探讨其生物学功能和预后价值,猜测SCLC关键基因CDK1、BUB1和CCNB2等可能通过微管运动、DNA修复、驱动蛋白复合物及微管结合等多个生物学过程、细胞组分及分子功能,并调节细胞循环、DNA修复和酪氨酸代谢等多个通路,进而影响影响肿瘤的发生发展,故可能成为潜在的预后生物标志物。但目前有关这些关键基因在SCLC发生发展过程中作用的研究相对不足,故仍需后续研究进一步验证。

猜你喜欢

关键通路肺癌
中医防治肺癌术后并发症
硝酸甘油,用对是关键
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
高考考好是关键
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
microRNA-205在人非小细胞肺癌中的表达及临床意义
proBDNF-p75NTR通路抑制C6细胞增殖
基于肺癌CT的决策树模型在肺癌诊断中的应用
通路快建林翰:对重模式应有再认识
Hippo/YAP和Wnt/β-catenin通路的对话