APP下载

肺腺癌诊断标志物筛选及免疫细胞浸润分析

2022-11-12雷媛娣刘艳萍孙站兵邓伟华张朝晖

生物信息学 2022年3期
关键词:差异基因腺癌标志物

雷媛娣,刘艳萍,孙站兵,邓伟华,张朝晖

(南华大学 公共卫生学院 预防医学系,湖南 衡阳 421001)

肺癌是近年来全球范围内发病率和死亡率最高的恶性疾病[1],其中85%以上为非小细胞肺癌(NSCLC)[2],包括肺腺癌(LUAD),肺鳞状细胞癌(LUSC)和大细胞肺癌(LCLC),以及其他不常见的类型,其中肺腺癌最常见。目前,在肺腺癌的分子病理学、临床肿瘤学、靶向治疗等研究方面取得了较好进展,但肺腺癌患者的死亡率没有显著降低[3-4]。因此,需要寻找肺腺癌的早期诊断生物标志以提高患者的生存率。

近年,肿瘤与免疫的相关性受到越来越多的重视,肿瘤中免疫细胞浸润程度与肿瘤生长、进展和患者结局有关,其不仅对患者的生存具有预测价值,还可影响肿瘤的治疗效果[5-6]。肺癌、乳腺癌等实体肿瘤组织中存在免疫细胞浸润,免疫细胞浸润类型与这些实体肿瘤的临床特征有较强的相关性且免疫细胞浸润情况可用于肿瘤风险分层[7-9],免疫细胞包括B细胞,NK细胞、T细胞、DC细胞等等,而这些细胞通常会表达一些特定基因。

从TCGA和GEO数据库中下载肺腺癌mRNA表达数据,用生物信息学方法筛选肺腺癌差异表达基因,对差异基因进行系统性分析,并利用Cibersort计算肺腺癌和正常肺组织样本中不同种类免疫细胞的浸润程度,探讨肺腺癌早期诊断的生物标志物,为肺腺癌的靶向治疗研究提供新思路。

1 材料与方法

1.1 数据下载

通过GEO(https://www.ncbi.nlm.nih.gov/GEO31210)和TCGA数据库(https://portal.gdc.cancer.gov/)下载肺腺癌基因表达及临床病理数据。包括mRNA和clinical;GSE31210数据集基于GPL570([HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array)平台,包括226例肺腺癌肿瘤样本和20例正常肺组织样本;TCGA数据集包括526例肺腺癌样本和59例正常肺组织样本。

1.2 差异基因筛选(DEGs)

利用R语言limma包,以P<0.05 及|log 2 FC|>2为条件,筛选正常组织以及肺腺癌样本之间的差异表达基因[10],再将GEO和TCGA的差异基因取交集,得到234个差异基因,使用(http://PSB.ugent.be/web tools/Venn/)在线绘制Venn图,然后用R语言ggscatter包绘制差异基因的火山图。

1.3 GO和KEGG富集分析

利用DAVID网站(https://david.ncifcrf.gov/tools.jsp,对DEGs进行GO注释及KEGG富集分析,研究DEGs的生物功能,包括生物过程(BP)、分子功能(MF)和细胞成分(CC);KEGG用于通路富集分析,P<0.05和FDR<0.05被标记为有效项。

1.4 PPI网络构建及hub gene基因的选择

通过 STRING 数据库(https://string-db.org/)构建 PPI网络,Cytoscape 软件 将 PPI 网络可视化[11],并利用 cytoHubba 插件选择前 20 个基因作为 hub 基因。

1.5 预后生存分析

按照表达量高低将肺腺癌样本分为:高表达和低表达两组,利用R语言survival包在GSE31210和TCGA数据库里分别做预后生存分析;并使用卡普兰-迈耶(Kaplan-Meier)(http://kmplot.com/analysis/index.php)在线工具对20个关键基因进行生存分析,并对有预后价值的基因用 GraphPad Prism 5软件绘制生存图。

1.6 诊断生物标志物的筛选

用R语言pROC包绘制肺腺癌预后生存分析中有统计学意义的基因的ROC曲线[12],并根据AUC值对肺腺癌有诊断价值的hub基因进行评估,按AUC>0.7筛选肺腺癌诊断生物标志物。

1.7 GSEA基因富集分析

为提高分析结果的准确性,采用GSEA软件(https://www.gsea-msigdb.org/gsea/index.jsp)分析已筛选的肺腺癌诊断生物标志物等基因是否在所选数据集中富集分子通路[13-14],计算富集分数并进行显著性检验分析。

1.8 免疫细胞浸润的评估

为了评估肺腺癌中免疫细胞浸润情况,以及筛选的肺腺癌诊断生物标志物等基因表达与肺腺癌组织中免疫细胞浸润情况间的关系,用CIBERSORT算法(https://cibersort.stanford.edu/)对GSE31210数据进行分析,根据P<0.05筛选合适的样本并计算样本中每种免疫细胞的百分比,用 ggplot2 包绘制22种免疫细胞浸润可视化小提琴图,并分析其22种免疫细胞浸润的差异。

2 结果分析

2.1 肺腺癌差异表达基因(DEGs)

结果显示:TCGA数据库中肺腺癌差异基因有2 019个,其中有1 195个表达上调,824个表达下调;GEO数据库中肺腺癌差异基因为315个,129个上调,186个下调;由TCGA和GEO共得到234个肺腺癌差异表达基因DEGs(见图1)。

图1 TCGA和GEO数据库中LUAD差异基因的筛选

2.2 差异基因的GO富集分析及KEGG富集分析结果

GO分析发现,DEGs在分子功能(MF)方面主要富集在:血清型內肽酶活性、氧运输功能、肝素结合、金属内肽酶活性;在细胞组分(CC)方面主要富集在:质膜的组成成分、质膜、细胞外基质、胞外、细胞黏附等;在生物过程(BP)方面主要富集在胶原代谢、蛋白水解、血小板脱粒、免疫反应等(见图2a)。KEGG富集分析发现DEGs主要涉及免疫、蛋白、胶原、细胞外成分等一系列与微环境相关的通路,如:PPAR信号通路、与疟疾、补体和凝血级联反应、PI3K AKT信号通路、病毒蛋白与细胞因子和细胞因子受体的相互作用通路,以及蛋白质消化和吸收相互作用通路、趋化因子信号通路及细胞周期信号通路(见图2b)。

图2 肺腺癌差异基因的功能富集分析

2.3 蛋白-蛋白相互作用(PPI)网络的构建和关键基因(hub genes)的筛选

用STRING构建的PPI网络(见图3a);利用cytoHubba 插件选择的前20个hub基因分别是:SPP1、CLDN5、BDNF、TEK、IL6、PPBP、CXCL13、MMP9、CCNA2、EGF、CAV1、MMP7、CDH5、SELE、MMP3、MMP13、MMP1、HMMR、TOP2A、DLGAP5等基因(见图3b)。

小儿急性支气管炎西医诊断标准参照《诸福棠实用儿科学》第8版制定[5]。小儿咳嗽痰热壅肺证参照中华中医药学会《中医儿科常见病诊疗指南》(2012)制定[6]。

图3 PPI网络构建和Hub基因

2.4 预后生存分析

采用卡普兰-迈耶曲线和对数秩检验分析了以上20个肺腺癌关键基因对总生存期的影响,结果显示:CCNA2、DLGAP5、HMMR、MMP1、MMP9、MMP13、SPP1、TOP2A等8个基因对肺腺癌生存期有影响(P<0.05),其中CCNA2、DLGAP5、HMMR、MMP1、SPP1、TOP2A等6个基因对肺腺癌生存期有显著影响(P<0.01)(见图4)。

图4 肺腺癌关键基因的预后分析

2.5 肺腺癌诊断生物标志物的筛选

对以上与肺腺癌预后生存相关的8个关键基因进行ROC 分 析,结 果 显 示:DLGAP5(AUC=0.703)、CCNA2(AUC=0.682)、TOP2A(AUC=0.634)、HMMR(AUC=0.689)、MMP1(AUC=0.636)、MMP13(AUC=0.603)、SPP1(AUC=0.706)、MMP9(AUC=0.616),其中DLGAP5、SPP1的AUC>0.7,提示它们具有较高的诊断价值(见图5)。

图5 肺腺癌预后生存相关的8个hub 基因的ROC曲线

2.6 GSEA相关通路分析

通过上述分析,发现DLGAP5及SPP1与其它hub基因相比更具有作为诊断标志物与预后标志物的潜力,因此验证肺腺癌中DLGAP5、SPP1这2个关键基因的富集相关通路及其免疫相关功能,用GSEA根据DLGAP5、SPP1在肺腺癌组织表达的高低,验证其是否富集在列表的顶部或底部并进行相关功能注释[15],结果发现高表达DLGAP5、SPP1的肺腺癌样本中富集了转移、增殖、侵袭等通路,说明DLGAP5、SPP1等基因在肺癌转移、增殖、侵袭过程中起到促进作用(见图6,表1)。

图6 GSEA分析DLGAP5、SPP1基因富集通路

表1 DLGAP5、SPP1基因在转移、增殖、侵袭等通路的GSEA富集分析结果

2.7 肺腺癌组织免疫细胞浸润分析

利用GSE31210数据进行分析,使用Cibersort软件“反卷积算法”,分析了数据库中所有肺腺癌样本组织中免疫细胞构成情况(见图7);然后对正常肺组织与肺腺癌组织中免疫细胞浸润情况进行分析,结果显示:肺腺癌组织免疫细胞情况与正常肺组织存在明显差异,且肺腺癌组织中免疫细胞数量较多的分别是未活化的CD4+记忆性T细胞、记忆性B细胞、滤泡辅助性T细胞、调节性T细胞、嗜酸性粒细胞、M0巨噬细胞(P<0.05)(见图8)。

图7 肺腺癌组织样本中22种免疫细胞构成图

图8 肺腺癌及正常组织中免疫细胞占比小提琴图

2.8 DLGAP5、SPP1基因表达和肺腺癌组织免疫细胞浸润分析

使用Cibersort分析GSE31210数据库中肺腺癌样本的DLGAP5、SPP1基因表达与免疫细胞浸润的关系,结果(见图9),肺腺癌组织中浆细胞、未活化的CD4+记忆细胞、调节T细胞、巨噬细胞(M0、M1、M2)及中性粒细胞等免疫细胞的数量与DLGAP5、SPP1基因表达水平显著相关(P<0.05),肺腺癌组织中DLGAP5基因高表达时浆细胞、M0巨噬细胞、中性粒细胞等细胞数量较多(P<0.05),而DLGAP5低表达时记忆B细胞、未活化的记忆CD4+T细胞、滤泡辅助性T细胞、未活化肥大细胞分布较多。肺腺癌组织中SPP1基因高表达时巨噬细胞、静息树突细胞、中性粒细胞分布较多,而SPP1基因低表达时肺腺癌组织中浆细胞、未活化记忆CD4+T细胞、调节T细胞、M2巨噬细胞、肥大细胞分布高。以上结果表明DLGAP5、SPP1的表达水平与肺腺癌组织中浆细胞、未活化的CD4+T记忆细胞、调节T细胞、巨噬细胞、巨噬细胞M0、M1、中性粒细胞浸润密切相关。

图9 DLGAP5、SPP1基因表达与肺腺癌组织免疫细胞浸润的关系

3 讨 论

肺腺癌在世界各地发病率和死亡率都很高[16]。肺腺癌的高死亡率在很大程度上归因于诊断不及时,因此寻找特异性早期诊断生物标志物对改善肺腺癌的预后至关重要。本研究利用生物信息学工具分析肺腺癌的mRNA表达谱及其肺腺癌中免疫细胞浸润情况。本研究共筛选出234个肺腺癌DEGs,通过构建PPI网络和富集分析及生存分析,共筛选出20个关键基因,其中CCNA2、DLGAP5、HMMR、MMP1、MMP9、MMP13、SPP1、TOP2A等8个基因对肺腺癌有预后价值。在生物过程方面,DEGs主要涉及胶原代谢、蛋白水解、免疫反应等生物过程,介导血清型内肽酶活性、金属内肽酶活性等分子功能,DEGs基因产物主要富集于细胞外基质、胞外、细胞黏附。研究证明,细胞外基质与受体相互作用参与细胞黏附、细胞周期以及细胞增殖,而这些是导致肺癌中肿瘤增殖和细胞凋亡的关键[17-18]。本研究中肺腺癌关键基因富集的通路主要与PPAR信号通路、PI3K-AKT信号通路、TGF-β信号通路及细胞周期信号通路密切相关,该结果与Tang等人的研究结果相符[19]。

DLGAP5是细胞周期调控基因的表达产物[25],在肝细胞癌、脑膜瘤和肾上腺皮质瘤等癌症中的表达水平随疾病侵袭性升高而升高[26],因此推测周期调控基因DLGAP5可能在肺癌的免疫浸润方面存在一定作用。另一方面,DLGAP5与视网膜母细胞瘤的发生、浸润有关[27],且已在肺腺癌中被证实为生物诊断标志物。因此,DLGAP5和SPP1基因作为肿瘤微环境中浸润性免疫细胞重要组成部分,可有效预测患者预后[28]。

浸润性免疫细胞是肿瘤微环境的重要组成部分,可有效预测患者预后。本研究用“反卷积算法”分析了数据库中肺腺癌样本组织中免疫细胞构成及正常肺组织与肺腺癌组织中免疫细胞浸润情况,发现肺腺癌组织免疫细胞构成情况与在正常肺组织有明显差异,肺腺癌组织中免疫细胞数量较多主要是未活化的CD4+记忆性T细胞、记忆性B细胞、滤泡辅助性T细胞、调节性T细胞、嗜酸性粒细胞、M0巨噬细胞,且巨噬细胞M0、中性粒细胞数量与肺腺癌浸润程度有关,提示这些免疫细胞参与了肺腺癌的发生与发展。巨噬细胞是肿瘤中主要的免疫浸润细胞,是连接炎症和癌症的关键细胞类型[29],主要为巨噬细胞M1和巨噬细胞M2。巨噬细胞M1可激活细胞因子的产生,募集前免疫刺激白细胞TME,导致肿瘤细胞的吞噬作用,而M2型巨噬细胞可通过基底膜破裂、白细胞募集、血管生成和免疫促进肿瘤的发展[30-31]。有研究表明,巨噬细胞M1水平的增加肿瘤患者预后较好[32],而巨噬细胞M2水平的增加预后较差[33]。在免疫细胞浸润分析中发现,DLGAP5和SPP1低表达的样品中M2巨噬细胞增多。M2巨噬细胞具有激活肿瘤细胞增殖的作用,更重要的是可释放多种细胞因子抑制淋巴T 细胞功能,成为影响 T 淋巴细胞功能和促进肿瘤细胞免疫逃逸的重要因素[34]。前期研究发现,SPP1过表达可参与肺腺癌 A549 细胞诱导的巨噬细胞的 M2 极化,进而减弱了 T 淋巴细胞活性,促进A549 细胞增殖、迁移和侵袭[35]。在A549细胞上清液促进了THP-1巨噬细胞向M2的极化,而敲除巨噬细胞中SPP1的可逆转这一过程,以上均表明SPP1在A549细胞和肿瘤微环境中起重要作用[36]。

4 结 论

研究发现DLGAP5及SPP1与肺腺癌患者的预后生存相关,DLGAP5、SPP1表达越高,则肺腺癌患者预后生存越差;同时,DLGAP5、SPP1基因表达水平与肺腺癌组织免疫细胞浸润密切相关。因此,DLGAP5、SPP1有望成为肺腺癌潜在的诊断和预后生物标志物以及免疫相关治疗靶点,尚需进一步研究证实。

猜你喜欢

差异基因腺癌标志物
ICR鼠肝和肾毒性损伤生物标志物的筛选
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
脓毒症早期诊断标志物的回顾及研究进展
HIF-1a和VEGF-A在宫颈腺癌中的表达及临床意义
冠状动脉疾病的生物学标志物
GSNO对人肺腺癌A549细胞的作用
肿瘤标志物在消化系统肿瘤早期诊断中的应用
MR-proANP:一种新型心力衰竭诊断标志物
SSH技术在丝状真菌功能基因筛选中的应用