APP下载

lncRNA HOTAIR作为肺鳞癌预后标记物的生物信息学研究

2023-11-02殷国泉

皖南医学院学报 2023年5期
关键词:共表达癌症数据库

殷国泉,吕 坤

(皖南医学院第一附属医院 弋矶山医院 1.中心实验室;2.检验科,安徽 芜湖 241001)

世界卫生组织国际癌症研究机构最新发布的数据显示,每年约有200万人被诊断为肺癌,其死亡人数约占癌症总死亡人数的18%[1-2]。中国东部和城市地区的肺癌发病率较高,其中吸烟、长期接触惰性气体、空气污染都是导致肺癌的高危因素[3-4]。非小细胞肺癌(nonsmall-cell lung cancer,NSCLC)包括腺癌、鳞状细胞癌和大细胞癌[5],大约占所有肺癌病例的85%。肺鳞癌(lung squamous cell carcinoma,LUSC)常见于中央型肺癌,早期常引发支气管狭窄,甚至可以发展为阻塞性肺炎[6]。LUSC预后不佳是目前的棘手问题,详细了解LUSC发生发展的机制对于改善该病生存率至关重要。

长链非编码RNA(long non-coding RNA,lncRNA)是一类长度大于200个核苷酸的RNA[7],一般无蛋白编码能力。研究表明,lncRNA异常表达往往与肿瘤的发展和转移密切相关[8-9]。长链非编码RNA HOTAIR(long non-coding RNA HOTAIR,HOTAIR)[10]在多种癌症中发挥重要作用。Liu等[11]研究表明,HOTAIR在NSCLC组织中显著上调,并通过下调HOXA5影响NSCLC细胞侵袭和转移。推测HOTAIR可能代表预后不良的新标志物,并且是NSCLC干预的潜在治疗靶点。此外有研究报道VPS9D1-AS1、MALAT-1等lncRNA与LUSC患者的生存相关[12-13]。HOTAIR在LUSC发生发展中发挥的调节作用仍有待充分研究。

本研究采用lncRNA转录组范围的微阵列方法,探讨HOTAIR在LUSC发生、转移及预后过程中的具体功能,为后续探讨其机制,寻找潜在的分子标志物及药物治疗靶点提供理论及实验基础。

1 材料与方法

1.1 数据处理及分析 通过TIMER数据库分析33种癌症中HOTAIR的表达情况;在癌症基因组图谱(TCGA)数据库中下载配对及非配对LUSC患者项目中level 3 HTSeq-FPKM格式的RNAseq数据,利用R语言软件中的R包,主要为ggplot2(用于可视化),将FPKM格式的RNAseq数据转换成TPM格式并进行log2转化,采用Mann-Whitney U检验。利用LinkedOmics数据库(http://www.linkedomics.org/login.php)下载LUSC中共表达HOTAIR基因,通过Pearson相关系数确定HOTAIR共表达基因,筛选出正负相关的前50个基因,通过热图及数据分析展示结果,利用基因集合富集分析探索HOTAIR及其共表达基因的基因本体生物学过程(GO_BP)和KEGG通路。

1.2 HOTAIR表达差异与临床参数及预后的关系 下载TCGA数据库中LUSC临床数据,根据中位数将数据分为高、低表达HOTAIR组,对下载的临床数据采用回归模型进一步分析HOTAIR表达水平与LUSC临床病理特征之间的关系,survival包分析HOTAIR与整体生存期(overall survival,OS)、疾病特异性生存期(disease specific survival,DSS)、无进展生存期(progression-free survival,PFS)的关系。

1.3 LUSC中共表达基因数据筛选富集及免疫分析 LinkedOmics数据库确定HOTAIR的共表达基因,筛选出正、负相关的前50个基因,并通过热图和火山图显示结果。本研究利用基因集富集分析(GSEA)探索HOTAIR及其共表达基因的GO_BP和KEGG路径。免疫浸润算法使用ssGSEA(GSVA包内置算法);使用TIMER软件验证不同HOTAIR mRNA表达水平与TCGA数据库中LUSC免疫细胞浸润的相关性。

1.4 统计学方法 在TCGA数据库中下载HTSeq-FPKM格式的RNAseq数据,采用秩和检验分析HOTAIR在LUSC中的表达情况;采用Cox回归分析HOTAIR表达水平与LUSC临床病理特征之间的关系,survival包用于生存资料的统计分析及可视化。LinkedOmics数据库(http://www.linkedomics.org/login.php)下载LUSC中共表达HOTAIR基因,通过Pearson相关系数确定HOTAIR共表达基因。

2 结果

2.1 HOTAIR在泛癌中的表达情况 从TIMER2.0数据库下载并分析HOTAIR在34种常见癌症中的表达情况。结果显示HOTAIR在乳腺癌、胆管癌、结肠癌、食管癌、头颈鳞癌、肾透明细胞癌、肺鳞癌等多种癌症中表达上调,仅在肾嫌色细胞癌中低表达(图1)。

图1 HOTAIR在泛癌中的表达情况

2.2 HOTAIR在LUSC中的表达情况 通过对TCGA数据库中LUSC数据处理分析,可以看出551对非配对LUSC样本中(包括49例正常样本及502例肿瘤样本)HOTAIR在肿瘤组织中高表达(t=5.220,P<0.001,图2A);在49对配对LUSC样本中,HOTAIR在肿瘤组织中表达上调(t=4.138,P<0.001,图2B);分析HOTAIR在LUSC中的诊断价值,受试者工作特征(ROC)曲线下面积(AUC)=0.883(95%CI:0.854~0.912);灵敏度为0.939,特异度为0.779(图2C)。

A.非配对LUSC患者中HOTAIR表达情况(n=551;P<0.001);B.LUSC患者及其配对正常组织中HOTAIR的表达情况(n=49;P<0.001);C.LUSC患者中HOTAIR的ROC分析(n=551)。

2.3 HOTAIR表达情况与LUSC患者的临床特征之间的关系 通过TCGA数据库,将LUSC患者的临床数据进行分析,将502例患者按中位数分为高、低表达两组,进行临床病理特征分析时,剔除临床性状未知的标本。结果显示,HOTAIR表达与患者的病理分级密切相关(P<0.05,表1)。

表1 HOTAIR表达与LUSC患者临床病理特征之间的关系[n=502,n(%)]

2.4 HOTAIR表达与LUSC患者预后之间的关系 剔除TCGA数据库中因随访资料缺失及预后资料缺失的数据,用survminer包以及survival包进行数据的可视化及数据分析,将496例LUSC患者分为高、低表达HOTAIR两组(其中高表达组314例;低表达组182例),结果显示,与低表达HOTAIR组相比,高表达HOTAIR组的LUSC患者远期生存预后不理想。高表达HOTAIR组患者的总体生存预后较差,其中位生存时间为44.9个月;低表达HOTAIR组患者的中位生存时间为72.0个月(HR=1.41;95%CI:1.06~1.89;P=0.020),见图3A;患者的DSS结果差异无统计学意义(P=0.263),高表达HOTAIR患者的生存预后较差,见图3B;高表达HOTAIR的患者生存预后也较差,其中高表达组中位生存时间为26.6个月,低表达组中位生存时间为40.1个月,差异具有统计学意义(HR=1.36;95%CI:1.04~1.78;P=0.022),见图3C。HOTAIR的表达可能会影响LUSC患者的生存预后。

2.5 HOTAIR共表达基因网络及其富集分析 在LUSC中,1 396个基因(深红点)与HOTAIR呈正相关,1 143个基因(深绿点)与HOTAIR呈负相关(图4)。热图显示了与HOTAIR呈正、负相关的前50个基因(图5A、B)。通过GO/KEGG富集分析确定HOTAIR共表达基因的GO富集,发现HOTAIR及其共表达的正相关基因主要富集在DNA结合转录抑制活性、RNA聚合酶Ⅱ特异性、增强子结合、增强子序列特异性、DNA结合、胚胎骨骼系统的发育、骨骼系统的形态发生等生物过程(图5C、D)。负相关基因主要富集在中性粒细胞介导的免疫中性粒细胞活化、中性粒细胞脱颗粒等生物过程(图5E、F)。这些结果表明,HOTAIR的表达可能通过调节免疫反应而在LUSC中发挥重要作用。

A.与HOTAIR正相关的前50个基因热图;B.与HOTAIR负相关的前50个基因热图;C、D.正相关基因的GO/KEGG富集分析;E、F.负相关基因的GO/KEGG富集分析。

2.6 HOTAIR表达与免疫细胞浸润之间的关系 考虑到GO和KEGG富集分析都发现HOTAIR可能参与了肿瘤免疫应答,本研究进一步应用ssGSEA分析了HOTAIR表达与免疫细胞浸润水平的关系(图6A)。此外通过TIMER 2.0数据库进一步分析HOTAIR表达与免疫细胞之间的关系,本研究分析了常见的几种免疫细胞与HOTAIR的关系,可以看出,HOTAIR的表达与B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞呈明显正相关,而与中性粒细胞、树突状细胞呈负相关(图6B)。

A.免疫细胞浸润与HOTAIR表达的相关性;B.HOTAIR的表达与B细胞、CD8+T细胞、CD4+T细胞、巨噬细胞的相关性。

3 讨论

LncRNA HOTAIR已被证实通过影响细胞增殖、凋亡、侵袭和迁移在癌症中发挥重要作用[14-16]。本研究通过生物信息学分析方法,寻找LUSC与癌旁组织中差异表达的lncRNA,在泛癌症分析中,发现HOTAIR在大多数癌症类型中均上调。进一步探讨发现,HOTAIR的高表达与LUSC患者的OS降低有关。通过Logistic回归分析来评估HOTAIR的表达水平与LUSC的临床病理特征之间的关系,结果显示HOTAIR与临床分期显著相关。以上结果和ROC分析表明,HOTAIR可能是LUSC患者的一个预后生物标志物。

本研究的基因富集分析表明,HOTAIR的主要生物学功能是参与免疫应答。为了证实HOTAIR表达与免疫细胞浸润相关,本研究假设HOTAIR可能通过改变特定免疫细胞类型的比例来影响肿瘤微环境,从而促进肿瘤进展和转移。有研究[17]发现,HOTAIR参与巨噬细胞的功能、迁移和分化,最近的研究[18]也表明,HOTAIR对M2样巨噬细胞(肿瘤相关巨噬细胞)至关重要,并促进肿瘤生长。由此可见,HOTAIR是维持肿瘤微环境的重要组成部分。本研究表明巨噬细胞与HOTAIR的表达之间存在正相关关系。肿瘤微环境在其调节方面具有高度的复杂性,肿瘤微环境中的其他免疫细胞类型也可能影响肿瘤细胞的存活,包括中性粒细胞、NK细胞、CD56细胞、Th1细胞、DC和pDC。未来的研究需要进一步探索HOTAIR表达与这些细胞之间的关系。

综上所述,本研究证明了HOTAIR表达在LUSC中上调,并且与不良生存预后显著相关。HOTAIR可能通过影响免疫细胞的浸润水平参与LUSC的发生和发展。本研究揭示了HOTAIR在LUSC中的作用,并有希望成为LUSC预后生物标志物。

猜你喜欢

共表达癌症数据库
体检发现的结节,离癌症有多远?
侵袭性垂体腺瘤中lncRNA-mRNA的共表达网络
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
膀胱癌相关lncRNA及其共表达mRNA的初步筛选与功能预测
数据库
数据库
数据库
数据库