肾透明细胞癌基因表达谱芯片的生物信息学分析
2018-10-10卢泽潮唐福才何烨李志标雷汉祺黄伟娜何朝辉
卢泽潮 唐福才 何烨 李志标 雷汉祺 黄伟娜 何朝辉
肾细胞癌是肾脏最常见的恶性肿瘤,大约占成人恶性肿瘤的4%。近年来肾细胞癌的发病率和死亡率都有所上升[1],其中70%~80%的患者为肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)[2]。ccRCC早期诊断困难,约30%~50%的患者确诊时已经发生了转移[3]。Ⅲ期和Ⅳ期肾细胞癌患者预后差,5年生存率仅有50%和10%[4-5],同时转移性肾细胞癌对放疗和化疗不敏感[6]。因此,对ccRCC发生发展和转移机制进行研究,将有利于ccRCC的临床诊断和治疗。
随着分子生物学和生物信息学的快速发展及芯片和测序技术在医学领域的广泛应用, GEO(Gene Expression Omnibus)和TCGA(The Cancer Genome Atlas)数据库中积累了丰富的不同疾病的基因组和基因表达谱,为研究包括肿瘤在内的各种疾病的分子发病机制提供了新思路。本研究对GEO和TCGA数据库中与ccRCC相关的芯片和测序数据进行了差异基因筛选,并进行了生物信息学分析,包括通路富集、蛋白质-蛋白质相互作用(protein-protein interaction, PPI)网络分析和生存分析,旨在为ccRCC分子机制研究提供基础。
对象与方法
一、数据下载
本文从GEO(http://www.ncbi.nlm.nih.gov/geo/)下载ccRCC mRNA表达谱芯片GSE53757,该数据集有144个样本,其中包括72例ccRCC及72例正常肾脏组织。同时从TCGA(http://cancergenome.nih.gov/) 数据库下载610例ccRCC的RNA测序数据,其中包括538例ccRCC以及72例癌旁组织作为对照。
二、差异表达基因筛选
利用R语言的limma包和edgeR包分别对GEO芯片和TCGA测序数据进行差异基因筛选。差异倍数的变化阙值设为2,P值为0.05。两个数据库中筛选出来的差异基因结果取交集,获得共同的差异基因,并绘制火山图和韦恩图。
三、功能富集和PPI网络分析
利用metascape(http://metascape.org)在线分析网站对上述共同差异表达基因进行功能和通路富集,利用STRING网站进行PPI网络分析。并将所有的差异基因导入Cytoscape软件进行可视化和模块分析。
四、生存分析
通过构建的PPI网络筛选出关键基因,并利用OncoLnc(http://www.oncolnc.org/)网站对关键基因进行生存分析。
结 果
一、ccRCC差异表达基因的筛选
GEO数据库中的基因筛选结果显示,ccRCC的上调差异基因有567个,下调差异基因有531个。TCGA数据库中的基因筛选结果显示,ccRCC的上调差异基因有1 830个,下调差异基因有558个。在两个数据库中共同表达上调的差异基因有326个,共同表达下调的差异基因有334个。根据基因筛选结果绘制的火山图和韦恩图见图1。
A:GEO数据库的火山图;B:TCGA数据库的火山图;C:韦恩图
图1 差异基因火山图和韦恩图(红色和绿色斑点代表差异基因,红色:上调; 绿色:下调)
二、差异表达基因的通路与功能富集
利用metascape对326个共同上调和334个共同下调的差异基因进行通路富集分析,并按P值大小排列,结果显示差异表达基因主要富集在白细胞迁移、细胞黏附调节及免疫应答正调节等通路。见图2。
三、PPI网络分析
取交集后的660个差异基因,利用STRING网站进行PPI分析,并构建PPI网络和两个重要的模块。见图3。同时对PPI网络中的节点进行得分计算,得到位列前15的差异基因,分别是VEGFA、EGF、CD86、ITGAM、CCL5、TYROBP、CCR5、KNG1、CXCR4、CD2、ITGB2、LILRB2、CXCL10、MMP9和CXCL9。
图2 通路与功能富集结果
A:PPI网络;B:来自PPI网络的模块1;C:来自PPI网络的模块2
图3 PPI网络和两个重要的模块(红色节点表示上调的差异基因,绿色节点表示下调的差异基因)
四、生存分析
为了进一步探究排名前15的关键基因的临床意义,利用OncoLnc对这15个基因进行生存分析,结果发现CCL5(P=0.000 31)、TYROBP(P=0.004 68)、LILRB2(P=0.002 71)和MMP9(P=0.000 85)4个基因的表达量与患者的生存率密切相关。Kaplan-Meier曲线显示CCL5、TYROBP、LILRB2和MMP9低表达的患者与高表达的患者相比,有更高的生存率。见图4。
讨 论
肿瘤的发生发展往往伴随着多个基因的参与。随着生物芯片和高通量测序技术的发展,人们可以运用生物信息学方法从全基因组的角度,对与肿瘤相关的基因进行深入的研究。本研究基于对GEO和TCGA数据库的挖掘,结合生物信息学,筛选出660个差异基因。通过PPI网络分析,在660个差异基因中筛选出起重要作用的关键基因,包括VEGFA、EGF、CD86、ITGAM、CCL5、TYROBP、CCR5、KNG1、CXCR4、CD2、ITGB2、LILRB2、CXCL10、MMP9及CXCL9。生存分析表明,CCL5、TYROBP、LILRB2和MMP9的表达量与患者的生存率密切相关。其中文献检索和生存分析表明,TYROBP和LILRB2可能是与ccRCC相关的潜在关键基因。
A:CCL5;B:TYROBP;C:LILRB2;D:MMP9
图4 Kaplan-Meier曲线
660个差异表达基因中上调基因326个,下调基因334个。为进一步研究差异基因的功能,本文利用metascape进行了功能富集分析。结果显示差异基因主要富集在白细胞迁移和细胞黏附调节等通路。在人体自我防御中,白细胞迁移是先天性免疫必不可少的部分。在肿瘤治疗中,增强自然杀伤细胞的迁移能力,可以促进其向肿瘤微环境归巢,从而增强自然杀伤细胞的抗肿瘤作用。Kremer等[7]的研究表明,增强自然杀伤细胞表面趋化因子受体CXCR2的表达,可以促进自然杀伤细胞的迁移能力,提高对肾细胞癌癌细胞的杀伤力。提示监测和增强白细胞迁移通路,对ccRCC的治疗具有重要的意义。细胞黏附是指细胞之间的黏附,是细胞生理活动必需的,细胞黏附能力的增强或改变是导致肿瘤侵袭和转移的重要因素[8]。研究表明,上皮细胞黏附分子可以作为ccRCC的独立预后因子[9],血管细胞黏附分子1是一种黏附分子,具有作为ccRCC标志物的临床价值[10]。上述研究均表明细胞黏附可以作为ccRCC诊断或预后的关键通路。
利用筛选出的660个差异基因构建PPI网络,并计算网络节点的得分,由高到低排列,筛选出在ccRCC中最关键的15个基因。已有文献[11-21]报道VEGFA、EGF、CD86、CCR5、KNG1、CXCR4、CD2、CXCL10、MMP9和CXCL9基因与肾癌关系密切。OncoLnc的生存分析显示,CCL5、TYROBP、LILRB2和MMP9表达量的高低与患者的生存率密切相关(P<0.05)。提示CCL5、TYROBP、LILRB2和MMP9可能在ccRCC的发生发展过程中发挥重要的作用,并且可能具有潜在的临床诊断和治疗价值。
有研究[22]指出将T细胞和肾癌细胞共同培养,将刺激产生更多的CCL5因子。但是在肾癌中的具体调控机制不详。TYROBP是存在于自然杀伤细胞内的多种活化性受体的调节性蛋白,起激活小胶质细胞识别和吞噬神经胶质瘤细胞作用[23]。但是目前国内外尚无TYROBP与ccRCC相关研究的文献报道。同样,也未发现LILRB2与肾细胞癌相关的文献报道,可作为肾细胞癌发生发展的潜在基因做进一步研究。LILRB2主要表达于骨髓细胞和B细胞,起抑制免疫应答的作用,其在非小细胞肺癌中的高表达与患者的预后不良相关[24]。LILRB2与其配体ANGPTL2的自分泌信号在胰腺癌前病变的早期转移行为中起关键作用,提示其在胰腺导管腺癌早期检测、转移和治疗中的作用[25]。但在ccRCC方面,未见文献报道。本文生存分析结果显示,TYROBP、LILRB2基因低表达的患者,生存率要明显高于LILRB2、TYROBP基因高表达的患者。提示TYROBP和LILRB2可能对ccRCC的诊断、治疗以及预后评价具有重要的意义,但仍然需做进一步的研究,探究其在ccRCC中的作用。MMP9涉及多个阶段的癌症进展,包括侵袭和转移[26]。研发针对MMP9的抑制剂或许能成为抑制ccRCC侵袭和转移的新思路。
综上所述,本文运用生物信息学方法,筛选得到ccRCC与正常组织之间的差异基因,并筛选出相关的通路。同时对差异基因行进一步筛选,得到包括LILRB2在内的15个关键基因。这些关键基因可能在ccRCC的发生发展中发挥重要的作用,但具体作用机制还需要进一步的实验探讨,这对于ccRCC的诊断、治疗以及预后具有极大的临床意义。