APP下载

基于公共数据库分析FABP5在肾透明细胞癌中表达及预后的意义

2018-11-29高鑫张淑芳黄邓高曹卉

天津医药 2018年11期
关键词:差异基因芯片数据库

高鑫,张淑芳,黄邓高,曹卉

近年来,肾细胞癌的发病率和死亡率正在逐年上升,严重影响人类健康[1]。肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)是肾细胞癌中最常见的类型,约占肾癌病理类型的75%,在肾脏常见的上皮性肿瘤中预后最差[2]。深入研究肾细胞癌的发生发展机制,寻找治疗靶点和预后预测分子标志物对肾细胞癌治疗有重要意义。脂肪酸结合蛋白5(fatty acid-binding protein 5,FABP5)是一种小分子胞质蛋白,是细胞内脂质结合蛋白家族的成员,参与长链脂肪酸的摄取和运输。此外,该蛋白还在细胞信号传导、基因调控、细胞生长和分化中发挥重要作用[3]。越来越多的研究表明,FABP5在多种肿瘤中高表达且可促进肿瘤细胞生长[4-7],但少见FABP5在肾透明细胞癌中表达及预后文献报道。笔者推测该基因在肾透明细胞癌中也可能存在高表达情况。Oncomine数据库是大型的肿瘤基因芯片数据库,该数据库整合了高质量的芯片数据而被学术界广泛认可。GEO数据库是当今最大、最全面的公共基因表达数据资源。DAVID数据库是目前常用的基因富集和功能注释分析数据库。基因表达谱交互分析(gene expression profiling interactive analysis,GEPIA)是由北京大学开发的一个可用于分析来自TCGA数据库和GTEx项目RNA测序表达数据的在线分析工具。本研究先通过Oncomine数据库和GEO数据库提取FABP5在肾透明细胞癌中的表达数据,然后利用DAVID数据库对GEO数据库筛选得到的差异基因进行功能分析,并通过GEPIA分析FABP5基因在肾透明细胞癌中的表达与临床预后相关性,以期了解FABP5在肾透明细胞癌中的表达和临床意义,为寻找肾透明细胞癌治疗靶点和药物开发提供思路。

1 资料与方法

1.1 从公共数据库中提取数据

1.1.1 Oncomine数据库提取数据 首先在Oncomine数据库(https://www.oncomine.org/)中使用机构邮箱注册,得到该数据库的使用权限。登录后根据本研究的要求进行设定数据检索和信息提取条件:(1)Cancer type:kidney cancer。(2)Gene:FABP5。(3)Analysis type:cancervs.normal analysis。按照以上条件可得到研究数据集,筛选出相关的研究数据集进行分析。

1.1.2 GEO数据库提取表达数据 在Pubmed主界面(https://www.ncbi.nlm.nih.gov/pubmed/)搜索栏中找到GEO datasets选项,进入GEO数据库,在搜索框中输入检索关键词“kidney cancer”,筛选条件设置为“Homo sapiens”,找到有按照正常组和肿瘤组分析的数据集,下载符合条件的芯片数据CEL文件包。采用R语言软件(http://bioconductor.org/biocLite.R版本3.5.0)对芯片数据进行质量分析和差异基因筛选。

表达谱芯片质量控制和预处理:首先对从GEO数据库中下载的CEL文件采用R语言中的affyPLM语言包进行芯片质量分析,采用RMA法标准化预处理芯片数据集,提取探针表达数据,再通过该芯片数据集相应的平台探针文件对探针ID和Gene symbol进行转换,得到标准的基因名称,并采用最近邻居法(k-Nearest Neighbor,KNN)寻找有缺失值的基因和表达谱相似的基因,通过这些基因的表达值(依照表达谱相似性加权)来填充缺失值,最终得到含基因名称的表达矩阵文件。差异基因筛选:采用R语言中的limma语言包对已得到的基因表达矩阵文件进行差异基因筛选,以满足log2FC>1或log2FC<(-1),校正P<0.05为候选差异基因。

1.1.3 DAVID数据库富集分析 通过DAVID 6.8版本数据库主界面(https://david.ncifcrf.gov/)选 择“Functional Annotatio”分析工具,在“Enter Gene List”框中批量输入筛选得到的差异基因 ,“SelectIdentifier”设置为“OFFICIAL_GENE_SYMBOL”,“List Type”选择“Gene List”,提交数据后再将分析物种设置为“Homo sapiens”,按照上述条件分析后可得到富集分析和功能注释结果数据,下载结果数据进行进一步整理分析。

1.1.4 GEPIA生存分析 在GEPIA主界面(http://gepia.cancer-pku.cn/index.html)的搜索框中输入要分析的基因名,分析工具栏里选择“Survival Plots”,肿瘤类型为“Kidney renal clear cell carcinoma,KIRC”,置信区间设置为95%。其他参数采用数据库默认设置。

1.2 统计学方法 采用Graphpad Prism 6.0软件对FABP5在肾透明细胞癌GEO表达谱芯片中的表达丰度进行t检验并作图,采用Kaplan-Meier法计算FABP5表达与预后的关系,应用Log-rank检验比较2组生存率。以P<0.05为差异有统计学意义。

2 结果

2.1 FABP5在不同类型肿瘤中的表达情况 在Oncomine数据库中共收集到了445项不同肿瘤类型(包括肾癌)正常组与肿瘤组的FABP5基因表达研究结果,这些研究中FABP5表达差异有统计学意义的结果有56项研究,其中FABP5表达增高的有32项,表达降低的有24项。在肾癌研究中高表达的有5项,低表达的有0项,见图1。

Fig.1 Expression of FABP5 in all tumor related studies in Oncomine database图1 FABP5在Oncomine数据库中所有肿瘤相关研究中的表达

2.2 FABP5在肾透明细胞癌中的表达 对Oncomine数据库中的FABP5表达进一步深入提取肾癌相关研究信息,寻找有关肾透明细胞癌的研究数据集,共找到4项涉及肾透明细胞癌和正常组织中的FABP5芯片表达研究,其中肾透明细胞癌组织共68例,正常肾组织共45例。这4项研究数据集分别发表于Clinical Cancer Research[8-9]、American Journal of Pathology[10]和 BMC Cancer[11]。笔者在Oncomine数据库中综合比较分析4项研究数据集结果,发现与正常对照组相比,FABP5在肾透明细胞癌中显著高表达(P<0.05),见图2、表1。Oncomine数据库中FABP5在不同肾透明细胞癌研究数据集中的表达情况见图3。为了验证以上分析结果,笔者进一步挖掘分析GEO数据库,选择包含13例肾透明细胞癌患者癌与13例癌旁组织的芯片数据集GSE66271,该芯片数据的平台为GPL570[HGU133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。笔者在对其进行质量分析和预处理后筛选出2 427个差异基因,见图4。这些差异基因包含了FABP5基因(log2FC=4.231,校正P=1.6×10-7)。从这26例芯片数据中提取FABP5基因在癌组织和癌旁组织中的表达丰度值,发现FABP5在肾透明细胞癌组织中的转录水平显著高于其癌旁组织(t=7.562,P<0.001),见图5。

Fig.2 Comprehensive comparison of FABP5 expression data sets in renal clear cell carcinoma in Oncomine database图2 Oncomine数据库中关于FABP5在肾透明细胞癌中表达数据集的综合比较

Tab.1 Overexpression of FABP5 protein in different researches表1 FABP5蛋白在不同研究中的过表达情况

2.3 差异基因GO富集与KEGG功能注释 通过DAVID数据库对GEO数据库筛选的2 427个差异基因进行GO和KEGG分析,发现这些差异基因在生物过程(Biological Process)中主要影响无机阴离子运输过程,见图6A。分子功能(Molecular Function)中主要影响转运蛋白活性,见图6B。细胞组分(Cellular Component)中主要影响胞外成分,见图6C。KEGG代谢通路注释主要集中在蛋白质的消化和吸收代谢功能,见图6D。

2.4 FABP5与肾透明细胞癌预后的关系 通过上述数据库挖掘的信息分析发现,FABP5在肾透明细胞癌组织中表达增高。为了进一步明确FABP5表达与肾透明细胞癌预后之间的关系,笔者通过GEPIA采用Kaplan-Meier法对来自TCGA数据库和GTEx项目的516例肾透明细胞癌进行FABP5表达与预后分析,其中高表达和低表达各258例。发现FABP5的表达水平与肾透明细胞癌患者生存预后之间存在相关性,FABP5高表达的患者总体死亡率较高,低表达FABP5的患者预后较好(Log-rankχ2=10.640,P=0.0011),见图7。

Fig.3 Expression of FABP5 in different renal clear cell carcinoma datasets in the Oncomine database图3 Oncomine数据库中FABP5在不同肾透明细胞癌研究数据集中的表达

3 讨论

Fig.4 Differential genes screened from the GSE66271 dataset(Red dots represent differentially expressed genes,and black spots represent genes that are not differentially expressed)图4 GSE66271数据集筛选的差异基因(红点代表差异基因,黑点代表无差异的基因)

Fig.5 Expressions of FABP5 protein in renal clear cell carcinoma and adjacent tissues图5 FABP5蛋白在肾透明细胞癌与癌旁组织中的表达

肾透明细胞癌是最常见的肾脏恶性肿瘤,其是一种具有不同分子特征的侵袭性肿瘤,治疗效果往往不佳。研究表明靶向治疗可显著改善肾转移性透明细胞癌患者的存活率[12-13]。但目前临床上肾透明细胞癌治疗靶点较少,仍需进一步预测和发掘更多治疗靶点为临床治疗提供参考。脂肪酸结合蛋白(FABPs)是低分子质量细胞内脂质结合蛋白家族。FABPs参与结合和储存疏水性配体如长链脂肪酸,以及将这些配体转运至细胞内的适当区室。FABP5是细胞内脂质结合蛋白家族的成员,是一种几乎在所有组织中都有表达的小分子质量蛋白[14]。其通过结合细胞质中的长链脂肪酸和其他疏水性配体而在脂质信号传导中起作用。FABP5在多种肿瘤中高表达并可促进肿瘤的发展,导致患者预后较差。Wang等[5]研究发现,FABP5表达在宫颈癌组织中显著上调,并且FABP5高表达与宫颈癌患者不良预后相关,是宫颈癌不良预后的独立危险因素。Kawaguchi等[4]通过对正常前列腺细胞和前列腺癌细胞进行亚硫酸氢盐测序分析发现,FABP5在前列腺癌中的过表达可以归因于其启动子区中CpG岛的低甲基化,以及直接反式作用因子特异性蛋白1(specificity protein 1,Sp1)和c-Myc的上调。沉默Sp1、c-Myc或FABP5表达导致细胞增殖显著降低,表明Sp1和c-Myc上调FABP5的表达是前列腺癌细胞增殖的关键。Ju等[7]研究发现FABP5在乳腺浸润性导管癌中显著高表达,通过4-氨基-2-三氟甲基-苯甲酸酯(ATPR)抑制FABP5的表达可抑制乳腺癌的侵袭和迁移,表明FABP5可能成为乳腺癌治疗的靶点。此外,FABP5还在少突胶质细胞瘤[15]、神经母细胞瘤[16]、颅咽管肿瘤[17]、胃癌[18]和肝细胞癌[19]中高表达且可促进肿瘤发展,与患者预后相关。因此,FABP5未来可能成为肿瘤治疗的药物靶点。

Fig.6 Functional annotation of differential gene GO enrichment and KEGG metabolic pathways图6 差异基因GO富集和KEGG代谢通路功能注释

Fig.7 The survival curves of FABP5 expression and prognosis of renal clear cell carcinoma图7 FABP5的表达与肾透明细胞癌预后的生存曲线

尽管已有多项研究表明FABP5的高表达与肿瘤发展和预后不良相关,但FABP5在肾透明细胞癌中表达情况与预后相关性还少见文献报道。因此,研究FABP5在肾透明细胞癌中的表达与预后意义显得十分必要。Oncomine数据库和GEO数据库是当今世界上庞大且较为全面的基因芯片数据平台,因其整合了高质量的芯片数据而得到学术界认可。通过对这些数据库进行数据挖掘,可以比较容易地获得大量样本信息,增加研究结果的可信度。本研究通过深入挖掘Oncomine数据库和GEO数据库中的基因芯片表达数据,结果均发现FABP5基因在肾透明细胞癌中的表达显著高于正常肾组织。此外,笔者还通过GEPIA分析FABP5基因的表达与肾透明细胞癌患者预后的关系,发现FABP5高表达与患者预后差显著相关。以上结果表明FABP5在肾透明细胞癌中高表达并可能促进癌细胞的增殖,FABP5可能成为肾透明细胞癌的治疗靶点。然而,本研究的局限性在于分析GEO数据库表达谱数据时纳入的样本量较少和缺少分子生物学实验的验证,未来还需继续在GEO数据库中追踪发掘更多符合条件的样本芯片表达谱数据并通过实验来进一步验证以上结果,才能完全明确FABP5在肾透明细胞癌中的具体调节机制。

总之,本次研究通过综合公共数据库的数据信息进行深入挖掘,分析结果提示FABP5在肾透明细胞癌组织中高表达,且生存分析发现FABP5与肾透明细胞癌患者预后有关,将为寻找肾透明细胞癌治疗靶点和药物的开发提供重要的理论依据和临床指导。

猜你喜欢

差异基因芯片数据库
芯片会议
人体微芯片
关于射频前端芯片研发与管理模式的思考
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
数据库
数据库
数据库
数据库
SSH技术在丝状真菌功能基因筛选中的应用