APP下载

基于数据挖掘分析GPR35表达对肺腺癌预后的影响

2018-12-25葛丽艳王琦朱宏

医学信息 2018年23期
关键词:肺腺癌数据挖掘数据库

葛丽艳 王琦 朱宏

摘 要:目的 研究數据挖掘分析GPR35表达对肺腺癌预后的影响,并明晰其参与的分析调控网络。方法 利用Oncomine数据库挖掘GPR35在肺腺癌组织中的表达情况;利用Kaplan-Meier Plotter进行肺腺癌患者生存周期分析;利用Coexpedia数据库分析GPR35参与的分子调控网络。结果 GPR35在人体正常组织中均有表达,其中胰腺组织和骨髓来源的CD33+细胞含量较高。相比于正常肺组织,GPR35基因在肺腺癌组织中呈现高表达,而在肺鳞癌以及大细胞肺癌中,未见明显变化。GPR35基因在肺腺癌组织中,男性患者相对于女性患者呈现高表达,而其表达在StageⅠ和StageⅣ均明显上调,且StageⅣ中GPR35的表达高于其他三期的患者;肺腺癌组织中存在EGFR L858R突变的患者,其GPR35的表达相对于无突变的患者明显上调。GPR35的表达水平对肺腺癌患者的总生存时间有着显著影响。与低表达组相比,GPR35高表达组肺腺癌患者的总存活时间降低(P<0.05);GPR35的表达水平对LUSC患者的总生存时间未见显著影响(P>0.05)。GPR35参与多种肿瘤相关的分子调控网络。结论 大样本数据挖掘能迅速准确地获取肺腺癌组织中GPR35表达的相关信息,为深入研究奠定基础。

关键词:肺腺癌;GPR35;数据挖掘;Oncomine 数据库

中图分类号:R734.2 文献标识码:A DOI:10.3969/j.issn.1006-1959.2018.23.024

文章编号:1006-1959(2018)23-0086-06

Abstract:Objective The expression of GPR35 has been found in many tissues and cells. However, no systemic research on lung adenocarcinoma was reported. Methods The Oncomine database was used to explore the expression of GPR35 in lung adenocarcinoma tissues. Kaplan-Meier Plotter was used to analyze the life cycle of lung adenocarcinoma patients. The Coexpedia database was used to analyze the molecular regulatory network involved in GPR35. Results GPR35 was expressed in normal human tissues, and the content of CD33+ cells in pancreatic tissue and bone marrow was higher. Compared with normal lung tissue, GPR35 gene showed high expression in lung adenocarcinoma tissues, but no significant changes in lung squamous cell carcinoma and large cell lung cancer. GPR35 gene in lung adenocarcinoma tissues, male patients showed high expression compared with female patients, and its expression was significantly up-regulated in both StageI and Stage IV, and the expression of GPR35 in Stage IV was higher than that in other three stages; the presence of lung adenocarcinoma In patients with the EGFR L858R mutation, the expression of GPR35 was significantly up-regulated relative to patients without mutation. The expression level of GPR35 has a significant effect on the overall survival of patients with lung adenocarcinoma. Compared with the low expression group, the total survival time of patients with GPR35 high expression group was decreased (P<0.05);The expression level of GPR35 had no significant effect on the overall survival time of LUSC patients (P>0.05). GPR35 is involved in a variety of tumor-related molecular regulatory networks. Conclusion Large-scale data mining can quickly and accurately obtain information about the expression of GPR35 in lung adenocarcinoma, which lays a foundation for further research.

Key words:Lung adenocarcinoma;GPR35;Data mining;Oncomine database

肺癌(lung cancer)是严重威胁人类健康的恶性肿瘤之一,其发病率居高不下,亦是人类癌症死亡最重要的原因之一[1]。按照组织学差异,肺癌可分为小细胞肺癌(small-cell lung cancer,SCLC)和非小细胞肺癌(non-small-cell lung cancer,NSCLC),后者又主要分为肺腺癌(lung adenocarcinoma,LUAD)和肺鳞癌(lung squamous cell carninoma,LUSC)。在我国,肺腺癌占NSCLC總数的50%以上,发病年龄较小,临床治疗效果及预后不如鳞癌,手术切除后5年生存率<10%。因此,寻找肺腺癌早期诊断和预后判断的指标,是目前实现肺腺癌有效治疗的关键。G蛋白偶联受体35(G coupled protein receptor 35,GPR35)是一类配体尚未完全明确的孤儿受体,属于G蛋白偶联受体(G-protein-coupled receptor,GPCR)超家族,其在胃肠道、免疫器官以及神经系统等多种组织和细胞均有表达[2]。研究表明,GPCRs参与了肿瘤的发生和进展,包括细胞的分化、发育、凋亡、免疫逃逸、侵袭、血管生成以及转移[3],但目前尚未发现GPR35在肺腺癌中的表达及相关研究的报道。本研究通过深度挖掘Oncomine数据库中收录的GPR35在肺腺癌中的表达数据,并利用GEO数据库分析GPR35基因与肺腺癌患者生存预后之间的关系,借此了解GPR35在肺腺癌发生发展及预后中的作用,以期为肺腺癌的早期诊断和治疗提供理论依据。

1资料与方法

1.1 BioGPS数据库分析GPR35的表达 利用BioGPS数据库(http://biogps.org/)分析GPR35基因(210264_at)于人体各组织器官的表达,见图1。

1.2 Oncomine数据库提取数据 根据需求在Oncomine数据库中设定筛选和提取数据的条件。本研究在数据库检索界面输入的筛选条件如下:①cancer type:lung adenocarcinoma;②gene:GPR35;③data type:mRNA;④Sample Type:Clinical Specimen;⑤analysis type:cancer vs normal analysis;⑥临界值设定条件(P value<1E-4,fold change>2,gene rank=top 10%)。选择柱状图展示结果。

1.3 Kaplan-Meier Plotter进行患者生存周期分析 利用Kaplan-Meier Plotter数据库(http://kmplot.com/analysis/)的肺腺癌数据集进行在线生存分析。筛选条件如下:①cancer:Lung Cancer;②gene:GPR35;③survival:OS;④histology:lung adenocarcinoma。

1.4 Coexpedia数据库进行GPR35分子调控网络分析 利用Coexpedia数据库(http://www.coexpedia.org/)对GPR35进行分子调控网络分析。筛选条件如下:gene:GPR35。

2结果

2.1 GPR35在肺腺癌组织中的表达 BioGPS数据库显示,GPR35在人体正常组织中均有表达,其中胰腺组织和骨髓来源的CD33+细胞含量较高,见图1。Oncomine数据库显示,相比于正常肺组织,GPR35基因在肺腺癌组织中呈现高表达,而在肺鳞癌以及大细胞肺癌中,未见明显变化,见图2A。

2.2 GPR35的表达肺腺癌患者的性别、分期以及EGFR突变的关系 Oncomine数据库显示,GPR35基因在肺腺癌组织中,男性患者相对于女性患者呈现高表达,见图2B,而其表达在StageⅠ和StageⅣ均明显上调,且StageⅣ中GPR35的表达高于其他三期的患者,见图2C;肺腺癌组织中存在EGFR L858R突变的患者,其GPR35的表达相对于无突变的患者明显上调,见图2D。

2.3 GPR35的表达水平与肺腺癌患者预后的关系 Kaplan-Meier Plotter数据结果显示,GPR35的表达水平对肺腺癌患者的总生存时间有着显著影响。与低表达组相比,GPR35高表达组肺腺癌患者的总存活时间降低(P=0.00069),见图3A;GPR35的表达水平对LUSC患者的总生存时间未见显著影响(P=0.51)。

2.4 Coexpedia数据库分析GPR35的分子调控网络 分子生物网络展现了分子之间的相互作用,可较为深入地反映基因间的表达调控关系,在组学机理的研究中尤为重要。本研究利用Coexpedia数据库筛选出GPR35基因调控的分子调控网络,GPR35参与调控多种分子网络,见图4。

3讨论

近年来,肺腺癌在我国以其高发病率、高死亡率和预后不佳等特点严重危害患者健康。超过70%的肺腺癌患者确诊病情时,已处于晚期[4],失去手术机会。尽管化疗、放疗及靶向治疗的应用使晚期患者的生存期有所延长,5年生存率仍不足30%[1]。由于临床上缺乏肺腺癌特异性的分子靶标,不利于肺腺癌的早期诊断、治疗方法的选择及治疗效果。这迫切要求从原发性肿瘤中寻找一些表达差异较大并有临床意义的基因,来探讨肿瘤的发生、发展机制,为临床诊断、预后判断寻求新的基因治疗靶点提供理论依据。

GPR35是一类配体尚未完全明确的孤儿受体,属于GPCR超家族,本研究利用BioGPS数据库分析发现,其在胃肠道、免疫器官以及神经系统等多种组织和细胞均有表达。研究表明,GPCRs参与了肿瘤的发生和进展,包括细胞的分化、发育、凋亡、免疫逃逸、侵袭、血管生成以及转移[3]。另外,Nieto Gutierrez A等人亦发现,NSCLC中,GPCRs和EGFR二者协同促进了肿瘤细胞对吉非替尼的抵抗[4]。GPCRs亦可以通过Smo-Gβγ信号通路诱导慢性粒细胞性白血病对化疗药物的抵抗[5]。通过对二型糖尿病耐药患者基因组的单核苷酸多态性分析发现,GPR35与患者的耐药密切相关[4]。Oncomine数据库是目前世界上最大的基因芯片数据库和整合数据挖掘平台。我们研究发现,相对于肺鳞癌、大细胞肺癌和癌旁对照,GPR35基因在肺腺癌组织中表达升高。另外,GPR35在男性患者的表达水平亦显著高于女性,有关GPR35与肺腺癌分期之间的相关性,本研究发现,在Ⅰ期和Ⅳ期肺腺癌患者中,GPR35的表达相对较高。

本研究进一步发现,GPR35低表达有利于提高肺腺癌患者的总存活时间。而在肺鳞癌患者中,未见明显影响。为了明晰GPR35参与调控的分子生物网络,我们利用Coexpedia数据库对GPR35参与调控的网络进行分析,本研究发现,GPR35参与调控多种分子调控网络,如参与肿瘤生物转化的S100P、TRIM15、CDHR5基因[4,6];参与卵巢癌发生发展的EPS8L3、CYP1A2、SPINK1等基因[7];參与非小细胞腺癌LGALS4、ACSL5、CDH17等基因[8,9]。

综上所述,我们通过对肺癌组织中GPR35相关信息的深入挖掘,提出GPR35在肺腺癌组织中高表达,且与肺腺癌预后相关。采用数据库进行大样本分析,发现GPR35在肺腺癌和肺鳞癌患者中存在的差异,并进一步明晰GPR35参与调控的分子网络,对临床的早期诊断和治疗提供重要理论依据。

参考文献:

[1]Sigel RL,Miller KD,Jemal A.Cancer statistics,2018[J].CA Cancer J Clin,2018,68(1):7-30.

[2]Resta F,Masi A,Sili M,et al.Kynurenic acid and zaprinast induce analgesia by modulating HCN channels through GPR35 activation[J].Neuropharmacology,2016,108(4):136-143.

[3]Nieto Gutierrez A,McDonald PH.GPCRs:Emerging anti-cancer drug targets[J].Cellular Signalling,2018,41(9):65-74.

[4]Wu TS,Tan CT,Chang CC,et al.B-cell lymphoma/leukemia 10 promotes oral cancer progression through STAT1/ATF4/S100P signaling pathway[J].Oncogene,2017,36(38):5440.

[5]Zhan X,Wang J,Liu Y,et al.GPCR-like signaling mediated by smoothened contributes to acquired chemoresistance through activating Gli[J].Molecular Cancer,2014,13(4):4.

[6]Cheng Y,Yan Z,Liu Y,et al.Analysis of DNA methylation patterns associated with the gastric cancer genome[J].Oncol Lett,2014,7(4):1021-1026.

[7]Rasanen K,Itkonen O,Koistinen H,et al.Emerging Roles of SPINK1 in Cancer[J].Clin Chem,2016,62(3):449-457.

[8]Hayashi T,Saito T,Fujimura T,et al.Galectin-4,a novel predictor for lymph node metastasis in lung adenocarcinoma[J].PLoS One,2013,8(12):e81883.

[9]Chen WC,Wang CY,Hung YH,et al.Systematic Analysis of Gene Expression Alterations and Clinical Outcomes for Long-Chain Acyl-Coenzyme A Synthetase Family in Cancer[J].PLoS One,2016,11(5):e0155660.

收稿日期:2018-8-21;修回日期:2018-9-11

编辑/雷华

猜你喜欢

肺腺癌数据挖掘数据库
基于并行计算的大数据挖掘在电网中的应用
靶向沉默RACK1基因对肺腺癌裸鼠移植瘤生长的抑制作用
G—RH2诱导人肺腺癌A549细胞凋亡的实验研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究