基于 GEO 数据库分析非小细胞肺癌癌组织中配对盒基因 8 的表达及其与病人预后的关系
2021-06-17渠茂林
渠茂林
作者单位:呼和浩特市蒙医中医医院检验科,内蒙古自治区 呼和浩特 010010
非小细胞肺癌(NSCLC)是最常见的一种肺癌,包括鳞状细胞癌(鳞癌)、腺癌、大细胞癌,约占所有肺癌的 80%~85%,恶性程度高 ,易发生转移和扩散。目前,NSCLC 病人主要采用手术联合放化疗,以期延长病人的生存时间,但术后易复发转移,5年生存率很低。目前,NSCLC 发生发展的机制尚不清楚,从基因水平研究 NSCLC 的病理机制对提高早期诊断率、寻找治疗靶点、改善预后至关重要。配对盒基因 8(PAX8)是一种细胞系限制性转录因子,可以与靶 DNA 结合,调控相关基因的转移。已有研究显示,PAX8 在乳腺癌、胃癌、肾癌以及肺癌等多种恶性肿瘤中均存在异常高表达,但 其 在NSCLC 中的表达研究报道较少。高通量基因表达数 据 库(Gene expression Omnibus,GEO 数据库)是目前最大的面向公众提供数据查询和可进行提交数据进行储存交换的芯片公共数据库之一。因此本研究于 2019年 6月至 2019年 8月利用 GEO 数据库分析 PAX8 在 NSCLC 病人中的表达及其与病人预后的关系。
1 资料与方法
1.1 数据资料采集
利用在线工具 Oncomine(https:∕∕oncomine.org∕)选择 TCGA Lung 2 数据集,其中包括 1 537 个样本的基因表达谱数据,正常肺组织 390例,肺癌组织共 721例,血液样本 420例,无意义样本 6例,分析 PAX8 在肺癌组织与正常肺组织中的 表达情况 。 再 从 GEO 公共数据 库(https:∕∕www.ncbi.nlm.nih.gov∕gds)检索 NSCLC 的差异基因表达谱及相关临床数据,检索平台 Platforms:GPL570,数据集:GSE77803。1.2 数据筛选及分组
下载 GSE77803(GPL570)基因表达 矩阵,156例NSCLC 病人 的数据 集包含 156例NSCLC 病人的基因表达谱数据和性别、年龄、病理类型、T 分期、N 分期和术后复发情况。根据矩阵中 PAX8(121_at)表达值的中位数,将 NSCLC 临床样本分为 PAX8 低表达组(n
=78)和 PAX8 高表达组(n
=78),分析两组 PAX8 基因表达水平与 NSCLC 病人临床特征及预后之间的关系。1.3 PAX8 基因功能分析
采用基因本体(GO)注释 分 析(https:∕∕bioportal.bioontology.org∕ontologies∕GO)PAX8 基因的功能,采用 KEGG PATHWAY 分析(https:∕∕www.kegg.jp∕kegg∕pathway.html)PAX8 可 能参与的信号通路。2 结果
2.1 肺癌组织中 PAX8 的表达
采用 Oncomine 在线数据库,选择基因 PAX8,设置 foldchange 为 2,得到 PAX8 在不同肿瘤中的表达情况。TCGA Lung 2数据集共检测了 1 537 个样本,其中正常肺组织 390例,肺癌组织共 721例,血液样本 420例,无意义样本 6例。与正常肺组织(0.06±0.02)相比,PAX8 在肺腺癌(0.14±0.07)和肺鳞癌(0.15±0.09)中表达水平明显升高(F
=217.130,P
<0.001)。2.2 NSCLC 癌组织中 PAX8 的表达与临床特征之间的关系
NSCLC 癌组织中 PAX8 的表达水平与病人的T分期 、N分期和是否复发有关(P
<0.05),见表1。2.3 PAX8 的表达与 NSCLC 病人预后生存之间的关系
156例NSCLC 病人的随访时间范围为6.2~64.8个月,中位随访时间为48.7个月。 癌 组 织 中PAX8 低表达病人的总生存率为 52.94%,中位生存期 为 54.6个月 ,显著高于PAX8 高表达病人的(34.35%,48.6 个月)(log-rankχ
=
4.609,P
=0.032),见图1A。癌组织中 PAX8 低表达的无病生存率为42.50%,中位生存期为 51.7 个月,显著高于 PAX8 高表达病人的(28.71%,40.8 个月)(log-rankχ
=
5.712,P
=0.017),见图1B。2.4 PAX8 的 GO 分 析
GO 分 析 PAX8 可 能 的 功能,结果显示,在生物学过程水平上,PAX8 可能参与了泌尿系统、肾脏、中枢神经系统、甲状腺等多组织器官的生理生化过程,在细胞组成水平上,PAX8主要定位与细胞核;在分子功能水平上,PAX8 存在DNA 结合位点,可以与靶 DNA 结合,发挥其转录因子的作用,见表2。2.5 PAX8 的京都基因和基因组数据库(KEGG)分析
KEGG 分 析 PAX8 可能参与的信号通路 ,map05216 和 map04918 显示,PAX8 蛋白可能参与调节甲状腺癌的发生发展以及甲状腺激素的合成,map05202 和 map05200 显示,PAX8 蛋白可能在肿瘤发生发展中发挥其转录因子的调节作用,见表3。表1 非小细胞肺癌癌组织中配对盒基因 8 的表达与临床特征之间的关系∕例(%)
3 讨论
NSCLC 约占所有肺癌的 80%,是一种高度异质性疾病,探索 NSCLC 的发病机制,分析 NSCLC 的特异性分子标志物具有重要临床意义。Oncomine 数据库整合了 GEO、TCGA 和已发表的文献等来源的RNA 和 DNA-seq 数据,是目前最常用的大型肿瘤基因芯片数据库 ,可用于分析差异基因的表达。PAX8 蛋 白由 450 个氨基 酸组 成,位 于 2q12-14 染色体的基因编码,在多种恶性肿瘤中均存在异常高表达。本研究采用 Oncomine 基因芯片数据库检索了 PAX8 在肺癌中的表达情况,发现 PAX8 在大部分肺腺癌和肺鳞癌中均存在异常高表达,在少部分表达肺腺癌和肺鳞癌中出现异常低表达,肺腺癌和肺鳞癌均属于 NSCLC,提示 PAX8 在大部分 NSCLC 中均存在异常高表达。宋艳等的研究显示,PAX8在甲状腺癌、肾细胞癌、子宫内膜腺癌等多种卫星肿瘤中存在高表达,提示 PAX8 在 NSCLC 的发生发展中具有重要意义。肿瘤 GEO 数据库是目前世界上最全面的储存高通量基因表达丰度数据的开源数据库,收录了多个物种,多种不同类型的高通量实验数据。因此,本研究基于 GEO 数据库分析了PAX8 的表达与 NSCLC 病人预后生存之间的关系。
表2 配对盒基因 8(PAX8)的基因本体(GO)分析
表3 配对盒基因 8(PAX8)的京都基因和基因组数据库(KEGG)分析结果
图1 配对盒基因 8(PAX8)的表达与非小细胞肺癌病人预后生存之间的关系:A 为 PAX8 的表达与总生存率;B 为 PAX8 的表达与无病生存率
本研究分析 GEO 数据库数据集(GSE77803)中PAX8 的表达,发现 PAX8 的表达与 NSCLC 病人的 T分期和 N 分期有关。T 分期主要反映了肿瘤的浸润深度,N 分期主要反映了肿瘤的淋巴结转移情况,是指导临床治疗的主要依据,提示 PAX8 的表达与肿瘤的恶性程度有关,参与了肿瘤的发生发展。研究显示,PAX8 在腮腺癌组织表达与其术后复发、转移有关,可作为评估腮腺癌根治术预后的指标,提示 PAX8 与 NSCLC 病人的临床病理特征有关,可以反映 NSCLC 的病情发展。本研究分析 GEO 数据库数据集(GSE77803)中 PAX8 的表达,PAX8 高表达NSCLC 病人术后复发的比例明显高于 PAX8 低表达病人,提示 PAX8 的表达与 NSCLC 病人的术后复发有关。本研究发现 PAX8 低表达病人的总生存率和无病生存率明显高于 PAX8 高表达病人,提示 PAX8与 NSCLC 病人的预后生存有关,有望作为其临床预后的分子标志物。
GO 富集可以根据 PAX8 蛋白的序列信息,分析其可能的功能,在基因功能的分析 中具有重要作用。GO 富集主要从分子功能本体论、生物学途径本体论和细胞组件本体论三个层面分析基因的功能。本研究 GO 富集分析显示,PAX8 蛋白参与机体多器官的生理生化过程,可以与相应的靶 DNA结合,发挥其转录因子的调节作用。KEGG 分析是一种常用的生物信息学代谢通路分析工具之一,可以分析蛋白质参与的最主要的代谢和信号转导途径。本研究 KEGG 分析显示,PAX8 蛋白可能参与了甲状腺癌等多种肿瘤发生发展的信号通路。Li等的研究显示,PAX8 蛋白在 NSCLC 中异常高表达 ,参与调节了NSCLC细胞的生长和运动 ,提示PAX8 参与调控 NSCLC 的发生发展,有望成为其治疗和预后的标志物。
综上所述,PAX8 蛋白可能参与调节 NSCLC 发生发展的信号通路,在大部分肺腺癌和肺鳞癌中均存在异常高表达,其表达与 NSCLC 病人的 T 分期、N分期以及术后复发有关,PAX8 低表达病人具有更高的生存率。但 PAX8 蛋白作用于 NSCLC 发生发展的具体机制尚不清楚,有待于下一步研究。