联合使用多种数据库分析KIAA0101对三阴性乳腺癌的影响
2021-06-01谭雅文刘繁孙诗瑶谢萍刘国文
谭雅文,刘繁,孙诗瑶,谢萍,刘国文
(1.深圳市第二人民医院(深圳大学第一附属医院)甲状腺乳腺外科, 广东深圳 518000;2.首都医科大学基础医学院细胞生物学系,北京 100069)
据世界卫生组织发布的《2020年全球最新癌症负担报告》,2020年全球乳腺癌新发病例226万例,已经超越肺癌成为全球发病第一的恶性肿瘤[1]。 同年,乳腺癌全球相关死亡病例约68万例,成为全球第五的癌症致死病因[1]。乳腺癌在分子水平上具有很强的异质性,临床上根据免疫组化标记的异同,将乳腺癌分为4种不同的亚型,三阴性乳腺癌(triple-negative breast cancer, TNBC)是其中一类特殊的分子分型,其缺乏雌激素受体、孕激素受体以及人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)的表达,大约占乳腺癌总数的16%[2]。由于TNBC缺乏以上受体的表达,其对现有的内分泌药物、靶向药物均无效,目前其主要治疗仍然依靠手术及化疗,加之其在已知的乳腺癌分型中侵袭性最强,早期复发率及远处转移率高,故TNBC的预后很差[3-4]。
Kazusa cDNA计划是一个旨在开展广泛的人类 cDNAs 测序的项目,来预测未知的人类基因的编码序列,科学家将此计划新发现的基因命名为“KIAA”基因,也被称作未知基因,到目前为止一共发现了两千多个KIAA基因[5]。近年来KIAA基因的研究主要着眼于识别其编码的蛋白质的生理功能。KIAA0101基因,又被叫做PCNA 相关因子(PCNA associated factor,p15 PAF), 编码增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)蛋白[6],该蛋白为DNA复制和DNA损伤修复过程中的必要蛋白。KIAA0101参与调控多种生物学过程,如DNA损伤修复[7]、细胞周期和细胞增殖[8]。它的异常表达已经被证实与多种肿瘤的发生、发展密切相关,也被认为是多种恶性肿瘤的癌基因,在多种恶性肿瘤的恶性进程、预后[6]以及耐药[9]中发挥着重要作用。有研究报道[10],KIAA0101在乳腺癌中高表达,但是暂时没有KIAA0101与三阴性乳腺癌的相关报道。本课题联合使用多种数据库分析KIAA0101在TNBC中的表达及其对该类患者预后的影响,以期为进一步研究KIAA0101在TNBC中的作用机制提供线索和思路。
1 材料与方法
1.1 数据库资料下载
在GEO数据库(http://www.ncbi.nlm.nih.gov/gds)中搜索人三阴性乳腺癌数据集,通过对表达谱芯片的信息进行分析,确定将来源于GSE38959和GSE27447中27例非肿瘤乳腺癌样本和35例三阴性乳腺癌样本数据纳入本研究。
1.2 筛选差异表达基因
利用GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/) 对来自GEO的数据进行整合, 并以|log FC|>1、P<0.05为标准进行差异表达基因筛选,然后使用在线分析网站(http://bioinformatics.psb.ugent.be/webtools/Venn/)进行韦恩分析,得到重叠的差异表达基因。
1.3 GEPIA数据库分析
利用GEPIA数据库(http://gepia.cancer-pku.cn/)检索WIF1与RERGL在TNBC癌组织中的表达情况,检索条件为:① Cancer: Breast invasive carcinoma;② Gene:WIF1; RERGL;③ Matched Normal data:Match TCGA normal and GTEx data。在GEPIA数据库(http://gepia.cancer-pku.cn/)中检索PMCHL1和KIAA0101在乳腺癌组织中的表达情况, 检索条件为:① Cancer:Breast invasive carcinoma; ② Gene:PMCHL1;KIAA0101; ③ Matched Normal data: Match TCGA normal and GTEx data。
1.4 UALCAN数据库分析
通过UALCAN数据库(http://ualcan.path.uab.edu)获取KIAA0101基因在乳腺癌内的表达情况,通过Expression选项中sample type、major subclasses、cancer stage和nodal metastasis status等分类预测KIAA0101在三阴性等乳腺癌中的表达情况。
1.5 免疫浸润
在TIMER数据库(https://cistrome.shinyapps.io/timer/)中下载TCGA样本中免疫细胞浸润水平矩阵,将KIAA0101表达水平与检索结果进行相关性分析,得到其与免疫细胞浸润程度的相关性。
1.6 生存分析
使用Kaplan-Meier Plotter数据库在线分析,检索KIAA0101基因,得到三阴性乳腺癌患者差异表达KIAA0101的生存曲线。限定条件:总生存期(overall survival,OS)和无复发生存率(recurrence-free survival,RFS),进行预后分析。
2 结 果
2.1 筛选差异表达基因
对GSE38959和GSE27447芯片进行韦恩分析得到25个重叠的差异表达基因,其中表达上调的基因有12个(图1A),下调基因有13个(图1B)。GO功能富集分析表明这些重叠的差异基因在胞外区域、信号转导、负向调节Wnt信号通路、正向调节脂肪细胞分化、Wnt-蛋白质结合等方面起作用(图1C)。差异柱状图分别显示了两个数据集中重叠的差异基因表达情况,数据集GSE38959中KIAA0101上调最显著,数据集GSE27447中PMCHL1上调最显著(图1D)。
A
B
C
D
2.2 在常见肿瘤组织中的PMCHL1和KIAA0101 mRNA水平
用GEPIA数据库对PMCHL1和KIAA0101在人体各器官肿瘤组织中的mRNA水平进行了分析,结果提示PMCHL1 mRNA在TNBC癌组织中表达升高不明显,P值不具有统计学意义(图2A),而KIAA0101在TNBC癌组织中升高显著,较正常组织升高明显(P<0.05)(图2B)。
A
B
2.3 KIAA0101 mRNA水平与TNBC进展相关
通过UALCAN数据库,基于sample type、major subclasses、cancer stage和nodal metastasis status等分类比对了KIAA0101 mRNA在癌组织中的表达情况,发现KIAA0101 mRNA在乳腺癌组织中的含量显著高于癌旁组织(P<0.001)(图3A),并且在TNBC不同亚型和不同临床分期中KIAA0101 mRNA在癌组织中表达量也均高于癌旁组织(图3B和3C)。此外,分析数据显示与无淋巴结转移的患者(N0)相比,N1-N3期淋巴结转移患者的KIAA0101 mRNA出现升高(P<0.001)(图3D)。
A
B
C
D
2.4 KIAA0101的表达量和免疫细胞浸润数量呈正相关
使用TIMER数据库对KIAA0101与免疫细胞浸润联系进行在线分析, 发现KIAA0101的表达情况与TNBC中B细胞(P<0.001)、中性粒细胞 (P=0.02) 浸润均呈正相关, 并且与B细胞的相关性最强。与CD8+T细胞、CD4+T细胞、巨噬细胞、树突状细胞浸润不相关(图4)。
图4 KIAA0101 mRNA表达量对免疫细胞浸润的影响
2.5 KIAA0101的表达对TNBC患者预后的影响
通过对Kaplan-Meier Plotter数据库进行分析, 发现在TNBC中高表达KIAA0101患者的OS较低表达患者显著缩短, 差异具有统计学意义(HR=2.45,P=0.0073)。此外,在TNBC样本中,KIAA0101与患者RFS无明显联系,差异无统计学意义(HR=0.81,P=0.27)(图5)。
A
B
3 讨 论
乳腺癌作为一种严重威胁人类健康的疾病,发病率、死亡率正在逐年增加。2020年,全球乳腺癌新发病例高达226万例,新增的乳腺癌相关死亡病例约68.5万例[1]。据不完全统计,每年中国乳腺癌新发病例和死亡人数分别约占全世界的12.2%和9.6%[11-12]。而TNBC与其他亚型乳腺癌相比,具有肿瘤组织学分级高,复发转移率高等特点,由于其侵袭性高,很多患者在初诊时临床分期相对较晚[13]。目前,TNBC的有效治疗手段非常有限,手术是其局部治疗的最佳方案,而化疗则是目前唯一有效的辅助治疗方法。虽然乳腺癌治疗手段层出不穷,但针对TNBC的治疗没有突破性进展,由于治疗手段的匮乏,TNBC的总体预后仍然没有得到改善。这就促使科研工作者不断寻找治疗TNBC的新方法,探寻与TNBC有关的差异基因表达,以寻找新的肿瘤治疗靶点。
KIAA0101含有一个保守的PCNA结合基,与CDK抑制剂p21竞争结合 PCNA[9]。有研究证明,KIAA0101可以与BRCA1结合,从而影响中心体的数量[10]。此外,KIAA0101的转录变体1可以抑制p53激活,从而阻止使用阿霉素诱导的细胞凋亡[14-15]。还有研究证明KIAA0101 的过表达,可以激活 PI3K/AKT/mTOR 通路,抑制肿瘤细胞凋亡、自噬,从而导致顺铂类药物的耐药[9]。KIAA0101在多种性肿瘤中表达升高, 如胃癌[16]、 乳腺癌[10]、 食管癌[17]、肝癌[18],并可能与癌症患者的预后相关[6]。
本研究通过使用GEO、GEPIA、UALCAN、TIMER和 Kaplan-Meier Plotter 等数据库挖掘KIAA0101基因表达的相关数据,探寻其在三阴性乳腺癌中的表达、免疫细胞浸润及与预后的关系。
研究发现,癌变组织的SORT1水平显著高于非癌变组织,SORT1 mRNA水平在乳腺癌发生发展过程中会出现升高,并且发现在所有三阴性乳腺癌的亚型中均出现升高,尤其是TNBC-LAR亚型中升高最为显著。在人蛋白数据库(Human Protein Atlas, HPA)(https://www.proteinatlas.org)内检索关键字“KIAA0101”, 选择 “Pathology” 模块, 并未找到KIAA0101抗体在三阴性乳腺癌中蛋白免疫组化结果。但Kais[10]和Wang[19]等研究发现,KIAA0101在乳腺癌中高表达,那么在接下来的研究中,可利用临床病理样本,从蛋白表达水平上分析 KIAA0101与TNBC发生发展的关系。
其后,使用TIMER数据库对KIAA0101与免疫细胞浸润之间的关系进行在线分析,发现KIAA0101的表达与B细胞、中性粒细胞浸润呈正相关,表达量增加,在B细胞中尤为明显,这可能为寻找TNBC免疫治疗新靶点提供一个新思路。
最后通过Kaplan-Meier Plotter数据库进行预后分析,发现高表达KIAA0101会对患者总生存期产生不良影响,即从转录水平发现KIAA0101的表达会TNBC患者带来不良的预后,由此进一步证明KIAA0101基因可能有促进TNBC进展的作用。然而,这些实验结果均来自芯片检测结果,相关结论尚有待后续验证。
同时, 关于KIAA0101如何与其他分子发生相互作用来影响TNBC的发展需要进一步的研究; KIAA0101在TNBC中的转化应用也需要更多的实验数据来支撑。为了进一步明确KIAA0101与TNBC之间的关系,接下来将利用临床样本,从蛋白表达水平上分析其与TNBC的关系,并分析其与患者预后的关系。
综上,KIAA0101在三阴性乳腺癌组织中表达升高,且与其临床分期呈正相关;另外,它还影响患者的生存预后,与免疫细胞浸润密切相关,在一定程度上提示了KIAA0101作为三阴性乳腺癌潜在治疗靶点的可能,也为进一步研究KIAA0101基因与三阴性乳腺癌的关系奠定了基础,希望为三阴性乳腺癌的治疗提供一定的理论依据,并开拓新的治疗思路。