2021-01-20欧阳松刘继红倪钊李强丁国富王勤章
欧阳松 刘继红 倪钊 李强 丁国富 王勤章
在世界范围内,膀胱癌的发病率居所有恶性肿瘤的第十二位[1]。膀胱癌中最常见的类型为膀胱尿路上皮癌(bladder urothelial carcinoma, BLCA)[2],BLCA按组织学分级分为高级别BLCA和低级别BLCA,其中低级别BLCA极少侵犯膀胱肌层或其他部位,并且死亡率极低,绝大多数死亡病例为高级别膀胱癌。而按是否侵犯肌层又分为非肌层浸润性膀胱癌(non-muscle invasive bladder, NMIBC)和肌层浸润性膀胱癌(muscle invasive bladder, MIBC),约75%的新发膀胱癌为NMIBC,较肌层浸润病变而言,NMIBC患者生存期较长且肿瘤特异性死亡风险较低[3]。因此膀胱癌的早期诊断和治疗可改善患者的总体生存状况,寻找一种新的生物标志物和潜在的治疗靶点对提高膀胱癌患者的临床治疗水平具有重要意义。
ST3GAL5是一种可编码神经节苷脂GM3蛋白的编码基因[4]。神经节苷脂GM3参与诱导细胞分化、调节细胞增殖、维持成纤维细胞形态、信号转导和整合素介导的细胞黏附[5]。同时,越来越多的证据表明GM3对肿瘤的发生、发展具有强大的作用[6]。然而,ST3GAL5在膀胱癌中的表达谱和作用功能尚不清楚。因此,本文基于公共生物信息学数据库,初步探讨ST3GAL5在BLCA中的表达水平、预后特征及作用机制。
所有研究数据通过TCGA、GEO、Oncomine、TIMER、GENT、UCSC-Xena、GEPIA2和Kaplan-Meier plotter等公开数据库获得并处理。其中TCGA数据通过UCSC Xena网站(xenabrowser.net/)下载获得,GEO原始矩阵数据通过R语言安装包“GEOquery”下载并处理,Oncomine表达数据通过网站(www.oncomine.org/)审查元素的二、ST3GAL5在膀胱癌中的表达通过Oncomine、GENT2(gent2.appex.kr/gent2)和TIMER2.0(timer.cistrome.org/)数据库挖掘ST3GAL5在不同类型癌症与对应正常组织中的表达水平,然后通过Oncomine、GEO和TCGA数据库分别探讨ST3GAL5在膀胱癌与正常膀胱、MIBC与NMIBC、高级别膀胱癌与低级别膀胱癌中的表达水平。其中Oncomine数据库默认设置为P<1×104,|差异倍数|>2,基因排名为前10%。GENT数据库使用U133Plus2平台进行分析。TCGA-BLCA数据集、GEO数据集GSE13507和Oncomine数据集Lee Bladder的数据用于膀胱癌与正常膀胱组织的表达分析,TCGA-BLCA数据集、GEO数据集(GSE120736、GSE13507和GSE31684)和Oncomine数据集(Blaveri Bladder2、Lee Bladder、Sanchez-Carbayo Bladder2和Stransky Bladder)分别用于MIBC与NMIBC、高级别与低级别膀胱癌的表达分析。三、生存预后分析通过UCSC-Xena浏览器下载TCGA-BLCA的基因表达水平及生存数据,使用R语言安装包“survival”和“survminer”进行Kaplan-Meier生存曲线分析,使用Kaplan-Meier plotter网页工具(kmplot.com/analysis/)进行生存分析验证,使用GENT2网页工具(gent2.appex.kr/gent2)进行总体生存率Meta分析。四、功能及通路富集分析为了进一步辨别ST3GAL5不同表达水平在膀胱癌中的信号通路,采用基因集富集分析(Gene Set Enrichment Analysis, GSEA)对GEO数据集GSE83586进行京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)通路验证。根据ST3GAL5的表达均值,将其分为高表达组和低表达组,使用GSEA软件4.02版本进行分析,基因集置换运行1 000次,以错误发现率(false discovery rate, FDR)<0.25,|标准化富集分数|>1及P<0.05为显著性差异。最后使用R安装包“Rtoolbox”对GSEA报告进行二次绘图。结 果一、ST3GAL5在不同类型癌症中的表达Oncomine数据库中,ST3GAL5在膀胱癌、肺癌、卵巢癌、前列腺癌和其他癌症中低表达,在食管癌、头颈癌、肾癌、白血病、淋巴瘤、黑色素瘤和骨髓瘤中高表达;GENT2数据库的U133Plus2平台中,ST3GAL5在脂肪癌、膀胱癌、血液癌、脑癌、乳腺癌、子宫内膜癌、肝癌、肺癌、卵巢癌、肌肉癌和前列腺癌中表达下调;TIMER 2.0数据库中见8种癌症ST3GAL5表达显著下调和7种癌症ST3GAL5表达显著上调。3个独立数据库均显示ST3GAL5在不同类型癌症中的表达明显下调,且ST3GAL5在膀胱癌中的表达水平均显著降低(P<0.05),见图1。A:Oncomine数据库(红色代表上调,蓝色代表下调);B:GENT2数据库;C:TIMER2.0数据库图1 ST3GAL5在不同类型癌症中的表达二、ST3GAL5在膀胱癌中的表达在GEO数据集GSE13507、Oncomine数据集 Lee Bladder和 TGCA数据库中均提示ST3GAL5在膀胱癌中表达显著降低(P=0.004 9、P=5×10-7和P=0.000 17),见图2。A:GEO数据集GSE13507;B:Oncomine数据集Lee Bladder;C:TCGA数据库图2 ST3GAL5在BLCA中的表达三、ST3GAL5在MIBC中的表达在Oncomine数据库中,比较分析后发现有4组数据集提示ST3GAL5在膀胱癌中表达显著下调(P=5.7×10-9、P=4.9×10-9、P=4.9×10-12、P=6×10-10),见图3A。对此4组数据集进行Meta分析后发现ST3GAL5在MIBC中表达显著下调(P=2.64×10-9),见表1。而在GEO数据集GSE120736、GSE13507和GSE31684中也均提示ST3GAL5在MIBC中表达显著下调(P=3.8×10-13、P=8.8×10-12和P=3.5×10-6),见图3B。其中,TCGA-BLCA数据集中因仅有5例MIBC报道,故未作分析。表1 Oncomine数据集中ST3GAL5表达下调的比较A:Oncomine数据集;B:GEO数据集图3 ST3GAL5在MIBC中的表达四、ST3GAL5在高级别膀胱癌中的表达在4组独立Oncomine数据集中,ST3GAL5 在高级别BLCA中均显著下调(P=0.002、P=4.2×10-7、P=6×10-5和P=1.4×10-7),见图4A。而在GEO数据集GSE120736、GSE13507和GSE31684中也均提示显著下调(P=2.6×10-12、P=8.2×10-10和P=0.049),见图4B。同样在TCGA-BLCA数据集也证实其显著下调 (P=4.2×10-6),见图4C。A:Oncomine数据集;B:GEO数据集;C:TCGA-BLCA数据集图4 ST3GAL5在高级别BLCA中的表达五、ST3GAL5表达与膀胱癌的生存关系分析在TCGA-BLCA数据集中,在总体生存率、疾病特异性生存率、无疾病间期及无进展间期方面,ST3GAL5低表达组较高表达组风险更高(P=0.002 4、P=0.001 3、P=0.03和P=0.000 48)。见图5A~5D。而在Kaplan-Meier plotter 网页工具中也验证了在总体生存率及无复发生存率方面,ST3GAL5低表达比高表达均具有更高的风险(P=5×10-4和P=0.007 3),见图5E、5F。最后通过GENT2网页工具对总体生存率作Meta生存分析,同样提示ST3GAL5低表达比高表达均具更高的风险[P=0.004,HR=0.622(0.452~0.856),τ2=0.086,I2=0.884(0.728~0.950)],见图5G。以上分析均提示了ST3GAL5在膀胱癌患者中的表达与预后有一定的关联性。A~D:TCGA-BLCA数据集结果;E~F:Kaplan-Meier plotter 网页结果;G:GENT2网页结果图5 ST3GAL5表达与膀胱癌的生存关系分析六、ST3GAL5低表达在膀胱癌中的GSEA分析为了进一步确定ST3GAL5在膀胱癌中差异表达所激活的信号通路,我们对GEO 一项大样本数据集GSE83586中ST3GAL5高表达组(n=124)和ST3GAL5低表达组(n=183)之间进行了GSEA分析以验证其KEGG通路,其中低表达ST3GAL5富集分析结果见表2。最终,我们确定了3种ST3GAL5低表达与膀胱癌显著正相关的肿瘤相关途径:NOD样受体信号通路、细胞因子-细胞因子-受体相互作用和JAK-STAT信号通路,见图6。表2 ST3GAL5低表达表型的GESA富集结果A:NOD样受体信号通路;B:细胞因子-细胞因子-受体相互作用;C:JAK-STAT信号通路图6 ST3GAL低表达在膀胱癌中的GSEA分析讨 论膀胱癌可分为低级别和高级别病变,同时也可分为非肌层浸润和肌层浸润性病变。低级别膀胱癌极少侵犯膀胱肌层且死亡极少。而高级别膀胱癌常侵犯肌层且死亡率高。与此同时,NMIBC的预后良好(5年生存率为95%,MIBC则为69%)[7]。但是70%的非肌层浸润疾病通常容易复发并且30%在首次治疗后可进展为肌层浸润疾病[8],复发和进展到高级别导致不良结果[9]。目前关于膀胱癌肌层侵犯和高级别进展的病因尚不清楚。因此,寻找一种有效的生物标志物来预测膀胱癌的肌层侵犯与否、分级和预后至关重要。目前,对于ST3GAL5表达对膀胱癌肌层侵犯、分级和预后的影响尚未见文献报道,ST3GAL5在膀胱癌中的潜在作用是本研究的重点。本文综合运用生物信息学方法对多组独立的公共数据库进行分析,发现ST3GAL5在多种癌症中低表达,在膀胱癌中的表达水平较正常膀胱组织低,在膀胱癌中ST3GAL5的低表达与肌层侵犯、高分级和预后不良有一定的关联性。这些结果提示ST3GAL5可能是膀胱癌的抑癌基因,ST3GAL5可能抑制膀胱癌向肌层侵犯和高级别进展,这也提示ST3GAL5可能是膀胱癌的治疗靶点。上调ST3GAL5表达有可能延缓膀胱癌肌层侵犯和向高级别进展,并可能改善患者的总体生存和复发状况。但仍需要进一步的研究来探索ST3GAL5在膀胱癌患者进展和预后中的详细分子机制。ST3GAL5催化神经节苷脂GM3的形成[4],因此也被称为GM3合酶。GM3在多种癌症中过度表达,可作为肿瘤相关的糖类抗原,用于癌症的免疫治疗。同时,GM3还可以通过抗血管生成或运动等途径抑制肿瘤细胞的生长[5]。有文献报道GM3在结肠癌[10]、乳腺癌[11]、肝癌[12]和其他癌症[6,13]中具有抗肿瘤细胞增殖作用,虽然已有少量研究表明GM3在人膀胱癌中有抗癌作用[14-16],但其作用机制和信号通路尚不清楚。因此,在本研究中,我们对一项大样本的膀胱癌数据集(n=307)进行了通路验证,深入探讨了其对膀胱癌的信号通路效应。首先,根据膀胱癌中ST3GAL5的平均表达值,将其分为低表达组和高表达组,然后对两组进行GSEA分析。最终我们确定了3种与膀胱癌中ST3GAL5低表达显著正相关的肿瘤相关途径:NOD样受体信号通路、细胞因子-细胞因子-受体相互作用和JAK-STAT信号通路。NOD样受体信号通路是一种典型的免疫学信号通路,与多种人类疾病如感染、癌症、自身免疫和炎症性疾病等相关。NOD样受体及其下游信号成分与细胞死亡和自噬途径形成复杂的串扰,这两种途径都是癌症发展的关键过程[17]。此外,众所周知,细胞因子是重要的细胞间调节因子和动员因子,参与先天性和适应性炎症宿主防御、细胞生长、分化、细胞死亡、血管生成以及旨在恢复体内平衡的发育和修复过程[18]。在本研究中,该通路与ST3GAL5的低表达呈正相关,表明ST3GAL5的低表达可能通过影响免疫状态而促进膀胱组织的癌变。而JAK-STAT信号异常已被证实与癌症的进展和转移有关[19]。本研究中的通路分析提示ST3GAL5的低表达可能通过肿瘤免疫、细胞因子相互作用和细胞因子转导等途径影响膀胱癌的进展,这些均为膀胱癌的靶向治疗和免疫治疗提供了新的思路。
通过Oncomine、GENT2(gent2.appex.kr/gent2)和TIMER2.0(timer.cistrome.org/)数据库挖掘ST3GAL5在不同类型癌症与对应正常组织中的表达水平,然后通过Oncomine、GEO和TCGA数据库分别探讨ST3GAL5在膀胱癌与正常膀胱、MIBC与NMIBC、高级别膀胱癌与低级别膀胱癌中的表达水平。其中Oncomine数据库默认设置为P<1×104,|差异倍数|>2,基因排名为前10%。GENT数据库使用U133Plus2平台进行分析。TCGA-BLCA数据集、GEO数据集GSE13507和Oncomine数据集Lee Bladder的数据用于膀胱癌与正常膀胱组织的表达分析,TCGA-BLCA数据集、GEO数据集(GSE120736、GSE13507和GSE31684)和Oncomine数据集(Blaveri Bladder2、Lee Bladder、Sanchez-Carbayo Bladder2和Stransky Bladder)分别用于MIBC与NMIBC、高级别与低级别膀胱癌的表达分析。
通过UCSC-Xena浏览器下载TCGA-BLCA的基因表达水平及生存数据,使用R语言安装包“survival”和“survminer”进行Kaplan-Meier生存曲线分析,使用Kaplan-Meier plotter网页工具(kmplot.com/analysis/)进行生存分析验证,使用GENT2网页工具(gent2.appex.kr/gent2)进行总体生存率Meta分析。
为了进一步辨别ST3GAL5不同表达水平在膀胱癌中的信号通路,采用基因集富集分析(Gene Set Enrichment Analysis, GSEA)对GEO数据集GSE83586进行京都基因和基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)通路验证。根据ST3GAL5的表达均值,将其分为高表达组和低表达组,使用GSEA软件4.02版本进行分析,基因集置换运行1 000次,以错误发现率(false discovery rate, FDR)<0.25,|标准化富集分数|>1及P<0.05为显著性差异。最后使用R安装包“Rtoolbox”对GSEA报告进行二次绘图。
Oncomine数据库中,ST3GAL5在膀胱癌、肺癌、卵巢癌、前列腺癌和其他癌症中低表达,在食管癌、头颈癌、肾癌、白血病、淋巴瘤、黑色素瘤和骨髓瘤中高表达;GENT2数据库的U133Plus2平台中,ST3GAL5在脂肪癌、膀胱癌、血液癌、脑癌、乳腺癌、子宫内膜癌、肝癌、肺癌、卵巢癌、肌肉癌和前列腺癌中表达下调;TIMER 2.0数据库中见8种癌症ST3GAL5表达显著下调和7种癌症ST3GAL5表达显著上调。3个独立数据库均显示ST3GAL5在不同类型癌症中的表达明显下调,且ST3GAL5在膀胱癌中的表达水平均显著降低(P<0.05),见图1。
A:Oncomine数据库(红色代表上调,蓝色代表下调);B:GENT2数据库;C:TIMER2.0数据库图1 ST3GAL5在不同类型癌症中的表达
在GEO数据集GSE13507、Oncomine数据集 Lee Bladder和 TGCA数据库中均提示ST3GAL5在膀胱癌中表达显著降低(P=0.004 9、P=5×10-7和P=0.000 17),见图2。
A:GEO数据集GSE13507;B:Oncomine数据集Lee Bladder;C:TCGA数据库图2 ST3GAL5在BLCA中的表达
在Oncomine数据库中,比较分析后发现有4组数据集提示ST3GAL5在膀胱癌中表达显著下调(P=5.7×10-9、P=4.9×10-9、P=4.9×10-12、P=6×10-10),见图3A。对此4组数据集进行Meta分析后发现ST3GAL5在MIBC中表达显著下调(P=2.64×10-9),见表1。而在GEO数据集GSE120736、GSE13507和GSE31684中也均提示ST3GAL5在MIBC中表达显著下调(P=3.8×10-13、P=8.8×10-12和P=3.5×10-6),见图3B。其中,TCGA-BLCA数据集中因仅有5例MIBC报道,故未作分析。
表1 Oncomine数据集中ST3GAL5表达下调的比较
A:Oncomine数据集;B:GEO数据集图3 ST3GAL5在MIBC中的表达
在4组独立Oncomine数据集中,ST3GAL5 在高级别BLCA中均显著下调(P=0.002、P=4.2×10-7、P=6×10-5和P=1.4×10-7),见图4A。而在GEO数据集GSE120736、GSE13507和GSE31684中也均提示显著下调(P=2.6×10-12、P=8.2×10-10和P=0.049),见图4B。同样在TCGA-BLCA数据集也证实其显著下调 (P=4.2×10-6),见图4C。
A:Oncomine数据集;B:GEO数据集;C:TCGA-BLCA数据集图4 ST3GAL5在高级别BLCA中的表达
在TCGA-BLCA数据集中,在总体生存率、疾病特异性生存率、无疾病间期及无进展间期方面,ST3GAL5低表达组较高表达组风险更高(P=0.002 4、P=0.001 3、P=0.03和P=0.000 48)。见图5A~5D。而在Kaplan-Meier plotter 网页工具中也验证了在总体生存率及无复发生存率方面,ST3GAL5低表达比高表达均具有更高的风险(P=5×10-4和P=0.007 3),见图5E、5F。最后通过GENT2网页工具对总体生存率作Meta生存分析,同样提示ST3GAL5低表达比高表达均具更高的风险[P=0.004,HR=0.622(0.452~0.856),τ2=0.086,I2=0.884(0.728~0.950)],见图5G。以上分析均提示了ST3GAL5在膀胱癌患者中的表达与预后有一定的关联性。
A~D:TCGA-BLCA数据集结果;E~F:Kaplan-Meier plotter 网页结果;G:GENT2网页结果图5 ST3GAL5表达与膀胱癌的生存关系分析
为了进一步确定ST3GAL5在膀胱癌中差异表达所激活的信号通路,我们对GEO 一项大样本数据集GSE83586中ST3GAL5高表达组(n=124)和ST3GAL5低表达组(n=183)之间进行了GSEA分析以验证其KEGG通路,其中低表达ST3GAL5富集分析结果见表2。最终,我们确定了3种ST3GAL5低表达与膀胱癌显著正相关的肿瘤相关途径:NOD样受体信号通路、细胞因子-细胞因子-受体相互作用和JAK-STAT信号通路,见图6。
表2 ST3GAL5低表达表型的GESA富集结果
A:NOD样受体信号通路;B:细胞因子-细胞因子-受体相互作用;C:JAK-STAT信号通路图6 ST3GAL低表达在膀胱癌中的GSEA分析
膀胱癌可分为低级别和高级别病变,同时也可分为非肌层浸润和肌层浸润性病变。低级别膀胱癌极少侵犯膀胱肌层且死亡极少。而高级别膀胱癌常侵犯肌层且死亡率高。与此同时,NMIBC的预后良好(5年生存率为95%,MIBC则为69%)[7]。但是70%的非肌层浸润疾病通常容易复发并且30%在首次治疗后可进展为肌层浸润疾病[8],复发和进展到高级别导致不良结果[9]。目前关于膀胱癌肌层侵犯和高级别进展的病因尚不清楚。因此,寻找一种有效的生物标志物来预测膀胱癌的肌层侵犯与否、分级和预后至关重要。
目前,对于ST3GAL5表达对膀胱癌肌层侵犯、分级和预后的影响尚未见文献报道,ST3GAL5在膀胱癌中的潜在作用是本研究的重点。本文综合运用生物信息学方法对多组独立的公共数据库进行分析,发现ST3GAL5在多种癌症中低表达,在膀胱癌中的表达水平较正常膀胱组织低,在膀胱癌中ST3GAL5的低表达与肌层侵犯、高分级和预后不良有一定的关联性。这些结果提示ST3GAL5可能是膀胱癌的抑癌基因,ST3GAL5可能抑制膀胱癌向肌层侵犯和高级别进展,这也提示ST3GAL5可能是膀胱癌的治疗靶点。上调ST3GAL5表达有可能延缓膀胱癌肌层侵犯和向高级别进展,并可能改善患者的总体生存和复发状况。但仍需要进一步的研究来探索ST3GAL5在膀胱癌患者进展和预后中的详细分子机制。
ST3GAL5催化神经节苷脂GM3的形成[4],因此也被称为GM3合酶。GM3在多种癌症中过度表达,可作为肿瘤相关的糖类抗原,用于癌症的免疫治疗。同时,GM3还可以通过抗血管生成或运动等途径抑制肿瘤细胞的生长[5]。有文献报道GM3在结肠癌[10]、乳腺癌[11]、肝癌[12]和其他癌症[6,13]中具有抗肿瘤细胞增殖作用,虽然已有少量研究表明GM3在人膀胱癌中有抗癌作用[14-16],但其作用机制和信号通路尚不清楚。因此,在本研究中,我们对一项大样本的膀胱癌数据集(n=307)进行了通路验证,深入探讨了其对膀胱癌的信号通路效应。
首先,根据膀胱癌中ST3GAL5的平均表达值,将其分为低表达组和高表达组,然后对两组进行GSEA分析。最终我们确定了3种与膀胱癌中ST3GAL5低表达显著正相关的肿瘤相关途径:NOD样受体信号通路、细胞因子-细胞因子-受体相互作用和JAK-STAT信号通路。NOD样受体信号通路是一种典型的免疫学信号通路,与多种人类疾病如感染、癌症、自身免疫和炎症性疾病等相关。NOD样受体及其下游信号成分与细胞死亡和自噬途径形成复杂的串扰,这两种途径都是癌症发展的关键过程[17]。此外,众所周知,细胞因子是重要的细胞间调节因子和动员因子,参与先天性和适应性炎症宿主防御、细胞生长、分化、细胞死亡、血管生成以及旨在恢复体内平衡的发育和修复过程[18]。在本研究中,该通路与ST3GAL5的低表达呈正相关,表明ST3GAL5的低表达可能通过影响免疫状态而促进膀胱组织的癌变。而JAK-STAT信号异常已被证实与癌症的进展和转移有关[19]。本研究中的通路分析提示ST3GAL5的低表达可能通过肿瘤免疫、细胞因子相互作用和细胞因子转导等途径影响膀胱癌的进展,这些均为膀胱癌的靶向治疗和免疫治疗提供了新的思路。