胶质瘤中碳水化合物磺基转移酶6的表达与临床预测价值☆
2024-01-08赵北川宣若恒杨桂涛凌耿强夏之柏
赵北川 宣若恒 杨桂涛 凌耿强 夏之柏
胶质瘤因其高死亡率给社会和家庭均带来了沉重负担,识别更好的生物标志物,建立更准确的预后模型在神经胶质瘤的临床诊治中具有十分重要的意义。碳水化合物磺基转移酶6(carbohydrate sulfotransferase 6,CHST6)作为一种催化硫酸基转移酶的编码基因,通过参与子宫内膜癌[1]、甲状腺癌[2]、肾透明细胞癌[3]的糖酵解途径,影响肿瘤的侵袭,其高表达与上述肿瘤较差的预后密切相关。同时在GRANT等[4]对437例胰腺癌患者和1922例正常人的全外显子测序中发现,CHST6在胰腺癌患者中具有罕见的破坏性变异富集。目前,CHST6基因在正常组织和神经胶质瘤,以及不同神经胶质瘤临床亚型中的表达差异水平及预后作用仍不清楚,本研究旨在分析CHST6基因在神经胶质瘤中的差异表达情况,以及与胶质瘤的预后关系,并探寻胶质瘤可能的新作用靶点,为进一步探寻神经胶质瘤的发展机制及治疗提供参考。
1 对象与方法
1.1 研究对象各种神经胶质瘤类型的RNA表达数据和临床数据来自癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库(https://portal.gdc.cancer.gov)和中国胶质瘤基因组图谱(Chinese Glioma Genome Atlas,CGGA)(http://www.cgga.org.cn/)325和693数据库。正常样本RNA表达数据则来自于基因型和基因表达量关联数据库(The Genotype-Tissue Expression,GTEx)中标签为“Brain”的1152例样本。
神经胶质瘤样本纳入标准:①行颅脑肿瘤切除术;②病理诊断明确,世界卫生组织(World health organization,WHO)分级为II~IV级的弥漫性胶质瘤。排除标准:①生存状态及术后生存时间缺失或不完整;②生存期<60 d或随访<60 d;③异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)突变、1号染色体短臂和19号染色体长臂(1p19q)共缺失和O6-甲基鸟嘌呤-DNA-甲基转移酶(methyl guanine methyl transferase,MGMT)甲基化状态、性别、年龄或分级信息缺失或不明确。共获得TCGA数据库501例样本、CGGA_325和CGGA_693数据库共703例样本。所有样本将转录本定量(Fragments Per Kilobase of exon model per Million mapped fragments,FPKM)格式的RNA-seq表达数据转换为TPM(Transcripts Per Million)格式,其中CGGA_325和CGGA_693 RNA-seq表达数据合并时行批次校正处理。
1.2 统计学方法使用GraphPad Prism 9.4.1软件行统计分析。用Mann-WhitneyU检验对比非正态分布定量变量CHST6在正常样本与胶质瘤样本间差异表达情况。
以TCGA数据库中501例胶质瘤样本为训练集,CGGA数据库中703例胶质瘤样本为外部验证集,以TCGA数据库中CHST6表达值中位数为界限,分为CHST6高表达风险组与低表达风险组,行Kaplan-Meier预后差异分析及外部验证。并分别做受试者工作特征(receiver operating characteristic,ROC)曲线分析,以ROC曲线下面积(area under curve,AUC)值>0.7表示其有较好的辨别能力,分别验证CHST6在TCGA与CGGA数据库中对胶质瘤患者1年、3年、5年生存期预测的准确性。
使用R语言survival软件包,基于单因素和多因素比例风险(Cox)回归分析TCGA数据库中CHST6表达量与性别、年龄、WHO肿瘤分级、IDH突变状态、1p19q共缺失情况和MGMT甲基化状态等不同临床特征是否为神经胶质瘤患者的独立预后因素,检验水准α=0.05。基于结果构建改进预测模型的列线图(Nomogram)和预测模型的校准图(Calibration),以C指数(C-Index)>0.75认为该模型有较好预测效度。以纳入CHST6表达量的预测模型为改进模型,未纳入CHST6表达量的预测模型为对照模型,以CGGA数据库为验证集,带入TCGA数据库改进模型与对照模型参数,Bootstrap法比较纳入CHST6后,AUC变化情况。
1.3 功能与免疫差异分析使用R语言GSEA软件包对TCGA数据库CHST6高低表达组(中位值为界限)行差异基因集富集分析(Gene Set Enrichment Analysis,GSEA)。通过R语言ClusteProfiler软件包分别作为基因本体(Gene Ontology,GO)功能注释分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,获得差异富集的分子功能(molecular function,MF)、生物学过程(biological process,BP)和细胞成分(cellular component,CC),以及KEGG通路富集情况。
2 结果
2.1 临床特征本研究纳入501例TCGA数据库和703例CGGA数据库胶质瘤样本,临床特征见表1,1152例GETx数据库正常样本。结果显示,胶质瘤样本CHST6表达值[TCGA 4.27(2.37,8.73),CGGA 6.61(3.37,18.17)]较正常样本[GTEx 1.81(1.32,2.23)]明显升高(TCGAvs.GTEx,Z=2.457,P<0.001;CGGAvs.GTEx,Z=4.800,P<0.001)。
表1 神经胶质瘤样本临床特征分组情况 例
2.2 预后分析Kaplan-Meier分析显示,CHST6高表达风险组(中位值4.277为界限)在TCGA数据库和CGGA数据库中总生存期均较低表达风险组明显下调(P<0.0001)。见图1。ROC曲线分析显示,CHST6在TCGA与CGGA数据库中对胶质瘤患者1年、3年、5年生存期预测有较好的准确性(TCGA 1年AUC 0.820,3年AUC 0.748,5年AUC 0.760;CGGA 1年AUC 0.724,3年AUC 0.769,5年AUC 0.760)。见图2。单因素与多因素Cox回归分析结果显示,CHST6与年龄、WHO级别、IDH突变状态、1p19q共缺失等临床特征共同作为胶质瘤患者的独立预后因素。见表2。根据多因素Cox回归分析结果,我们将上述独立预后因素共同纳入预后分析,构建出改进预测模型的列线图(Nomogram)和预测模型的校准图(Calibration)(C-Index 0.885,95%CI0.862~0.908)。见图3、4。纳入CHST6表达量的改进模型较未纳入CHST6表达量的对照模型有着更高的效度(TCGA改进模型1、3、5年AUC 0.900,0.886,0.850;对照模型AUC 0.874,0.865,0.822;改进模型vs.对照模型d=0.036±0.004,SE=0.002,P=0.007;CGGA改进模型1、3、5年AUC:0.719,0.758,0.752;对照模型AUC:0.663,0.666,0.668;改进模型vs.对照模型d=0.087±0.004,SE=0.002,P=0.001)。见图5。
图1 TCGA与CGGA Kaplan-Meier分析曲线 mOS,中位总生存期(median overall survival);HR,风险比率(hazard ratio);95%CI,95%置信区间(95% confidence interval)
图2 TCGA与CGGA ROC分析曲线 TCGA与CGGA ROC模型阈值=4.277,AUC>0.7认为有较好的预测效度
图3 TCGA数据库样本预测模型列线图
图4 TCGA数据库样本预测模型校准图 C-index,C指数;Observed OS,观测生存期;Nomogram-predicted OS,预测生存期。C指数>0.75,表示有着较好的预测效度
表2 TCGA数据库样本多因素Cox回归分析结果
2.3 功能与免疫差异分析GSEA富集分析显示,CHST6高表达风险组GO主要富集于胞外结构(图6红色标记),如含胶原蛋白的细胞外基质、细胞外基质组织、细胞外结构组织、外部封装结构组织、细胞粘附的正向调节(表3);KEGG主要富集于PI3KAkt信号通路、神经活性配体-受体相互作用、黏着斑、细胞因子-细胞因子受体相互作用、人乳头瘤病毒感染(图7红色标记,表4),此外还有癌症中的蛋白聚糖(proteoglycans in cancer)、ECM-受体相互作用(ECM-receptor interaction)等通路(图7紫色标记)。
图6 TCGA数据库GSEA GO富集差异分析结果 MF,分子功能(molecular function);BP,生物学过程(biological process);CC,细胞成分(cellular component)
图7 TCGA数据库GSEA KEGG富集差异分析结果 注:Count,核心基因的数目,值越大,差异富集越显著;GeneRatio,核心基因(Count)与该GO条目中包含表达数据集中的基因数目(setSize)的比值,值越大,差异富集越显著;qValue,校准后P值
表3 TCGA数据库GSEA GO差异富集分析结果
表4 TCGA数据库GSEA KEGG差异富集分析结果
3 讨论
CHST6编码一种催化硫酸基转移酶,相关研究认为CHST6通过参与糖酵解途径,与子宫内膜癌[1]、甲状腺癌[2]、肾透明细胞癌[3]的预后密切相关。LIU等[5]在对能量代谢基因的研究中发现,CHST6与低级别胶质瘤的预后密切相关。本研究经TCGA与CGGA数据库Kaplan-Meier分析和ROC曲线分析,证实CHST6对胶质瘤患者预后有较高的预测价值。多因素Cox回归分析提示,CHST6与年龄、WHO级别、IDH突变状态和1p19q共缺失情况,共同作为胶质瘤的独立预后因素,并绘制生存预测列线图,提示临床可通过该模型图,对胶质瘤患者预后进行预判,从而指导临床尽早展开针对性治疗。
糖酵解作为一种成熟的代谢途径,在癌症的进展中发挥着重要作用。其中异柠檬酸脱氢酶(IDH)作为参与糖酵解途径的关键限速酶之一,其突变情况是胶质瘤的重要临床预后特征,相比于IDH野生型,IDH突变型胶质瘤有着更低水平的糖酵解和更好的预后[6-7]。近年来的研究发现,在胶质母细胞瘤中,肿瘤细胞主要通过激活PI3K/AKT信号通路促进肿瘤细胞的有氧糖酵解[7-11]。本研究的GSEA分析结果也显示,CHST6高表达风险组在PI3K-Akt信号通路有显著的富集,这提示CHST6可能通过PI3K-Akt信号通路,促进胶质瘤的糖酵解水平,并在临床特征中表现为更少的IDH突变,从而影响胶质瘤患者的预后。
在本研究的GSEA分析中,CHST6高表达风险组还在神经活性配体-受体相互作用、黏着斑、细胞因子-细胞因子受体相互作用、ECM-受体相互作用中显著富集。在神经活性配体-受体相互作用中,近年来的研究发现,其中的GABRP与胰腺癌的趋化因子信号、巨噬细胞浸润和肿瘤进展有关[12],小胶质细胞和骨髓来源的髓系细胞分泌的CCL5,与NF1相关的低级别胶质瘤(LGGs)生长有关[13]。细胞外基质(extracellular matrix,ECM)是肿瘤微环境中的一个高度活跃的部分,影响肿瘤细胞的行为和转移能力,对肿瘤的诊断、靶向治疗、预后有着重要意义[14-15]。其中,ECM可通过抑制肿瘤细胞死亡和抗原的释放、感染肿瘤抗原提呈、影响效应T细胞启动和激活、调节T细胞的迁移,干扰T细胞识别和杀死癌细胞等免疫途径,导致免疫系统逃逸和肿瘤生长[16]。黏着斑是一种重要的细胞外基质粘附结构,对于细胞的伸展,粘附,迁移和免疫应答都有不可替代的作用,在肿瘤的转移和侵袭性中具有重要作用[17-18]。以上GSEA分析表明,CHST6在通过PI3K-Akt信号通路促进肿瘤细胞的生长增殖同时,还可能通过神经活性配体的内分泌途径,促进神经胶质瘤的生长;通过影响ECM和细胞外基质结构如黏着斑,促进胶质瘤的生长和免疫系统逃逸。
综上所述,本研究揭示了CHST6的高表达与神经胶质瘤患者的预后不良相关,并制作出的风险因素预后列线图。此外,本研究还对CHST6造成神经胶质瘤患者不良预后的可能通路进行分析,表明CHST6可能作为神经胶质瘤免疫治疗的潜在靶点。但CHST6作用于糖酵解的调控机制、与胶质瘤相关通路的作用机制仍需进一步在胶质瘤细胞系及肿瘤样本中验证。