基于公共数据库探讨INHBA在宫颈癌中的表达及临床意义*
2023-08-15袁婉婧曾云慧曾丽平
袁婉婧 曾云慧 曾丽平 李 娜,3
1 湖南中医药大学第二附属医院病理科,湖南省长沙市 410005; 2 湖南医药学院基础医学院; 3 湖南医药学院第一附属医院
宫颈癌(Cervical cancer, CC)是当前常见的女性生殖系统恶性肿瘤,位居全球女性高发肿瘤第四位,具有较高的发病率和病死率[1-2]。宫颈癌的发病机制复杂,长期高危型人乳头瘤病毒 (HPV)是导致其发病的重要原因。除此之外,肿瘤抑制基因和(或)癌基因的改变是宫颈癌发生发展的重要因素。抑制素(inhibin, INH)是一种性腺分泌的水溶性蛋白,具有多种生物学功能,在肿瘤等多类疾病的发生和进展过程中扮演重要角色。INHBA基因编码抑制素的βA亚基,通过形成抑制素和激活素参与调节机体的生殖和发育过程。近年来的一些研究表明,INHBA在食管癌[3]、肺腺癌[4]、胃癌[5]、结直肠癌[6]等恶性肿瘤中过表达,参与肿瘤的发生、发展,并与临床预后密切相关。然而,对于INHBA在宫颈癌中的表达及意义目前研究较少,本研究通过对癌症基因组图谱(The Cancer Genome Atlas, TCGA)和基因表达综合数据库(Gene Expression Omnibus, GEO)中宫颈癌的基因表达数据进行分析,探讨INHBA在宫颈癌中的表达及临床意义,以期为宫颈癌的分子诊断和预后评估提供新的标志物。
1 材料与方法
1.1 数据下载与处理 从UCSC XENA(https://xenabrowser.net/datapages/)在线服务器中下载TCGA数据库中宫颈癌的RNAseq及临床信息数据和基因型—组织表达(Genotype-Tissue Expression,GTEx)数据库中宫颈正常组织数据。利用R软件包对数据进行log2转化用于样本间基因表达差异比较。GSE63514、 GSE39001、GSE7803和GSE9750四组宫颈癌基因表达数据及对应的患者临床资料均下载自GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)。
1.2 INHBA的表达分析 在R环境下利用ggplot2 软件包分析INHBA在肿瘤组织和非肿瘤宫颈组织中的表达差异,进行Mann-WhitneyU检验,以P< 0.05为差异有统计学意义。
1.3 预后价值分析 利用survminer包和survival包进行生存分析,绘制Kaplan-Meier(KM)生存曲线,并通过Log-rank test比较2组患者间总生存期(Overall survival,OS)、疾病特异性生存(Disease specific survival,DSS)和无进展间隔(Progress free interval,PFI)的差异,计算风险比(Hazard ratio,HR),以P< 0.05为差异有统计学意义。
1.4 诊断价值分析 利用Graphpad Prism软件(版本8.0)进行接受者操作特征曲线分析并绘制相关曲线,计算曲线下面积(AUC)和95%置信区间(95%CI),以P< 0.05为差异有统计学意义。
2 结果
2.1 INHBA基因在宫颈癌组织中的表达显著升高 通过对TCGA+ GTEX数据库中的306例宫颈癌样本和13例宫颈正常组织样本的测序数据进行分析,我们发现INHBA的mRNA在宫颈癌组织中的表达水平明显高于非肿瘤宫颈组织(P=0.018)。为了进一步验证INHBA在宫颈癌组织中的表达情况,我们纳入了GEO数据库中的3个宫颈癌基因表达数据集GSE63514、 GSE39001和GSE7803进行分析,其包含的上皮组织样本分别为24 例、12例和10例,宫颈癌组织样本分别为28例、43例和21例,3个数据集中的分析结果均表明INHBA在宫颈癌组织中的表达较非癌宫颈组织明显增加,差异有统计学意义(均P<0.05)。
2.2 INHBA的表达与临床病理特征的关系 根据TCGA数据库中宫颈癌的基因表达数据,利用INHBA的中位表达值将患者分为INHBA高表达组和低表达组,分析INHBA的表达与患者临床病理特征的关系。结果表明,高INHBA表达的宫颈癌患者更容易出现淋巴结转移(P=0.002),且具有较低的身体质量指数(BMI,P=0.046),而INHBA的表达与患者T分期、M分期、临床分期、年龄和组织学分级等之间的关系没有统计学差异(均P>0.05),见表1。
表1 INHBA的表达与宫颈癌患者临床病理特征的关系[n(%)]
2.3 INHBA基因在宫颈癌中的预后价值分析 通过TCGA数据库进一步分析了INHBA基因的表达与宫颈癌患者预后的关系,根据INHBA表达中位值将患者分为高、低表达2组,绘制KM曲线。结果显示,INHBA基因高表达组宫颈癌患者的总生存期(HR=2.45,95%CI 1.54~3.89,P<0.001)、疾病特异性生存期(HR=2.49,95%CI 1.47~4.24,P=0.001)和无进展间隔(HR=2.36,95%CI 1.49~3.77,P<0.001)均明显短于INHBA低表达组患者对应的生存期(见图1),差异有统计学意义(均P<0.05),提示INHBA基因高表达的宫颈癌患者临床预后较差。
图1 NHBA的表达对宫颈癌患者的预后价值分析
2.4 INHBA基因在宫颈癌中的诊断价值分析 为了进一步探讨INHBA对宫颈癌的诊断价值,通过ROC曲线分析了GSE39001、GSE63514、GSE7803和GSE9750四个数据集中INHBA对宫颈癌的诊断能力。结果如图2所示,每组数据集的AUC为GSE39001(AUC=0.82,95%CI 0.70~0.93,P=0.000 8),GSE63514(AUC=0.90,95%CI 0.82~0.98,P<0.000 1),GSE7803(AUC=0.87,95%CI 0.71~1.00,P=0.001 1)和GSE9750(AUC=0.94,95%CI 0.89~1.00,P<0.000 1),表明通过检测组织中INHBA的表达量,能较好地区分宫颈癌组织和非肿瘤宫颈组织。
图2 INHBA对宫颈癌诊断价值分析
3 讨论
宫颈癌是女性常见的恶性肿瘤,发病率和死亡率较高。对宫颈癌实现早期筛查和诊断,并采取适宜的治疗手段可以显著提高患者的生存率,5年的总生存期可达90%[7]。然而,对于发生转移的宫颈癌患者,治疗方式有限,患者预后很差,5年的总生存期低于10%[8]。因此,找寻有效的宫颈癌诊断和预后评估生物标志物是提高患者生存率的关键。
INHBA基因的编码产物为抑制素βA亚基,是转化生长因子-β超家族的重要成员,参与生成抑制素和激活素,从而在癌症等多种疾病的发生发展过程中起着重要作用[9-10],可以作为评估部分肿瘤预后情况的生物标记物[4,6]。在本研究中,我们通过对TCGA和GEO数据库中的宫颈癌基因表达数据进行分析,初步发现了INHBA在宫颈癌组织中表达显著上调,且高INHBA表达的患者更容易出现淋巴结转移,提示INHBA可能参与宫颈癌的发生和进展过程。进一步通过生存曲线分析发现高INHBA表达的患者对应较短的总生存期、疾病特异性生存和无进展间隔,表明INHBA可以作为宫颈癌患者预后情况评估的有效生物标志物。这些研究与先前学者在食管鳞状细胞癌[3]、乳腺癌[11-12]、结肠腺癌[6,13]、头颈部癌[14]等肿瘤中的发现基本类似,在一定程度上进一步支持了我们的发现。此外,我们也发现检测组织中INHBA的表达对宫颈癌具有较好的诊断价值,提示INHBA可以作为诊断宫颈癌的潜在新分子标记,但INHBA是否可以作为宫颈癌早期诊断生物标记物需要进一步的大样本临床研究来验证。
综上,我们的研究结果初步表明INHBA与宫颈癌的发生和进展密切相关,可以作为宫颈癌诊断和预后评估的分子标记物。但鉴于研究方法仅限于生物信息学分析,研究的结果可能存在一定的偏倚,需进一步的基础和临床实验探讨INHBA在宫颈癌中的生物学功能和临床意义。