APP下载

miRNA作为乳腺癌潜在预后生物标志物的构建及评估*

2021-11-26张开炯吴立春

国际检验医学杂志 2021年22期
关键词:训练组总体生存率

张 珂,张开炯,吴立春,陈 莉

四川省肿瘤医院·研究所/四川省癌症防治中心/电子科技大学医学院附属肿瘤医院:1.输血科;2.检验科,四川成都 610041

乳腺癌是全球女性最常见的恶性肿瘤,其发病率位居第一[1]。世界卫生组织2020年最新癌症报告显示,乳腺癌新增人数达226万,正式取代肺癌成为全球第一大癌症。尽管近年来乳腺癌的治疗方法已有很大改善,但由于个体差异,预后仍然不理想[2]。因此,有必要找到敏感而精确的生物标志物,以更好地预测乳腺癌患者的生存和预后。微小RNA(miRNA)是一种由21~23个核苷酸组成的高度保守的内源性短链非编码RNA分子[3]。现已证明miRNA可靶向超过60%的人类基因[4],几乎参与了每个生物学过程,包括发育,血管生成,细胞分化、增殖、存活、侵袭、凋亡,伤口愈合和免疫细胞功能等[5]。既往研究证实,miRNA在肿瘤的发生、发展、转移和患者存活中起重要作用,其能够作为肿瘤的潜在治疗工具和诊断生物标志物[6-7]。近年来,许多集中于乳腺癌miRNA表达谱的研究发现,miRNA在预测患者预后中已显示出巨大希望[8]。然而,miRNA在乳腺癌中的生物学功能仍不为人所知,为提高乳腺癌预后的预测准确性,仍需要系统地研究多种miRNA的表达,利用整体的危险评分进行预后评价。因此,鉴定出更强大和实用的miRNA信号具有重要的临床意义。本研究通过开发和验证基于癌症基因组图谱(TCGA)数据库的miRNA预后模型,并进一步系统地评估该模型对乳腺癌患者总体生存的预测价值,以明确miRNA作为乳腺癌预后生物标志物的可靠性。

1 材料与方法

1.1数据来源 从TCGA数据库 (https://portal.gdc.cancer.gov/)下载1 086例乳腺癌组织和804例正常组织的miRNA测序数据和临床信息。

1.2方法

1.2.1差异表达miRNA筛选 采用R语言edgeR程序包筛选肿瘤组织与正常组织之间差异表达的miRNA,以FDR<0.05和log2|fold change|>1作为筛选标准。

1.2.2预后相关miRNA筛选 将1 086例乳腺癌患者表达矩阵和临床信息进行清洗,剔除连续表达量低的数据,将清洗后剩余的1 033例乳腺癌患者按照7∶3比例分为训练组(723例)与验证组(310例),首先使用R程序包survival进行单因素Cox回归分析,其次采用glmnet程序包进行LASSO回归分析,再次使用survival包进行逐步多因素Cox回归分析,以赤池信息准则(AIC)为准,选取AIC信息统计量最小的模型为最终模型,以P<0.05作为筛选标准,P<0.05说明该变量为独立的预后影响因素。

1.2.3miRNA风险模型构建与验证 将单因素Cox回归分析与LASSO回归分析筛选出的miRNA进行逐步多因素Cox回归分析,建立预后风险模型。根据风险得分中值将训练组的患者分为低风险组和高风险组,使用Kaplan-Meier计算高低风险组患者之间的生存差异。使用R软件包survival 受试者工作特征(ROC)曲线计算模型1年、3年和5年的曲线下面积(AUC)。将训练组构建的预后风险模型纳入验证组进行验证,并计算高低风险组患者之间生存差异和模型1年、3年和5年的AUC。

2 结 果

2.1乳腺癌差异表达miRNA筛选 共发现269个差异表达的miRNA,其中204个miRNA表达上调,65个miRNA表达下调。

2.2乳腺癌总体生存相关miRNA筛选 单因素Cox回归分析发现,35个miRNA与乳腺癌总体生存相关。进一步通过LASSO回归分析发现,以最小λ值作为筛选准则,筛选出18个miRNA与乳腺癌患者总体生存相关。逐步多因素Cox回归分析发现,8个miRNA(hsa-miR-3923、hsa-miR-105-2、hsa-miR-3927、hsa-miR-449c、hsa-miR-106a、hsa-miR-1262、hsa-miR-605和hsa-miR-3929)与乳腺癌患者总体生存情况相关。

2.3乳腺癌miRNA预后风险模型的构建 基于逐步多因素Cox回归分析筛选出的8个miRNA,将每个miRNA的多因素Cox回归系数和每个miRNA的表达值构建了1个由8个miRNA组成的风险评分模型:风险得分=0.361×hsa-miR-3923+0.097×hsa-miR-105-2+0.724×hsa-miR-3927-0.333×hsa-miR-449c-0.232×hsa-miR-106a-0.366×hsa-miR-1262+0.288×hsa-miR-605+0.979×hsa-miR-3929,根据风险得分中位值将训练组患者分为高低风险两组(图1A),结果显示,高风险组患者的总体生存率明显低于低风险组患者(P<0.001);ROC曲线分析显示,风险模型1年、3年和5年的AUC分别为0.779、0.688和0.728(图1B)。

注:A为训练组高低风险组Kaplan-Meier生存曲线;B为训练组采用ROC曲线评估预测模型1年、3年和5年的预测效能。

2.4乳腺癌miRNA预后风险模型的验证 在验证组中低风险组患者的总体生存率显著高于高风险组(P<0.05,图2A),风险模型1年、3年和5年的AUC分别为0.777、0.768和0.806(图2B)。

注:A为验证组高低风险组Kaplan-Meier生存曲线;B为验证组采用ROC曲线评估预测模型1年、3年和5年的预测效能。

3 讨 论

目前,越来越多的研究表明,差异表达的miRNA与乳腺癌的发生发展密切相关,其可作为乳腺癌诊断、预后判断和治疗的潜在生物标志物[9-10]。与单个生物标志物相比,多个生物标志物的综合判别可以提高预测准确性。本研究先后通过单因素Cox、LASSO回归和多因素Cox比例风险回归,确定了8个miRNA(hsa-miR-3923、hsa-miR-105-2、hsa-miR-3927、hsa-miR-449c、hsa-miR-106a、hsa-miR-1262、hsa-miR-605和hsa-miR-3929)可作为乳腺癌独立的预后预测指标。然后,根据它们的表达谱和回归系数构建了一个由8个miRNA组成的风险模型,并用于预测乳腺癌患者的总体生存率。为了明确所构建模型预后预测价值的可靠性,本研究设置了训练组和验证组两个独立的研究队列。在训练组中,根据患者的风险评分将患者分为高风险组和低风险组,Kaplan-Meier生存曲线表明两组患者的总体生存率差异有统计学意义(P<0.001),高风险组患者的总体生存率明显低于低风险组患者。ROC曲线分析显示,miRNA模型在预测乳腺癌患者存活风险方面具有较高的预测准确性,可作为预测乳腺癌患者预后的可靠生物标志物。

在既往的研究中,研究者主要通过单个基因和通路的分析探究miRNA作为乳腺癌或其他肿瘤的生物标志物的价值[11-12]。例如,LI等[11]发现,miR-106b-5p和miR-93-5p在乳腺癌细胞中表达水平增高,其高表达可抑制抑癌基因PTEN的表达水平,从而促进乳腺癌细胞的迁移、侵袭和增殖,同时增强乳腺癌细胞磷脂酰肌醇3激酶(PI3K)/蛋白激酶B(Akt)途径的活性;ZHAO等[12]通过多变量分析发现,miR-106a是胶质母细胞瘤(GBM)患者总体生存的独立预后生物标志物,可用于预测单个GBM患者的预后和治疗反应。BERTOLI等[13]研究发现,与单个miRNA相比,循环体液中多个miRNA图谱显示出更好的诊断和预后预测性能以及更高的灵敏度。因此,多基因多模型综合分析在肿瘤诊断和治疗中显得尤为重要。

近年来,亦有研究者将多基因综合分析用于肿瘤诊断和预后分析。WANG等[14]通过TCGA数据库构建了由4个miRNA(hsa-miR-126,hsa-miR-3613,hsa-miR-424和hsa-miR-4772)组成的用于预测胰腺腺癌(PAAD)总体生存率的模型,该模型2年生存率AUC为0.789,其可作为预测PAAD患者生存的有效独立预后生物标志物。SIRIWARDHANA等[15]采用单因素Cox和逐步多因素Cox回归筛选出5个miRNA(miR-375,miR-582-3p,miR-326,miR-181c-5p和miR-99a-5p)用于肺腺癌预后模型的构建,其模型可作为预测肺腺癌预后的可靠工具。最近,LUO等[16]采用LASSO Cox的方法筛选出包括miR130b,miR-18a和miR-223在内的3个miRNA。根据3个miRNA特征性危险评分的最佳临界值,将所有患者分为高危组和低危组。两组患者的生存率差异有统计学意义(P<0.000 1),并且3个miRNA标志物具有良好的预后预测准确性,可作为肾透明细胞癌独立的预后预测因素。这些结果表明,多基因模型的构建在肿瘤预后的预测准确性方面具有重要意义。

尽管本研究构建了由8个miRNA组合的预后分子标志物,其在乳腺癌预后预测中具有良好的准确性和可靠性,显示了其可作为乳腺癌预后生物标志物的巨大潜能,但也存在一些局限性。首先,虽然本研究设置了验证组以验证所构建模型的可靠性,但没有进行临床试验;第二,本研究所构建的预后风险模型虽然能够明显区分高低风险组,但1年、3年和5年风险得分的AUC仅能达到75%左右,其预测效能欠佳。后续研究将进一步纳入该8个miRNA进行临床验证,同时纳入其他数据库进行功能分析和探究。

综上所述,本研究构建了1个由8个miRNA组成的与乳腺癌患者总体生存显著相关的预测模型,可以从高预后风险的患者中准确识别出低预后风险的患者,并在验证组中评估了该模型的准确性和可靠性。这些结果表明,整合的8个miRNA组合可以作为预测乳腺癌患者预后的潜在标志物。

猜你喜欢

训练组总体生存率
新型抗阻力训练模式改善大学生身体素质的实验研究
跑台运动训练对脊髓损伤大鼠肺功能及HMGB-1表达的影响
用样本估计总体复习点拨
线上自主训练与线下指导训练表面肌电差异分析
2020年秋粮收购总体进度快于上年
“五年生存率”不等于只能活五年
人工智能助力卵巢癌生存率预测
外汇市场运行有望延续总体平稳发展趋势
日本首次公布本国居民癌症三年生存率
“五年生存率”≠只能活五年