APP下载

基于TCPA数据库的结直肠癌预后相关蛋白预后模型的建立与应用

2021-11-06路丽祯温菲菲许晓阳郭宁杰贾真真吴淑华

滨州医学院学报 2021年5期
关键词:直肠癌分子蛋白

路丽祯 温菲菲 许晓阳 郭宁杰 贾真真 吴淑华

滨州医学院附属医院病理科 山东 滨州 256603

近年来结直肠癌平均发病率已连续高居世界第三位,仅次于乳腺癌和肺癌,也是我国常见的癌症之一[1]。同时,由于人们生活环境和饮食习惯不断发生变化,结直肠癌发病率更是逐年上升,且呈低龄化趋势[2],值得引起大家的重视。在目前所有对结直肠癌的发生机制的研究中,主要有两种类型的分子缺陷,一种是癌基因的功能被改变而增强,另一种是抑癌基因的功能被改变所抑制[3];多种基因在大多数结直肠癌突变中起重要作用,如APC、KRAS、BRAF和p53基因等[4]。随着现代医学的发展,各种生物标志物可用于预测该病的发生和预后,并为临床提供治疗指导[5]。在临床工作中,CEA、MSI和KRAS突变等是结直肠癌中最常用的肿瘤标志物[6]。随着研究的进展,更多生物标志物将被发现并用于结直肠癌的发生、发展,预后与治疗。结直肠癌严重威胁着广大人民的健康,影响着许多患者的日常生活和工作。分析结直肠癌的早期发生、发展机制,对开展结直肠癌的早期防治工作具有重要指导意义。

分子预后模型是指将一系列分子标记重组,作为评估疾病生物学特性的新变量。与单分子功能研究相比,分子预后模型更加关注分子之间的相互作用,从整体水平上系统地、定量地描述了一些特定的生物学特性,其准确性通常高于单分子检测的准确性[7]。本研究利用TCPA数据库获取结直肠癌预后相关蛋白的表达谱数据,并建立分子预后模型,评估结直肠癌预后相关蛋白组成的预后模型对结直肠癌患者预后的预测价值,并在总体结直肠癌患者中验证其应用价值。

1 材料与方法

1.1 数据资料 从TCPA(The Cancer Proteome Atlas)数据库中选择结直肠癌患者的蛋白表达数据,并从TCGA数据库中下载与患者相关的临床数据。提取的临床数据包括总生存期(OS)、年龄、性别、病理分期、TNM分期。

1.2 研究方法 从TCPA数据库中筛选结直肠癌和正常组织中预后相关蛋白的表达数据。所有统计分析和图表均使用R(V3.6.2)进行。生存软件包用于筛选影响患者总体生存的预后相关蛋白。先使用单因素COX筛选差异表达蛋白,再使用多元COX回归分析建立预测模型并计算风险评分(RS)。然后根据中位数将患者分为高危组和低危组。用Kaplan Meier生存曲线分析高危组与低危组之间的生存差异。在单因素和多因素COX回归模型中纳入预后评分和临床病理因素,例如TNM分期、病理分期、年龄(≤65岁,> 65岁)和性别,以分析影响结直肠癌患者生存的因素。最后使用ROC曲线评估预后预测模型的准确性。

1.3 统计学方法 使用WilCOX测试分析和筛选差异蛋白和倍数变化(FC)。 筛选标准为:logfc> 1或logfc <-1,P<0.05。 使用单因素COX回归模型筛选预后相关的蛋白质状况(P<0.05)。 在其余单变量COX分析,多元COX分析和Kaplan Meier曲线中,P<0.05具有统计学意义。曲线下面积(AUC)>0.60被认为是可以接受的预测,而AUC> 0.75被认为具有良好的预测价值。在临床相关性分析中,WilCOX检验用于比较两组,Kruskal检验用于比较多个组。以P<0.05为差异具有统计学意义。

2 结果

2.1 结直肠癌预后相关差异蛋白的筛选 TCPA数据库中共下载了398例结直肠癌组织样本和39例正常组织样本的表达信息,同时在TCGA数据库中下载384例结直肠癌患者的临床信息,其中有完整临床信息的共有337例。单因素COX检验筛选出其中24个预后相关差异蛋白表达有统计学意义,其中INPP4B、IGFBP2、BIM、GATA6、EGFR、EEF2K等17个基因上调,BID、SRC、CYCLIND1、等7个基因(见图1A),其中红点代表17个上调的差异蛋白,绿点代表7个下调的差异蛋白,黑点表示在结直肠癌组织样本中未差异表达的蛋白。

2.2 预后相关蛋白模型的建立 将上述24个蛋白进行单因素COX分析和KM分析(P<0.05),共有BIM、SRC、BID、CYCLIND1、SRC_pY527、IGFBP2、INPP4B、GATA6、BECLIN、EGFR、EIF4G等11个差异蛋白可能影响患者的总体生存期(图1B)。再将上述筛选后的11个蛋白进行多因素COX分析(P<0.05),进一步筛选出BIM、SRC、BID、CYCLIND1、SRC_pY527、IGFBP2、INPP4B共7个蛋白,并建立预后预测模型(见表1),其中高表达BIM、IGFBP2、INPP4B患者预后较差(P<0.05),低表达SRC、BID、CYCLIND1、SRC_pY527的患者预后不良(P<0.05)。预后评分公式为:PI=1.22×BIM的表达量 -1.82×BID的表达量-1.64×CYCLIND1的表达量+0.44×IGFBP2的表达量+0.83×INPP4B的表达量-0.75×SRC的表达量-0.35×SRC_pY527的表达量。根据预后评分公式计算的中位RS值将337例患者纳入低风险组及高风险组。结果显示低风险组的5年生存率约为85%,高风险组5年生存率约为50%(P<0.01)。低风险组75%OS(8.3年)较高风险组(2.52年)明显延长,总生存率优于高风险组(图2B)。预后评分越高(图2C),死亡的患者就越多(图2D),也就是说,风险评分越高,预后越差。 图2A显示结直肠癌预后相关蛋白预后模型各蛋白在低风险组及高风险组的表达量。

表1 多因素COX分析建立结直肠癌预后相关蛋白预后预测模型表

A. 火山图;B. 森林图。

A.模型中高风险(蓝色)和低风险(粉色)组结直肠癌患者中风险蛋白的表达;B.高风险和低风险组结直肠癌患者的预后;C.结直肠癌预后相关蛋白预后模型中高风险(红色)和低风险(绿色)结直肠癌患者的风险评分分布;D.散点图显示了本模型中结直肠癌患者的生存状况。红点表示死亡的患者,绿点则表示活着的患者。

2.3 TCGA数据库中选取的结直肠癌患者的临床特征 从上述所得TCGA数据库数据中,对可以提取到完整临床数据的337例结直肠癌患者的相关数据进行整理并分析,纳入患者的临床特征见表2。

表2 TCGA数据库中337例结直肠癌患者的临床特征

2.4 结直肠癌患者生存影响因素的COX回归分析及多指标ROC曲线 纳入COX回归分析的自变量中的连续变量为结直肠癌预后相关蛋白模型评分,余为分类变量。单因素COX回归模型分析结果显示年龄、性别、分级、TMN分期及结直肠癌预后相关蛋白预后模型评分是影响结直肠癌总体生存期的危险因素(P<0.05,图3B)。多因素COX回归模型分析,结果显示年龄、结直肠癌预后相关蛋白预后模型是结直肠癌患者预后的独立影响因素(P<0.05,图3A)。多指标ROC曲线分析患者5年的生存情况,结直肠癌预后相关蛋白模型的ROC曲线的AUC值最大,为0.727(零假设:实面积=0.5,P<0.001),提示结直肠癌预后相关蛋白模型可以接受预测,见图4。

A.多因素分析;B.单因素分析。

图4 5年生存多指标的ROC曲线

3 讨论

结直肠癌是我国一种常见的消化系统肿瘤,在恶性肿瘤中居第三位,在癌症致死原因中居第四位[8]。目前,根治性切除联合合理的放化疗是治疗结直肠癌的主要方法,但疗效并不理想。30%~50%的患者术后复发[9],生存率不高。发生转移的患者5年生存率仅为10%~15%[10]。由此可见,结直肠癌的发病率在各类癌症中很高,但其具体的发病机制和转移的分子病理机制尚不清楚,已成为结直肠癌诊治的主要难题之一。目前判断结直肠癌预后的主要因素依旧是临床与病理等观察指标,而且随着分子生物学的进步,许多能够影响结直肠癌预后的分子标志物被发现而越来越受到重视,如这些分子标志物被引入结直肠癌预后分析系统,有助提高预测的准确性。因此,寻找敏感性、准确性和特异性高的新的预后标志物将有助于结直肠癌早期诊断和治疗。

BIM(Bcl-2 Interacting Mediator of cell death)是BH3-only蛋白的重要成员,具有高度的促凋亡性,在生理和病理生理条件下启动内源性凋亡途径。多位学者的研究证明,当BIM高表达时,可以抑制肿瘤的增殖与转移从而改善预后[11-14]。BID(BH3-interacting domain death agonist)也是BH3-only蛋白的成员,过度表达时使某些癌症细胞对抗癌药物诱导的凋亡敏感,特别是通过死亡受体(例如TRAIL)作用的那些药物诱导的凋亡非常敏感[15],但是同时,Yin等的研究表明,BID的缺失一方面可以抑制肝细胞癌变,但是却增加了患白血病的风险[16]。SRC是一种非受体胞质酪氨酸激酶,是多种生理稳态途径中不可缺少的一员。在肿瘤中常有SRC的活性增加,并且在侵袭、转移的发展中具有显著的作用[17],还有研究表明,结直肠癌中SRC过表达还可以通过多个下游信号通路如PI3K-AKT、MAPK、VEGF等产生化疗耐药性,影响化疗药物的疗效[18]。CyclinD1介导各种癌症中G1至S期发育,在包括结直肠癌在内的许多癌症的发展过程中都观察到了CyclinD1表达增高[19]。并且有研究证明,PTEN介导的自噬可以抑制CyclinD1的表达,从而导致G0-G1期停滞[20]。INPP4B(II型肌醇多磷酸4-磷酸酶)是一种磷酸肌醇磷酸酶,是PI3K / AKT途径的负调控因子之一[21],在前列腺癌、宫颈癌等癌症中起着抑癌作用[21-22],同时有学者研究表明,INPP4B在结直肠癌中过表达,通过增加mTORC1活性来促进结直肠癌细胞的增殖[23]。IGFBP2(胰岛素样生长因子(IGF)结合蛋白2)被认为是一种致癌因子,在多种癌症、多种信号通路中发挥作用导致肿瘤发生发展[24],ZHU等的研究显示,IGFBP2通过抑制E-钙黏着蛋白的表达促进结直肠癌细胞的增殖和迁移[25]。而对于SRC_pY527的研究尚未见报道。

在这项研究中,我们分析了来自TCPA数据库的结直肠癌预后相关蛋白的数据,并进行了筛选。然后,我们使用单变量COX回归分析和多元COX回归分析来确定与OS相关的7个风险差异相关蛋白。我们进一步构建了结直肠癌预后相关蛋白的预后风险模型(OS模型),并分析了该模型与临床指标之间的相关性,证明了它们可以为结直肠癌患者提供准确的预后。这项研究可能为结直肠癌的分子机制和预后预测提供新的见解,为临床医生提供一种选择来更准确地分析每个患者的预后,并有助于定制治疗方案。同时,建立多基因预后模型可以提供比临床病理指标更准确的预后评估指导,减少医疗资源的浪费,指导个体化治疗方案的选择,使患者受益于临床。

猜你喜欢

直肠癌分子蛋白
《分子催化》征稿启事
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
直肠癌术前分期诊断中CT与MRI检查的应用效果对比
锌指蛋白与肝细胞癌的研究进展
MRI在直肠癌诊断中的价值及预后的应用研究
直肠癌在调强放疗中保持膀胱充盈度一致的重要性研究
细砂糖对法式蛋白糖的质量影响研究
水通道蛋白的发现
“精日”分子到底是什么?
米和米中的危险分子