APP下载

综合生物信息学探究RNA结合蛋白对肾乳头癌预后的影响

2021-07-30檀飞飞刘同族

现代泌尿外科杂志 2021年7期
关键词:差异基因生存率曲线

陈 赵,檀飞飞,刘同族

(1.武汉大学中南医院泌尿外科,湖北武汉 430071;2.武汉大学人民医院消化内科,湖北武汉 430071)

肾细胞癌(renal cell cancer,RCC)是泌尿系统高发的疾病之一,主要有5大分型,肾乳头癌(kidney renal papillary cell carcinoma,KIRP)是其发病率第2的分型。RNA结合蛋白(RNA binding proteins,RBPs)是一种在细胞中稳定表达的结合蛋白,它与多种编码或非编码RNA结合,对细胞的生长起调节作用。RBPs在人多种癌症中被证明与预后相关,而在KIRP中的研究缺乏,故笔者就RBPs对肾乳头癌的预后影响进行了探究,报道如下:

1 资料与方法

1.1 数据的下载与处理从TCGA数据库下载人肾乳头癌基因表达样本321个,包括32个正常样本和289个肿瘤样本,并提供相应的临床信息。从GER等[1]的一次人类普查中收集了RBPs,总共获得了1 542个RBPs基因(表1)。原始数据采用limma软件包进行预处理。使用函数wilcox.test进行差异表达筛选,差异表达的RBPs以错误发现率(false detection rate,FDR)<0.05和|logFC|≥0.5纳入,FC为差异倍数(fold change,FC)。其中133个下调基因,259个上调基因(图1)。

A:热图;B:下调基因的火山图。

1.2 GO、KEGG富集分析使用R包“clusterProfiler”对差异基因进行了GO、KEGG富集分析,P<0.05被设为阈值标准,并使用R包“GOplot”对这些富集的结果进行了可视化处理。

1.3 蛋白网络互作和可视化处理使用String(检索相互作用基因/蛋白质的搜索工具)检测了所有差异表达的RBPs之间的蛋白质-蛋白质相互作用(https://string-db.org/),并使用Cytoscape 3.6.1软件进行可视化处理,P<0.05为差异有统计学意义。

1.4 RBPs预后基因的筛选和预后模型的构建通过基于生存时间和生存状态对差异基因进行了单因素Cox分析,通过kmPfilter<0.01筛选出预后相关的RBPs基因。对预后相关的RBPs基因进行多因素Cox分析筛选出独立预后的RBPs基因,并建立了预后模型,随后对模型进行生存分析,绘制风险曲线、受试者工作曲线(receiver operating characteristic curve,ROC)曲线。

1.5 预后基因的免疫组化验证为了进一步确定这些独立预后基因在KIRP中的表达,使用了人类蛋白质图谱数据库中的免疫组化结果进行检验。

2 结 果

2.1 GO富集分析GO富集分析发现在生物学过程中,上调的差异基因(图2A、C)主要富集在ncRNA代谢过程、核糖核蛋白复合物的生物发生、ncRNA处理、RNA剪接。下调的差异基因(图2B、D)主要富集在翻译的调节、RNA剪接、细胞酰胺代谢过程的调节。在细胞成分中,上调的差异基因主要富集在核糖体亚基、核糖体、大核糖体亚基;下调的差异基因主要富集在细胞质核糖核蛋白颗粒。在分子功能中,上调的差异基因主要富集在催化活性,作用于RNA、核糖体的结构成分;下调的基因主要富集在催化活性,作用于RNA、翻译调节器活动。

A、B:上调的差异基因GO富集分析结果;C、D:下调的差异基因GO富集分析结果。

2.2 KEGG富集分析KEGG富集分析得出上调的差异基因(图3A、C)主要富集在核糖体、剪接体、RNA转运中,下调的差异基因(图3B、D)主要富集在RNA转运、mRNA监测途径中。

A、C:上调差异基因的KEGG富集分析结果;B、D:下调差异基因的KEGG富集分析结果。

2.3 PPI互作网络为进一步探索这些差异基因的潜在分子功能及分子间相互作用,将差异基因导入string数据库并用cytoscope可视化构建蛋白互作网络,为方便展示,我们筛选了连接度大于20的进行展示,可以发现部分基因蛋白的相互作用预测关系(图4)。

A:所有差异基因蛋白的相互作用;B:3个子网络之间的相互作用。

2.4 四个独立预后RBPs基因的Cox分析单因素Cox、多因素Cox分析筛选出PIWIL1、DALRD3、DNMT3B、TERT 4个独立预后RBPs基因。其中DALRD3是低风险的预后基因,PIWIL1、DNMT3B、TERT是高风险的预后基因(图5)。预后模型的生存分析得出高风险的患者其5年生存率远远低于低风险的患者,用于内部验证的train组ROC曲线面积为0.944,外部验证的test组ROC曲线面积为0.955,说明了该预后模型具有很高的预测价值(图6)。风险曲线分析结果表明,根据模型评分,得分越高其生存率越低,反之亦然(图7)。

A:28个RBPs基因的单因素Cox分析;B:6个RBPs基因的多因素Cox分析。

2.5 免疫组化和生存分析最后使用免疫组化展示了4个预后RBPs基因在肿瘤和正常组织中的蛋白表达水平。可以看出3个高风险的基因(PIWIL1、DNMT3B、TERT)在肿瘤组织中的表达要明显高于正常组织,低风险基因(DALRD3)在正常组织中的表达要高于肿瘤组织。同时我们还对4个预后基因进行了生存分析,结果表明在高风险的基因中表达水平越高生存率越低,而低风险的基因则显示出了相反的结果(图8)。

根据train组风险评分的中位值划分高低风险组;A:train组高低风险组生存分析;B:train组ROC曲线;C:test组高低风险组生存分析;D:test组ROC曲线。

A:train组预后基因的热图;B:train组风险曲线;C:test组预后基因热图;D:test组风险曲线。

A:PIWIL1基因;B:DALRD3基因;C:DNMT3B基因;D:TERT基因。

3 讨 论

RCC是泌尿系统恶性肿瘤,约占所有癌症的3%[2]。KIRP的发病率仅次于肾透明细胞癌。KIRP起源于肾近端的小管细胞[3],其分为两个亚型,1型预后相对较好,2型预后较差[4]。目前关于RCC的治疗还是以手术为主,但是临床上大约有30%的RCC患者会发生转移[5]。对于转移的RCC来说手术治疗效果不佳,近年来关于预后标志物在设计诊断和预后测试方面研究越来越重视,预后标志物的发现对于RCC的治疗来说具有重要的意义。

RBPs是一种可以和多种RNA结合的蛋白,可在细胞中稳定表达,主要的作用是对RNA的加工,如对mRNA的剪接和对翻译的调节等[6]。在过去的几十年,已经研究发现RBPs与很多肿瘤的发生发展之间有着密切的关系[7-8]。因此本研究对KIRP和RBPs之间的关系进行了深入分析。

本文通过分析得出PIWIL1、DALRD3、DNMT3B、TERT这4个独立预后的RBPs基因。其中PIWIL1是PIWI亚家族的成员,该蛋白在进化上是相对保守的蛋白,一项Meta分析的研究表明PIWIL1和多种癌症的表达有相关性,其表达量越高患者的死亡率越高,且该研究还表明PIWIL1表达量越高的患者,其术后复发率越高[10]。SHI等[11]研究发现敲除PIWIL1基因可以大幅减少胃癌的转移。我们推测其有可能成为KIRP预后标志物。DALRD3基因目的作用及功能国内外还没有定论,本研究发现它是一个低风险基因,即其表达量越高患者的生存率越高,对于肿瘤患者来说是一个保护因素。DNMT3B是一个维持甲基转移的酶,参与DNA甲基化以调节正常的生物学功能,其功能的异常通常与肿瘤的发生相关[12]。ZHU等[13]研究发现DALRD3通过调控RAD9表达来促进前列腺癌的发生发展。还有研究表明DNMT3B的表达与黏液表皮样癌的增殖有关[14]。结合我们的研究分析,DNMT3B有望成为KIRP的预后标志物。TERT是一种端粒酶的逆转录的酶,生物学功能就是维持染色体的稳定,表达的失调可能与肿瘤的发生相关[15]。JUN等[16]研究发现TERT的表达促进了结直肠癌的发生。还有研究发现对于黑色素瘤来说,TERT突变的男性患者免疫治疗的效果可能会更好[17]。这也给我们提供了新的思路,免疫和RBPs联合分析可能会更加精确KIRP的治疗靶点。

我们首创的KIRP-RPBs预后预测模型结果表明,风险评分越高的患者,其5年的生存率越低。对于本模型做了独立预后分析,发现其可以作为独立的预测因子。也就是说患者可以通过我们的模型计算出其风险评分,能够初步计算出其5年生存率。尽管在每个步骤中都进行了严格的设计和过滤标准,但本研究仍存在一些局限性。首先,本研究仅纳入了TCGA数据库且样本量较少。应该多中心,大量的纳入样本以确保研究的客观性。其次,我们的实验仅仅是数据分析层面,应加以实验的验证。

总之,我们通过一系列生物信息学分析得出了4个KIRP预后相关的RBPs,这4个基因有望成为KIRP潜在的生物预后标志物,并且我们还建立了KIRP患者的预后预测模型,希望本研究可以为临床靶向治疗KIRP提供一定的理论依据。

猜你喜欢

差异基因生存率曲线
未来访谈:出版的第二增长曲线在哪里?
肿瘤复发,为何5 年是一个坎
幸福曲线
“五年生存率”不等于只能活五年
日本首次公布本国居民癌症三年生存率
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
日本癌症患者十年生存率达59%左右
梦寐以求的S曲线