APP下载

利用生物信息学方法鉴定与NMIBC相关的Hub基因

2021-06-28李洪明

牡丹江医学院学报 2021年3期
关键词:泛素膀胱癌枢纽

李洪明,吴 凯,欧 铜,吴 松,

(1.牡丹江医学院,黑龙江 牡丹江 157011;2.深圳大学泌尿外科研究所 深圳大学第三附属医院泌尿外科,广东 深圳 518000)

膀胱癌是临床上常见的肿瘤,年龄越高其发病率也越高[1],男性在发病率和死亡率方面是女性的数倍[2-3]。该疾病的主要治疗手段是手术治疗[4],放射治疗、化学治疗和免疫治疗等在膀胱癌治疗中也起到重要作用。相对传统的治疗,生物疗法较新颖[5]。靶向疗法是众多生物疗法之一,靶向疗法重中之重是找到枢纽基因,枢纽基因可能与肿瘤的发生、复发和转移有关,可进一步影响患者的预后。WGCNA是一种生物学研究方法[6],能在基因模块与临床性状间构建关联,确定候选生物标记、治疗靶标和调控基因等[7-8]。本研究通过WGCNA构建网络,将网络划分为模块,筛选与NMIBC相关的枢纽基因并进行一系列生物信息学分析,期望对临床有所帮助。

1 资料与方法

1.1 数据获取及处理基因芯片GSE13507数据及其临床信息从GEO数据库下载(https://www.ncbi.nlm.nih.gov/geo/),该数据集基于GPL6102(Illumina human-6v 2.0 expression beadchip)平台。包含165例原发性膀胱癌样本,其中NMIBC样本103例(67例无复发历史,36例有复发历史),肌层浸润性膀胱癌样本62例;复发性NMIBC样本23例;癌旁正常膀胱粘膜样本58例和正常膀胱粘膜样本10例。在本研究中,主要研究NMIBC相关的生物标志物,因此删除数量较少的10例正常样本,删除23例复发样本,删除62例肌层浸润性膀胱癌样本和36例治疗后有复发史的样本。将剩余的58例癌旁正常组织样本与67例NMIBC样本分为正常组和肿瘤组。筛选表达量最高的前5000个基因进行WGCNA分析。

1.2 共表达网络的构建利用R语言“WGCNA”包构建共表达网络[9]。利用“cutreeStatic”函数处理离群值,经处理后的矩阵数据用于后续分析。先获取基因间的相关系数,在明确基因一致性表达后生成邻接矩阵,后通过邻接矩阵变换成拓扑重叠矩阵(topologiacal overlap dissimilarity measure,TOM),在满足无尺度网络的前提下选择适当的软阈值β构建基因网络,按照最小模块基因数为30,将相似的基因分类到同一的基因模块中。

1.3 枢纽模块筛选引入临床数据,计算基因显著性(gene significance,GS)和模块显著性(module significance,MS),根据MS值筛选枢纽模块,本研究中选取最显著的模块进行分析。

1.4 GO和KEGG功能富集分析使用DAVID6.8版本(http://david.abcc.ncifcrc.gov)在线分析工具对枢纽模块基因进行GO生物过程富集分析和KEGG通路富集分析。

1.5 枢纽基因筛选计算枢纽模块中模块基因隶属度(module membership, MM),在枢纽模块中符合|GS|>0.2且|MM|>0.8的基因筛选为备选枢纽基因。利用STRING数据库(http://string-db.org/)构建枢纽模块基因的蛋白互作网络[10],本研究以点度中心性(degree)≥30为条件筛选另一组备选枢纽基因,对两备选枢纽基因集合取交集,最后确定枢纽基因。

1.6 枢纽基因验证基于GEPIA[11](http://gepia.cancer-pku.cn/index.html)在线分析工具对枢纽基因进生存分析和结果验证。

1.7 统计学方法使用R语言软件(3.6.1)调用Bioconductor处理数据,利用WGCNA方法构建并划分网络,GEPIA在线分析工具应用对数秩检验计算患者的总体生存率,P<0.05为差异具有统计意义。

2 结果

2.1 数据筛选GSE13507数据共包含256例样本,经筛选最终剩余58例癌旁正常组织样本与67例NMIBC样本用于后续分析。分析流程图见图1。

图1 分析流程图

2.2 WCGNA分析和模块计算共纳入125样本用于构建共表达网络,其中GSM340606样本集群高度超过80被标识为离群值(图2A),删除离群值后的124个样本构建特征热图(图2B)。为确保无尺度独立性(接近0.9)和低均值连通性(接近0),选取6为软阈值构建网络(图2C)。以最小模块基因数为30的标准构建分层聚类树(图3A),相似基因被归类到同一模块。共得到14个模块(图3B),通过比较模块和临床性状相关性系数的大小,发现black模块与肿瘤的关系最密切(cor=0.72,P=2.6e-82),用于进一步分析(图3C)。

图2 样本树状图和软阈值估计

图3 基因聚类和模块鉴定

2.3 Hub基因的鉴定在black模块中,以|GS|>0.2且|MM|>0.8为筛选条件得到67个备选枢纽基因。利用STRING数据库对black模块基因创建蛋白质与蛋白质间相互作用网络,以degree大于等于30为条件获得8个备选枢纽基因。利用R语言“VennDiagram包”对两组备选枢纽基因取交集,最终确定PA2G4和PRPF19为枢纽基因(表1、图4)。

图4 枢纽基因韦恩图

表1 模块枢纽基因

2.4 功能富集分析对枢纽模块(black)所包含的508个基因进行GO生物过程富集分析及KEGG信号通路富集分析。以P<0.05为筛选条件,显著富集的GO生物过程有27个条目,表2展示了排名靠前的10个功能;显著富集的KEGG通路分析有20个,表3展示其中排名靠前的10个结果。

表2 black模块基因的GO富集分析结果

表3 back模块KEGG富集分析结果

2.5 枢纽基因验证通过GEPIA对得到枢纽基因进于生存分析验证,PA2G4和PRPF192高表者均显示具有较短的总生存期(P<0.05)(图5A、5B);在肿瘤组织和正常组织对比中两个基因均有表达差异的现象,在肿瘤组中呈高表达(图5C、5D)。

图5 生存分析及表达量

3 讨论

NMIBC手术治疗有较高的局部复发率,约有1/10~1/5的患者治疗后进展为肌层浸润性膀胱癌[12]。随着治疗技术进步,精准治疗逐渐成为研究热点,精准治疗的前提是确定疾病相关的枢纽基因。本研究通过WGCNA将模块与临床特征相关联,筛选出与NMIBC相关显著的模块,进一步分析模块基因鉴定与NMIBC相关的枢纽基因。

鉴定枢纽基因的方法先前已有部分研究,Deng等[13]运用同样的方法,鉴定8个膀胱癌的枢纽基因;Zhang[14]等鉴定6个与膀胱鳞癌相关的枢纽基因。Yuan等[15]研究发现COL3A1过表达影响膀胱癌预后。

本研究最终获得了2个与NMIBC相关的枢纽基因分别是PA2G4和PRPF19。PA2G4位于12号染色体,参与编码ErbB3结合蛋白1(Ebp1) 的亚型(p42和p48)[16],两亚型与多种蛋白质或RNA相互作用,调解相应蛋白质的转录和调控,在人类多种癌组织中有重要作用[17-18],如在结直肠肿瘤中能够促进肿瘤其生长[19]。PA2G4作为一种辅助因子,其在神经母细胞瘤中发挥了关键作用,通过竞争性抑制作用可以作为一种潜在的神经母细胞瘤治疗靶点[20],ErbB3可以调节细胞的生长和分化,如参与p53的肿瘤抑制活性[21]。PA2G4P4可促进PA2G4的表达与核易位,对胶质母细胞瘤细胞的活力和凋亡产生影响[22]。PA2G4P4在膀胱癌的发生发展中发挥着功能作用,通过敲除基因的方法验证了PA2G4P4缺失影响膀胱癌细胞的增殖、迁移和死亡,鉴定其为膀胱肿瘤的标记基因[22]。

PRPF19是一种蛋白质编码基因,与泛素-蛋白转移酶活性有关,PRPF19泛素连接酶影响底物泛素化水平,在胰腺癌中影响肿瘤的发生和发展[23]。郑雨薇[24]等在伯基特淋巴瘤的差异表达基因中也发现了PRPF19基因。有研究报道[25],PRPF19编码的蛋白与甲型流感病毒感染细胞中的NS1蛋白有相互作用,能够影响病毒在宿主细胞中的复制,在PRPF19减表达的情况下,相应的病毒复制受到限制,在膀胱肿瘤中其高表达是否会影响肿瘤的进展有待进一步研究。在胶质瘤相关研究中[26],DNA损伤反应基因PRPF19的甲基化使得患者有生存降低。在DNA损伤反应中PRPF19能够发挥传感器的作用,激活泛素连接酶驱动ATR进一步影响损伤修复[27],许妍妍等[28]发现,茶多酚影响PRPF19表达,对微卫星不稳定性结直肠癌有抑制作用,也有相关研究表明PRPF19在卵巢癌的侵袭性中发挥作用[29]。在胃癌中PRPF19也发现表达上调[30]。以上的研究均发现在肿瘤组织中存在PRPF19基因高表达的现象,并且该基因在DNA修复及泛素相关调控中有重要作用,本研究中,通过GEPIA分析发现其不仅在膀胱肿瘤组织中高表达,而且高表达患者的整体生存时间变短,但在膀胱癌中该基因具体发挥何种作用尚不清楚。

枢纽模块基因KEGG分析主要富集在HTLV-I感染、神经营养因子信号通路和醛固酮的合成和分泌等方面。模块基因GO分析显示,生物过程主要富集在RNA聚合酶II启动子的转录、蛋白酶体介导的泛素依赖的蛋白质分解过程、mRNA剪接体等方面。有研究证实,mRNA剪接体模式的改变影响对膀胱肿瘤细胞的抑制作用[31],泛素结合酶是影响肿瘤微环境的重要因子,参与DNA修复和调控周期分布[32],江伟凡等[33]实验证明泛素在膀胱癌组织中高表达,并通过与其他相关蛋白相互作用促进膀胱癌的增值。PRPF19基因也影响泛素-蛋白转移酶活性,进一步说明本研究结果的可靠性。

综上所述,通过WGCNA的生物学研究方法鉴定了PA2G4和PRPF19两个枢纽基因,经验证二者表达与NMIBC患者的预后相关,有望成为该疾病的生物标志物。

猜你喜欢

泛素膀胱癌枢纽
三氯乙烯致L-02细胞毒性中SET蛋白介导的组蛋白泛素化及类泛素化修饰鉴定
TFPI-2在膀胱癌组织中的表达及临床意义
泛素链的体外制备、磷酸化修饰与标记方法
尿频尿急可能是膀胱癌
VI-RADS评分对膀胱癌精准治疗的价值
外泌体长链非编码RNA在膀胱癌中的研究进展
泛素化在心肌梗死后的心肌保护与促再生作用的研究进展
微小核糖核酸-1205沉默Cullin-RING泛素E3连接酶4A激活AMPK信号传导保护人成骨细胞免受地塞米松损伤的研究
枢纽的力量
期待已久,连接传统与潮流的枢纽 Sonos AMP无线立体声功放