APP下载

基于细胞色素P450通路的前列腺癌差异关键基因的筛选与验证*

2022-03-24黄可馨王慧丰魏银锋华毅明罗海琼陈庆锋

广西医科大学学报 2022年1期
关键词:前列腺癌色素通路

黄可馨,罗 丹,王慧丰,魏银锋,华毅明,谢 博,罗海琼△,陈庆锋

(广西医科大学 1.信息与管理学院;2.生命科学研究院;3.基础医学院,南宁 530021;4.广西大学计算机与电子信息学院,南宁 530004)

前列腺癌是一种恶性肿瘤,常见于欧美等西方国家。近年来,由于生活水平,医疗水平的提高,饮食结构西化以及前列腺癌早期诊断方法的进步,前列腺癌在我国的发病率及死亡率呈现快速增长的趋势[1]。前列腺癌发生发展机制的不明确给前列腺癌的治疗带来很大困难,常规的治疗手段如内分泌治疗、化学治疗等方法主要以改善临床症状,提高患者生活质量为主[2]。目前还没有能从根本上治疗前列腺癌的方法。细胞色素P450(cytochrome P450,CYP450)是一种以铁原卟啉为辅基的B 族细胞色素,因其还原态与一氧化碳(CO)作用后形成的复合物在450 nm 波长处产生特异吸收峰而命名。细胞色素CYP450酶在很多前致癌物和抗癌物质的代谢活化和代谢消除中发挥着重要作用[3]。

近年来,国内外学者运用生物信息学技术对前列腺癌相关数据进行研究,从核酸和蛋白质层面分析蕴含在其中的结构功能信息。迄今为止,作为世界上最大的存储高通量分子数据的公共数据库GEO已收录了205万个样本的数据,涉及16亿个基因表达丰度数据,涵盖500多种生物体,广泛覆盖各种生物学内容[4]。本研究通过GEO 的基因数据集,筛选在药物代谢细胞色素P450 通路和细胞色素P450 对外来异物的代谢通路上共同的差异表达基因,并进一步进行生物信息挖掘,为前列腺癌的发生机制的研究提供依据。

1 材料与方法

1.1 基因表达数据 National Center for Biotechnology Information 又称NCBI,GEO 数据库全称Gene Expression Omnibus,是由美国国立生物技术信息中心NCBI 创建并维护的基因表达数据库。NCBI-GEO(https://www.ncbi.nlm.nih.gov/geo/)是一个免费的微阵列/基因图谱公共数据库。通过GEO数据库搜索prostate cancer(查询日期:2020 年10 月16日),筛选来自临床的样本,然后就可获取到临床的前列腺癌样本数据。本课题组查找获得了GSE46602[5]、GSE32571[6]和GSE70768[7]3 个数据集并进行分析。GSE46602、GSE32571 和GSE70768的微阵列数据基于GPL570 平台、GPL6947 平台和GPL10558 平台,其中包括3 个数据集分别为36 例前列腺癌组织(prostate cancer,PCa)和14 例癌旁组织,138例PCa组织和118例良性组织,126例PCa组织和73例良性组织。

1.2 前列腺癌数据的处理 本研究以前列腺癌组织为实验组,良性组织为对照组,通过GEO2R分析工具对PCa标本与正常前列腺标本之间的差异表达基 因(difference expression genes,DEGs)进行筛选[8]。当P<0.05时具有统计学意义,且该值越小越好。FC(fold change)表示两样本间表达量的比值,一般默认取绝对值大于1 为差异基因的筛选标准,因为样本量较小,所以把范围缩小到-0.5 到0.5 之间[9]。log2FC小于-0.5的基因是下调基因,在肿瘤组织中属于低表达,大于0.5就是上调基因,因此将筛选条件调整为P<0.05 且|log2FC|>0.5。通过筛选得到共同表达在药物代谢—细胞色素P450 通路和细胞色素P450对外来异物的代谢通路的DEGs。

1.3 关键基因的筛选 将筛选所得的DEGs 导入String在线数据库(https://string-db.org/)获得蛋白质网络互作图,运用Cytoscape 3.8.0进行可视化分析,利用Cytoscape 插件MCODE 获取显著相互作用模块,设置参数为MCODE scores>7、Degree cutoff=2、Node score cutoff=0.2、K-score=2、Max.depth=100。

1.4 GEPIA 分析 GEPIA 数据库是基于利用TCGA 数据做可视化分析的工具,通过获取TCGA 中DEGs相关临床数据分析比较关键基因在肿瘤组织与正常组织的差异,P<0.01,Fold Change>1,被认为差异有统计学意义。

1.5 UALCAN分析 Gleason分级是一种被广泛采用的前列腺癌组织学分级的方法,Gleason评分是根据腺体分化程度按5 级评分,分数越高腺体分化程度越低。为验证基因mRNA 表达与PCa 患者临床病理参数的关系,利用UALCAN(http://ualcan.path.uab.edu/)分析前列腺癌组织中6 个DEGs 的mRNA表达(查询日期:2020年10月29日)。采用t检验比较转录表达差异,以P<0.05 为差异有统计学意义。分析6 个基因的mRNA 表达与前列腺癌Gleason 分级是否有相关性,具有明显相关性时可以认为基因mRNA 的表达差异与不同Gleason 分级有关,这6个基因在临床治疗中就有意义。

1.6 人类蛋白质图谱数据库(the human protein atalas,HPA)分析 在验证了前列腺癌中DEGs 的mRNA 表达后,学者试图通过HPA[10](https://www.proteinatlas.org/)探索前列腺癌中6 个DEGs 的蛋白表达(查询日期:2020 年11 月2 日),利用HPA 筛选获得在前列腺癌组织中差异表达的蛋白。

1.7 实时荧光定量PCR(RT-qPCR)实验验证 本实验采用罗氏High Pure Viral RNA Kit 提取前列腺癌旁组织正常细胞RWPE-1,以及前列腺癌细胞DU145、C4-2、LNCaP的总RNA,参照反转录试剂盒得到cDNA,然后以cDNA 为模板进行RT-qPCR 扩增反应。严格按照SYBR Green RT-qPCR试剂盒进行操作,反应体系:SYBR Premix ExTaq Ⅱ(2×)10 μL,cDNA 1 μL,10 μmol/L 上、下游引物各0.8 μL,dH2O 补足体系至20 μL;反应条件为:95 ℃10 min,循环1次;95 ℃15 s,61 ℃60 s,72 ℃10 s,共循环40次。GSTM1、GSTM5、GSTP1以GAPDH为内参,采用2-△△CT法计算GSTM1、GSTM5、GSTP1的相对表达量。根据NCBI 中GSTM1、GSTM5、GSTP1的序列号(Gene ID:2944、Gene ID:2949和Gene ID:2950),利用Primer primer 5.0 软件进行引物设计,均由上海生工生物公司合成,引物序列见表1。

表1 引物序列

1.8 统计学方法 所有数据采用SPSS 21.0 统计软件进行统计处理,计量资料以均数±标准差()表示,多组比较采用完全随机设计的方差分析,以P<0.05为差异有统计学意义。

2 结果

2.1 前列腺癌中差异表达基因的筛选 本研究选择3 个基因表达谱系列(GSE46602、GSE32571 和GSE70768),共有300个PCa组织和205个正常前列腺组织。通过GEO2R 工具,对从GSE46602、GSE32571、GSE70768 中提取了5628、5559 和9515个DEGs分析,获得368个差异表达基因,见图1。

图1 差异表达基因维恩图

2.2 多套公共数据的差异整合分析 本研究选择3 个基因表达谱系列(GSE46602、GSE32571 和GSE70768),筛选在药物代谢—细胞色素P450通路和细胞色素P450 对外来异物的代谢通路上共同差异表达的基因。在药物代谢—细胞色素P450 通路上的差异表达基因有ALDH3B2、FMO5、GSTP1、CYP3A5、GSTM1、GSTM5、GSTM2、AOX1、MGST3,在细胞色素P450 对外来异物的代谢通路上的基因有ALDH3B2、GSTP1、CYP3A5、GSTM1、GSTM5、GSTM2、MGST3。在药物代谢—细胞色素P450 通路和细胞色素P450 对外来异物的代谢通路上共同表达的差异基因包括ALDH3B2、GSTP1、CYP3A5、GSTM1、GSTM5、GSTM2、MGST3。

2.3 PPI 模块的分析 通过Cytoscape 获得显著相互作用模块(图2),包含7个节点、21条边,7个关键基因分别为ALDH3B2、GSTP1、CYP3A5、GSTM1、GSTM5、GSTM2、MGST3。结果显示,在细胞色素P450相关通路上共同表达的7个DEGs之间具有相互作用的关系。

图2 PPI模块的分析结果

2.4 共同差异表达基因的TCGA 数据的验证 为了进一步验证以上获取的P450 相关通路的基因表达,本课题组进一步在TCGA 样本中进行验证。GEPIA法即基因表达谱数据动态分析,是一个新开发的用于癌症和正常基因表达谱分析和交互分析的web服务器[11]。GEPIA是利用TCGA数据做可视化分析中比较著名的一款在线工具,它可以检测同时富集在药物代谢—细胞色素P450 通路和细胞色素P450 对外来异物的代谢通路的7 个基因(ALDH3B2、GSTP1、CYP3A5、GSTM1、GSTM5、GSTM2、MGST3)在前列腺癌组织和正常前列腺组织中的表达水平。结果显示,与正常前列腺组织相比,7个基因中有6 个基因(ALDH3B2、CYP3A5、GSTM1、GSTM2、GSTM5、GSTP1)在正常组织与前列腺癌组织中的表达比较,差异均有统计学意义(均P<0.05),见 图3,而MGST3基因的表达差异无统计学意义(P>0.05)。

图3 共同差异表达基因的TCGA数据的验证结果

2.5 mRNA 表达与临床病理参数的关系 为了验证基因的mRNA 表达在前列腺癌治疗中的临床意义,采用Ualcan[12]对6 个基因(ALDH3B2、CYP3A5、GSTM1、GSTM2、GSTM5、GSTP1)的mRNA 表达与前列腺癌Gleason分级是否有相关性进行评估。结果显示,6个基因的mRNA表达与Gleason分级明显相关,并且随着Gleason 评分的升高,除ALDH3B2外,所有mRNA 表达量有不断降低的趋势。在6 个基因中,低分化的前列腺癌都倾向于有更低的mRNA 的表达,在Gleason 评分为10 的低分化前列腺癌中尤为明显,见图4。

图4 mRNA表达与临床病理参数的关系

2.6 蛋白表达 将6 个DEGs 导入人蛋白网络图谱,选择前列腺癌组织,获得3 个DEGs 在前列腺癌组织中表达的蛋白,包括GSTM1、GSTM5、GSTP1,这些来自前列腺癌临床数据的蛋白在正常前列腺组织和前列腺癌组织中均有表达,见图5。GSTM1、GSTM5、GSTP1 均在正常前列腺组织中高表达,而在前列腺癌组织中则可以观察到它们的中等表达和不表达。由此结果显示,在前列腺癌患者中GSTM1、GSTM5、GSTP1的蛋白质表达为低表达。

图5 GSTM1、GSTM5、GSTP1蛋白表达情况

2.7 RT-qPCR 检测结果 基于运用RT-qPCR 验证3 个关键差异基因(GSTM1、GSTM5、GSTP1)的mRNA表达情况。与前列腺癌旁正常细胞RWPE-1相比,GSTM1和GSTP1在不同的前列腺癌细胞(DU145、C4-2、LNCaP)中mRNA 表达下降。前列腺癌细胞和癌旁正常细胞表达水平比较,差异均有统计学意义(均P<0.05),GSTM5 在DU145 细胞株中的mRNA 表达差异具有统计学意义,而在C4-2、LNCaP 中的mRNA 表达虽然下降但差异并无统计学意义(P>0.05),见图6。

图6 RT-qPCR检测结果

3 讨论

通过NCBI 数据库收集到前列腺癌的GSE46602、GSE32571、GSE707683 个数据集,共获得300 份前列腺癌组织数据和205 份正常组织数据。运用GEO2R工具对3个数据集进行分析,得到P<0.05的差异表达基因。运用GEPIA对富集在药物代谢—细胞色素P450和细胞色素P450对外来异物的代谢通路的7 个基因进行箱式图分析,其中有6 个基因在前列腺癌中的差异表达具有统计学意义。研究表明,细胞色素P450同工酶被认为是前列腺癌治疗和预防的潜在指标[13]。对富集在药物代谢—细胞色素P450通路和细胞色素P450对外来异物的代谢通路的基因进行研究,有可能获得前列腺癌治疗相关的潜在靶点。根据这6 个基因的Gleason分级研究与临床病理参数之间的关系,再通过HPA数据库分析6 个差异表达基因,最后得到有3 个差异表达基因在前列腺癌中表达。采用RT-qPCR 技术验证前列腺癌细胞株中3 个差异表达基因(GSTM1、GSTP1、GSTM5基因)mRNA的表达水平,结果表明,与RWPE-1 相比,GSTM1和GSTP1差异表达基因在不同的前列腺癌细胞(DU145、C4-2、LNCaP)中基因表达下降(P<0.05),GSTM5差异表达基因虽然在不同的前列腺癌细胞中基因表达下降但差异并无统计学意义(P>0.05)。

GSTM1编码谷胱甘肽S-转移酶M 1蛋白,它是前列腺癌的风险因素之一。与正常组织相比,在前列腺癌组织中低表达。通过KEGG 分析得到GSTM1在多个通路富集,主要包括药物代谢—细胞色素P450,药物代谢—其他酶,细胞色素P450对外来物质的代谢作用等通路。GSTM1 富集的药物代谢相关的细胞色素P450通路与前列腺癌有关,并且细胞色素P450 家族的CYP3A4 和CYP3A5 在前列腺癌细胞中的表达降低[14]。由此可猜测GSTM1 有可能在细胞色素P450 代谢通路参与表达并进而影响前列腺癌的发生发展。

GSTP1、GSTM5都可以编码谷胱甘肽S-转移酶pi 1,谷胱甘肽S-转移酶(GST)是一类酶,通过催化许多疏水性和亲电子化合物与还原型谷胱甘肽的结合,在排毒中起重要作用,在细胞凋亡,增殖,分化中也起着重要作用。研究显示,GSTP1的低表达与前列腺癌生物标志物c-myc 的高表达有关,GSTP1的过表达通过靶向c-myc对前列腺癌有保护作用[15]。GSTM5参与前列腺癌的生物学过程,在前列腺癌的进展中起关键作用。相比于正常组织,在前列腺癌中GSTP1低表达,属于下调基因。GEPIA分析显示GSTP1,GSTM5 在前列腺癌中的差异表达具有统计学意义(P<0.05)。经过RT-qPCR 技术验证,得出GSTM5 虽然在不同的前列腺癌细胞中基因表达下降但差异无统计学意义(P>0.05)。关于与前列腺癌发生发展机制有关的研究较少,有潜在的研究价值。

基于生物信息学分析的研究发现,GSTM1、GSTP1、GSTM5基因在前列腺癌的发生发展过程中起着重要作用,其在前列腺癌中的低表达预示着它们有望成为前列腺癌的治疗靶点。虽然本研究最终得到部分差异表达基因,通过研究差异基因的表达可以初步了解前列腺癌的发生,但是对于研究前列腺癌复杂的发生发展过程还需要继续进行其他体外实验验证,之后才能为前列腺癌的诊断、治疗、预后提供确实有效的研究依据。

猜你喜欢

前列腺癌色素通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
食用色素安全吗
尿液检测可能会发现侵袭性前列腺癌
炫彩熔岩灯
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
从五种天然色素提取废渣中分离果胶的初步研究
又高又壮的男人易患前列腺癌
50岁以上男性应做前列腺癌筛查