APP下载

基于GEO数据集筛选良性前列腺增生的关键基因及信号通路

2022-01-05危鹏宇林东旭罗长城张梦阳陈亮张加桥袁慧星陈忠

现代泌尿生殖肿瘤杂志 2021年4期
关键词:关键前列腺病理

危鹏宇 林东旭 罗长城 张梦阳 陈亮 张加桥 袁慧星 陈忠

良性前列腺增生(benign prostatic hyperplasia, BPH)是一种常见的老年男性疾病,表现为前列腺组织学增生和体积增大,以及继发的下尿路症状(lower urinary tract symptoms, LUST)。其患病率高,且随年龄增长,约有50%的男性在60岁时出现BPH引起的症状,到80岁时可增加到80%左右[1]。LUST包括尿频、尿急、夜尿、尿失禁和尿潴留等,给患者的生活质量造成极大影响,同时也给社会带来极大的经济负担[2]。

BPH的病理、生理机制仍不完全清楚,目前的观点认为性激素比例失调、慢性炎症状态、前列腺干细胞分化、前列腺胚胎再唤醒等可能与BPH的发生、发展密切相关[3];高血压、糖尿病等慢性疾病常被认为是BPH的风险因素[4],但具体涉及到该疾病发生、发展的基因与信号通路仍有许多未知。

随着测序技术的发展,生物信息学技术被越来越多的研究人员用于探究各类疾病在基因等层面的发生、发展机制。然而,针对BPH发病机制的生物信息学研究仍比较缺乏。目前以BPH和Bioinformatics为关键词在美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)中检索,仅能检索到一篇关于BPH的生物信息学文章,且该研究选取的样本只包含2例BPH及2例正常对照样本,该研究样本量过少,代表性较差[5]。本研究收集了基因表达汇编(Gene Expression Omnibus, GEO)数据库中比较BPH与正常前列腺样本的基因表达谱数据集GSE7307(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE7307)与GSE119195[6];其中,GSE7307包含7个BPH样本和6个正常对照样本,GSE119195包含5个BPH样本和3个正常对照样本,且GSE119195是目前GEO数据库中唯一一个只研究BPH与正常对照的数据集,具有较好的代表性。我们试图通过生物信息学技术发现与BPH发生、发展相关的关键基因及通路,以期更好地了解BPH的病因,并为改善BPH诊断和治疗提供新的思路和靶点。

对象与方法

一、资料来源

本研究中使用的数据集均来自NCBI公共数据平台的 GEO 数据库(http://www.ncbi.nlm.nih.gov/geo)。以Benign Prostatic Hyperplasia、BPH、Normal为关键词,物种限定在智人,数据类型为基因芯片表达数据,共检索到16个数据集。在排除了研究前列腺癌与BPH、药物作用前后、BPH不同细胞间后,最终纳入数据集GSE7307与GSE119195[6]进行分析。

二、数据预处理和差异基因(differential expression genes, DEGs)分析

在GEO数据库下载GSE7307、GSE119195数据集。利用RStudio 1.2.5033(https://rstudio.com/)处理数据。将表达值进行log2变换后,根据相应芯片平台进行基因备注,其中无备注的探针删除,多个探针对应一个基因时,只保留平均值最大的探针。然后利用Limma 3.46.0(http://bioinf.wehi.edu.au/limma)分别进行标准化,利用Hclust、PCA分析观察样本是否符合分组,最后用Limma 3.46.0以|log2FC|>1和P<0.05为筛选条件分别进行DEGs筛选[7],随后用在线韦恩图工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)取两个数据集DEGs交集进行之后的分析。

三、基因本体论(gene ontology, GO)富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析

利用Cytoscape 3.8.2[8]中的 ClueGO 2.5.7[9]插件对DEGs进行GO富集分析及数据可视化,以P≤0.05,卡帕系数>0.4为筛选条件;利用RStudio 1.2.5033中ClusterProfiler 3.18.0(http://dx.doi.org/10.1089/omi.2011.0118)对DEGs进行 KEGG通路富集分析及数据可视化,以P≤0.05,q≤0.05为筛选条件。

四、蛋白互作网络(protein protein interaction, PPI)构建及关键基因分析

本研究通过STRING数据库(http://www.string-db.org/)构建DEGs的PPI,以互作评分>0.4分,去掉无连接的节点构建[10]。将数据导入Cytoscape 3.8.2软件进行可视化和关键基因筛选。cytoHubba 0.1插件中包括最大集团中心度(maximal cliquecentrality, MCC)、最大邻域组件分量(density of maximum neighborhood component, DMNC)、度(degree)、边缘渗透分量(edge percolated component, EPC)等10种关键基因的算法,为了提高预测的可靠性,比较不同算法得到的关键基因,以重复出现最多的为最终结果。

五、关键基因相关转录因子及miRNA预测

利用NetworkAnalyst 3.0[11]预测可能与关键基因相互作用的转录因子及miRNA。其中预测转录因子使用的是ENCODE数据库(https://www.encodeproject.org/)的数据,筛选条件为峰值强度系数<500,预测调节电位评分<1分;miRNA使用的是miRTarBase数据库(http://mirtarbase.cuhk.edu.cn/php/)的数据。

结 果

一、BPH与正常对照样本DEGs筛选

从GEO数据库下载的两个数据集,其中数据集GSE119195共包含5个BPH样本和3个正常对照样本,GSE7307包含7个BPH样本和6个正常对照样本。为了使DEGs有更好的普遍性,分别进行DEGs分析后利用韦恩图取交集。GSE119195 DEGs筛选后结果显示有63个上调基因,122个下调基因;GSE7307 DEGs筛选后结果显示有567个上调基因,590个下调基因。对两个数据集结果绘制韦恩图(图1),显示有36个共同的上调DEGs,45个下调DEGs,具体结果见表1。

表1 两个数据集共同的DEGs

图1 两个数据集的DEGs韦恩图

二、对DEGs进行功能富集分析

对81个DEGs进行了GO分析和KEGG通路分析。GO富集显示DEGs主要集中在干细胞负性增殖调控、乙醇初步代谢、维生素效应等15个生物过程(表2,图2)。而KEGG的结果(图3)显示主要集中在Hippo信号通路、肾素分泌、PPAR信号通路等10条通路。

表2 DEGs GO分析结果

注:圆形代表富集到的条目;连线代表两个GO富集条目之间存在相同的DEGs;图形越大表明富集到的基因数目越多

注:形状大小反映富集在该通路的基因数目,颜色反映P值大小

三、DEGs构建PPI

DEGs在STRING 数据库构建PPI后再在Cytoscape中可视化,共显示有52个节点,67条连线(图4),随后利用cytoHubba的不同计算方法各取前5的关键基因(表3),以不同方法中出现次数最多的5个关键基因作为最终的关键基因,即CCL2、LPL、VCAN、IGF1、WNT2。

表3 不同计算方法得到前5的关键基因

注:圆形代表基因;紫色为下调基因;红色为上调基因;连线代表两基因间存在相互作用

四、利用数据库对关键基因相关转录因子及miRNA预测

将关键基因输入NetworkAnalyst在线分析工具进行关键基因相关转录因子(图5)及miRNA预测(图6),其中ZNF2、ZNF501能同时参与调控VCAN、LPL两个关键基因;hsa-mir-129-5p同时参与调节VCAN、IGF1,hsa-mir-29a-3p同时参与调节IGF1、LPL,hsa-mir-155-5p同时参与调节LPL、CCL2,hsa-mir-1-3p、hsa-mir-24-3p、hsa-mir-26b-5p、hsa-mir-98-5p同时参与调节CCL2、IGF1。

注:深蓝色菱形代表下调基因;红色菱形代表上调基因;浅蓝色菱形代表预测得到的可能与关键基因相互作用的转录因子

注:深蓝色菱形代表下调基因;红色菱形代表上调基因;浅蓝色菱形代表预测得到的可能与关键基因相互作用的miRNA

讨 论

BPH的病理表现在不同患者间有很大的差异,有的以间质增生为主、有的以腺上皮增生为主、有的两者均有,病理表现不同的患者对一线药物的反应性差异很大,而产生病理异质性的原因在于BPH是一个多因素疾病[12]。因此,当前对于BPH,根据不同病因和病理表现实施个性化的治疗是十分重要的。近几十年来为了找出BPH不同病理表现背后的关键致病机制,进行了大量的基础及临床研究,但其具体的发生、发展机制目前仍不完全明确。

本研究尽可能收集了目前已公开的相关基因表达谱数据集,试图通过基因表达的差异来分析那些尚未明了的BPH发病机制,为后续的BPH个性化治疗研究提供思路。本研究共发现36个上调DEGs,45个下调DEGs。GO分析发现DEGs主要富集于干细胞负性增殖调控、乙醇初步代谢、维生素效应等生物学过程,KEGG主要富集于Hippo信号通路、肾素分泌、PPAR信号通路等信号通路;最终得到CCL2、LPL、VCAN、IGF1、WNT2这5个关键基因。我们通过查阅文献试图明确这5个关键基因与BPH病理生理机制的相关性,为BPH的病因研究提供一定的基础(图7)。

图7 文章思路图

5个关键基因中IGF1与BPH的发生、发展的关系已有较多文献支持[14-18]。IGF1作为一种重要的生长因子,通过激活PI3K-AKT/PKB和Ras-MAPK通路,广泛参与细胞的增殖、迁移,生长和凋亡[13],同时其结构与胰岛素相似,能表现出部分胰岛素的功能,如促进葡萄糖吸收、糖原合成等。有研究证实血浆IGF1水平高的男性患BPH的风险显著升高,反之IGFBP-3(胰岛素样生长因子结合蛋白,能与IGF1结合,抑制其与靶细胞结合发挥作用)水平高的男性患BPH的风险显著降低[14]。研究证实BPH患者前列腺组织中IGF1和IGF2基因表达明显上调,且与前列腺体积相关[15]。另一研究证实IGF1/Akt/β-catenin信号轴对睾酮诱导的大鼠BPH有促进作用[16];IL-1可通过IGF1通路介导前列腺的炎性增生[17];5α还原酶抑制剂通过抑制睾酮转化为双氢睾酮是治疗BPH常用的药物,长期使用5α还原酶抑制剂后BPH患者的前列腺成纤维细胞IGF1水平下降,从而上调前列腺成纤维细胞自噬水平[18]。

VCAN与BPH的相关性有文献报道,但仍需进一步验证。它负责编码多种细胞外基质,它们在调节细胞增殖、迁移和细胞外基质组成外,还参与细胞黏附、分化和存活[19]。有研究发现在BPH患者的前列腺中VCAN表达明显增加[20]。TGF-β通过调节基质细胞的增殖、生长、分化和凋亡等多个过程参与BPH的发生、发展[21],它作用于前列腺间质细胞后会促使VCAN在间质的积累[22]。此外有研究报道VCAN能激活Toll样受体,从而促进肿瘤炎性微环境产生[23],而同样有文献报道炎症微环境与BPH发生、发展的相关性[24-25],因此我们猜测VCAN可作为TGF-β下游分子,通过参与炎症微环境的形成,促进BPH进展。

虽然目前尚无直接关于BPH与生长因子家族成员之一WNT2的研究,但是β-catenin作为WNT2下游的转录因子,已有文献报道其能促进前列腺细胞良性增生[26]。WNT2参与的主要通路包括典型的WNT2/β-catenin通路与非典型的WNT2/Ca2+、PCP、WNT2/JNK和 WNT/Rho 等通路。这些通路的靶基因包括c-Myc、Cyclin D1、Cox-2、Cox-9、AR等,从而调节细胞周期、增殖、凋亡等多个生理过程[27]。因此我们推测WNT2通路参与BPH的发生、发展。

LPL和趋化因子CCL2与BPH的关系暂无文献报道,但这两个基因都参与代谢综合征(metabolic syndrome, MetS)的发生、发展。MetS指包括中枢性肥胖、血脂异常、高血压、胰岛素抵抗和葡萄糖耐受不良等代谢异常的综合征,该病在老年人群中十分常见[28]。越来越多的文献报道MetS与BPH的发生密切相关[4,29]。

LPL负责编码脂蛋白脂肪酶,与肝胰脂肪酶属于同一基因家族[30]。其主要负责水解脂蛋白,促进脂肪代谢,是能量代谢的关键酶之一。对MetS患者的内脏脂肪LPL表达分析发现,MetS患者的LPL基因甲基化程度较重,伴有LPL的表达量降低,说明LPL的表达异常和MetS的发生特别是肥胖密切相关[31]。而有文献报道肥胖与前列腺体积增大、LUST风险增加呈正相关,同时减肥能在一定程度上降低患BPH的风险及LUST症状的严重程度[32]。

CCL2是参与免疫调节和炎症过程中分泌蛋白超家族一员[33]。该分子主要由巨噬细胞、内皮细胞产生,通过招募单核巨噬细胞广泛参与炎症和肿瘤的病理、生理过程[34]。目前有大量文献报道CCL2与慢性前列腺炎相关[35-36]。同时CCL2也参与MetS的病理、生理过程[37],研究证实CCL2能通过降低大鼠脂肪组织对胰岛素的敏感性,可能直接参与脂肪组织胰岛素抵抗的形成[38]。但在前列腺局部,研究证实胰岛素会促进BPH的进展[15,29],因此推测前列腺组织中CCL2表达水平的降低可能会使前列腺上皮对胰岛素敏感性增加,促进BPH进展。

综上所述,得到的关键基因中IGF1、LPL、CCL2可能通过影响前列腺物质、能量代谢水平参与BPH的发生、发展,而VCAN参与炎症对BPH的影响,WNT2是影响BPH的生长因子之一。本研究利用生物信息学方法,对GEO数据库中与BPH相关的数据集进行二次挖掘,筛选出了可能参与BPH发生、发展的关键基因及相关通路,这些基因可能有助于对BPH病因的研究。但其具体作用还有待进一步的基础及临床研究验证。值得注意的是,由于目前利用测序技术研究BPH病理生理的文章较少,本文使用的数据集中BPH组总病例数为12例,对照组为9例,病例数不足可能对结果的可靠性有一定影响。同时本研究为纯粹的生物信息研究,其结论缺少实验结果支撑,对可靠性有一定影响,但目前我们没有BPH患者和相应对照的前列腺样本,拟在以后收集相关样本以验证本研究所得结论。

猜你喜欢

关键前列腺病理
病理诊断是精准诊断和治疗的“定海神针”
高考考好是关键
韩履褀治疗前列腺肥大验案
治疗前列腺增生的药和治疗秃发的药竟是一种药
开展临床病理“一对一”教学培养独立行医的病理医生
治疗前列腺增生的药和治疗秃发的药竟是一种药
与前列腺肥大共处
不一致性淋巴瘤1例及病理分析
获胜关键
生意无大小,关键是怎么做?