基于生物信息学探讨骨质疏松与脂代谢疾病的关系
2024-02-29张方晴吴嘉朔阮豪南薛昊天王镜勋石钺
张方晴 吴嘉朔 阮豪南 薛昊天 王镜勋 石钺
骨质疏松 ( osteoporosis,OP ) 是一种常见的以骨量减少,骨微观结构退化为特征的骨代谢失衡疾病,根据病因可分为原发性和继发性[1-2]。在 21 世纪,OP 已经成为世界五大疾病之一,全球 OP 患者人数已超出 2 亿,由 OP 导致骨折的患者在 160 万以上。在 60~70 岁阶段,约 1 / 3 的女性和 1 / 5 的男性患有该疾病。随着全球人口老龄化的加剧,OP 已成为日益严重的公共卫生问题[3-4]。目前研究表明,肥胖 ( obesity,OB )、糖尿病 ( diabetes,DM )、多发性硬化症和心肺功能障碍等多种疾病的发生容易增加 OP 的患病风险,同时增加骨折发生的概率[5]。
脂质是细胞的重要组成部分之一,在机体的信号传递、能量储存和细胞膜形成等过程中起到关键作用[6]。当脂肪酸的合成与分解失衡时,会引发脂质代谢紊乱,过量的脂质累积会导致包括心脏、大脑、骨骼在内的多种组织的细胞发生功能障碍或死亡[7]。最常见的脂代谢紊乱疾病包括 OB、非酒精性脂肪肝 ( non-alcoholic fatty liver disease,NAFLD )、动脉粥样硬化 ( atherosclerosis,AS ) 和 DM 等。而目前研究表明,脂代谢功能与骨稳态的维持关系密切。一方面,过量的脂肪累积会造成低骨量和高骨折率,即过度 OB 不利于骨稳态的维持和骨骼健康[8]。脂肪酸对骨量的形成具有直接和间接的影响,脂肪酸可直接作为膜结合受体或核结合的相关受体影响骨代谢,同时也可间接影响骨骼肌、肝脏、肾脏等组织相关细胞中的脂质含量来调节骨量。同时,过量脂肪酸累积可通过氧化应激或刺激免疫炎症诱导骨代谢失衡[9]。另一方面,经证实,骨骼的稳态能够调节“胰岛素 ( insulin,INS ) / 葡萄糖”轴,从而改善机体的能量代谢[10]。能量代谢和骨代谢可以由相同的激素调节,如瘦素 ( leptin,LEP ) 和催产素可在增加能量消耗和脂类分解的同时作用于成骨细胞,从而促进肌肉和骨骼形成,增加绝经后 OP 患者的骨密度[11-12]。上述研究表明,OP 与脂质代谢之间联系紧密复杂,且二者能够相互影响。然而,OP 与脂代谢紊乱疾病之间的关系尚未完全阐明,临床上仍缺乏治疗 OP 与脂代谢疾病共病的药物。
基于此,本研究选取了 OB、NAFLD、AS、DM 四种常见的脂代谢紊乱疾病,通过疾病数据库对 OP、OB、NAFLD、AS、DM 五种疾病的靶点进行检索,筛选出疾病的交集靶点,构建蛋白 - 蛋白互作网络 ( protein-protein interaction,PPI ),进行基因本体论 ( gene ontology,GO ) 和京都基因与基因组百科全书 ( kyoto encyclopedia of genes and genomes,KEGG ) 生物富集分析。同时构建“靶点 - 药物 - 转录因子 ( transcription factors,TFs ) - 微小核糖核酸( microRNAs,miRNAs )”的基因调控网络以阐明 OP和脂代谢疾病潜在的基因调控途径,为揭示二者的潜在关系提供参考,并为临床上治疗 OP 与脂代谢疾病共病的药物的开发奠定基础。
材料与方法
一、疾病靶点的获取
以“Osteoporosis”“Nonalcoholic fatty liver disease”“Atherosclerosis”“Obesity”和“Diabetes”为关键词,分别在 GeneCards 数据库、在线孟德尔遗传 ( Online Mendelian Inheritance in Man,OMIM ) 数据库、Drugbank 数据库、药物靶点( therapeutic target database,TTD ) 数据库进行检索( 表 1 )。进行数据清洗后,获得 OP、OB、NAFLD、DM 和 AS 的疾病靶点。利用 Venny 2.1 软件筛选靶点间的交集,以获得不同疾病间的共同靶点,并利用联川生物云平台进行可视化。所有的靶点均经过Uniprot 数据库进行归一化处理。
二、PPI 网络构建与关键基因的筛选
PPI 可以阐释蛋白与蛋白彼此间的相互作用,以了解蛋白之间的功能联系。在基因 / 蛋白相互作用检索搜查工具 ( search tool for the retrieval of interacting genes / proteins,STRING ) 11.0 数据库平台上导入69 个交集靶点。物种选择“Homo sapiens”,互作评分阈值设置为 0.4,其它筛选条件为系统默认参数。导出“TSV”文件后利用 Cytoscape 3.7.2 软件进行可视化,并利用软件内置工具“Network analyzer”计算不同靶点的 Degree 值和紧密程度。Degree 值,即度值,表示复杂网络中某一节点的连接数,也等于其相连节点的数量,可用于衡量某一节点在复杂网络中的重要性。按照 Degree 值和紧密程度对交集靶点进行可视化处理。选取 Degree 值排名前 10 的交集靶点作为核心靶点。
表1 在线数据库及数据分析平台Tab.1 The online database and analytical platforms used in this study
三、生物富集分析
采用 Metascape 平台进行 GO 和 KEGG 富集分析( 表 1 ),以明确 69 个交集靶点富集的相关的信号通路和生物过程,并通过 GeneRatio 和Q-value值 ( 即调整后的P值 ) 评价富集水平。其中富集分析通过 R 语言对前 30 条通路进行可视化处理。GO 分析包括对交集靶点的生物功能 ( biological process,BP )、细胞组分 ( cellular component,CC ) 和分子功能 ( molecular function,MF ) 的富集分析。以Q-value值进行排序,取各分类下排名前 10 的条目进行可视化处理。为了便于阅读,GO、KEGG 的Q-value值均以 - Log10(Q-value) 进行气泡图绘制及统计数据的展示。
四、基因调控网络的建立
基因调控网络的建立可以进一步探讨 OP 与脂代谢疾病的潜在作用关系。采用 miRTarBase 数据库、DNA 元件百科全书 ( encyclopedia of DNA elements,ENCODE ) 数据库和比较毒理基因组学 ( comparative toxicogenomics database,CTD ) 数据库筛选与交集靶点相关的 miRNAs、TFs 和药物。此外,采用NetworkAnalyst 平台对基因调控网络进行分析。所获得的数据经 Cytoscape 软件评估网络的拓扑学参数并进行可视化处理。采用 Degree 值表示复杂网络中某一节点的连接数以衡量某一节点在复杂网络中的重要性,根据 Degree 值进行筛选,随后建立“靶基因 -药物 - 转录因子 - miRNAs”网络。
结 果
一、OP 与四种脂代谢疾病的交集靶点
经过数据库筛选和归一化处理,共收集 OP 相关靶点 841 个,OB 相关靶点 717 个,AS 相关靶点 696 个,DM 相关靶点 691 个,NAFLD 相关靶点1142 个。其中 OP 与 OB 共有交集靶点 177 个,OP与 AS 共有交集靶点 184 个,OP 与 DM 共有交集靶点 162 个,OP 与 NAFLD 共有交集靶点 194 个。共有 69 个靶点在五种疾病中均存在,为其共同交集靶点 ( 图 1,表 2 )。
图1 OP / OB / AS / DM / NAFLD 的交集靶点 Venn 图Fig.1 The Venn diagram of OP / OB / AS / DM / NAFLD targets
表2 数据集的交集靶点Tab.2 The overlapped targets of different datasets
二、PPI 网络构建和核心基因的筛选
通过 STRING 数据库构建的 PPI 网络图共包含68 个节点和 2148 条边 ( 有 1 个节点未与其它节点产生相互作用,故省去 )。按照 Degree 值筛选核心靶点,前十位靶点包括血清白蛋白 ( serum albumin,ALB )、INS、白细胞介素 6 ( interleukin-6,IL-6 )、肿瘤坏死因子 ( tumor necrosis factor,TNF )、C-反应蛋白 ( C-reactive protein,CRP )、LEP、RAC-α 丝氨酸 / 苏氨酸 - 蛋白激酶 ( RAC-alpha serine / threonineprotein kinase,AKT1 )、过氧化物酶体增殖物活化受体 γ ( peroxisome proliferator-activated receptor gamma,PPARG )、胰岛素样生长因子 1 ( insulin-like growth factor 1,IGF1 ) 和脂联素 ( adiponectin,ADIPOQ ) ( 图 2 )。
图2 交集靶点的蛋白互作网络图 ( 节点颜色越深,直径越大,代表该节点 Degree 值越高;中间圆代表核心靶点 )Fig.2 The protein-protein interaction network of all overlapped targets ( The deeper color and larger diameter of nodes represented the higher “Degree” values; The nodes in the center represented the core targets )
三、GO、KEGG 生物富集分析
经过 STRING 数据库分析,共得到 1287 条GO-BP 富集结果 (P< 0.05 ),34 条 GO-CC 富集结果 (P< 0.05 ),51 条 GO-MF 富集结果 (P< 0.05 ) 和136 条 KEGG 信号通路 (P< 0.05 )。GO 富集结果显示,OP 和脂代谢疾病的交集靶点主要与平滑肌细胞增殖、炎症应答、蛋白质磷酸化、肽反应和细胞增殖等生物过程有关;与内质网、囊泡腔和血小板 α 颗粒等细胞组分有关;与受体配体活性、信号受体激活与调控、细胞因子活性和细胞因子受体结合等分子功能有关 ( 图 3,表 3 )。KEGG 富集结果显示,交集靶点广泛富集在 AMP 依赖的蛋白激酶[ adenosine 5’-monophosphate ( AMP )-activated protein kinase,AMPK ]、低氧诱导因子 1 ( hypoxia inducible factor 1,HIF-1 )、Apelin、过氧化物酶体增殖物活化受体 ( peroxisome proliferator-activated receptor gamma coactivator,PPAR ) 和细胞衰老等信号通路 ( 图 4,表 4 )。此外,根据 KEGG 富集分析结果绘制的“交集靶点 - 通路”网络如图 5 所示。结果显示,AKT1、信号转导与转录激活因子 ( signal transducer and activator of transcription 3,STAT3 )、转化生长因子 β1 ( transforming growth factor beta-1 proprotein,TGFB1 )、IGF1、基质金属蛋白酶 9 ( matrix metalloproteinase-9,MMP9 )、IL-6等靶基因 Degree 值较高,并富集在多条相关通路上,提示其在 OP 和脂代谢疾病中的关键作用。多数交集靶点富集于 AMPK 等信号通路、脂质与粥样硬化和癌症相关通路上,提示其可能为解决 OP 及脂代谢疾病的关键通路。
图3 GO 富集分析结果气泡图Fig.3 The bubble chart of the results of GO enrichment analysis
图4 KEGG 富集分析结果气泡图Fig.4 The bubble chart of the results of KEGG enrichment analysis
图5 交集靶点 - 信号通路网络Fig.5 The overlapped targets-singling pathway network
表3 GO 通路下所含的靶基因 ( 前 30 条 )Tab.3 Target genes contained in GO pathway ( first 30 )
表4 KEGG 通路下所含的靶基因 ( 前 10 条 )Tab.4 Target genes contained in KEGG pathway ( first 10 )
四、基因调控网络
经 Cytoscape 可视化后,得到的基因调控网络如图 6 所示。其中三角形代表转录因子,“V”字型代表 miRNAs,菱形代表药物,圆形代表靶基因。节点大小按拓扑学参数“Degree”值大小进行排列。
图6 “靶点 - 药物 - 转录因子 - microRNAs”基因调控网络Fig.6 The“targets-drug-TFs-miRNAs” gene regulatory network
在 69 个交集靶点中,线粒体超氧化物歧化酶( superoxide dismutase 2,SOD2 )、血管内皮生长因子 ( vascular endothelial growth factor A,VEGFA )、肿瘤蛋白 P53 ( cellular tumor antigen p53,TP53 )、磷酸酶张力蛋白同源物 ( phosphatase and tensin homolog,PTEN ) 和 IGF1 的 Degree 值较高,提示其在基因调控网络中的关键作用。在 10 个相关候选药物中,CRX-139、Glucosamine、ApreMilast、AV-411 的Degree 值较高,提示其可能为治疗与预防 OP 和脂代谢疾病共病的关键药物。
转录因子可以与其它蛋白形成复合体后特异性识别 DNA 序列,起始或阻断 DNA 的转录过程,从而调控基因表达。经筛选后,共保留 83 个相关TFs,其中 PPARG、NR2F ( nuclear receptor subfamily 2,group f )、ZNF580 ( zinc finger protein 580 )、MXD4( recombinant human max dimerization protein 4 )、ZBTB33 ( zinc finger and BTB domain containing 33 ) 等与脂肪酸代谢、血管形成和细胞信号转导以及免疫炎症激活相关的转录因子 Degree 值较高,提示其在基因调控网络中的关键作用。miRNAs 可参与转录后的基因表达调控,与靶基因有着密切的联系,对 miRNAs 进行预测可以进一步了解靶基因的功能和作用机制。经筛选,共保留 82 个 Degree 值较高的 miRNAs,其中 hsa-mir-335-5p、hsa-mir-124-3p、hsa-mir-155-5p 和 hsa-mir-26b-5p 的 Degree 值 > 10,证明对靶基因的表达及调控具有重要作用。
讨 论
为了深入探讨 OP 与脂代谢疾病的关系,本研究通过生物信息学分析方法,对 OP 与脂代谢疾病( NAFLD、AS、OB 和 DM ) 之间的关系和潜在作用机制进行探讨。
脂代谢疾病即由脂质代谢紊乱所引发的疾病,包括本研究提及的 NAFLD、AS、OB 和 DM,也包括其它疾病如高脂血症、高血压等。笔者选取上述四种疾病代表脂代谢疾病的原因有两方面:( 1 ) 上述四种疾病在诸多脂代谢疾病中具有较强的代表性,具有较强的危害性且患病率正逐年增加;( 2 ) 经过文献调研,笔者发现在既往的研究报道中,上述四种疾病与 OP具有密切的联系,值得进一步挖掘与探讨[25-28]。
经过临床数据库整合 OP 与 NAFLD、AS、OB和 DM 的靶基因后,本研究筛选得到 69 个同时调控 OP 与脂代谢的关键靶基因,侧面印证了 OP 与脂代谢疾病间关系密切且作用机制复杂,其中 ALB、INS、IL-6、TNF、LEP、AKT1、PPARG、IGF1 和ADIPOQ 等靶基因在 PPI 相互作用中 Degree 值较大,可能为 OP 与脂代谢疾病相关联的关键靶点。在此,笔者对这些靶基因在骨代谢与脂代谢中发挥的作用进行讨论。
ALB 是人体血浆中含量最丰富的白蛋白,可与生物活性物质结合,运输脂肪酸、金属离子等内源性或外源性化合物,其也具有一定的抗氧化、抗炎、抗血栓特性[29-30]。研究表明,脂肪酸是 ALB 最重要的内源性配体之一,可以与 ALB 紧密结合并影响其构象。而 ALB 与骨代谢的稳定息息相关,ALB可作为载体运载药物以促进骨形成[31],同时 ALB 本身可以促进成骨细胞增殖分化,当骨外损伤时伤口处 ALB 的局部浓度显著增加,骨骼愈合速率与 ALB的局部浓度成正比[32]。在临床研究中,低浓度 ALB可增加患者未来骨折的风险及骨质疏松性锥体骨折术后病死率[33-34]。ALB 对骨脂代谢的作用机制可能与两方面有关:第一,ALB 可募集内源性干细胞从而加快骨骼生长;第二,由于 ALB 具有良好的抗氧化特性,可靶向氧化应激的抗氧化体系,从而影响成骨细胞功能及调控脂代谢过程[32,35]。
INS 是由胰岛 β 细胞分泌的,能够调节人体内的脂质代谢的一类蛋白质激素,其对骨代谢的影响是多方面的。一方面,INS 可直接作用于成骨细胞上的胰岛素受体 IR,介导成骨细胞的增殖和分化,同时抑制破骨细胞的活性;另一方面 INS 可间接与促进骨形成的激素 [ 如甲状旁腺素 ( parathyroid hormone,PTH ) 和 IGF1 ] 协同作用,共同抑制骨吸收过程[36]。异位脂肪的累积和营养摄入过剩会导致INS 抵抗和脂代谢紊乱,从而诱发 OB 和 2 型糖尿病,骨骼作为 INS 的反应器官,代谢异常会引发骨量降低,增加骨骼脆性的风险[37-38]。
IGF1 是一类调控合成代谢的亲水性肽类激素,具有类胰岛素样作用,可促进细胞生长增殖,促进骨骼肌细胞再生,有利于维持骨骼肌的健康[39]。
LEP 是由白色脂肪组织分泌的,调节脂肪沉积和能量代谢的脂肪因子,可通过与受体结合激活下丘脑弓形核调控下游基因。阿片 - 促黑素细胞皮质素原和神经肽 Y 表达,从而减少食物摄入并增加能量消耗[40]。研究表明 LEP 一方面可直接作用于骨细胞调节骨形成和骨吸收,另一方面可以作用于下丘脑 - 垂体系统间接影响生长激素、甲状腺激素、皮质醇激素的分泌从而影响骨骼的健康[41]。
ADIPOQ 是一种由脂肪细胞分泌的,与 INS 抵抗密切相关的细胞因子。主要通过与 ADIPOQ 受体和磷酸酪氨酸衔接蛋白 1 结合后,分别激活 AMPK信号通路和 PPARα 信号通路以调节糖脂代谢,维持体内葡萄糖稳态,增强 INS 敏感性,发挥抗血糖和抗动脉粥样硬化等功能[42]。体外研究表明,ADIPOQ 一方面可以刺激成骨细胞分化并增加骨钙素的分泌,另一方面通过激活 NF-κB 促进破骨细胞分化,抑制骨吸收[43]。
IL-6 和 TNF 等促炎因子也是 PPI 结果中的核心靶点基因。脂代谢紊乱会刺激 TNF、IL-6 的合成与分泌,大量促炎因子的合成通过调控机体对 INS 的敏感度,影响脂代谢进程,进而诱发 OB、DM 等脂代谢异常疾病[44]。同时,TNF、IL-6 可以刺激NF-κB 受体,促使破骨细胞生成并加速骨吸收[45]。
AKT 是高等真核生物中关键的生长因子、细胞因子和信号转导节点,与 2 型糖尿病、癌症和 OP 的发生和发展密切相关[46]。磷脂酰肌醇 3-激酶 / 蛋白激酶 B ( phosphoinositide 3 kinase / Serine / threonineprotein kinase AKT-1,PI3K / AKT ) 信号通路是 OP的关键通路之一,在成骨细胞和破骨细胞的增殖、分化、凋亡中起着重要作用[47]。PI3K / AKT 信号通路的另一功能是对脂质功能信号产生应答,促进机体对葡萄糖的摄取和利用[48],该信号通路的激活可显著改善脂代谢紊乱造成的 INS 抵抗、OB 和NAFLD 等[49-50]。
PPARG 是脂肪酸激活受体转录因子 PPAR 的一种亚型,在白色脂肪组织中表达量最高,负责调控脂质合成和代谢,以调节机体能量稳态[51]。研究表明,除了调控体内葡萄糖和脂质平衡外,PPARG一方面可激活原癌基因以促进破骨细胞前体细胞分化为破骨细胞,加速骨吸收过程;另一方面可抑制间充质干细胞分化为成骨细胞,从而抑制骨形成过程[52]。笔者前期研究发现,在使用糖皮质激素后的SD 大鼠的胆固醇、甘油三酯含量均有显著性的提高,而骨碎补总黄酮给药后能显著降低大鼠血浆中胆固醇和甘油三酯的含量。同时骨碎补总黄酮能改善糖皮质激素所诱导的 SD 大鼠的 OP,该分子过程受 PPARG 基因的调控。故而可推断,PPARG 基因在骨代谢和脂代谢中具有双重调控作用[53]。
在 GO 生物富集分析结果中,交集靶点主要与细胞增殖、炎症应答和蛋白质磷酸化相关,涉及细胞因子和信号转导过程,侧面印证了炎症等过程在二者共病中起到的关键作用。
KEGG 生物富集分析提示,交集靶点广泛富集在 AMPK 信号通路和 HIF-1 信号通路,还和癌症、脂质与 AS 息息相关。AMPK 作为调节人体能量稳态的关键激酶,广泛参与到蛋白质、脂质、糖类代谢以及自噬和线粒体稳态等生理代谢活动中[54]。作为调控代谢的关键因子,研究表明 AMPK 在调节骨代谢方面具有重要作用。体外研究表明 AMPK 的激活可促进骨形成,降低骨量流失[55]。一方面,AMPK 的激活促使哺乳动物西罗莫司靶蛋白 ( mammalian target of rapamycin C1,MTORC1 ) 下调,从而激活自噬,抑制破骨细胞分化[56]。另一方面,AMPK 信号通路的激活可刺激叉头框 O 蛋白 ( forkhead box class O proteins,FOXOs )、P53 等细胞因子的产生,从而抑制 NF-κB活性,降低骨吸收速率[57]。上文提到的 ADIPOQ和 LEP 等激素可刺激钙离子分泌,激活钙 / 钙调蛋白依赖性蛋白激酶 ( recombinant calcium / calmodulin dependent protein kinase kinase 2,CAMKK2 ),从而促使 AMPK 调控骨脂代谢,PPAR 可通过调控AMPK 引起的自噬加速 DM 患者的骨再生[58]。HIF-1信号通路主要负责调控人体内葡萄糖代谢、血管生成及红细胞产生[59]。该信号通路上的 VEGFA 是血管生成的关键因子,可通过上调 VEGFA 的表达促进成骨细胞的表达,从而促进骨骼增长[60]。当前的研究多集中于 AMPK 信号通路和 HIF-1 信号通路对于OP 和脂代谢疾病的单独影响,而对于 OP 与脂代谢之间关系尚缺乏明确研究。但不可否认,AMPK 信号通路和 HIF-1 信号通路为治疗 OP 与脂代谢疾病的潜在的关键通路,AMPK 有望成为治疗二者共病的潜在作用靶点。
通过构建基因调控网络可以更好地了解潜在的分子机制。在调控网络的构建中,micro-RNA 如hsa-mir-335-5p、hsa-mir-124-3p、hsa-mir-155-5p 和hsa-mir-26b-5p 的 Degree 值较高,起到关键调控作用。Li 等[61]证明 hsa-mir-335-5p 可抑制高脂饮食所导致的成骨细胞凋亡。hsa-mir-124-3p 可调控前体脂肪细胞向成熟脂肪细胞的分化、脂质积累和代谢等生理过程。hsa-mir-124-3p 对骨的直接影响尚未见报道,但 hsa-mir-124-3p 可能通过调控细胞的增殖凋亡和迁移以及调控炎症因子来影响骨细胞[62]。转录因子 PPARG 对脂代谢和骨代谢的潜在调控作用值得关注。药物 Glucosamine 的 Degree 值较高,据报道,Glucosamine 可以帮助修复和维护软骨,并能刺激软骨细胞的生长,并通过 AMPK 信号通路对体内葡萄糖的感应来调节脂肪生成[63]。
本研究首次将 OP 与脂代谢疾病联系起来,通过整合疾病数据库,发现 OP 与脂代谢疾病 ( NAFLD、AS、OB 和 DM ) 共有的交集靶点 69 个,同时进一步揭示了二者相关分子机制,发现交集靶点与免疫炎症、糖脂代谢、氧化应激密切相关,且 AMPK 信号通路在 OP 与脂代谢疾病中为关键通路,提示可以通过调控 AMPK 信号通路上的相关靶基因和靶蛋白以同时调控脂代谢疾病与 OP 的发生和发展。为了更好地服务于临床,笔者通过数据库进行药物筛选,发现药物 Glucosamine 在同时治疗 OP 和脂代谢紊乱方面的应用潜力巨大。综上所述,本研究论证了 OP作为一种常见的骨代谢疾病,与脂代谢紊乱疾病的发生发展关系密切,为 OP 与脂代谢疾病的关系提供了临床参考,并为二者共病机制的研究提供了潜在的研究方向。