心肌梗死后心力衰竭大鼠左心室心肌基因组学特征的生物信息学研究
2020-03-09杨翠郑思道陈少军
杨翠,郑思道,陈少军
近年来随着心血管疾病诊疗水平提高,心肌梗死带病生存患者数量明显增加,心力衰竭(heart failure,HF)患病率亦随之升高[1-2]。既往研究表明,冠心病患者发展为HF 的比例较高(49.6%),提示心肌缺血梗死相关因素在HF 发病过程中具有重要作用[3]。目前,HF 是60 岁以上人群住院的主要原因之一,近年抗HF药物虽不断增多,但仍需慎重选择才能有效改善患者生存质量[4]。本研究采用生物信息学工具分析心肌梗死后HF 大鼠左心室心肌基因学特征,旨在为心肌梗死后HF 基因组学特征研究及新药研发提供参考。
1 材料与方法
1.1 基因数据获取 以“heart failure”为检索词在GEO 数据库(www.ncbi.nlm.nih.gov/geo/)中进行检索,选取大鼠(rattus norvegicus)分类下DOROTA TULACZ等提交的GSE47495 芯片数据作为研究材料,该芯片数据来源于Affymetrix Mouse Gene 1.0 ST Array 基因表达芯片平台GPL6247,共包含29 214 个基因,以大鼠左心室心肌为研究组织,纳入假手术组(Sham组)6 个 样 本(GSM1151154~GSM1151159) 和 冠 状动脉结扎诱导的心肌梗死后HF 组(HF 组)5 个样本(GSM1151172~GSM1151176)。
1.2 差异基因分析 应用GEO2R 在线软件(www.ncbi.nlm.nih.gov/geo/geo2r/)筛选两组差异基因,并选取上调、下调倍数最显著的基因各20 个进行分析。
1.3 功能及信号通路富集分析 将40 个差异基因提交至DAVID 6.8 数据库(www.david.abcc.ncifcrf.gov)进行GO 功能富集分析及KEGG Pathway 富集分析,并通过在线工具webgestalt(www.webgestalt.org)进行可视化分析。
1.4 蛋白相互作用 采用STRING 11.0 数据库(www.string-db.org)对40 个差异基因相关蛋白进行蛋白相互作用分析。
2 结果
2.1 差异基因 Sham 组与HF 组大鼠芯片数据分布较好(见图1)。与Sham 组相比,HF 组大鼠左心室心肌样本中共有2 162 个基因表达存在明显差异,其中表达上调1 073 个、表达下调1 089 个(见图2);选取表达上调、下调最显著的基因各20 个(见表1)。
2.2 GO 功能富集分析 GO 功能富集分析结果显示,40 个差异基因富集在细胞膜、内膜系统及细胞外空间等细胞成分中,可参与调控蛋白质结合、离子结合、转运活性等分子功能,涉及应激、多细胞生物过程、生理调节等多个生物学过程,详见表2~3。
2.3 KEGG Pathway 富集分析 KEGG Pathway 富集分析结果显示,40 个差异基因主要参与心肌细胞中的肾上腺素能信号传导(见表4)。
2.4 差异基因蛋白相互作用 STRING 分析结果显示,纤维粘连蛋白1(FN1)、骨膜蛋白(POSTN)、结缔组织生长因子(CTGF)、分泌型磷蛋白1(SPP1)、成纤维细胞生长因子7(FGF7)、分泌型卷曲相关蛋白2(SFRP2)等多个蛋白在相互作用网络中处于关键节点。差异基因蛋白相互作用网络立体图见图3(差异基因蛋白相互作用网络立体高清图见本文OSID 码)。
图1 Sham 组与HF 组大鼠芯片数据箱体图Figure 1 Box diagram for chip data of rats in Sham group and HF group
表1 Sham 组与HF 组大鼠左心室心肌表达差异显著的40 个基因Table 1 The 40 genes with significant expression difference of left ventricular myocardium of rats in Sham group and HF group
图2 Sham 组与HF 组大鼠左心室心肌差异基因的火山图Figure 2 Volcano plot for differentially expressed genes of left ventricular myocardium of rats in Sham group and HF group
图3 差异基因蛋白相互作用网络立体图Figure 3 Network stereogram for differentially expressed genes protein interaction
表2 40 个差异基因的GO 功能富集分析Table 2 GO functional enrichment analysis on the 40 differentially expressed genes
表3 40 个差异基因的细胞成分、分子功能及生物学过程分类Table 3 Classification of cell composition,molecular function and biological processes of the 40 differentially expressed genes
表4 40 个差异基因KEGG Pathway 富集分析Table 4 KEGG Pathway enrichment analysis on the 40 differentially expressed genes
3 讨论
心肌梗死患者HF 发生率高、病死率高且预后较差,因此其防治工作不容忽视。神经内分泌调节、心肌重构抑制等HF 的关键分子和信号传导通路是近年来抗HF新药研发的热点[5],此外通过基因组编辑或转录后分子调控干预疾病正在探索中,并有望解决现存临床诊疗难点、改善患者预后[6-7]。
既往研究表明,基因组学研究不断深入不仅能帮助理解HF 基因变化,还有助于探索HF 的发病机制及对患者预后的影响,从而推动临床诊疗工作持续发展[8]。笔者所在课题组前期探讨过基因水平相关分子介导的药物作用机制[9-11]。本研究采用生物信息学工具分析心肌梗死后HF 大鼠左心室心肌基因学特征,并选出40个差异基因;GO 功能富集分析结果显示,40 个差异基因富集在细胞膜、内膜系统及细胞外空间等细胞成分中,可参与调控蛋白质结合、离子结合、转运活性等分子功能,涉及应激、多细胞生物过程、生理调节等多个生物学过程;KEGG Pathway 富集分析结果显示,40 个差异基因主要参与心肌细胞中的肾上腺素能信号传导;STRING 分析结果显示,FN1、POSTN、CTGF、SPP1、FGF7、SFRP2 等多个蛋白在相互作用网络中处于关键节点,这对进一步阐释HF 病理生理机制、新药研发具有重要参考价值。
综上所述,应激、多细胞生物过程、生理调节等多个生物学过程及心肌细胞肾上腺素能信号传导通路参与心肌梗死后HF 的发生发展;但本研究存在以下不足:(1)本研究基因数据来源于动物模型,与人类机体具体情况存在差异,临床决策仍需基于真实世界的研究结果,因此需在医学伦理规范下积极弥合疾病模型与临床疾病之间的差异;(2)生物信息学工具虽能辅助预测潜在关键分子与通路,加快研究步伐,缩短研发时间,但最终结论仍依赖于基因编辑工具在基础和临床中的应用结果。
作者贡献:郑思道进行文章的构思与设计,研究的实施与可行性分析,并对文章整体负责,监督管理;杨翠、郑思道进行数据收集、整理、分析,结果分析与解释;杨翠负责撰写论文及进行论文的修订;郑思道、陈少军负责文章的质量控制及审校。
本文无利益冲突。