APP下载

基于生物信息学对扩张型心肌病与慢性心力衰竭共同生物标志物的预测*

2023-01-07黄青青李书珍杜晶晶石笑娜李克研

解剖学杂志 2022年5期
关键词:淋巴管胞外基质探针

黄青青 李书珍 杜晶晶 石笑娜 李克研Δ

(锦州医科大学,1 附属第一医院心血管内科,2 基础医学院生物化学与分子生物学教研室,锦州 121000)

扩张型心肌病(dilated cardiomyopathy,DCM) 作为一种异质性心肌病,主要特征是心室扩大伴有心肌收缩功能降低[1-2]。DCM严重者造成心肌组织的不可逆损伤,危及生命[3]。DCM对心肌组织的不同程度损伤,终将进展为心力衰竭,并伴有神经、内分泌等多系统的病理改变[4]。慢性心力衰竭(chronic heart failure,CHF)是一种复杂的临床综合征,CHF患者逐年增加,发病率提高,预后更差,给患者和家庭带来极大的经济负担[5]。近年来,研究显示CHF为多数DCM病程发展的最后阶段,并成为其主要的死亡原因[6]。并且已有相关研究,筛选了用于诊断DCM导致CHF的生物标志物,如肝细胞生长因子、结蛋白等[7-8]。但是DCM与CHF发病之间的相关性和潜在的机制仍然不明确,为了更准确地分析DCM与CHF发病之间的基因改变和分子间的相互作用,本研究利用生物信息学方法筛选分析了DCM与CHF发病的共同差异表达基因

(common differentially expressed gene,cDEGs),

并对这些共同差异表达基因进行了基因本体注释、信号通路富集分析、蛋白质相互作用网络分析,筛选出了关键生物标志物,为后续研究提供参考。

1 材料和方法

1.1 数据提取

从基因表达数据库(gene expression omnibus,GEO) (http:www.ncbi.nlm.nih.gov/geo)中下载基因芯片GSE76701和GSE3585。数据集GSE76701是基于平台GPL570 [HG-U133_plus_2] Affymetrix Human Genome U133 plus 2.0 Array生成的,此项研究纳入4例CHF患者样本和4例正常对照样本。数据集GSE3585是基于平台GPL96 [HG-U133A] Affymetrix Human Genome U1331 Array生成的,此项研究纳入5例正常对照样本和7例DCM患者样本。

1.2 数据预处理

从GEO数据库下载两芯片原始Raw数据芯片进行质量评估,使用R包affyPLM和RColorBrewer对数据集进行回归计算,分别绘制 RLE 箱线图和NUSE箱线图。相对对数表达(RLE)检测中,1个探针组在某个样品的表达值除以该探针组所有样品中表达值的中位数后取对数,反映平行实验的一致性,质量控制检测中,相对标准差(NUSE)1个探针组在某个样品的 PM 值的标准差除以该探针组在各样品中的PM值标准差的中位数后取对数,反映平行实验的一致性。

1.3 差异表达基因的筛选

对每个芯片原始数据,RAM法预处理数据,探针ID转换为基因symbol,多个探针对应1个基因时取均值,最近邻居法(KNN,k-Nearest Neighbor)补充缺失值。R软件(version 3.6.1) Limma包做差异分析,确定差异基因鉴定标准:P<0.05和|log2FC| >0.5,负数代表下调,正数代表上调,R软件绘制差异表达基因的火山图和热图,韦恩图获得共同差异表达基因。

1.4 差异基因本体与通路分析

为了探究DEGs富集的生物学功能,利用DAVID在线工具(http://david.ncifcrf.gov/)对共同差异表达基因进行分析,包括基因本体论(gene ontology,GO)及京都基因与基因组百科全书(Kyoto encyclopedia of genes and gnomes,KEGG)分析,GO 分析包括生物学过程(biological process,BP)、分子功能(molecular function,MF)、细胞组件(cellular component,CC)3 个方面。 设置Benjamini 校正后的P<0.05。

1.5 差异基因PPI网络构建分析

将差异表达基因 (differentially expressed genes,DEGs)导入在线分析工具STRING 11.0(https://string-db.org/),进行蛋白质相互作用(protein-protein interaction,PPI)分析,综合筛选关键基因(hub gene)。选择置信(综合)评分>0.4作为PPI的阈值,下载PPI列表,利用 Cytoscape 软件对PPI网络做可视化处理。

2 结果

2.1 数据预处理

1个探针组在某个样品的表达值除以该探针组在所有样品中表达值的中位数后取对数,反映平行实验的一致性(图1A);一个探针组在某个样品的 PM 值的标准差除以该探针组在各样品中的 PM 值标准差的中位数后取对数,反映平行实验的一致性(图1B)。结果显示,每个样本RLE的中位值位于0附近,NUSE的中位值位于1附近,说明没有离群样本,芯片质量合格,可纳入分析。

2.2 差异表达基因的筛选

基于GEO数据库芯片GSE76701(CHF)和芯片GSE3585(DCM)原始数据,R软件(version 3.6.1)Limma包做差异基因分析,结果显示GSE7670芯片数据中,上调基因355个,下调 299个;GSE3585芯片数据中上调基因141个,下调99 个(图2A)。分别可视化最上调和最下调的Top 10基因,根据|log2FC|做热图(图2B)。 对上述差异表达基因绘制韦恩图,获得GSE76701(CHF)和GSE3585(DCM)2组芯片数据的共同差异表达基因,结果显示,共同差异表达基因中上调表达基因19个,下调表达基因17个(图3)。

图1 芯片质量评估的RLE箱线图和NUSE箱线图

2.3 GSE76701和GSE3585共 同DGEs的 GO功 能 富集分析

应用功能富集分析工具ToppFun对DCM和CHF的共同差异表达基因进行GO功能富集分析,显著性水平为0.05。选择Go-Biologic Process 数据库,进行生理过程的富集分析,差异表达基因主要富集在转化生长因子β(TGFβ)受体信号通路、丝/苏氨酸蛋白激酶通路、细胞对TCFβ刺激的反应、血小板脱颗粒。选择Go-Cell Component数据库,进行细胞组分的分析,显示差异表达基因主要富集在血液微粒、血小板α颗粒、含有胶原的细胞外基质。选择Go-Molecular Function数据库,进行分子功能的富集分析,差异表达基因主要富集在脂肪酸衍生物的结合、TGFβ的结合、长链脂肪酸的结合,尤其富集到细胞外基质结构的构建功能中(图4)。

2.4 GSE76701和GSE3585共 同DEGs的KEGG通 路分析

通过R包ClusterProfiler对DCM和CHF的共同差异表达基因进行KEGG通路分析,选择Pathway数据库,显著性水平为0.05,结果显示差异表达基因主要富集的通路主要与肺结核、Fcepsilon RI 信号通路、补体系统、叶酸抵抗、哮喘具有一定的相关性(表1)。

2.5 GSE76701和GSE3585共同DEGs的PPI 相互作用网络分析

为了进一步分析GSE76701和GSE3585共同差异表达基因的相互作用,我们通过STRING数据库进行了可视化分析,构建了共同差异表达基因的PPI网络图,在PPI网络图中,每个节点代表一种蛋白质,节点之间的线代表蛋白质之间的相互作用(图5)。在 PPI网路图中,连接度(Degree)≥3视为hub基因,hub基因 分 别 为: CD163、LYVE1、MRC1、VSIG4、FCER1G、S100A9、F13A1 (表2)。

图2 GEO数据库芯片GSE76701(CHF)和GSE3585(DCM)的差异表达基因火山图和热图

图3 GSE76701和GSE3585的共同差异表达基因韦恩图

表1 GSE76701和GSE3585 共同差异表达基因的KEGG 通路富集分析

3 讨论

DCM和CHF在全世界范围内已成为高发疾病,近年来,研究显示CHF为多数DCM病程发展的最后阶段,并成为其主要的死亡原因[5-6]。因此,探讨DCM与CHF发病之间的相关性显得尤为重要。

本研究分别选取2种数据集芯片GSE76701(心衰)和芯片GSE3585(扩张型心肌病),通过生物信息学分析筛选出了2种疾病各自的差异表达基因及共同差异表达基因,结果显示:GSE7670芯片数据中,上调基因355个,下调基因 299个;GSE3585芯片数据中上调基因141个,下调基因99个。上述差异表达基因进行绘制韦恩图,获得GSE76701(心衰)和GSE3585(扩张型心肌病)两组芯片数据的共同差异表达基因,结果显示,两者共同差异表达基因36个,其中表达上调基因19个,表达下调基因17个。为了明确差异表达基因之间的相互作用,构建了PPI相互作用网络图,提取PPI网络图中连接最为紧密且位于重要的节点位置6个hub gene,分别是CD163、LYVE1、MRC1、VSIG4、FCER1G、S100A9、F13A1。其中CD163和KYVE1,发挥核心作用。

图4 GSE76701和GSE3585的共同差异表达基因 GO功能富集分析

图5 GSE76701和GSE3585的共同差异表达基因PPI网络图

表2 GSE76701和GSE3585芯片中的差异表达基因

CD163属于富含半胱氨酸的 SRCR 超家族成员之一,是一种单链跨膜糖蛋白,特异性表达于单核/巨噬细胞表面。当机体受到感染、外伤等因素刺激时,激活单核/巨噬细胞,血清、尿液中CD163表达增高[9]。CD163作为血红蛋白清道夫受体而识别,被认为具有减少脂质过氧化、抗炎症和抗动脉粥样硬化作用[10]。有研究显示CD163表达水平可反映体内动脉粥样硬化相关的炎症的程度及斑块的稳定性,有望作为评价冠心病严重程度的指标之一[11]。CD163还具有一定的免疫受体功能,在免疫调节反应过程中有重要作用,可以影响固有的免疫反应以及调节适应性免疫反应[12-13]。李志强等[14]的研究显示:CD163 与其他炎症细胞因子共同参与CHF的病理生理过程,与CHF的发病机制有关,是CHF发病的独立因素。

淋巴管内皮细胞透明质酸受体1(lymphatic vessel endothelial hyaluronan receptor 1,LYVE-1)

属于淋巴管内皮细胞标志物之一。随着LYVE-1等淋巴系统标志物的发现,心脏淋巴管的研究得到了迅猛发展。心脏淋巴管在心肌梗死、CHF、心功能改善、心脏手术并发症预防等方面具有一定的病理生理意义[15]。Klotz等[16]用 Whole-mount 法检测小鼠胚胎心脏的LYVE-1、 VEGFR-3、Prox-1等标记物,发现在心脏淋巴管发育过程中新生的淋巴管内皮细胞部分来自于内皮祖细胞。Dashkevich等[17]将晚期CHF心与正常心比较,提出心力衰竭后淋巴管的新生是在已有淋巴管基础上由内皮细胞增殖形成。

GO 功能富集和KEGG信号通路分析表明,DCM和CHF的共同关键基因参与的主要生理过程为TGF-β信号通路、丝/苏氨酸蛋白激酶通路、细胞外基质结构构建、血液颗粒、脂肪酸代谢等。TGF-β信号通路在多种疾病的纤维化重构中起关键作用。TGF-β是激活成纤维细胞的关键因子,通过诱导胶原纤维合成,引起器官纤维化,导致心室重构,是引发心脏疾病的关键因素。TGF-β信号通路的激活对心室重构的致病过程起着关键的促进作 用[18]。另有研究显示,TGF-β信号通路参与心血管内皮、平滑肌细胞的增殖和迁移过程[19]。细胞内重要的丝氨酸/苏氨酸蛋白激酶较多,如PKA、PKG、PKC、PKB、MAPK等。研究显示G蛋白- cAMP-PKA信号通路在CHF的发生、发展中起到一定作用[20]。另有研究显示在DCM患者体内,炎症因子浓度升高后,通过MAPK信号通路参与DCM晚期发展为心衰恶病质[21]。DCM发展为CHF的发生、发展基本机制是心脏重构,含有胶原的细胞外基质在心脏重构过程中起到重要的作用,通过细胞因子的作用,呈现为细胞分泌胶原蛋白后聚集在细胞间质,引起细胞外基质的重构,细胞外基质重构是导致心力衰竭的主要病理异常[22]。

本研究通过对DCM和HCF基因芯片数据的挖掘及生物信息学分析,筛选出了CD163、LYVE1、MRC1、VSIG4、FCER1G、S100A9、F13A等6个hub gene与DCM和HCF的发病密切相关,同时发现细胞外基质重构、TGF-β信号通路、丝/ 苏氨酸蛋白激酶通路等生理过程和信号通路在DCM和CHF的发病中起到重要作用,为后续DCM与CHF发病的分子机制和治疗靶点提供了一定的理论依据。未来仍需要一定的实验来验证关键基因在疾病的发生发展中具体作用机制。

猜你喜欢

淋巴管胞外基质探针
淋巴管栓的研究进展*
中医药对淋巴管新生与回流功能的作用研究进展
足部淋巴管分布的研究进展及临床意义
基于“土爰稼穑”探讨健脾方药修复干细胞“土壤”细胞外基质紊乱防治胃癌变的科学内涵
脱细胞外基质制备与应用的研究现状
基于FANUC数控系统的马波斯探针标定原理及应用
松弛素对马兜铃酸诱导肾小管上皮细胞MMP-9/TIMP-1 表达的影响
关于经络是一种细胞外基质通道的假说
肺淋巴管肌瘤病肺内及肺外CT表现
气液鼓泡床反应器中气泡行为光纤探针测量方法