二叶式主动脉瓣钙化关键基因的生物信息学分析
2021-06-11朱鹏程卞金辉倪布清邵永丰
朱鹏程, 张 倩, 卞金辉, 章 辉, 倪布清, 邵永丰
(南京医科大学第一附属医院, 1. 心脏大血管外科, 2. 泌尿外科, 江苏 南京, 210029)
二叶式主动脉瓣(BAV)畸形是最常见的先天性心脏病类型,在普通人群中的发病率为0.5%~2.0%, 男、女患者比例约为3∶1[1]。与常见的三叶式主动脉瓣(TAV)相比, BAV患者更易出现主动脉瓣钙化并导致主动脉瓣狭窄,具有发病更早、进展更快、病死率更高等特点。此外, BAV最严重且最致命的并发症是主动脉扩张及主动脉夹层,且主动脉扩张可呈现出发病早、持续进展等特点[2]。BAV所导致的一系列症状常出现在患者成年后,提示此病的防治应着重于早诊断、积极预防各种并发症,并密切监测瓣膜病变的进展情况。
目前的统计数据[3]显示, BAV的发病呈现一定的家族聚集倾向,BAV患者及其一级亲属发病率为24%,远高于普通人群的发病率,提示BAV具有较强的遗传倾向。尽管如此, BAV的发病并不符合孟德尔的遗传定律,该病的发生并不是简单的单基因遗传模式,而男性发病率高于女性则提示该病还与X染色体相关。目前, BAV的发病机制尚未明确,只能认为BAV是多种基因突变且与X染色体相关的疾病,而不同的环境危险因素和BAV瓣膜形态学的不同分型又导致了特殊的血流动力学分布,使得该病的进展呈现较强的异质性。本研究收集Gene Expression Omnibus (GEO)数据库的相关数据,比较并筛选钙化的BAV瓣膜数据与正常的TAV瓣膜数据的差异基因(DEGs),探讨BAV钙化的关键基因(hub基因)和关键通路,现将结果报告如下。
1 材料与方法
1.1 研究材料
本研究的数据来源于GEO数据库,通过GEO数据库下载GSE83543数据矩阵、探针文件GPL10558及对应的临床信息。数据处理主要采用Perl(V5.28.1)软件, R(The R Project for Statistical Computing)软件用于数据筛选及数据可视化操作, FunRich软件进行富集分析及预测miRNA, Cytoscape软件构建蛋白互作(PPI)网络及miRNA-mRNA调控网络。
1.2 研究方法
1.2.1 原始数据的处理: 将GSE83453数据集的数据进行分组,其中钙化BAV组共10个样,正常的TAV组共8个样。通过探针文件GPL10558将原始数据中的“ID-REF”转换为“Gene Symbol”。使用R软件的“limma”包筛选出DEGs, 筛选标准为adj.Pvalue<0.05和|logFC|>1。使用R软件将DEGs进行可视化处理,绘制热图及火山图。
1.2.2 GO富集分析: 使用R软件的“clusterprofiler”“org. Hs. eg. db”“enrichplot”“ggplot2”R包对DEGs进行GO富集分析。GO富集分析结果用R软件绘制成气泡图。上述步骤涉及的R包通过https: //bioconductor. org. 网址下载安装。
1.2.3 KEGG富集分析: KEGG富集分析通过R软件的“enrichKEGG”命令对DEGs进行富集分析。富集分析结果由R软件绘制为条形图。
1.2.4 PPI网络构建: 从STRING数据库搜索DEGs间的相互作用关系,将PPI关系导入Cytoscape构建PPI网络。
1.2.5 筛选hub基因: 根据PPI使用Degree算法将DEGs排序,选择前10个基因作为hub基因。
1.2.6 预测hub基因的miRNA: 分别采用miRwalk数据库及FunRich软件预测hub基因对应的miRNA, 将2组miRNA取交集,获得hub基因对应的miRNA。
1.2.7 构建miRNA-mRNA调控网络图: 根据此前的数据,整理hub基因及预测出的miRAN的对应关系,采用Cytoscape软件构建出miRNA-mRNA调控网络图。
2 结 果
2.1 DEGs
从数据集GSE83453中共筛选出DEGs 126个,其中上调基因85个,下调基因41个,DEGs的结果见图1。
A: 热图; B: 火山图。红色代表上调,绿色代表下调。
2.2 GO富集分析及KEGG富集分析
对筛选出的126个DEGs进行GO注释分析,发现DEGs涉及的生物过程(BP)主要富集在细胞外基质组织、细胞外结构组织、白细胞迁移及酸性化学反应相关的过程中; 在细胞成分(CC)方面, DEGs主要参与含胶原蛋白的细胞外基质的构成; 从分子功能(MF)方面来看, DEGs主要参与细胞外基质结构的构成。GO分析的可视化结果见图2。
KEGG富集分析结果显示, DEGs主要涉及的通路有PI3K-Akt信号通路、人类乳头瘤病毒感染通路、细胞外基质受体相互作用通路、局灶黏附通路等。KEGG分析的可视化结果见图3。GO富集分析及KEGG富集分析数据见表1。
表1 DEGs的GO及KEGG富集分析结果(部分)
2.3 hub基因
根据PPI,通过Degree算法将所有的DEGs排序,前10位的DEGs为hub基因,即COL1A1、MMP9、COL1A2、COL3A1、SPP1、THBS2、SERPINE1、COL4A1、COL5A2、COL4A2。DEGs的PPI网络见图4。
图2 DEGs的GO富集分析气泡图
图3 DEGs的KEGG富集分析条形图
图4 DEGs的PPI网络图
2.4 预测hub基因的miRNAs
将miRwalk数据库及FunRich软件预测出的miRNAs取交集,共获得12个miRNA,即hsa-let-7d-5p、hsa-miR-124-3p、hsa-miR-338-3p、hsa-miR-143-3p、hsa-miR-6088、hsa-miR-181c-5p、hsa-let-7i-5p、hsa-let-7a-5p、hsa-let-7e-5p、hsa-miR-98-5p、hsa-miR-196a-5p、hsa-miR-145-5p, 绘制的韦恩图见图5。根据miRNA和mRNA的相互对应关系,构建出miRNA-mRNA调控网络,见图6。
图5 miRWalk及FunRich预测出的miRNA的韦恩图
图6 预测的miRNA和hub基因构成的miRNA-mRNA调控网络
2.5 对DEGs及hub基因的验证
本课题组从GEO数据库获取另一组主动脉瓣的测序数据(GSE51472), 该数据集有正常及钙化的主动脉瓣膜组织。从该数据集共筛选出672个DEGs, 将其与GSE83453数据集的DEGs取交集,共有34个相同的DEGs, 其中包括2个hub基因,韦恩图见图7,具体数据见表2。
图7 GSE83453、GSE51472的DEGs及hub基因的韦恩图
表2 GSE83453、GSE51472的DEGs及hub基因的交集
3 讨 论
本研究通过对GEO数据库中的GSE83453数据集进行差异分析,筛选出钙化的BAV与正常的主动脉瓣的DEGs共126个。GO富集分析显示, DEGs主要参与细胞外基质组织、细胞外结构组织等生物过程,与含胶原蛋白的细胞外基质构成的细胞成分相关,其主要分子功能为细胞外基质结构的构成; KEGG富集分析显示, DEGs主要参与PI3K-Akt信号通路、人类乳头瘤病毒感染通路、细胞外基质受体相互作用通路、局灶黏附通路等。
根据富集情况可以推断,细胞外基质组织、细胞外结构组织、含胶原蛋白的细胞外基质的构成、细胞外基质结构构成相关的通路发生改变是导致BAV瓣膜纤维化及进一步钙化的直接原因。PI3K-Akt信号通路受抑制会导致细胞凋亡[4],而细胞凋亡则可能是瓣膜出现病理改变的诱因。根据KEGG数据库的检索结果,局灶黏附通路相关的疾病包括家族性胸主动脉瘤和主动脉夹层,这个结果可以解释BAV患者随着年龄的增长,主动脉扩张的风险也随之增高[5-6]; 细胞外基质受体相互作用通路相关的疾病有埃勒斯-当洛综合征主动脉瓣型,其中第V亚型易合并先天性心脏病。
根据本研究的PPI结果, Degree算法获取的10个hub基因分别为COL1A1、MMP9、COL1A2、COL3A1、SPP1、THBS2、SERPINE1、COL4A1、COL5A2、COL4A2。筛选出的10个hub基因中,有5个是COL家族基因:COL1A1和COL1A2组成Ⅰ型胶原的三螺旋结构,而胶原蛋白是骨基质中含量最丰富的蛋白质。研究[7-9]表明COL1A1/COL1A2突变与成骨不全症及埃勒斯-当洛综合征相关。成骨不全症常伴有钙磷代谢异常,这可能与BAV瓣膜的钙化相关,而埃勒斯-当洛综合征则易出现先天性心脏病。COL3A1突变的不同类型与血管性埃勒斯-当洛综合征的表型和严重程度相关[10], 提示BAV患者主动脉病变的进程可能与COL3A1突变类型相关;COL4A1、COL4A2与血管及心脏发育畸形相关[11-12],COL4A2还对细胞外基质中的成骨分化有重要影响[13];COL5A2低表达更易出现主动脉瘤和夹层[14],提示患者更易出现严重并发症。MMP9受抑制会促进细胞自噬[15], 而MMP9具有促进炎症的功能[16]。SPP1对应的蛋白是骨桥蛋白,广泛存在于细胞外基质中。骨桥蛋白与羟基磷灰石紧密结合,在细胞外基质中起重要作用。SPP1通过TGF-β信号通路促进纤维化[17], 这可能与BAV瓣膜病变早期的纤维化进程相关。目前,THBS2和SERPINE1均与肿瘤相关,与BAV钙化的相关性暂时不确定。由此可见,COL1A1、COL1A2、COL4A2、SPP1可能与BAV瓣膜纤维化及进一步的钙化相关,而COL3A1、COL4A1、COL4A2、COL5A2与BAV患者主动脉并发症的出现有关,MMP9基因的异常表达可能导致BAV瓣膜间质细胞自噬功能紊乱并促进炎症反应。
此外,本课题组通过GSE51472数据集筛选出主动脉瓣钙化相关的DEGs, 将其与GSE83453数据集的DEGs取交集,共有34个相同的DEGs, 包括2个hub基因,提示BAV瓣膜钙化与TAV瓣膜钙化可能有相似的通路,与之相关的hub基因是SPP1及MMP9。加剧BAV瓣膜病变并导致BAV相关并发症的hub基因则可能是THBS2、COL5A2、COL4A1、COL1A1、COL3A1、COL4A2、COL1A2、SERPINE1。数据库及软件预测出的miRNA的交集共有12个。目前尚未找到与本研究相似的microRNA测序结果,所以预测出的miRNA还需要进一步验证。