缺血性脑卒中差异表达基因筛选、功能富集与相关信号通路生物信息学分析
2022-08-11武金燕
武金燕
天津市静海区医院 天津医科大学静海临床学院神经内科 301600
缺血性脑卒中(Ischemic stroke,IS)是临床最为常见的脑血管病。相关数据显示,2020年IS是全球第二大最常见的死亡原因,造成约700万人死亡(约占总死亡人数的11%)[1]。2020年,大约有1 800万人罹患IS,其中2/3的IS发生在65岁以上的人群中,而南亚人IS的风险尤其高,占全球IS死亡人数的40%[2]。IS发生后,当缺血的脑组织中氧气或葡萄糖消耗殆尽,高能磷酸化合物(如三磷酸腺苷)将不再产生,进而导致组织细胞生存所必需的能量依赖过程(如离子泵)无法进行[3-4],导致细胞损伤和死亡。目前认为,IS的发生有一定的遗传背景因素,多个基因的差异时空表达可能影响IS的发生和预后[5]。本研究采用生物信息大数据分析方法筛选IS相关差异基因并进行可能的信号通路分析。
1 数据与方法
1.1 数据来源及数据库分析 选取基因表达谱公共数据库GEO,对GEO数据库中关于IS患者与正常人群外周血中差异表达基因谱数据进行筛选,并对差异表达基因进行筛选。筛选条件为IS组和正常人群中上调或下调超过2个拷贝的基因。对不同数据集中筛选出的基因进行分析,选取重叠的差异基因(共差异基因)作为研究对象。选择蛋白—蛋白相互作用数据库STRING(http://string-db.org/cgi/input.pl),对公差异表达基因进行蛋白拓扑网络构建。采用KEGG数据库对,共差异表达基因信号通路进行分析。
1.2 IS差异表达基因筛选 GEO数据库中检索IS基因表达数据集,检索词为“Ischemic stroke”,种属为“human”。进一步对检索到的结果进行筛选,选取GSE22255[6]、GSE98319和GSE66724[7]三个数据集进行分析。根据数据集中IS患者与健康人群外周血中的基因表达谱情况进行筛选,筛选条件为IS组和正常人群中上调或下调超过2个拷贝的基因,且P<0.05;分别对GSE22255、GSE98319和GSE66724数据集中的差异基因进行重叠分析,选取共差异表达基因,并绘制Venn图。
1.3 功能富集及信号通路分析 在STRING数据库中对筛选出的共差异表达基因进行蛋白相互作用拓扑网络构建,构建条件为:数据来源Textmining、co-expression、gene function和co-occurrence;相互作用关系系数≥0.4;相互作用蛋白不高于20个。
1.4 KEGG信号通路分析 在KEGG数据库中(https://www.genome.jp/kegg/pathway.html)对STAT3、MMP9和SOCS3相关信号通路进行分析。物种选择“human”;通路包含:代谢、遗传信息、环境信息、细胞过程、人类疾病和药物开发等。
2 结果
2.1 缺血性脑卒中患者差异表达基因筛选 GSE22255、GSE98319和GSE66724数据集中缺血性脑卒中患者和正常对照人群中差异表达基因分别为30个、196个和13个。其中共差异表达基因3个分别为STAT3、MMP9和SOCS3,见图1。
图1 缺血性脑卒中患者差异表达基因筛选
2.2 差异表达基因的聚类热图 对GSE66724差中差异表达基因进行聚类分析,结果显示STAT3、MMP9和SOCS3等差异表达基因在缺血性脑卒中组聚类明显,见图2。
图2 STAT3、MMP9和SOCS3等差异表达基因聚类热图
2.3 共差异表达基因的图谱网络 STAT3、MMP9和SOCS3蛋白网络中有节点数为20个,节点间相互作用115个,平均聚类指数为0.75,STAT3、MMP9和SOCS3蛋白相互作用网络蛋白富集明显(P<0.05),见图3。
图3 STAT3、MMP9和SOCS3蛋白相互作用拓扑网络
2.4 STAT3、MMP9和SOCS3功能富集 STAT3、MMP9和SOCS3等基因编码蛋白主要富集于细胞质、Cul5-RING泛素连接酶复合物等;生物学功能主要富集于蛋白结合、非膜跨越蛋白酪氨酸激酶活性、RNA聚合酶ii特异性DNA结合转录因子结合等;分子功能主要富集于细胞表面受体信号通路、白细胞介素-6的细胞反应和细胞对氧化应激的反应等。见表1。
表1 STAT3、MMP9和SOCS3功能富集
2.5 STAT3、MMP9和SOCS3相关信号通路 STAT3、MMP9和SOCS3基因主要涉及蛋白代谢、表达调控信号通路见图4。信号通路涉及Jak-STAT信号通路、凋亡通路和MAPK等。
图4 STAT3、MMP9和SOCS3相关信号通路模式图
3 讨论
3.1 IS特征及危险因素 IS是由于供血不足而发生的缺血性梗死,临床较为常见。缺血会导致大脑的某些部分出现功能异常,包括偏身感觉或运动障碍、语言障碍、感音障碍,甚至昏迷。IS的主要危险因素是高血压,其他危险因素包括高胆固醇、吸烟、肥胖、糖尿病、既往短暂脑缺血发作、终末期肾病和房颤等[8]。预防措施包括减少危险因素,对有问题的颈动脉狭窄患者进行干预;对房颤患者使用华法林阿司匹林进行抗凝;对存在高血脂的患者应进行有效的降脂治疗[9]。
3.2 IS发生的病生理改变 IS目前的发生发展病生理机制并未完全阐明,主要为大脑部分供血不足而引起的缺血性级联反应,如缺氧超过1 ~ 1.5min,脑组织功能将受到明显影响,缺血缺氧大约3h后脑发生不可逆的损伤,并导致脑组织死亡,即脑梗死[10]。脑动脉粥样硬化可导致脑血管管腔狭小,进而导致血流减少,引起血管内血栓的形成,或通过动脉粥样硬化斑块的崩解释放大量小栓子干扰血液供应[11]。当栓子停留在脑血管时,该血管供血区域的脑组织得不到血液和氧气而发生梗死。
3.3 IS差异表达基因和信号通路 在本研究中,笔者采用生物信息分析方法,探讨了IS发生有关的基因并进行了可能的信号通路分析。结果显示,STAT3、MMP9和SOCS3在IS与正常人群外周血中存在明显差异表达。同时,STAT3、MMP9和SOCS3基因编码蛋白拓扑网络富集明显(P<0.05);STAT3、MMP9和SOCS3基因及其涉号通路包括Jak-STAT信号通路、凋亡通路和MAPK等信号通路。信号转导和转录激活因子3 (STAT3)是信号转导和转录激活因子的一种,其作用体现在细胞信号的交流和基因的转录等方面。已有文献报道,STAT3在IS发生中具有重要作用。林建国等人[12]研究认为JAK2/STAT3/HIF-1a信号通路的激活或抑制在IS中所发挥重要作用,IS急性期抑制JA K2/STA T3/HIF-1α信号通路的表达、康复期激动JAK2/STAT3/HIF-1a信号通路的表达、抑制与激动的结合运用可能是今后对JAK2/STA T3/HIF-1α信号通路的研究方向。
3.4 总结与不足 通过生物信息大数据分析不同的IS与健康人群差异表达基因谱,笔者发现STAT3、MMP9和SOCS3可能与IS发生有关,并有望成为IS预防和治疗的新靶点。但本研究数据主要基于数据库生物信息分析,其结论的可靠性有待进一步相关试验证实。