APP下载

基于微阵列芯片数据分析中国人冠心病的关键基因和信号通路

2023-10-26张明磊高建步张永杰齐贵彬

中国实验诊断学 2023年10期
关键词:珠蛋白差异基因通路

王 星,张 妍,张明磊,高建步,张永杰,齐贵彬

(河南省南阳市中心医院,河南 南阳473000)

随着医疗技术水平的提高以及人们健康意识的提升,虽然我国心血管疾病防治工作目前取得了阶段性的成效,然而仍面临着极大的挑战。据《中国心血管病报告2018》[1]概要显示,我国心血管疾病的患病率仍处于上升期,估算现存心血管疾病患者人数高达2.9亿,其中约有1100万人患冠心病(CHD);不仅如此,因心血管病死亡人数占居民疾病死亡人数构成的40%以上,严重威胁着公共健康安全,加重我国社会的疾病负担。CHD的病理基础为动脉粥样硬化(AS),虽然高血压、糖尿病以及血脂紊乱在临床上被公认为AS的高危因素,并且受个人基因调控,然而,AS是一种多基因疾病,病理过程复杂,并且其发病机制尚未阐明[2-4]。因此,用科学的方法从分子层面阐述冠心病的潜在机制已成为当务之急,以期为临床筛选高危患者以及制定干预疾病治疗方法提供理论基础。近年来生物信息学通过获取基因芯片,可高效、广泛地收集生物信息与相关疾病的表达谱数据,在基因功能研究、蛋白结构预测以及药物设计等方面发挥着重要作用[5]。本研究利用生物信息学工具分析GEO数据库筛选中国人CHD的关键基因和信号通路数据,探究CHD潜在的发病机制与治疗靶点。

1 材料与方法

1.1 芯片数据收集本研究在美国国家生物技术信息中心(NCBI,http://www.ncbi.nlm.nih.gov/)中以“coronary heart disease AND homo sapiens[Organism]”为关键词进行检索,在人类冠心病基因表达芯片实验数据的检索结果中找到GSE71226数据集,它是基于Affymetrix人类基因U133 Plus 2.0阵列的GPL570平台进行搭建的。GSE71226数据集中包含6个样本,3个CHD患者样本,分别为GSM1830987,GSM1830988,GSM1830989;3个健康人群样本,分别为GSM1830990,GSM1830991,GSM1830992。分别下载基因表达图谱(GEO)原始数据[6]和探针注释文件进行进一步分析。

1.2 筛选差异基因利用R studio软件“limma”包对GSE71226数据进行标准化处理[7],设置参数P值<0.05;差异倍数(FC)≥2进行差异表达分析以及聚类分析;利用R studio软件“pheatmap”包绘制差异表达基因的火山图以及热图等可视化处理。

1.3 GO功能富集和KEGG通路富集分析利用R Studio软件中“clusterProfiler”包和“org.Hs.eg.db”包对差异基因进行GO功能富集分析和KEGG通路富集分析,P值<0.05认为差异有统计学意义。

1.4 构建差异基因PPI网络利用STRING网站(http://string-db.org/)和Cytoscape软件构建PPI网络[8],使用Cytoscape软件中的cytoHubba插件筛选CHD的hub基因并用MCODE插件筛选PPI网络中的功能模块识别关键基因[9],以此来获取毂基因。

2 结果

2.1 差异基因的筛选对CHD芯片表达数据集GSE71226进行标准化处理后,差异基因筛选结果显示,GSE71226数据集中包含120个差异表达基因,其与健康对照人群相比,冠心病患者有76个基因显著上调和44个基因显著下调。差异基因表达图见图1,图2。

图1 差异表达基因火山图

图2 前50位差异表达基因热图

2.2 GO富集分析及KEGG通路分析GSE71226数据集来源的差异表达基因显著富集在血红蛋白复合体(hemoglobin complex)和结合珠蛋白-血红蛋白复合体(haptoglobin-hemoglobin complex)等细胞成分(CC)中,分子功能(MF)主要体现为结合珠蛋白结合(haptoglobin binding)以及氧气载体活性(oxygen carrier activity),见图3;上调差异表达基因主要富集在单纯疱疹病毒1型感染信号通路,真核生物中的核糖体合成信号通路,信使RNA监测通路以及RNA转运信号通路,上调差异表达基因主要富集在疟疾信号通路,金黄色葡萄球菌感染信号通路,补体和凝聚级联信号通路以及神经活性配体受体相互作用信号通路,见图4。

图3 差异表达基因的GO富集分析气泡图

图4 差异表达基因的KEGG富集通路分析

2.3 PPI网络构建及毂基因的获取将CHD患者外周血样本与健康人群外周血样本间筛选出的差异表达基因导入STRING后构建出PPI网络图,该网络由104个节点蛋白和92条边构成(P<0.05),见图5;通过Cytoscape软件进一步筛选出10个基因,其中与CHD关联最大的基因为α血红蛋白稳定蛋白(AHSP)以及SLC4A1,见图6。

图5 差异基因之间的蛋白-蛋白相互作用

图6 关键基因模块

3 讨论

本研究通过从GEO数据库获取GSE71226数据集,采用逐步生物信息学分析,最终发现确定AHSP为CHD的关键基因。R语言对微阵列芯片进行分析,得出120个CHD患病人群与健康对照人群间的差异表达基因,其中76个上调基因和44个下调基因。GO功能分析发现差异基因主要参与的CC为血红蛋白复合体与结合珠蛋白-血红蛋白复合体,主要参与的MF体现为结合珠蛋白结合以及氧气载体活性;KEGG通路分析发现差异表达基因主要富集在单纯疱疹病毒1型感染,真核生物中的核糖体合成,信使RNA监测,RNA转运疟疾,金黄色葡萄球菌感染,补体和凝聚级联以及神经活性配体受体相互作用信号通路。通过蛋白质相互作用网络得到AHSP关键基因。

心血管疾病给居民和社会带来沉重的经济负担,据相关统计[10-11]报道,因心血管病死亡占据中国城乡居民总死亡原因的首位,其中农村地区死亡率为46.66%,城市为43.81%,并且每年因心脏病过早死亡导致的直接损失高达5580亿美元。心血管疾病中尤以CHD最为致命,其病情不仅十分凶险,而且易迅速进展为恶性心律失常、心力衰竭,甚至导致心源性猝死,严重威胁着患者的生命安全。因此,寻找冠心病新的诊断与治疗的靶点成为科研工作者们亟待解决的问题[1,12-14]。越来越多的研究表明,在动脉粥样硬化形成与发展中,免疫系统发挥着至关重要的作用[15]。转录组学通过对特定条件下细胞内或者组织内所有转录本进行测序,反映生物体在不同条件下不同基因的表达水平和调控模式[16]。在KEGG通路分析中,发现差异表达基因主要富集在单纯疱疹病毒1型感染信号通路上。众多临床病理研究[17-19]中显示,单纯疱疹病毒等的微生物可能是CHD发病的感染因子。病毒感染易引起炎症细胞的增多、聚集和激活,并分泌TNF-α、IL-1、IL-2、IL-6等细胞因子,导致脂代谢紊乱、血清甘油三酯(TG) 的积累、高密度脂蛋白胆固醇(HDL-C) 减少,氧自由基大量合成和释放,增加CHD发生发展的风险。

在筛选出的关键基因中,AHSP基因主要有两个作用,一是稳定游离α-珠蛋白;二是促进血红蛋白四聚体的组装,以此来抵御过多游离而不稳定的α-珠蛋白给机体造成的危害[20-21]。有研究[22-23]表明,AHSP表达或功能的改变正是在地中海贫血患者中观察到的一些临床变异性的原因,然而,在冠心病患者中的作用却未曾报道。这可能是因为AHSP在维持红系细胞的氧化还原平衡状态过程中发挥积极的保护作用,α-珠蛋白由氧化产生并通过内源性还原酶循环,如氧化环境中无β-珠蛋白行使“清道夫”的职责,过量的α-珠蛋白将对心肌细胞产生毒性[24]。而过度的氧化应激是由自由基在体内产生的一种负面作用,其不仅可造成机体与细胞衰老,破坏Ca2+稳态,损伤心肌细胞,还能严重损伤胰岛β细胞,加速动脉粥样硬化,导致糖尿病及冠心病的发生及预后不良[25]。另外,AHSP能特异性结合游离α-血红蛋白,稳定其结构,并限制其参与产生活性氧的化学反应的能力[26-28]。如内皮细胞表达的α-珠蛋白结合内皮NOS(eNOS)通过氧化降解其酶促产物NO,从而减少NO对附近血管平滑肌的血管扩张作用,最终导致冠脉狭窄及氧气输送障碍[24,29]。

本研究仍存在一定的局限性,首先,本研究纳入的样本数量较小,这可能导致筛选的毂基因有所偏差;其次,本研究只采用生物信息学方法进行初步探索,有待进一步的实验进行验证。

综上所述,CHD发病机制复杂,由多种因素导致。本研究通过生物信息学分析CHD患者与正常人群间的基因表达差异,成功地构建相关的PPI,同时揭示了差异表达的富集的相关通路来参与CHD的发病过程,为CHD诊断和治疗提供了潜在的靶点。

利益冲突所有作者均声明不存在利益冲突

作者简介:王星(1984-),男,河南省南阳市人,硕士研究生,主治医师,主要研究心血管内科方向。

猜你喜欢

珠蛋白差异基因通路
16 249例川东北地区珠蛋白生成障碍性贫血基因检测结果分析*
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
345例αβ复合型珠蛋白生成障碍性贫血血液学和基因型结果分析*
深圳地区两种类型的珠蛋白生成障碍性贫血的基因型及表型研究
通路快建林翰:对重模式应有再认识
早发冠心病触珠蛋白水平及其在免疫调节中的作用研究
SSH技术在丝状真菌功能基因筛选中的应用