基于生物信息学分析鉴定阿尔茨海默病中关键差异表达基因及其潜在治疗靶点
2022-09-25范加琳来贺欢李荷李欢欢周海云吴绍长
范加琳 来贺欢 李荷 李欢欢 周海云 吴绍长
(1丽水市第二人民医院,浙江 丽水 323000;2丽水市中心医院)
阿尔茨海默病(AD)是以认知障碍和晚期痴呆为主要特征的神经退行性疾病,是当今最大的流行病和健康挑战之一。目前AD的病理特征普遍认为是淀粉样蛋白(Aβ)沉积、神经原纤维(NFT,主要为高度磷酸化的tau蛋白)缠结和不同大脑区域的退行性改变〔1〕。AD具有复杂的多种致病因素,如遗传因素、环境因素、免疫因素、抑郁症或高血压等〔2~4〕。这些因素中,遗传因素约占AD风险的70%〔5〕。已知的引起AD的遗传原因包括编码淀粉样前体蛋白(APP),早老素(PSEN)1和PSEN2基因的显著改变,这些基因增强了Aβ的产生和聚集。然而,APP、PSEN1和PSEN2仅是AD致病机制的一部分〔6,7〕。此外,遗传学分析表明,AD的个体差异可能是由多个基因及其变异引起,这些基因发挥各种生物学功能,以协同调节疾病风险〔8〕。除了与AD发病机制有关的识别机制外,对潜在候选基因的全面分析可能会为AD的预测或诊断测试提供新策略。本文拟利用生物信息学分析挖掘AD相关基因芯片,寻找其差异表达基因构建蛋白质相互作用网络,进而发现网络中的关键基因,为AD的诊断及治疗提供新的靶点。
1 材料与方法
1.1基因表达芯片 GSE132903基因表达谱从基因表达综合数据库(GEO)下载。该表达谱来自GPL10558(Illumina HumanHT-12 V4.0 expression beadchip)。GSE132903数据集中包含195个样本,包括正常对照组和AD患者的微阵列数据,样本全部来自颞中回。
1.2差异基因分析 采用R语言和Bioconductor中的Limma数据包分析数据集中的差异基因。筛选标准为P<0.05且差异倍数>0.5。
1.3差异基因功能富集分析 利用DAVID在线工具对差异基因进行GO和KEGG分析。
1.4差异基因蛋白质互作网络的构建 利用STRING数据库构建蛋白质相互作用网络。
1.5关键基因(Hub)的筛选 利用Cytoscape在线软件中的插件CytoHubba进行筛选,其中包含11种关键基因筛选的算法。本研究选择其中常用的6种算法,通过取交集得到最终的关键基因。
2 结 果
2.1差异表达基因 共得到319个差异表达基因,其中有201个下调基因,118个上调基因,见图1。
红色代表上调基因,绿色代表下调基因图1 AD患者样本与健康对照样本差异表达基因的火山图
2.2功能富集结果 AD患者与正常对照差异表达基因的GO富集分析结果表明,信号释放、神经递质功能、突触功能等生物学过程与AD密切相关。突触膜、运输小泡、运输囊泡膜、神经元等细胞组分与AD的发生密切相关。GO富集分析的分子功能主要富集于钙调素结合、SNARE复合体结合、突触融合蛋白结合、离子通道活性等,见图2。进一步对差异表达基因进行KEGG富集分析发现神经组织的配体-受体相互作用、突触囊泡循环、胰岛素分泌等通路对AD的发生密切相关,见图3。
图2 AD患者样本与正常对照样本差异表达基因GO富集和注释结果
图3 AD患者样本与正常对照样本差异表达基因KEGG富集和注释结果
2.3蛋白质相互作用网络 利用差异基因构建的蛋白质相互作用网络,其中有239个网络节点,红色代表上调基因,绿色代表下调基因,与其他蛋白质相互作用越多,节点越大,作用越强,连线越粗,见图4。
图4 AD患者样本与正常对照样本差异表达基因的蛋白质相互作用网络
2.4关键基因筛选 基于cytoHubba中的6种算法,分别选取前10个关键基因然后取交集,最大集团中心性(MCC):SNAP25、SYP、SYN2、CPLX2、SYT4、CPLX1、STXBP1、NSF、SYT1、STX1A;最大邻域分量(MNC):SNAP25、SYP、GABRG2、SYT4、SYT1、GABRA1、GAD2、VAMP2、SYN2、NRXN1;度数(Degree):SNAP25、SYP、SYT1、GABRG2、SYT4、GABRA1、GAD2、NRXN1、SYN2、GFAP;边缘渗透分量(EPC):SNAP25、SYP、GABRG2、SYN2、SYT4、SYT1、GAD2、NRXN1、GABRA1、CPLX2;接近中心性(Closeness):SNAP25、SYP、GABRG2、GABRA1、GAD2、GFAP、SYT1、SYT4、STMN2、NRXN1;辐射度(Radiality):SNAP25、SYP、GABRG2、GFAP、GABRA1、GAD2、STMN2、SYT1、SYT4、GAD1。最终得到SNAP25、SYP、SYT1、SYT4。
3 讨 论
AD是一种遗传上复杂的神经退行性疾病,虽然目前已有许多治疗方法,但其治疗效果差,给家庭和社会带来很大负担。到目前为止AD的发病原因尚不清楚,但tau蛋白的高度磷酸化、Aβ沉积等诸多因素,在AD的病理生理学中扮演重要角色。由于AD病因的多样性,也因此提出了许多关于AD发病机制的假说。目前比较被认可的假说包括胆碱能假说、Aβ假说、Tau 蛋白假说等〔9〕。
随着研究的进展,高通量微阵列技术与生物信息学分析相结合已被广泛应用于预测各种疾病的潜在分子治疗靶点中。本研究结果提示突触功能在AD中发挥重要作用。突触是大脑中记忆存储和信息传递的基本单元,由突触前部和突触后部组成〔10〕。在AD患者大脑中各种突触蛋白,如突触前蛋白(SNAP)-25、突触后蛋白(PSD)-95及突触蛋白1和嗜铬粒蛋白B(突触小泡蛋白),都在发生改变〔11,12〕。研究发现在AD动物模型中存在LTP和LTD受损及突触传递缺失〔13〕。神经病理学研究表明,在轻度认知障碍(MCI)阶段,突触功能异常已很明显〔14〕。另外,突触功能障碍与临床疾病的严重程度密切相关〔15〕。
进一步进行关键基因筛选获得4个关键基因(SNAP25、SYP、SYT1、SYT4)均为突触蛋白,共同参与突触传递。SNAP25是一种广泛分布的膜相关突触前蛋白。SNAP25参与突触小泡与质膜的对接和融合,也是可溶性N-乙基马来酰亚胺敏感性因子附着蛋白受体(SNARE)复合物的重要组成部分,在神经元的存活和认知中起重要作用〔16~18〕。提示SNAP25可能是反映突触可塑性的有用生物标志物。SYP是一种突触前囊泡膜蛋白,与神经生长、修复再生、突触结构和功能可塑性调节有关,是突触前特异的标志性蛋白,SYP的密度、分布间接反映突触的数量和分布情况〔19〕。研究发现,SYP可通过神经递质的磷酸化和释放而影响突触结构并在突触可塑性中起作用,进而在AD的发展中起关键作用〔20,21〕。SYT1与SYT4属于突触结合蛋白家族,被认为是调节神经递质释放和脑的学习记忆等生理功能的主要蛋白之一。SYT1包含两个Ca2+结合域C2A和C2B,且是突触中主要的钙传感器之一〔22,23〕。研究发现,在AD小鼠模型和AD患者的大脑中,SYT1蛋白的表达降低,提示SYT1可能与AD中神经功能的退化有关〔24〕。目前SYT4在AD患者发病过程中的作用尚未见报道,提示可能发现了一个新的与AD发病相关的关键基因。