基于生物信息学方法探究溃疡性结肠炎的关键基因和通路
2022-09-26张科
溃疡性结肠炎(ulcerative colitis,UC)是一种以结直肠黏膜连续性、弥漫性炎症表现为特点的慢性非特异性疾病,其发病机制尚不明确,临床很难根治。UC 主要症状为腹痛、腹泻、黏液脓血便等,症状轻重不等,但多为反复发作的慢性病程,严重影响患者的心理、经济状况和生活质量
。目前UC 以药物治疗为主,常用药物有氨基水杨酸类、糖皮质激素、免疫抑制剂等,但这些药物存在一定的不良反应,患者依从性低,治疗效果也不理想
。因此,寻求新的药物治疗靶点,开发新的高效、低毒的UC 治疗药物成为研究热点。近年来,随着高通量测序平台及研究方法在疾病基因表达分析的应用,各种疾病的相关机制逐渐从基因和分子层面被阐明
。本研究采用基于Affymetrix 芯片平台的GSE42911 数据集,探究溃疡性结肠炎(UC)的发病机制,为其早期诊断和治疗药物的开发提供新思路。
1 资料与方法
1.1 基因芯片数据获取 以“Ulcerative Colitis”为关键词,在Gene Expression Omnibus(GEO)数据库中检索与UC 相关的表达谱数据。选择GSE42911 芯片数据进行挖掘,该研究是基于GPL15207 平台(affymetrix human gene expression array)的芯片,由Kellermayer R 提交。由10 个样本构成,分别为GSM1053271、GSM1053272、GSM1053273、GSM1053274、GSM1053277、GSM1053268、GSM1053269、GSM1053270、GSM1053275、GSM1053276。其中,前5 个样本来自5 例溃疡性结肠炎患者,后5 个样本来自5 名正常人。
1.2 筛选差异基因 GEO2R 是GEO 数据库中以R语言为基础的交互式在线分析工具,借助R 语言及Limma 包对GEO 样品数据行基因差异表达分析
。本研究利用该工具筛选UC 患者和正常人大肠组织的差异基因(DEGs)。以基因倍数改变(fold change,FC)大于1.5,即|logFC|>1.5 作为DEGs的筛选标准,以
<0.05 为差异有统计学意义,除去重复和无效基因,得到本芯片的DEGs
。采用R 语言绘制DEGs的热图和火山图。
1.3 核心DEGs 筛选与生物学过程及信号通路分析将DEGs 导入STRING 数据库,设置筛选标准:combined score>0.4,将分析数据以TSV 格式导出,再导入Cytoscape 3.2.1 软件中,然后使用软件的NetworkAnalyzer 进行分析。在网络中,度值(Degree)表示某一节点与其他节点连接边的数量
;中介中心度(betweenness centrality,BC)表示一个节点担任其它两个结点之间最短路的桥梁的次数。BC 值越大,表示节点在网络拓扑结构中的枢纽程度越重要
。目前,网络分析的主要方法是选择节点Degree 值及BC 值高的作为网络的关键节点
。本研究也采用该分析方法,筛选BC>0.01,Degree>30的作为UC的核心DEGs。对大规模基因进行功能注释,包括基因功能富集分析(GO 基因本体论)和基因通路富集分析(KEGG)。GO 分析包括分子功能(molecular function,MF)、细胞组分(cellular components,CC)和生物学过程(biological process,BP)
。接着将核心DEGs 导入DAVID 数据库,并限定物种为人,进行基因功能注释分析和功能富集分析,然后导出数据,对生物过程(
<0.01)和信号通路(
<0.05)进行筛选,用R 语言对GO 和KEGG 富集分析结果进行可视化。
1.4 蛋白质相互作用网络构建及分析 将得到的核心DEGs 导入STRING 数据库绘制蛋白-蛋白互作网络图(protein-protein interaction,PPI),将分析数据以TSV 格式导出,导入Cytoscape 3.2.1 软件,绘制PPI 网络图,并对网络进行拓扑结构分析;再利用“Generate style from statistics”工具对网络节点的大小和颜色进行设置。网络图中节点的大小、颜色及其深浅变化代表Degree 值的大小,边的粗细反映了Combine Score的大小,从中筛选出Degree 值和接近中心度排名靠前的靶点。
形声字是现代汉字的主体,其中形符的表义功能,有助于留学生理解汉字的含义;声符的示音功能,利于留学生了解读音。对外汉语教师运用形声字的这些优势进行教学,不仅可以减轻学生们的负担,而且能够增强他们的信心,激发他们学习汉字的热情。
2 结果
2.3 PPI 网络分析结果 将核心DEGs 上传至STRING 数据库,PPI 网络图包含35 个节点和171条边,平均节点Degree 值为9.77,富集
<1.0E-16。将网络分析数据以TSV 格式从STRING 数据库中导出,然后导入Cytoscape 3.2.1 软件中,绘制PPI 网络图,Degree 排名前10的靶点包括RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7,见图4。
1.4 统计学方法 采用SPSS 17.0统计软件进行处理分析,计量资料以均数±标准差(±s)表示,组间比较采用t检验,计数资料用χ2检验。
再次,建立健全存货内部控制管理制度,确保采购、验收、入库、保管、出库等各个环节都有严格审批手续和监督控制措施,明确规定各岗位的职责。
2.2 核心DEGs 筛选与生物学过程及信号通路分析共得到36 个UC的核心DEGs,包括:UBB、CYCS、GNB2L1、APP、CDC42、SOD1、ACTG1、ISG15、RHOA、ACTR2、B2M、CANX、ATP5B、TXN、ATP5A1、CCT8、PFDN5、RAB11A、RAB7A、HNRNPA2B1、NEDD8、HSPD1、PARK7、TFRC、SDHB、RPL7、PSMA6、PCBP1、ATP5O、ANXA2、RPS27、GDI2、RAC1、CFL1、FAU、PTGES3。功能注释结果显示:36 个UC 核心DEGs共在53 个(
<0.01)GO term 上富集,其中BP18 个,CC24 个,MF11 个。BP 主要富集在Gtpase 介导的信号转导、细胞或亚细胞成分的运动、线粒体ATP 合成耦合质子转运、ATP 合成耦合质子运输、线粒体膜电位的调节等;CC 主要富集在胞外外体、胞质溶胶、细胞外间质、局部粘连等;MF 主要富集在蛋白质结合、多聚RNA 结合、质子转运ATP 合成酶活性、谷胱甘肽酶活性、跨膜转运活性等,BP、CC、MF的COUNT 得分排名前5的结果见表1、图2。KEGG 通路分析显示:36 个UC 核心DEGs 共富集在25 条通路上,主要包括:吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等,见表2、图3。
2.1 差异基因筛选结果 共筛选出487 个差异基因,其中上调465 个,下调22 个。采用R 语言绘制火山图,见图1A;绘制前30 位上调基因和下调基因的热图,见图1B。
3 讨论
随着高通量芯片技术发展,利用生物信息学方法可以更加快速、经济、高效地筛选出参与疾病发病机制的重要基因,为疾病的诊断、治疗及药物设计提供依据。本研究基于生物信息学分析筛选出UC的487 个DEGs,上调基因465 个,下调基因22 个,然后筛选得到36 个UC 核心DEGs。进一步探究了核心DEGs的生物学过程、分子功能和细胞组成,发现涉及的生物过程包括:GTP 酶介导的信号转导、细胞或亚细胞成分的运动、线粒体ATP 合成耦合质子转运、ATP 合成耦合质子运输、线粒体膜电位的调节、胞外外体、胞质溶胶、细胞外间质、局部粘连、蛋白质结合、多聚RNA 结合、质子转运ATP 合成酶活性、谷胱甘肽酶活性、跨膜转运活性等,这些与UC的发生和发展都有一定的联系。KEGG 通路分析显示主要通路包括:吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等。
PPI 网络分析结果显示,RACK1、ACTG1、UBB、CCT8、HSPD1、SOD1、CDC42、PSMA6、CFL1、RPL7等靶点是网络中的核心节点,推测它们是UC 发病的关键基因。目前研究显示,RACK1 通过控制蛋白激酶C(protein kinase C,PKC)介导的信号通路将蛋白锚定在特定亚细胞位置并调节活性,导致下游激酶的激活或失活,从而控制细胞极性,从动力学角度调节细胞骨架的动力。此外,RACK1 基因的过表达,调节某些癌症的上皮间质转化,从而促进多种不同肿瘤细胞的侵袭和扩散
。研究显示
,UC 患者结肠黏膜中CDC42 水平较正常人显著升高。CDC42是RhoGTP 酶蛋白家族中的一员,与GTP 结合后活化的CDC42 可以调控细胞黏附、细胞骨架重排、细胞运动和迁移、细胞膜蛋白物质运输等多种生物学活动
。在T 细胞中,CDC42 过表达对细胞骨架的肌动蛋白和微管蛋白分极和迁移、分化均有影响
。CDC42 还会使癌细胞依附于血管壁上,从而使它们通过血液扩散到身体的其他部位。因此,理论上抑制CDC42 蛋白可以使癌细胞无法依附于血管内壁的内皮细胞上,从而减少其扩散的机会,这在未来极有可能成为新的预防癌细胞扩散和转移的新靶点。
综上所述,RACK1、ACTG1、UBB、CCT8 等基因可能通过调控吞噬体、黏着小带、细菌侵袭上皮细胞、沙门氏菌感染、肌动蛋白细胞骨架调节、白细胞内皮移动等信号通路参与溃疡性结肠炎的发生发展。
[1] 张雪莹,单海燕,薄淑萍.隔药灸神阙八阵穴联合角调五音疗法治疗溃疡性结肠炎伴焦虑抑郁状态效果观察[J].天津中医药大学学报,2019(1):38-41.
[2] 中国中西医结合学会消化系统疾病专业委员会.溃疡性结肠炎中西医结合诊疗共识意见(2017年)[J].中国中西医结合消化杂志,2018,26(2):105-111,120.
[3] 张玉洁,梁洁,吴开春.炎症性肠病诊断与治疗的共识意见(2018年)溃疡性结肠炎部分解读[J].中华消化杂志,2018,38(5):312-314.
[4] 刘建军,刘东,王希龙,等.北豆根对溃疡性结肠炎模型大鼠的治疗作用[J].中医学报,2018,33(8):1476-1479.
[5] Laharie D.Towards therapeutic choices in ulcerative colitis[J].Lancet,2017,390(10090):98-99.
[6] Guo Y,Bao Y,Ma M,et al.Identification of key candidate genes and pathways in colorectal cancer by integrated bioinformatical analysis[J].Int J Mol Sci,2017,18(4):722.
[7] Li Y,Jiang Q,Ding Z,et al.Identification of a common different gene expression signature in ischemic cardiomyopathy[J].Genes (Basel),2018,9(1):56.
[8] 刘萌,段琪琪,王敏,等.基于生物信息学分析探究银屑病关键基因和通路[J].中国皮肤性病学杂志,2019,33 (11):1232-1238.
[9] 冯春来,顾於梅,秦悦,等.基于模块分解的生物网络分析算法及其应用[J].中成药,2016,38(10):2227-2232.
[10] 朱敬成,刘辉,王伦文,等.基于网络拓扑重合度的关键节点识别方法[J].计算机应用研究,2021,38(12):3581-3585.
[11] 王治,洪莉,李素廷,等.基于GEO 数据库生物信息学方法分析子宫内膜癌相关基因和候选通路[J].吉林大学学报(医学版),2020,46(4):904-808.
[12] 李宁,吴海明,耿荣鑫,等.基于生物信息学的糖尿病心肌病生物标志物及关键通路的筛选[J].中华老年多器官疾病杂志,2019,18(5):321-326.
[13] 徐丽秀,李金秋,哈提拉·吐尔逊,等.RACK1 通过调控脂质合成促进子宫颈癌ME180 细胞侵袭、迁移及增殖[J].临床与实验病理学杂志,2022(7):775-782.
[14] 祁代华.SLP-2 和CDC42 蛋白在结直肠癌组织中的表达及其临床意义[D].郑州:郑州大学,2019.
[15] 李晨.CDC42 对炎症性肠病中Thl7 细胞作用的研究[D].广州:南方医科大学,2015.
[16] 商浩,王萍,刘春霞,等.Rac1 和Cdc42 对横纹肌肉瘤细胞增殖、侵袭、迁移以及凋亡的影响[J].安徽医科大学学报,2020,55(3):379-384.