骨关节炎关节滑膜组织差异表达基因生物学功能及与免疫细胞浸润的关系分析
2023-01-06冯重阳姬振伟王志学张智翔王银歌吴鹏丁勇
冯重阳,姬振伟,王志学,张智翔,王银歌,2,吴鹏 ,丁勇
1 空军军医大学第二附属医院骨科,西安 710038;2 中国人民解放军联勤保障部队第922医院骨科
骨关节炎(OA)是常见的关节退行性疾病,累及整个关节包括滑膜炎症、软骨下骨硬化、退变和骨赘形成,最终表现为关节疼痛、僵硬和功能障碍[1]。随着全球人口老龄化加剧,OA 患病人数不断增加,影响着约3.8%的人口,造成了巨大的社会经济负担[2]。目前OA 发病机制尚不清楚,多数学者认为,滑膜炎症是OA 的启动环节,是导致患者出现疼痛和临床症状的一个关键因素[3]。AYRAL 等[4]采取连续关节镜检查证实早期OA 存在滑膜炎症,它是OA症状和疾病发展的一个重要病理环节。滑膜炎症由先天免疫细胞参与调控。CD4+和CD8+T 细胞以及先天免疫系统的单核细胞/巨噬细胞的异常都可能导致OA 进行性加重[5-7],在疾病恶化中起重要作用。因此探究OA 与免疫细胞之间的关系,为揭示OA 发生机制具有重要意义。
生物信息学作为一门新兴学科,被用于快速、大规模地获取生物信息,揭示疾病的分子机制。本研究从Gene Expression Omnibus 数据库(GEO)选取与OA 相关的基因芯片GSE55235、GSE55457、GSE1919和GSE12021,采用Meta 分析的方法筛选OA 和正常样本滑膜组织的差异表达基因(DEGs),对DEGs 进行生物学功能分析,并构建蛋白质—蛋白质相互作用(PPI)网络筛选核心差异表达基因,通过CIBERSORT 算法分析正常和OA 关节滑膜组织之间22 种免疫细胞浸润比例,以及核心差异表达基因与免疫细胞百分比的相关性,为探讨OA 的免疫机制提供理论依据。
1 材料与方法
1.1 OA 数据集及其来源 在 GEO(http://www.ncbi. nlm. nih. gov/geo)公共数据库中,检索与OA相关的基因芯片,符合以下条件:基因芯片为基因组mRNA 转录组数据的表达谱;包含OA 和正常对照患者滑膜组织的检测数据;排除药物干预或转染的数据集。根据筛选条件获得2 个平台的4个 mRNA 数据集,分别为 GSE55235、GSE55457、GSE1919 和 GSE12021,共有 69 个样本,其中包含35 个 OA 和 34 个 健 康 对 照 样 本 。GSE55235、GSE55457 和 GSE12021 所用平台为 GPL96(Affymetrix Human Genome U133A Array),GSE1919 所 用平 台 为 GPL91(Affymetrix Human Genome U95A Array)。GSE55235 数据集中OA 关节滑膜组织样本 10 个、正常关节滑膜组织 10 个;GSE55457 数据集中OA 关节滑膜组织样本10 个、正常关节滑膜组织10 个;GSE12021 数据集中OA 关节滑膜组织样本 10 个、正常关节滑膜组织 9 个;GSE1919 数据集中OA 关节滑膜组织样本5 个、正常关节滑膜组织5 个。
1.2 OA 与正常关节滑膜组织DEGs 筛选 应用在线分析平台 NetworkAnalyst(https://www. networkanalyst.ca/)对四个数据集原始数据整合分析[8]。首先将每个数据集上传、注释和处理,而后将四个数据集进行整合归一化处理,采用Fisher's分析方法筛选DEGs(Combined P<0.05,|logFC|>2)。对上调和下调前50的DEGs进行层次聚类,使用R软件的pheatmap软件包绘制每个数据集的热图。
1.3 OA 与正常滑膜组织DEGs 的生物学功能分析 GO 分析[9]包括细胞成分(CC)、生物学过程(BP)和分子功能(MF)。KEGG 是一个关于基因组、酶途径和生物化学物质的在线数据库[10]。 应用DAVID 在线生物信息学数据库(https://david.ncifcrf. gov/,版本6.8)进行基因本体功能及信号通道富集分析,以每个条目里基因数>10,P<0.05作为筛选条件。
1.4 OA与正常关节滑膜组织核心差异表达基因筛选 将DEGs 上传至STRING 在线分析平台(https://string-db. org/,版本 11.5[11])构建 PPI 网络,使用Cytoscape3.6.8 软件可视化PPI 网络。利用 MCODE 插 件 以 Degree Cut-off =2,Node Score Cutoff =0.2,K-Core =2,Max. Depth = 100 为筛选标准,得到网络中联系最紧密的模块,展示排名前3的模块,选取每个模块中得分最高的基因为核心差异表达基因[12]。
1.5 核心差异表达基因与免疫细胞浸润的相关性分析 通过CIBERSORT算法对NetworkAnalyst分析平台矫正、整合得到的四个数据集的芯片数据进行计算,得到22 种免疫细胞在每个样本中所占比例。使用vioplot 软件包绘制小提琴图。使用ggstatsplot软件包对筛选的核心差异表达基因水平与22 种免疫细胞百分比进行Spearman相关性分析。
2 结果
2.1 OA 与正常关节滑膜组织的DEGs 及其生物学功能 共筛选得到1 418 个OA 与正常滑膜组织的DEGs,其中上调 692 个,下调 726 个。GO 功能分析结果显示,DEGs 主要富集在酰胺结合、DNA 结合转录因子结合、糖胺聚糖结合、整合素结合、核受体结合等。KEGG 分析结果显示,DEGs 主要参与人类T细胞白血病病毒感染、TNF信号通路、类风湿性关节炎、癌症中的蛋白聚糖、爱泼斯坦-巴尔病毒感染等。
2.2 OA 与正常关节滑膜组织核心差异表达基因通过Cytoscape 软件构建了一个包含820 个节点、2 212 条边的 PPI 网络图。RPL37A、MYC 和细胞分裂周期蛋白20(CDC20)可能是OA 的核心差异表达基因。
2.3 OA和正常关节滑膜组织核心差异表达基因与免疫细胞浸润的相关性 与正常关节滑膜组织相比,OA 患者关节滑膜组织中记忆B细胞、浆细胞、辅助性T 细胞和静息肥大细胞所占比例较多,而静息记忆性CD4+T 细胞、嗜酸性粒细胞和活化肥大细胞所占比例较少(P 均<0.05)。核心差异表达基因与免疫细胞的相关性分析显示,RPL37A 与γδT 细胞、M2 巨噬细胞、单核细胞百分比呈正相关(r 分别为0.36、0.29、0.25,P 均<0.05),与初始 B 细胞、调节性 T 细胞、CD8+T 细胞、记忆 B 细胞、活化肥大细胞、静息树突状细胞百分比呈负相关(r 分别为-0.38、-0.40、-0.37、-0.32、-0.35、-0.25,P 均<0.05)。MYC 与静息记忆性T 细胞、嗜酸性粒细胞、活化树突状细胞、单核细胞、活化肥大细胞百分比呈正相关(r分别为0.52、0.37、0.35、0.34、0.29,P均<0.05),与记忆 B 细胞、调节性 T 细胞、CD8+T 细胞、静息树突状细胞、辅助性T 细胞百分比呈负相关(r 分别为-0.49、-0.48、-0.4、-0.27、-0.27,P 均<0.05)。CDC20 与 M2 巨噬细胞、静息肥大细胞、辅助性T 细胞百分比呈正相关(r 分别为0.59、0.30、0.25,P 均<0.05),与活化肥大细胞、嗜酸性粒细胞、初始B 细胞、活化树突状细胞、静息记忆性T 细胞百分比呈负相关(r 分别为-0.40、-0.35、-0.34、-0.26、-0.25,P均<0.05)。
3 讨论
OA 是常见的关节疾病,主要累及全身大关节,其中膝关节是最常见的累及部位,影响患者的日常生活,导致残疾[13]。但目前还没有可以有效预防或逆转关节损伤的治疗手段,终末期患者只能行关节置换。近年,越来越多的证据表明,OA 的早期到晚期始终伴随着滑膜炎症[14],且滑膜炎症会对邻近的骨和软骨造成损害,加重疾病进展[4,14]。此外,滑膜炎症中免疫细胞浸润在OA 的发生发展中也起着重要作用[15]。因此,探讨OA 与机体免疫之间的关系,有助于进一步明确OA发病机制。
本研究通过筛选得到四个基因芯片,使用NetworkAnalyst 分析平台整理、合并四个OA 关节滑膜组织基因表达芯片,随后得到1 418个DEGs,其中上调692个、下调726个。GO富集分析结果显示DEGs主要涉及酰胺结合、DNA 结合转录因子结合、糖胺聚糖结合、整合素结合、核受体结合等。KEGG 富集通路显示主要涉及人类T 细胞白血病病毒感染、TNF 信号通路、类风湿性关节炎、癌症中的蛋白聚糖、爱泼斯坦-巴尔病毒感染等相关通路。GO 富集分析表明,差异基因的功能与OA 的调控密切相关,糖胺聚糖的减低会导致软骨细胞的减少以及组织的降解,致使关节功能丧失[16],整合素作为软骨细胞表面受体,介导软骨细胞与细胞外基质的黏附,多种整合素及其配体是OA 疾病进展的生物标志物[17]。KEGG 富集分析表明,差异基因的相关通路除了与病毒感染性免疫反应相关外,在类风湿性关节炎、TNF 信号通路中基因富集较多,这些通路参与OA滑膜炎症因子渗出、免疫细胞浸润的过程[18]。TNF信号通路在OA 的发生机制中已被广泛研究,它可通过调控NF-κB 和MAPK 两条关键信号通路减少炎症因子的分泌,从而延缓OA的进展[19]。
本研究通过构建DEGs 的PPI 网络,利用MCODE 插件对PPI 进行分析,根据得分筛选出RPL37A、MYC、CDC20 为 OA 发展过程中的核心差异表达基因。RPL37A 是编码核糖体蛋白的基因[20]。本研究显示RPL37A 在正常人中高表达,与MI等[21]的分析结果一致。女性一直被认为是OA 发生的危险因素,YANG 等[22]的研究发现在女OA患者中 RPL37A 表达降低,确定了 RPL37A 是女性 OA 的核心基因。在斑马雀中,雌性表达RPL37A 的细胞总数低于雄性,并且随着年龄的增长,雌性体内RPL37A 反而下降,这一结果有可能解释为什么OA经常发生在老年女性[23]。MYC(也称为c-Myc)属于MYC 原癌基因家族,是一种转录因子,定位于8q24,用来调控细胞周期、生长、凋亡、分化、代谢等核心过程[24]。FISCH 等[25]研究确定了 MYC 可能是 OA 发病的核心基因。MYC 通过消除人体内和体外肾器官中的炎症和纤维化,从而降低炎症反应[26]。MAPK信号通路参与了人类OA 软骨细胞的凋亡和促炎症细胞因子的表达[27],其与MYC 密切相关。WU 等[28]研究证明,MYC 可以通过抑制MAPK 信号通路,抑制软骨细胞的凋亡,促进软骨细胞的增殖,来阻止OA 的进展,本研究与文献中结果一致,证实了MYC在OA 患者滑膜组织样本中表达降低,致使炎症发生。CDC20 通常被认为是致癌因子,主要通过活化APC 形成一种E3 泛素连接酶复合物APCCDC20,参与其下游底物的降解过程,来调节细胞周期、促进细胞凋亡等,与肿瘤的发生关系密切。本研究发现,CDC20 在OA 关节滑膜组织中高表达,提示CDC20可能在OA 发生中起重要作用,这在以往研究中未见报道。其原因可能是CDC20 与细胞周期密切相关,而细胞周期的异常调节与OA 的发展密切相关[29]。
慢性滑膜炎的免疫细胞浸润以巨噬细胞为标志。OA 患者滑膜中T 细胞和B 细胞的含量高于健康患者[3]。ROSSHIRT 等[15]研究表明,OA 出现免疫细胞浸润,包括CD4+T 细胞、CD8+T 细胞。为了进一步了解OA 滑膜炎症中免疫细胞浸润情况,我们使用CIBERSORT 算法进行了全面评估,CIBERSORT 是一个利用RNA-seq 数据评估免疫细胞表达的分析工具,可以用于深入了解正常和OA 关节滑膜组织中的免疫微环境。通过对比发现与正常关节滑膜组织相比,OA 患者关节滑膜组织中记忆B 细胞、浆细胞、辅助性T 细胞和静息肥大细胞比例较高,而静息记忆性CD4+T 细胞、嗜酸性粒细胞和活化肥大细胞比例较少,与GE 等[30]部分结果一致。当滑膜组织中静息肥大细胞的浸润比例增高时,可导致OA 患者的软骨结构发生损伤[31]。辅助性T 细胞会产生分解代谢细胞因子包括IL-2、IFN-γ、TNF-α,随着滑膜组织中浸润过多的辅助性T 细胞,其分泌的分解代谢细胞因子也会随之增加,导致OA的进展[32]。DE LANGE-BROKAAR 等[3]发现,浆细胞也可能影响着OA的进展。
我们进一步分析了核心差异表达基因与免疫细胞浸润的关系,发现RPL37A与γδT细胞、M2巨噬细胞、单核细胞呈正相关,与初始B 细胞、调节性T 细胞、CD8+T细胞、记忆B细胞、活化肥大细胞、静息树突状细胞呈负相关。MYC 与静息记忆性CD4+T 细胞、嗜酸性粒细胞、活化树突状细胞、单核细胞、活化肥大细胞所占比例呈正相关,与记忆B 细胞、调节性T 细胞、CD8+T 细胞、静息树突状细胞、滤泡辅助性T 细胞所占比例呈负相关。CDC20 与M2 巨噬细胞、静息肥大细胞、滤泡辅助性T 细胞呈正相关,活化肥大细胞、嗜酸性粒细胞、初始B 细胞、活化树突状细胞、静息记忆性CD4+T 细胞所占比例呈负相关。说明核心差异表达基因与免疫细胞的浸润关系密切。
综上所述,OA 关节滑膜组织DEGs 共1 418个,其中692 个上调、726 个下调,基因本体功能主要有酰胺结合、DNA 结合转录因子结合等,参与人类T 细胞白血病病毒感染、TNF 信号通路等;OA 的核心差异表达基因是RPL37A、MYC、CDC20;记忆B 细胞、浆细胞等可能参与OA 关节滑膜炎症的调控,RPL37A、MYC、CDC20 与免疫细胞浸润关系密切。本研究加深了对OA 关节滑膜炎症免疫分子机制的认识,可能为OA 早期诊断及治疗提供潜在标志物,然而,这些还需要临床以及进一步实验验证。