皮肌炎差异表达基因鉴定及治疗药物预测
2023-09-21郑超越张升校贺培凤程灵婧孙翔飞
郑超越, 张升校, 贺培凤, 于 琦, 程灵婧,冯 爽, 孔 腾, 孙翔飞
(山西医科大学, 1. 管理学院, 2. 第二临床医学院, 3. 人文社会科学学院, 山西 太原, 030001)
皮肌炎(DM)是一种自身免疫缺陷性疾病,主要损害患者的肌肉和皮肤,影响多个器官和系统,伴发肿瘤和其他结缔组织病的概率较高[1]。DM病因和发病机制尚未完全阐明,且相关并发症预后效果不佳,治疗也局限于激素和免疫抑制剂等传统方案[2], 因此寻找新的治疗方法显得尤为迫切。生物信息学作为一门新型学科,可与基因芯片或高通量测序技术相结合,其已成为发现各种疾病潜在生物标志物、重要通路和基因功能的有效方法。本研究基于生物信息学方法,通过对基因芯片的公共数据库(GEO)中符合筛选条件的芯片数据进行分析,探讨影响DM发生发展的潜在生物标志物,以此挖掘治疗DM的小分子化学药物和中药,为临床研究与预后及新药开发提供理论依据和思路。
1 资料与方法
1.1 数据集的获取
以"Dermatomyositis"作为关键搜索词,在GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中进行搜索,获取已公布的DM基因芯片信息,下载符合本研究标准的数据集,具体信息见表1。
表1 数据集基本信息
1.2 数据预处理及差异表达基因(DEGs)筛选
用R语言软件读取并下载原始数据集,通过oligo包进行数据处理及背景矫正,标准归一化后,使用sva包和limma包处理不同平台间的批次效应后合并3个肌肉组织数据集,采用limma包分别对肌肉组织和皮肤组织数据集进行分析,以|log2FC|≥0.58和调整后的P<0.05为存在差异,筛选出DEGs。
1.3 功能富集分析
利用富集分析工具DAVID(http: //david.ncifcrf.gov), 分别勾选基因本体(GO)分析的生物过程(BP)、细胞组分(CC)、分子功能(MF)以及京都基因与基因组百科全书(KEGG)分析的Pathway, 使用R语言软件包可视化分析结果,明确差异基因参与的 GO 功能富集和KEGG 通路富集情况。
1.4 蛋白质相互作用网络(PPI)与关键基因分析
将目标导入STRING在线工具(http: string-db.org/)获得蛋白互相作用的网络,同时导出combined score>0.7的文档信息文件到Cytoscape软件中进行可视化。此外,使用插件MCODE执行PPI网络,聚类功能按score进行排序,识别出最重要的模块; 使用CytoHubba插件,根据Degree算法进一步筛选核心基因。
1.5 核心基因受试者工作特征(ROC)曲线分析
使用OECloud(https: //cloud.oebiotech.cn)工具上的ROC曲线分析曲线功能,对10个核心基因进行分析,以此来验证核心基因的可靠性。
1.6 免疫浸润分析及核心基因与免疫浸润细胞的相关性分析
对2个不同组织数据集样本分别进行了免疫细胞浸润分析, CIBERSORT R软件包和LM22文件被用来在本地运行算法,过滤掉P>0.05的样本,得到免疫细胞浸润矩阵,按照不同组织中免疫细胞占比中位数进行排序。R语言中ggplot2包用于绘制22种免疫浸润细胞的箱线图,并可视化免疫细胞浸润的差异。使用Spearman相关性分析研究10个核心基因表达量与22种免疫浸润细胞丰度之间的相关性,并绘制相关性热图。
1.7 小分子化学药物预测
DREIMT是一种新的假设生成网络工具,用于对免疫调节进行药物优先级分析。使用DREIMT在线分析工具(http://www.dreimt.org),输入差异基因进行小分子药物预测。
1.8 核心基因中草药筛选
Coremine Medical(https://coremine.com/medical/)数据库是基于本体的国际医学信息检索平台,可以通过输入基因名检索出与该基因相关的疾病及潜在治疗药物。在Coremine Medical数据库中导入10个核心基因名称及dermatomyositis, 下载traditional Chinese medicine模块中的数据,得到可用于DM治疗的中药。
2 结 果
2.1 DEGs分析
使用limma包识别了数据集中疾病和对照之间的DEGs。结果发现,与健康者相比,DM肌肉组织中有552个基因存在差异表达,其中402个基因表达上调,150个基因表达下调; 皮肤组织中有970个差异基因,其中686个基因表达上调, 284个基因表达下调。此外,共确定了170个交集DEGs,去除6个上调、下调不一致的基因,剩余164个DEGs成为分析目标,见图1。
A: 肌肉组织差异基因火山图(蓝色、灰色、红色分别表示下调、无差异、上调);B: 肌肉组织差异基因热图(红色代表DEGs高表达,蓝色代表DEGs低表达); C: 皮肤组织差异基因火山图;D: 皮肤组织差异基因热图; E: 2组差异基因交集Venn图。
2.2 DEGs的GO富集分析结果
DEGs的GO注释获得了BP、CC、MF共3个部分的结果。提取BP、CC、MF富集数目分别前5位的条目,由BP分析可知富集基因数较多的条目为固有免疫应答、对病毒的防御反应、信号转导、对病毒的反应和免疫应答; 由CC分析可知富集基因数较多的条目为细胞质、细胞质膜、细胞质溶胶、胞外区和细胞外间隙等; 由MF分析可知,大量基因主要富集在蛋白质结合、相同蛋白结合、蛋白质同源二聚活性、受体结合和双链RNA结合,见图2。
图2 BP、CC、MF差异基因富集数目分别前5位的条目
2.3 DEGs的KEGG富集分析结果
KEGG信号通路富集分析结果显示, DEGs主要涉及的信号通路有: 新型冠状疾病病毒、甲型流感、Epstein-Barr病毒感染、麻疹、丙型肝炎、Kaposi肉瘤相关疱疹病毒感染、NOD样受体等,见图3。
图3 差异基因KEGG信号通路富集结果图
2.4 差异基因编码蛋白的相互作用网络
目标基因通过STRING在线数据库构建了一个包含164个节点和1 014条边的PPI网络(图4A), 将关于PPI网络的tsv格式的数据文件导入Cytoscape软件(图4B), 通过MCODE插件识别出最重要的模块,该模块包含32个上调基因(图4C); CytoHubba插件通过Degree算法筛选出前10位基因作为关键基因(图4D), 按照连接度由高到低分别为:STAT1、MX1、IFIT3、OAS2、IFI35、RSAD2、IFIT1、OAS1、ISG15、IRF7。
A: 交集DEGs在STRING中的PPI图; B: 交集DEGs在Cytoscape中的PPI图;C: 重要模块核心子网络图; D: 10个核心基因网络图。
2.5 核心靶基因ROC分析结果
ROC的曲线下面积(AUC)在0~1, 数值越大说明该模型的性能越好,是目前认为评估预测分布模型准确性的标准方法。本研究通过绘制ROC曲线图,评估10个核心基因作为DM疾病预测靶点的准确性,其中STAT1(AUC=0.88)、RSAD2(AUC=0.87)、OAS2(AUC=0.87)、OAS1(AUC=0.75)、MX1(AUC=0.83)、ISG15(AUC=0.92)、IRF7(AUC=0.87)、IFIT3(AUC=0.81)、IFIT1(AUC=0.89)、IFI35(AUC=0.91)的AUC基本在0.8以上,进一步证明上述核心基因作为靶点基因的可靠性。
2.6 免疫浸润及与核心基因相关性分析结果
免疫浸润结果显示,与正常肌肉组织相比,血浆细胞浸润在DM疾病肌肉组织中占主导地位,且差异有统计学意义(P<0.05)(图5A); 肌肉组织中10个核心基因与血浆细胞、M1巨噬细胞和M2巨噬细胞的免疫浸润水平呈正相关(P<0.05), 与调节性T细胞以及单核细胞的免疫浸润水平呈负相关(P<0.05)(图5B)。与正常皮肤组织相比, M2巨噬细胞浸润在DM疾病皮肤组织中大量渗透,差异有统计学意义(P<0.05)(图6A),皮肤组织中10个核心基因与M1巨噬细胞、M2巨噬细胞和记忆性活化CD4+T细胞的免疫浸润水平呈正相关,与静息肥大细胞、调节性T细胞以及静息性树突状细胞的免疫浸润水平呈负相关(P<0.05)(图6B)。
A: 免疫浸润细胞结果图; B: 核心基因与免疫细胞之间含量的相关性热图。
A: 免疫浸润细胞结果图; B: 核心基因与免疫细胞之间含量的相关性热图。
2.7 DREIMT小分子药物预测结果
根据药物优先级评分(|tau|)选择排名前10位的潜在小分子药物,见表2。将药物名字分别输入到DrugBank数据库(https://go.drugbank.com)中进行检索,获得10个潜在小分子药物的相关信息,为之后的实验验证提供了理论依据。
表2 排名前10位的潜在小分子药物
2.8 中草药筛选结果
借助Coremine Medical数据库,获得核心基因可用于治疗DM的中草药分别为丹参、三七叶、三七花、茶树根、三七、原蚕蛾、蚕沙、厚朴花和厚朴共9种,见表3。
表3 靶基因用于治疗DM的中草药信息
3 讨 论
DM是一种慢性自身免疫性疾病,主要发生在骨骼肌和皮肤[2], 常常快速进展成肺间质病变[3]。本研究通过分析DM芯片数据集,得到与病理过程密切相关的致病基因,旨在探索可能治疗DM的潜在化学药物和中草药,为后续疾病的治疗提供新思路。本研究通过对肌肉和皮肤组织数据集进行DEGs筛选,对2组DEGs的交集基因进行了GO和KEGG富集分析。相关研究[4]提出,新冠肺炎相关肌炎可能是DM的假设,主要是因为COVID-19中的器官损伤部分归因于Ⅰ型干扰素(IFN-I), 而现在已知干扰素在DM的肌纤维损伤中起着重要作用,特别是IFN-I与DM等自身免疫性疾病的发病机制相关。KEGG主要富集在病毒性通路上,除上面提到的新型冠状病毒以外,还有甲型流感、Epstein-Bar病毒(EBV)感染、麻疹、丙型肝炎、卡波西肉瘤-相关疱疹病毒感染,病毒感染可影响DM患者巨噬细胞的分化,从而影响M1与M2巨噬细胞的平衡,导致病情恶化[5]。个体免疫细胞功能和分化异常以及体液免疫发生改变,会引起细胞因子和化学分子不适当产生,引发炎症反应,导致骨骼肌肉损伤以及其他系统受累[6], 这与本研究DEGs的GO富集结果一致。
免疫浸润分析在DM的研究中一直发挥重要作用。本研究免疫细胞浸润结果显示,在肌肉组织中,浆细胞和T细胞被认为高度表达。研究[7]证明,浆细胞可能与肌肉炎症有关,但不能证明浆细胞紊乱直接与DM的发病机制有关; 在皮肤组织中,巨噬细胞占炎症浸润的大部分,研究[8]表明, M2巨噬细胞的高表达能够抑制免疫反应,巨噬细胞分泌的细胞因子可能与DM有关,因此巨噬细胞紊乱可能是DM的另一个致病机制。
通过STRING和Cytoscape筛选出来的前10位核心基因依次为STAT1、MX1、IFIT3、OAS2、IFI35、RSAD2、IFIT1、OAS1、ISG15、IRF7。STAT1是STAT蛋白家族的成员,具有信号转导和转录激活的双重功能,许多参与自身免疫和炎症疾病发病机制的细胞因子使用STAT来转导细胞内信号。STAT1是由干扰素-γ(IFN-γ)激活的转录因子。研究[9]证明, STAT1在DM中的萎缩性肌纤维中高度表达。MX1属于IFN诱导的GTP结合蛋白,对各种RNA病毒和一些DNA病毒具有抗病毒活性,在诱导的抗病毒效应因子中,一些MX蛋白成为抵御甲型流感病毒的关键组成部分[10], 这与本研究中DEGs富集的KEGG通路内容高度一致。IFIT3作为一种新型的抗病毒基因[11], 是细胞和病毒过程、细胞迁移、增殖、信号传导和病毒复制的抑制剂,是IFN-I系统的代表基因之一; IFIT1也是一种抗病毒蛋白,与IFIT3一样,二者在生物过程中都参与免疫、对病毒的防御反应[12], 表现在疾病上,则是参与DM的免疫反应。OAS2和OAS1同属于OAS家族,是由IFN诱导的双链RNA激活酶,在细胞先天抗病毒反应中起着关键作用[13], 已有研究[14]分析数据表明,所有OAS基因都在青少年DM肌肉活检中显著上调;OAS基因可能在其他细胞过程中发挥作用,如生长、分化、凋亡及基因调节,狼疮(CLE)和DM的皮肤病变中发生了过度的角质细胞凋亡,这也证实了这一点[15]。IFI35主要参与并调节先天免疫系统的响应,抑制内皮细胞增殖和迁移[16]。IFN诱导基因可能与DM的发病机制有关[17-18], 而IFI35作为一种IFN诱导的蛋白质,应当予以重视。RSAD2是一种IFN诱导抗病毒蛋白,在Ⅰ型和Ⅱ型IFN诱导的细胞抗病毒状态中起着重要作用[19], 能够抑制广泛的DNA和RNA病毒,包括KEGG通路中的甲型流感、丙型肝炎等病毒。RSAD2已被发现与各种自身免疫性疾病有关,如类风湿关节炎、系统性红斑狼疮、强直性脊柱炎等[20]。研究[21]证明, ISG15共轭物存在于自身免疫性人类疾病组织样本中。ISG15可以诱导自然杀伤细胞增殖,充当中性粒细胞的趋化因子,并作为IFN-γ诱导的细胞因子,在抗菌免疫中发挥重要作用[22]。研究[23]指出, IFN刺激基因15(ISG15)、IFN调节基因7(IRF7)的mRNA表达显著上调,并且发现成人发病临床肌病性皮肌炎(CADM)患者的外周血中过度产生IFN-α蛋白。IRF7是IFN-I依赖性免疫反应的关键转录调节剂,在对DNA和RNA病毒的先天免疫反应中也起着关键作用。在一项青少年DM的研究[24]中,高表达基因为ISG15(408倍)、IFIT3(261倍)、MX1(99倍)和IRF7(37倍)。
治疗DM的药物主要局限在糖皮质激素、硫唑嘌呤、霉酚酸酯、环磷酰胺、静脉免疫球蛋白等,还有一些老药新用的药物,如环孢素A、他克莫司等[25], 但患者预后普遍不佳。本研究通过分析DEGs, 获得10个得分较高的小分子药物,分别为苄达明(benzydamine)、脱氧皮质酮(desoxycorticosterone)、甲砜霉素(thiamphenicol)、胡椒碱(piperine)、二氟拉松(diflorasone)、骨化三醇(calcitriol)、阿利维A酸(alitretinoin)、阿尔维林(alverine)、维A酸(tretinoin)、氟尼缩松(flunisolide), 这些药物在治疗DM方面具有丰富的潜力,可以在未来的实验中加以验证。
邓韵珊等[26]通过统计使用频次得出治疗DM的中药主要有黄芪、当归、白术、丹参、薏苡仁、茯苓、党参、赤芍、牛膝、山药、牡丹皮、甘草、生地黄、金银花、红花、熟地黄、鸡血藤、连翘、苍术、黄柏等药物。本研究通过对疾病和核心基因的探索,除丹参以外,还分析出三七叶、三七花、三七、茶树根、原蚕蛾、蚕沙、厚朴花、厚朴存在治疗DM的可能性,为今后中医治疗DM提供了临床用药思路。