APP下载

重症COVID-19肺炎肺纤维化关键基因的筛选

2023-11-03夏碧李蒙蒙陆军

临床肺科杂志 2023年11期
关键词:肺纤维化纤维细胞关键

夏碧 李蒙蒙 陆军

重症COVID-19肺炎康复患者中,肺纤维化的发展是一个主要问题。对COVID-19肺炎患者的尸检研究表明,COVID-19肺炎患者死亡的主要原因是不同阶段弥漫性肺泡损伤(diffuse alveolar damage,DAD)引起的呼吸衰竭。据报道,在重症COVID-19肺炎幸存者中,20%非机械通气患者和72%机械通气患者在住院4个月后出现纤维样影像学异常[1]。目前,对于重症COVID-19肺炎肺纤维化,尚不清楚其分子机制且无确切的治疗手段[2]。近年来,生物信息学技术和微阵列技术的发展,为生物学机制的研究提供了便利。本文从GEO数据库中下载了编号为GSE206788的基因表达数据,使用R语言软件筛选出重症COVID-19肺炎肺纤维化组与正常对照组的差异表达基因(differentially expressed genes,DEGs),进一步筛选出关键基因,并通过关键基因预测可能的治疗中药,同时对DEGs进行GO和KEGG富集分析,旨在探究重症COVID-19肺炎肺纤维化的关键基因及可能机制,为临床治疗提供新的靶点。

资料与方法

一、数据获取

在GEO公共数据库(https://www.ncbi.nlm.nih.gov/geo/)检索并获取重症COVID-19肺炎患者肺纤维化的基因表达矩阵(GSE206788),其中包含19个样本,12个重症COVID-19肺炎肺纤维化组,7个正常对照组。基因表达的检测平台为GPL32385(Nano Stringn Counter human fibrosis panel)。

二、差异基因获取

使用R语言软件中的limma包筛选出重症COVID-19肺炎肺纤维化组与正常对照组的DEGs,筛选条件为P值<0.05 和|log2FC|>1。

三、差异基因功能富集分析

用生物学信息注释及可视化数据库(database for annotation,visualization and integrated discovery,DAVID)(https://david.ncifcrf.go/)对DEGs进行GO功能注释和KEGG富集分析。其中,GO功能注释包括生物学过程(biological process,bp)、细胞组成(cell composition,cc)和分子功能(molecular function,mf)[3];KEGG富集分析会将DEGs富集在特定的通路[4]。

四、蛋白互作网络构建与关键基因的筛选

将差异基因列表上传至数据库检索工具(search tool for the retrieval of interacting genes,STRING)平台进行蛋白质-蛋白质相互作用(protein-protein interaction,PPI)分析,筛选置信度>0.9的互作蛋白基因,通过 Cytoscape软件(https://cytoscape.org/)的CytoHubba 插件中的5种算法(MCC、Degree、Closeness、Betweenness和Radiality)共同筛选出关键基因。

五、关键基因中药预测

将关键基因输入 Coremine Medical 数据库(http://www.coremine.com/)中,下载每个基因对应的中药信息,通过每个基因对应的中药取交集,获取与关键基因相关性最高的中药列表。

结 果

一、差异分析结果

下载GEO数据库GSE206788的表达矩阵及平台文件GPL32385,在Excel中提取表达谱数据,使用VLOOKUP函数将ID转换成Gene symbol,将数据分为两组:重症COVID-19肺炎肺纤维化组与正常对照组,重症COVID-19肺炎肺纤维化组12个样本,正常对照组7个样本。通过R语言的limma将两组数据进行差异分析,按条件|log2FC|>1且P值<0.05筛选出249个DEGs,其中有125个上调基因,124个下调基因(见图1)。

图1 DEGs火山图注:蓝色为下调基因,红色为上调基因

二、差异基因功能富集分析

使用DAVID网站进行基因聚类分析,GO功能注释结果显示,DEGs富集的生物学过程包括信号转导(signal transduction)、免疫应答(immune response)、炎症反应(inflammatory response)等,在细胞组成中,主要富集于质膜(plasma membrane)、细胞溶质(cytosol)、细胞外区域(extracellular region)、细胞外空间(extracellular space)等,分子功能包括蛋白质结合(protein binding)等(见图2 )。KEGG通路分析结果显示,DEGs主要富集于癌症通路、PI3K/Akt信号通路、MAPK信号通路等(见图3)。

图3 DEGs的KEGG分析

三、蛋白互作网络构建与关键基因的筛选

采用STRING平台对已获取的249个DEGs进行蛋白互作网络的构建,去除网络中游离的蛋白质,通过Cytoscape软件(https://cytoscape.org/)的CytoHubba 插件分别使用MCC、Degree、Closeness、Betweenness、Radiality方法筛选前30个基因(见表1),并取交集获得10个关键基因:IL-10、IRF4、JUN、PTK2、TNF、KDR、CXCL8、SMAD3、NOTCH1、RPS27A(见图4),其中IL-10、IRF4、CXCL8为下调基因,JUN、PTK2、TNF、KDR、SMAD3、NOTCH1、RPS27A为上调基因。

表1 5种算法筛选的前30个基因

图4 5种算法取交集获得10个关键基因

四、中药预测结果

将关键基因输入 Coremine Medical 数据库中,下载相关的中药信息(见表2),其中去除PTK2、RPS27A后剩余关键基因在平台预测得到黄芩、黄芪、茶树根,通过关键基因关联中药数据取交集,同时与其中七个及以上基因关联的中药有丹参、人参、人参花、人参叶、人参芦、灵芝、黄芩、黄芪、茶树根等多味中药。

表2 关键基因的中药预测

讨 论

肺纤维化是COVID-19患者的长期并发症之一,新冠病毒主要通过鼻腔的上皮细胞传播到呼吸系统,感染肺部Ⅱ型肺泡细胞,引起DAD,进一步发展导致成纤维细胞增殖和上皮间充质转化(epithelial-mesenchymal transition,EMT),随后肌成纤维细胞灶形成、细胞外基质(extracellular matrix,ECM)积累,最终导致肺纤维化的形成。诊断肺纤维化后的中位生存期仅为2~3年,抗纤维化药物如尼达尼布和吡非尼酮正处于临床试验阶段,肺移植可能是最终的治疗手段[5-8]。本研究共筛选出249个DEGs,其中125个为上调基因,124个为下调基因。通过5种算法取交集筛选出10个关键基因:IL-10、IRF4、JUN、PTK2、TNF、KDR、CXCL8、SMAD3、NOTCH1、RPS27A。

IL-10基因编码的蛋白质是一种细胞因子,主要由单核细胞产生,少量由淋巴细胞产生。具有抗炎及抗纤维化作用。转化生长因子-β(transforming growth factor-β,TGF-β)是纤维化发展的主要介质,可增强成纤维细胞趋化和增殖、诱导成纤维细胞合成胶原蛋白、抑制ECM降解[9-10]。TGF-β有3种亚型:TGF-β1、TGF-β2、TGF-β3,虽然这些亚型的生物学功能是一体的,但TGF-β1在肺纤维化中起主要作用。IL-10主要通过抑制肺泡巨噬细胞TGF-β1的产生从而抑制肺纤维化[11]。PTK2基因编码一种细胞质蛋白酪氨酸激酶2(PTK2),PTK2主要通过整合素β1介导成纤维细胞迁移,在肺纤维化中起重要作用[12]。肿瘤坏死因子(TNF)是一种多效细胞因子,有跨膜和可溶性两种形式,可溶性形态在TGF-β1表达和纤维化病变形成中起作用,研究证实,TNF-α与COVID-19肺炎后肺纤维化存在显著相关[13]。血管内皮生长因子(vascular endothelial growth factor,VEGF)主要有两种受体,即 VEGFR1(Fms-like tyrosine kinase-1,Flt-1)和VEGFR2(Fetal liver Kinase-1/Kinase Domain-containing Receptor,Flk-1/KDR),KDR基因编码VEGRF2,VEGF/VEGFR2通路在肺间质纤维化异常血管形成过程中起主要作用[14]。SMAD3是TGF-β的下游受体调节型蛋白,激活后可促进成纤维细胞转化为肌成纤维细胞,增强ECM的沉积,诱发肺组织纤维化样改变[15]。周细胞-肌成纤维细胞转变(pericyte-myofibroblast transition,PMT)的特征是周细胞从内皮细胞分离,迁移到间质空间并转变为肌成纤维细胞,研究表明,NOTCH1通过PDGFRβ/ROCK1信号通路促进周细胞的增殖并向肌成纤维细胞分化从而促进肺纤维化[16]。

KEGG结果显示,DEGs主要在癌症、PI3K/Akt、MAPK等通路富集。在临床上,患者同时患有肺纤维化和肺癌是很常见的,两者存在一些共同的生物学途径,如PI3K/Akt信号通路等[17]。PI3K/Akt信号通路是调控细胞生长、增殖、运动、代谢和生存的核心信号通路之一。PI3K可分为3类,Ⅰ类PI3Ks是由p110催化亚基和P85调节亚基形成的异源二聚体,存在四种亚型,包括ⅠA类(PI3Ka, PI3Kb和PI3Kd)和ⅠB类(PI3Kg)。这四种亚型均可在人肺成纤维细胞中表达,其中PI3Ka常在肺相关疾病中上调或突变,PI3Kg常在特发性肺纤维化肺匀浆和成纤维细胞中过表达,而Ⅲ类PI3Ks参与自噬体膜的形成,可能影响肺纤维化。Akt有3种亚型:Akt1, Akt2和Akt3,可被上游PI3K激活。由于Akt3主要在脑组织中表达,有关肺纤维化的研究主要集中在Akt1和Akt2亚型上。Akt1介导的线粒体自噬有助于肺泡巨噬细胞凋亡抵抗,这对于肺纤维化的发展是必需的,而Akt2缺失的小鼠对博莱霉素诱导的肺纤维化和炎症具有保护作用,说明PI3K/Akt信号通路在肺纤维化发展过程中发挥重要作用[18]。MAPK广泛分布于哺乳动物细胞中,该通路在炎症、纤维化、肿瘤等一系列疾病中发挥重要作用。MAPK信号通路与多种主要器官的纤维化有关,如心肌纤维化、肾纤维化、肺纤维化等。研究发现,该通路可能通过介导TGF-β诱导的EMT发挥促纤维化作用[19]。

以关键基因预测得到黄芩、黄芪、茶树根、人参、灵芝、丹参等具有潜在疗效的中药,目前,人参皂苷元AD-1、黄芪-丹参药对、丹芍化纤胶囊(由丹参、赤芍、黄芪、银杏叶等组成)等在肺纤维化动物模型中均被证实有确切的抗纤维化疗效[20-22]。

综上所述,本研究筛选出了重症COVID-19肺炎肺纤维化相关的关键基因及预测了潜在的治疗性中药,为临床治疗的研究提供了参考,但仍需进一步实验来验证关键基因及相关中药的治疗作用。

猜你喜欢

肺纤维化纤维细胞关键
我国研究人员探索肺纤维化治疗新策略
硝酸甘油,用对是关键
遗传性T淋巴细胞免疫缺陷在百草枯所致肺纤维化中的作用
Tiger17促进口腔黏膜成纤维细胞的增殖和迁移
高考考好是关键
滇南小耳猪胆道成纤维细胞的培养鉴定
特发性肺纤维化合并肺癌
胃癌组织中成纤维细胞生长因子19和成纤维细胞生长因子受体4的表达及临床意义
沙利度胺治疗肺纤维化新进展
两种制备大鼠胚胎成纤维细胞的方法比较