APP下载

HCV 相关肝硬化关键基因的交互分析

2023-06-02张立洁芦东徽张明金

医学信息 2023年11期
关键词:纤维化肝硬化肝脏

张立洁,彭 泉,芦东徽,张明金

(解放军第901 医院肿瘤中心1,普外科2,安徽 合肥 230031)

据世界卫生组织统计,全球范围内丙型肝炎病毒(hepatitis C virus,HCV)的感染率约为3%,其中有30%的患者可能在30 年内发展为肝硬化(HCVCirr),而HCV-Cirr 出现后,HCV 相关肝癌(HCVrelatedhepatocellularcarcinoma,HCV-HCC)的发生率会以每年4%~7%的速度上升,因此对HCV-Cirr 患者的早期诊断和治疗是非常重要的[1,2]。HCV 感染肝组织后,可导致宿主基因组的表达变化和基因的突变,从而影响细胞的信号转导、氧化应激、增殖凋亡等生物学过程,使得肝脏组织出现代谢失调、纤维化及异常增殖等病理现象。在HCV-Cirr 的发生、进展过程中会有多基因参与,其中一些基因的表达改变,会在疾病的进程中发挥决定性的作用。由于技术及研究成本的限制,既往难以进行大规模的基因表达分析,而随着测序技术、基因芯片技术和大数据分析技术的发展[3],对发现HCV-Cirr 关键基因和这些基因的调控机制提供了保障。本研究旨在通过生物信息学的方法,筛选出在HCV-Cirr 与正常肝脏组织之间存在差异表达的关键miRNA 和基因,为鉴定HCV-Cirr 发生、发展过程中的关键生物标志物和潜在的调控机制研究提供依据。

1 材料与方法

1.1 数据来源 从GEO 数据库查询包含正常肝脏组织和HCV 相关肝硬化组织的基因表达谱和miRNA表达谱原始数据集。为保证数据集的可信度,芯片表达数据需同时包含HCV-Cirr 样本和正常肝脏组织样本,总样本量≥20 且各分组需≥5。最终选择GSE14323 和GSE40744 数据集。GSE14323 基于GPL571 平台,包括41 个HCV 相关肝硬化组织样品,19 个正常肝脏组织样品。GSE40744 基于GPL14613 平台,包括18 个HCV 样品和7 个正常肝脏组织样本。

1.2 差异miRNA、差异基因分析 将数据集中的样本分为两组(HCV-Cirr 组vs.正常肝脏组织)进行差异表达分析,使用GEO 数据库自带GEO2R 分析软件,鉴定出在两组间存在差异表达的基因(DEGs)和miRNA(DEMs)。本研究中将探针与基因关系为一对多或多对一的情况予以删除,将FDR<0.01,绝对值>1.5 作为筛选DEMs 或DEGs 标准,并保留TXT 格式的结果用于后续分析。

1.3 候选基因的筛选 miRnet 数据库(https://www.mirnet.ca/miRNet/home.xhtml)可以提供miRNA 和其靶基因的查询,其数据来源于已被实验验证的miRNA 和下游靶基因关系对[4]。在本研究中,将GSE40744 数据集分析得到的DEMs 在miRnet 数据库中进行靶基因预测,预测采用以下标准:Organism:H.sapiens;Tissue:liver;Target:genes,将得到下游基因与GSE14323 数据集分析得到的DEGs 取交集,得到的基因作为候选基因进行进一步研究。

1.4 候选基因的富集分析 GO 分析用于注释基因,基因产物和潜在生物现象序列的共同方法;KEGG通路分析用于基因组序列和其他高通量数据的生物学解释的整合数据库资源。在本研究中,使用NetworkAnalyst 在线软件工具(https://www.networkanalyst.ca/)对候选基因进行GO 和KEGG 通路分析[5],其中GO 分析包括以下3 个方面:生物过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF),以P<0.01,基因count>2 为选择标准。

1.5 PPI 网络构建和模块分析 STRING 数据库(https://string-db.org/cgi/input.pl)作为目前应用最为广泛的蛋白质相互作用检索工具,包含了1100 多个物种的5200 多万蛋白质,可使用多种计算工具构建PPI 互作关系[6]。本研究中为进一步在候选基因中获得关键基因,使用STRING 在线数据库构建PPI 网络,并使用Cytoscape 软件(版本号3.6.1)将其进行可视化。而在PPI 网络中,具有更多分度的节点被认为是中枢基因,并被作为是具有重要生理调节作用的核心蛋白或关键蛋白,使用Cytoscape 软件中的CytoHubba 插件在PPI 网络中进一步筛选关键基因。

2 结果

2.1 DEM 和DEG 鉴定 按上述差异基因筛选标准,在GSE14323 中得到288 个DEGs,其中248 个表达上调,40 个表达下调;在GSE40744 中得到30 个DEMs,其中24 个表达上调,6 个表达下调,通过查询miRBase 数据库(http://www.mirbase.org/)获得DEMs 成熟体的官方名称。基于表达情况,构建差异分析的火山图,见图1。

图1 数据集中在两组间存在差异表达的基因

2.2 候选基因筛选 按照标准,共得到9 个DEMs(hsa-miR-192-5p,hsa-miR-193a-3p,hsa-miR-34a-5p,hsa-miR-212-3p,hsa-miR-21-5p,hsamiR-223-3p,hsa-miR-29b-3p,hsa-miR-155-5p,hsa-miR-31-5p)下游的3323 个靶基因,其中只有hsa-miR-192-5p 为表达下调的DEM,其余均为表达上调的DEMs。将预测的DEMs 的靶基因与差异分析得到的DEGs 做Venn 图,得到共有的66 个基因作为候选基因进行下一步分析,见图2。

图2 DEMs 的靶基因和DEGs 的韦恩图

2.3 富集分析结果 使用NetworkAnalyst 在线软件工具对上述得到的66 个候选基因进行富集分析,在GO-BP 中,候选基因主要富集在对各种因素刺激的反应、血管发育和形态结构的形成;在GO-CC 中,基因主要富集在细胞外区域、细胞表面、内质网腔和基底膜;在GO-MF 中,基因富集在脂质结合、G_蛋白偶联受体结合并参与结构分子活性和细胞因子活性。KEGG 通路分析显示候选基因主要参与了MAPK、TNF、IL-17、雌激素信号通路传导、粘着斑、动脉粥样硬化及糖类代谢等,见图3。

图3 候选基因富集分析

2.4 PPI 网络构建和枢纽基因鉴定 使用STRING进行PPI 网络构建,选择交互分数≥0.4,得到包含66 个节点,99 个分度的蛋白互作网络,去除单个基因和不在主网络的基因后采用Cytoscape 软件进行可视化处理,使用CytoHubba 插件基于分度进行核心基因选择,最终得到10 个的枢纽基因:MMP2、CCL2、JUN、COL1A1、CAV1、TIMP3、SPARC、COL4A2、FBN1、FOS,见图4。进一步分析发现,这10 个枢纽基因在HCV-Cirr 中均是表达上调基因,其中仅有CAV1、SPARC、FBN1、FOS 为HCV-Cirr中表达下调的hsa-miR-192-5p 的靶基因。通过对枢纽基因的GO 富集分析发现,这些基因主要参与细胞对有机物和内源性刺激的反应、分子功能的调节、胞外结构等,KEGG 通路分析显示枢纽基因参与糖尿病并发症中的AGE-RAGE 信号通路、流体剪切应力与动脉粥样硬化以及松弛素信号通路。

图4 PPI 网络和核心基因

3 讨论

慢性HCV 感染是HCC 发生的主要因素之一,在HCV 感染到HCC 发生的过程中,比较重要的一个阶段是HCV-Cirr 的形成。因此,研究HCV-Cirr的发生、发展的分子机制具有重要意义[7,8]。在本研究中,采用生物信息学交互分析的方法鉴定出HCV-Cirr 的候选生物标志物和潜在的治疗靶点,将分析得出的DEMs 在经实验验证的数据库中查询肝脏组织特异性的靶基因,并与分析得出的DEGs 取交集,得出66 个可能在HCV-Cirr 中发挥重要生物学作用的基因靶点。

GO 富集分析表明候选基因参与了对各类刺激的反应,细胞外结构的组成和相关受体的结合,这些基因可能在HCV 感染后,肝脏细胞在长期炎症刺激下发生细胞变性,结构改变到出现肝脏纤维化的过程中发挥重要的生理作用。KEGG 通路分析提示候选基因主要参与MAPK 信号通路和粘着斑通路,其中MAPK 信号在多种疾病中发挥重要作用,而在肝硬化的疾病进展中,该通路也发挥了重要作用。MAPK 通路不仅是肝纤维化形成的信号调节通路,而且也可能参与了细胞的自噬,这表明MAPK 通路还可作为抗纤维化治疗的潜在靶点[9]。在大鼠模型的研究表明,大鼠肝纤维化模型中,MAPK 通路激活,经阿魏酸或和厚朴酚治疗后,MAPK 通路相关基因表达下调,信号转导受到抑制,起到了抗肝脏纤维化的作用[9,10]。此外,MAPK 通路激活在肝癌的发生,发展中也有重要的生物学作用,其靶向药物有望作为肝癌治疗的新方向[11]。

通过构建PPI 网络,本研究确定了10 个枢纽基因,均为在HCV-Cirr 中表达上调的基因,分别为4个上调DEMs(hsa-miR-34a-5p,hsa-miR-21-5p,hsa-miR-29b-3p,hsa-miR-155-5p)和1 个下调DEMs(hsa-miR-192-5p)的靶基因。其中CAV1、SPARC、FBN1、FOS 为HCV-Cirr 中表达下调的hsamiR-192-5p 的下游基因,同时SPARC、FBN1 也是hsa-miR-29b-3p 的靶基因,FOS 也是hsa-miR-155-5p,hsa-miR-29b-和hsa-miR-34a-5p 的靶基因。CAV1 是质膜中小窝的结构蛋白,目前已被认为是肝脏功能的调节剂,CAV1 可以调节肝脏内的脂类和糖类代谢,参与了肝细胞的增殖过程与肝脏星状细胞的活化过程,与胆汁淤积,肝炎,肝硬化和肝癌的发生有关[12,13],而且有研究表明在表达CAV1 的肝硬化组织更容易发生肝癌,因此可以作为包括肝硬化和肝癌在内的多种肝脏疾病的生物标志物和治疗靶点[14]。SPARC 编码的蛋白参与了细胞外基质的合成并促进细胞形态的改变,与肿瘤细胞的侵袭转移相关。目前,SPARC 在肝硬化中研究较少,少量的研究表明SPARC 及其家族蛋白参与了肝脏细胞的脂肪变性和纤维化[15],动物实验还表明SPARC 可通过细胞外基质的沉积和由此产生的疤痕化在肝硬化的发病机理和进展中发挥作用[16]。基于本研究分析所得,SPARC 在HCV-Cirr 中的作用机制值得进一步研究。FBN1 可编码细胞外基质成分原纤维蛋白,这些蛋白可在人体的弹性及非弹性结缔组织中提供结构支撑作用,在人体和大鼠模型的研究中都表明了FBN1 在肝脏纤维化的过程中起到了促进作用[17,18],通过阻止FBN1 编码蛋白的活化,可以抑制肝脏纤维化,作为治疗肝硬化的潜在疗法[19]。FOS 基因家族由4 个成员组成:FOS、FOSB、FOSL1 和FOSL2。FOS 编码蛋白已被认为是细胞增殖,分化和转化的调节剂,某些情况下FOS 基因的表达也与细胞凋亡有关。但在肝硬化疾病中,FOS 基因的研究较少,有报道称FOS 可通过参与竞争性内源性RNA相互作用网络(ceRNA)在肝硬化的免疫反应中发挥调控作用[20]。此外,FOS 家族成员还参与了HCC的发生[21,22]。总之,本研究分析得出的核心基因在肝硬化中的作用与文献报道相符,但目前为止在HCV 相关肝硬化中的研究仍十分罕见,其与上游miRNA 之间的调控关系也鲜有报道[23],因此值得进一步深入研究。

肝脏组织受到HCV 感染,进而出现HCV-Cirr到最终发生HCV-HCC,其过程涉及基因组的表达失调,信号通路的激活或抑制以及多种生物学过程,整合的生物信息学分析有助于研究和理解其分子机制。通过交互分析,本研究确定了一些可能有助于预测HCV-Cirr 发生和发展的生物标志物,此外还确立了一些有望用于治疗HCV-Cirr 的信号通路和机制。枢纽基因与上游miRNA 之间的调节关联可能为HCV-Cirr 的诊断和治疗提供新的研究方向。但值得注意的是,基因在miRNA 调控下的表达受到多种因素影响,本研究也发现在HCV-Cirr 中表达上调的多个枢纽基因同时受到上调和下调DEMs 的调控,因此需要开展进一步的实验,将分析得出的miRNA 和基因在组织样本中进行表达检测,并随后确认它们在HCV-Cirr 诊断和分子治疗中的实用性。

猜你喜欢

纤维化肝硬化肝脏
七种行为伤肝脏
肝纤维化无创诊断研究进展
肝脏里的胆管癌
肝纤维化的中医药治疗
肝硬化病人日常生活中的自我管理
肝脏减负在于春
防治肝硬化中医有方
IL-17A促进肝部分切除后IL-6表达和肝脏再生
活血化瘀药在肝硬化病的临床应用
肾纤维化的研究进展