APP下载

基于生物信息学分析鉴定子宫内膜异位症关键枢纽基因和信号通路

2022-05-05刘玉娟郭思璇刘珈宸万佳吴春玲

江西医药 2022年1期
关键词:差异基因异位症枢纽

刘玉娟,郭思璇,刘珈宸,万佳,吴春玲

(1.南昌市第一医院,南昌 330006;2.南昌大学医学院,南昌 330031;3.景德镇市妇幼保健院妇产科,景德镇 333099)

子宫内膜异位症(endometriosis,EMs简称:内异症)是具有生长功能的子宫内膜组织(腺体和间质)出现在子宫腔被覆内膜及子宫肌层以外的部位[1]。EMs是育龄期妇女常见病、多发病,在人群中的发病率10%~15%,近年呈上升趋势,被称为“现代病”;该病虽为良性疾病,却有侵袭、转移、复发等恶性表现,常引起痛经、不孕、慢性盆腔疼痛等,严重危害广大女性的健康和生活质量,甚至被称为“良性癌”[2]。目前子宫内膜异位症的金标准治疗方案是手术切除和激素抑制卵巢功能,然而由于其有不同的副作用,且复发率高,因此,寻找致病的关键基因及可能影响EMs发生、发展的潜在的机制显得尤为重要。

EMs的发病机制复杂,其确切的发病机制至今尚不清楚。目前仍以“经血逆流种植”学说为主导,经血逆流发生在76%~90%的人群,但只有10%的人发生EMs。因此,有学者提出了“在位内膜决定论”[2],即不同人(EMs和非EMs患者)经血逆流的自内膜碎片能否在异地“黏附—侵袭—血管生成”,在位内膜是关键。鉴于异位症的在位内膜的重要地位,本研究利用生物信息学技术,从开放的基因表达综合数据库GEO(Gene Expression Omnibus)中获取子宫内膜异位症在位内膜和正常人群的子宫内膜的全基因组表达芯片,通过挖掘参与内异症发生发展的关键枢纽基因和信号通路,为寻找子宫内膜异位症发病机制提供新思路,并为临床诊疗提供新的标志物和靶点。

1 材料及方法

1.1 数据的获得 在GEO数据库(https://www.ncbi.nil.nih.gov/geo/)中,通过搜索关键词“endometriosis”,获得EMs的数据。纳入标准:(1)来源于人类组织(Homo sapiens);(2)样本包含EMs的在位内膜及正常人群的子宫内膜芯片;(3)数据集的所有样品来源于Affymetrix人类基因组U133阵列芯片;(4)来自全基因组RNA表达芯片。排除标准:(1)排除子宫腺肌病;(2)来源于细胞系的标本;(3)基于非编码RNA的研究。

1.2 差异表达基因(Differentially Expressed Genes,DEGs)的鉴定 从GEO数据库筛选出的符合标准的数据集后,对数据集中病人信息进行逐一核对,并对病例组和正常对照组进行标注。使用GEO自带的差异分析工具GEO 2R,分析每个数据集的差异表达基因。采用t检验,以P<0.05作为差异基因的入选标准,将3组数据集获得的差异基因进行比较后,剔除表达趋势不同的差异基因,得到共同的差异基因。选取表达趋势相同的差异基因作为本文后续进行分析的差异基因。利用R软件中heatmap包绘制了DEGs的热图。

1.3 蛋白—蛋白相互作用网络 (protein-protein Interaction network,PPI)的构建与模块分析 利用STRING(Search Tool for the Retrieval of Interaction Genes/Proteins)数据库(https://string-db.org/),设定标准截值:置信度>0.4,构建差异基因编码的蛋白间相互作用(PPI)网络,以获得深入理解和预测已鉴定的基因的细胞功能和生物行为。此外,利用Cytoscape软件对PPI网络进行了可视化[3]。

1.4 枢纽基因和关键模块的选择 使用CentiScaPe 2.1计算PPI网络的各节点的点度中心性,根据节点的点度中心性的大小,确定了枢纽基因。节点的程度是节点上发生的平均(交互)数[4]。利用Cytoscape(version 3.6.1)中的分子复合检测(Molecular Complex Detection,MCODE)插件对Cytoscape中PPI网络的模块进行筛选,取截断度=2,节点得分截断值=0.2,k-core=2,深度=100的标准下,得到一个MCODE_Score=10的PPI网络最核心模块。

1.5 将核心模块基因进行KEGG通路分析KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)是一个可以系统性地分析基因功能的数据库,可以揭示差异表达基因的主要的代谢和信号通路。使用基于网络的基因分析工具WEB-based GEne SeT AnaLysis Toolkit(http://www.webgestalt.org),对核心模块中的DEGs进行KEGG富集分析,P<0.05为差异有统计学意义。

2 结果

2.1 数据筛选 GEO数据集中共3个微阵列数据集符合标准。3个数据集分别是GSE25628、GSE 7305和GSE6364。子宫内膜异位症患者的在位内膜定义为病例组,非子宫内膜异位症的在位内膜定义为正常对照组。GSE25628包含9个病例和6个正常样本,GSE7305包含10个病例和10个正常样本,GSE6364包含21个病例和16个正常样本。一共40个病例和32个正常样本,见表1。

表1 所纳入的数据集及样本信息

2.2 差异表达基因的鉴别 通过对GSE6364数据集进行差异分析,得到3901个差异表达基因,其中有1194个基因下调,2707个基因上调(图1-A);GSE7305数据集有12659个差异表达基因,其中有7156个基因下调,5503个基因上调(图1-B);GSE25628数据有6541个差异表达基因,其中有2693个基因下调,3848个基因上调(图1-C)。将三个数据集的差异表达基因进行求交集,共得到1010个共有的差异表达基因(图1-D),剔除表达趋势不同的差异基因,最后有279个稳定的差异表达基因,其中171个基因稳定上调,108个基因稳定下调,见表2。

图1 GEO中三个数据集的差异基因鉴别及共同的差异基因

表2 上调和下调的差异表达基因

2.3 PPI网络的构建与模块分析 利用STRING分析DEGs的PPI网络,结果如图2-A。利用Cytoscape的MCODE插件获得了最显著的一个模块,包括10个枢纽基因,其中SART1、PQBP1和CTNNBL1表达上调,SNRPE、HNRNPA1、WDR33、PAPOLA、PCF11、DDX5和PABPN1表达下调(图2-B)。

图2 DEGs的PPI网络及核心模块

2.4 对枢纽基因进行KEGG通路富集分析KEGG通路分析显示,枢纽基因主要富集于剪接体通路,mRNA监测途径,癌症相关通路中的转录调控失调和蛋白聚糖通路,见图3。

图3 枢纽基因KEGG通路富集分析

3 讨论

子宫内膜异位症发病机制不清,虽然是一种良性病,但在生物学上又有着类似肿瘤的特性—侵袭、转移、复发,是一种“良性癌”[5]。大量证据表明,子宫内膜异位症患者的子宫内膜具有别于正常子宫内膜的特性,在“黏附—侵袭—血管生成”方面均较正常子宫内膜强的生物活性,因此,又有了“在位内膜决定论”[2,6-7]。近年来随着生物信息学的迅速发展,对揭示疾病的分子机制具有重要意义。其中基因芯片技术,又名微阵列技术(DNA array),是一项随着“人类基因组计划”实施而逐渐发展起来的新型技术,目前已被用于高效、大规模的生物信息的采集,广泛地收集疾病的表达谱数据,广泛应用于疾病的基因诊断与治疗、药物筛选和药物开发等。

本研究通过生物信息学技术,从开放的公共数据库GEO中,筛查并比较了异位症患者的在位内膜和非内异症在位内膜基因表达谱的差异,筛查出279个稳定的差异表达基因,包括171个稳定上调基因,108个稳定下调基因。这提示EMs的在位内膜与非EMs患者自身就携带某种致病基因,使得其更容易发生子宫内膜异位症,从而在源头上揭示内异症患者在位内膜的“种子”效应。为了进一步明确差异表达基因功能,对279个差异表达基因进行PPI网络的构建与模块分析,得到功能最强的模块,其包含10个枢纽基因,其中SART1、PQBP1和CTNNBL1表达上调,SNRPE、HNRNPA1、WDR33、PAPOLA、PCF11、DDX5和PABPN1表 达下调。这些枢纽基因可能为EMs的关键致病基因,可为疾病的诊断及靶基因治疗提供了新的靶点。

对枢纽基因进行KEGG通路富集分析提示,剪接体通路是富集最强的通路。剪接体(spliceosome)是指进行RNA剪接时形成的多组分复合物,由5个小的核核糖核蛋白粒子(snRNPs)和超过100多个蛋白质组成的大分子结构[8],可以识别mRNA前体的5′剪接位点、3′剪接位点和分支点。mRNAs前体的剪接过程包括内含子的切除和外显子结合在一起,形成成熟的mRNA转录本,最后被翻译为蛋白质,这一过程是通过剪接体实现的。然而,和大多数生物过程一样,选择性剪接过程一旦出现异常,将导致疾病的发生,目前研究最多的是在癌症[9-10]和自身免疫性疾病中[11]。剪接的失调参与肿瘤生物发生和发展,包括细胞增殖、细胞凋亡、侵袭、肿瘤转移、血管生成和化学/放射治疗耐药性[12-13]。例如,调控细胞凋亡的关键基因Bcl-x有两种剪接变异体,两者在调节细胞凋亡方面功能相反。短亚型Bcl-xS促进细胞凋亡,而长亚型Bcl-xL抑制细胞凋亡。因此,Bcl-xL的过度表达与癌转移及化疗药物的耐药性风险增加有关[14]。显然,剪接体影响肿瘤的发生发展。

然而,关于剪接体与子宫内膜异位症的报道并不多。有研究表明,survivin有两种剪接变异体(survivin-2B和survivin-EX3),剪接变异体的表达模式在恶性肿瘤中survivin-EX3占主导,在良性肿瘤中survivin-2B占主导。在内异症患者中检测到survivin及变异体的改变,且在腹膜子宫内膜异位病变的survivin-EX3/surviving比例明显高于在位子宫内膜,反映了子宫内膜异位症在生物学上有类似肿瘤的特性[15]。类似报道还有,雌激素受体β及其剪接变体[16]以及CD44变异体[17]的增加,均可影响子宫内膜异位症的发生发展。

此外,对枢纽基因进行KEGG通路富集分析,还提示mRNA监测途径和癌症相关通路中的转录调控失调和蛋白聚糖通路与子宫内膜异位症密切相关,然而这些通路同时也是癌症的相关通路。由此可见,子宫内膜异位症与肿瘤的发生有着共同的信号通路,这就解释了,为什么EMs在“黏附—侵袭—血管生成”等方面均具有类肿瘤的恶性行为。

综上,子宫内膜异位症是一个多病因的疾病,其发病机制尚不明确。EMs的在位内膜在基因表达上有别于正常子宫内膜,是诱导EMs发生的根源,而其他的激素、免疫等因素只是影响内膜能否在异地生存的附加条件。本研究通过生物信息学分析鉴定子宫内膜异位症关键枢纽基因和信号通路,提高了我们对子宫内膜异位症的潜在分子事件和发病机制的理解,这对EMs的预测及基因靶向治疗具有重要意义。

猜你喜欢

差异基因异位症枢纽
体外高频热疗仪在子宫内膜异位症所致痛经患者中的应用效果观察
miR-145通过调控人子宫内膜基质细胞OCT4的表达促进子宫内膜异位症的发展机制
“六度之城”:佛山西站枢纽新城——广佛全新湾区能级枢纽蓝图绽放!
子宫内膜异位症是怎样引起的?
枢纽经济拓展发展空间——“三个经济”特别报道之一
常跷二郎腿,易患子宫异位症
枢纽经济连通发展动脉
枢纽经济的“三维构建”
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析