异位子宫内膜组织差异miRNAs 的生物信息学分析
2022-01-19马兰芳曹莉莉吴章颖汪俊涛
马兰芳 曹莉莉 吴章颖 汪俊涛
1.贵阳市妇幼保健院妇产科,贵州贵阳 550001;2.贵州医科大学附属医院妇产科,贵州贵阳 550003
子宫内膜异位症好发于育龄期女性,是一种常见的慢性妇科疾病,简称内异症,在女性人群中,发病率约为11%[1]。临床表现为进行性加重的痛经、不孕、性交痛、盆腔粘连等[2]。给女性带来了极大的痛苦及经济负担[3]。病理表现为子宫内膜(腺体及间质)生长于子宫腔以外的部位,其发病机制尚不清楚,存在多种学说[4-6]。微RNA(microRNA,miRNA)作为转录后水平的重要调控小分子RNA,是一类长度为19~24 bp的非编码内源性小分子RNA,在调节细胞周期、细胞增殖分化、新陈代谢及细胞寿命等多个生物过程中发挥重要作用[7]。研究发现,内异症患者的异位内膜、在位内膜及血清中均存在miRNA 的差异表达[8],且miRNA参与了内异症的病理生理过程,并且这些miRNA有望成为内异症诊断和治疗的靶点[9-10]。近年来随着基因芯片技术的发展和大量生物信息数据库的建立,为研究内异症与miRNA 之间的关系提供了新的思路与方向。本研究从GEO 数据库下载相关miRNA 芯片数据集,从生物信息学的分析视角,探讨miRNA 参与内异症发病机制的调控网络,寻找新的诊断和治疗靶点。
1 资料与方法
1.1 miRNA 表达谱的来源
本研究从美国国立生物信息技术中心(National Center for Biotechnology information,NCBI)的GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/),以“endometriosis”和“miRNA”为关键词检索获得原始数据集GSE105765[11]。该数据集是基于平台GPL11154 的miRNA 表达谱。该数据集包含8 个异位内膜样本和8 个配对的在位内膜样本。所有样本均采用R 语言软件进行miRNA 差异表达分析。
1.2 差异表达的miRNA 分析
运行R 语言脚本读取从GEO 数据库下载的数据集,同时对数据进行归一标准化。通过R 语言函数和limma 软件包对标准化后的芯片表达谱进行差异分析,并使用贝叶斯方法多重检验校正,筛选差异表达的miRNA 以|logFC|>2 和P <0.05 作为标准。对差异表达的miRNA 进行聚类分析,使用R 语言gplots 包绘制热图和火山图。选取表达倍数差异最大的前6 位miRNA 进行下一步分析。
1.3 miRNA 靶基因预测
利用在线数据库TargetScan7.2(http://www.targetscan.org/vert_72/)、miRWalk(http://mirwalk.umm.uni-heidelberg.de/)和miRDB(http://mirdb.org/)分别预测筛选出来的6 个miRNAs 的靶基因,为了提高准确性,缩小范围,通过在线网站Bioinformatics &Evolutionary Genomics(http://bioinformatics.psb.ugent.be/webtools/Venn/)绘制维恩图,取交集。
1.4 靶基因的功能和通路富集分析
使用DAVID 数据库(https://david.ncifcrf.gov/)对筛选出的交集靶基因进行数据分析,筛选条件为P <0.05。根据GO 进行基因功能注释富集分析,通过分子功能(molecular function,MF)、细胞组分(cellular components,CC)及生物过程(biological process,BP)进行数据分析。KEGG 对交集靶基因进行注释,主要包括基因功能、生物途径、细胞定位、信号通路等。
1.5 靶基因蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络分析
通过STRING 数据库(http://string-db.org/)、Cytoscape 软件进行靶基因PPI 分析和模块化分析。将靶基因导入STRING 数据库,进行PPI 分析,继而使用Cytoscape 软件的degree 插件对其结果进行模块分析,并挖掘PPI 中连接最为紧密的模块,预测靶基因编码蛋白之间的相互作用,同时筛选出最为关键基因。
2 结果
2.1 差异表达miRNA 的筛选
共筛选85 个差异表达miRNAs,与在位内膜组织比较,异位内膜组织上调的miRNA 共30 个,下调的miRNA 共55 个,并将差异表达的miRNA 可视化(图1)。由聚类分析图可以看出,异位内膜和在位内膜形成了明显的聚类群。其中差异最大的前6 位分别为miR-202-5p、miR-514a-3p、miR-615-3p、miR-202-3p、miR-509-3p、miR-509-3-5p(表1)。
表1 异位内膜和在位内膜组织差异表达排名前6 位的miRNA
2.2 差异表达miRNA 的靶基因交集
在线数据库TargetScan7.2、miRWalk 和miRDB预测miR-202-5p 的交集靶基因43 个(图2A),miR-514a-3p 的交集靶基因194 个(图2B),miR-615-3p的交集靶基因2 个(图2C),miR-202-3p 的交集靶基因598 个(图2D),miR-509-3p 的交集靶基因209 个(图2E),miR-509-3-5p 的交集靶基因556 个(图2F)。
图2 三个数据库共同预测的靶基因交集的维恩图
2.3 靶基因GO 和KEGG 富集分析结果
使用DAVID 数据库对1602 个靶基因进行GO功能富集分析,结果显示,在BP 中,靶基因主要参与了Ras 蛋白信号转导、轴突生成和转运、神经元投射导向、促进细胞分解代谢过程等;T 细胞活化的调节、调节淋巴细胞活化、体液免疫反应等过程;在CC 方面,靶基因主要富在神经元突触、细胞质等部位;在MF方面,靶基因主要富集在SMAD 结合、Ras GTPase 结合、mRNA 3’UTR 结合、小GTPase 结合(图3)。KEGG 信号通路富集分析提示显著差异基因主要富集在糖代谢途径(图4)。GO 和KEGG 富集分析结果提示与内异症相关的生物学功能是轴突转运和糖代谢途径。
2.4 PPI 网络枢纽基因的筛选
通过STRING 数据库和Cytoscape 软件对筛选得到的靶基因进行PPI 分析,筛选出排名前15 位的基因定位核心基因,分析结果显示,6 个miRNAs 靶基因的核心调控基因主要有RAC1、EP300、EGFR、CTNNB1、PIK3CA、FYN、KRAS、CUL2、ITCH、PLK1、FBXW11、PPP2CA、ATG7、RAB5C、ANAPC10(图5),提示RAC1、EP300、EGFR、CTNNB1 蛋白与其他蛋白作用关联较为紧密。
图5 靶基因PPI 网络图
3 讨论
本研究利用数据集GSE105765 分析内异症患者异位内膜与在位内膜差异表达的miRNA 共85 个,其中上调的miRNA 共30 个,下调的miRNA 共55 个,差异显著表达的前6 位miRNA 分别为miR-202-5p、miR-514a-3p、miR-615-3p、miR-202-3p、miR-509-3p、miR-509-3-5p。研究发现这些miRNA 生理作用大多是在肿瘤中,miR-202-5p 通过作用其靶基因抑制卵巢癌细胞及骨肉瘤细胞的迁移和侵袭[12-13];Jin等[14]研究提出miR-514a-3p 可以抑制肾脏肿瘤细胞的生长;Wang 等[15]在胃癌细胞的研究中发现,miR-615-3p 通过作用其靶基因CELF2 促进胃癌细胞增殖和迁移,抑制凋亡;miR-202-3p 在甲状腺乳头状癌中发挥抑癌作用,减少细胞的迁移和侵袭[16];Niu 等[17]研究发现miR-509-3p 能够增强卵巢癌对铂类化疗药的敏感性;Zhang 等[18]在2007 年发现miR-509-3-5p可以靶向PODXL 抑制胃癌侵袭和淋巴转移,可作为新的胃癌预后指标。由此可以推测,内异症所具有恶性生物学行为可能是通过miRNA 介导调控的,但具体调控机制尚需基础研究证实,该结果为研究内异症发病机制奠定了理论基础。
内异症典型的临床表现为进行性加重的痛经。内异症疼痛的病理生理过程为逆流的内膜组织或者细胞到达腹膜表面,建立血供并侵犯周围组织,刺激感觉神经、交感神经和副交感神经,从而出现炎症反应性疼痛。异位内膜分泌雌二醇和前列腺素E2,前列腺素E2能够刺激疼痛纤维,通过刺激神经生长因子和其他神经营养因子,增强侵袭病变的神经敏感性,刺激伤害感受器,从而导致持续性炎症疼痛并抑制神经元凋亡[2]。GO 与KEGG 的分析结果显示,6 个miRNAs的交集靶基因与神经轴突转运关系密切。推测miRNA可能通过靶基因介导了内异症的神经疼痛。如果该调控机制可以被阐释清楚的话,可能指导研究者找到内异症疼痛的治疗靶点,为寻找内异症疼痛的治疗靶点提供了新思路。
关于内异症的发病机制需要更深入地阐明,有待于结合遗传学、表观遗传学和免疫学等方面的研究成果[1],这需要进一步的流行病学研究及更加完善的动物模型。目前所提出的学说里,尚无提及糖代谢参与内异症的发病机制。内异症虽是良性疾病,但转移、侵袭、种植等能生物学特性类似于肿瘤。研究发现糖代谢途径参与了肿瘤代谢的重塑或异常改变[19-20]。本研究中GO 与KEGG 的分析结果显示,靶基因与糖代谢途径关系密切,miRNA 可能靶向这些靶基因参与调节糖代谢,从而调控内异症的这些生物学特性。这一假设的提出,有助于推进内异症发病机制中表观遗传学方向的研究,为探讨更多表观遗传学方向提供思路,同时为基础或临床研究提供新方向。
靶基因PPI 网络筛选结果显示,RAC1 及EGFR 作用最核心,这两种基因参与细胞的多种生物学过程[21-24]。已有研究发现,卵巢子宫内膜异位囊壁组织细胞中RAC1 呈高表达状态,它可以通过RHOGTP 酶信号级联反应促进卵巢子宫内膜异位囊壁组织细胞的迁移[25]。Ping 等[26]通过生物信息学分析显示,EGFR 和RAC1同为内异症组及对照组差异表达基因,共同参与了细胞黏附、细胞骨架调节、MAPK 细胞信号通路,且RAC1还参与了转录因子调控。本研究结果提示,RAC1 及EGFR 在内异症的蛋白调控网中的作用途径可能是通过miRNA 介导的,但具体的调控网络需要更多的研究去阐释。
综上所述,本研究从生物信息学的角度,揭示了miRNA 可能通过作用靶基因参与了内异症的病理过程。本研究分析筛选的6 个miRNAs 及其对应的靶基因发现,轴突转运及糖代谢为主要作用方式参与了内异症的发生,从新的视角探索了内异症的发病机制,这些miRNA 及途径可能成为内异症治疗的潜在靶点,具有重要临床意义。