APP下载

利用生物信息学分析LMO2在乳腺癌中的表达和功能

2021-06-05张明慧李彦姝

中国医科大学学报 2021年5期
关键词:共表达生物学通路

张明慧,李彦姝

(中国医科大学 1.临床医学系;2.生命科学学院分子细胞生物学教研室,教育部医学细胞生物学重点实验室暨卫健委细胞生物学重点实验室,沈阳 110122)

LMO2基因首次发现于急性T淋巴细胞白血病(acute T lymphoblastic leukemia,T-ALL)患者[1],作为核转录因子促进胚胎造血与血管的生成[2]。研究[3]表明,LMO2可在多种实体组织和肿瘤中的细胞质和细胞核表达。LMO2蛋白仅由2个串联的LIM结构域组成,在LDB1、GATA1、TAL1和E47构成的转录复合物中起桥梁作用[4]。乳腺癌是全世界女性癌症死亡的主要原因[5],也是目前中国女性最常见的癌症。2014年中国新增乳腺癌病例估计数约为28万例,因乳腺癌死亡人数约为6.6万[6]。

无论在正常的乳腺导管上皮还是乳腺癌细胞中,LMO2均主要表达在胞质中。通过阻断LIMK1介导的CFL1磷酸化,LMO2促进板状足/丝足的组装形成,进而增加基底型乳腺癌细胞的侵袭和转移[7-8]。此外,LMO2通过与DVL-1/2蛋白结合,减弱Wnt信号通路中β-catenin激活,因此,LMO2在乳腺癌细胞中的表达下调可促进细胞增殖,减少凋亡[9]。

本研究通过生物信息学分析LMO2 在乳腺癌中的表达以及LMO2及其共表达基因在乳腺癌中的生物学作用,有望为临床以LMO2基因为靶点的乳腺癌治疗提供依据。

1 材料与方法

1.1 数据来源

本研究数据来源于Oncomine数据(http://www.oncomine.org/resource),基因表达谱数据动态分析(gene expression profiling interactive analysis,GEPIA)数据库(http://gepia.cancer-pku.cn),人类蛋白质图谱(human protein atlas,HPA)数据库(http://www.proteinatlas.org/),KM plotter 数据库(http://kmplot.com/analysis/),Coexpedia 数据库(http://www.coexpedia.org/)和FunRich 3.1.3.软件。

1.2 数据提取

1.2.1 Oncomine数据库:肿瘤基因芯片数据库与集成数据挖掘平台,包含65个基因表达数据集,可提供肿瘤和正常组织的基因差异表达分析[10]。筛选条件为(1)gene:LMO2;(2)cancer type:breast cancer;(3)data type:mRNA;(4)analysis type:cancer vs normal analysis;(5)临界值设定为P< 0.01,fold change>2,gene rank=top10% 。

1.2.2 HPA数据库:免疫组织化学数据的公共存储库,该数据库测定了蛋白在正常组织、细胞以及肿瘤病理组织的表达。筛选条件为(1)search:LMO2;(2)type:tissue atlas:breast caner;(3)分别选择“tissue”“pathology”,组织来源为“female organs:breast”。

1.2.3 GEPIA 数据库:分析来自TCGA和GTEx的数据,提供关键的交互式和可定制的功能,包括差异表达分析、剖面绘制、相关性分析、患者生存分析、相似基因检测和降维分析[11],分析LMO2在乳腺癌与正常组织中表达的水平。筛选条件为(1)Expression DIY:Box plot;(2)gene:LMO2;(3)data selection:BRCA。其他设为默认值。

1.2.3.1LMO2基因在肿瘤组织中的表达差异分析(1)cancer type analysis:differential genes analysis;(2)dataset:BRCA;(3)differential methods:LIMMA。

1.2.3.2 相关性分析 筛选条件为(1)correlation analysis;(2)gene A:LMO2,gene B:GIMAP6、TGFBR2、LHFP、PTPRB、CAV1;(3)Dataset selection:BRCA Tumor。

1.2.4 KM plotter 数据库:采用包括乳腺癌在内多种癌症的基因表达和生存数据构建的在线数据库,评估LMO2在乳腺癌患者中的预后价值。筛选条件为(1)选 择:Breast cancer;(2)gene:LMO2;(3)Split patients by:Auto select best cutoff;(4)Survival:分 别选择“OS”“PPS”“RFS”。

1.2.5 Coexpedia数据库:通过功能关联进行评估的共表达[12],对 LMO2进行在乳腺癌中的分子调控网络分析。筛选条件为(1)Submit:Human LMO2;(2)MeSH incl.Neoplasms:Breast Neoplasms。

1.2.6 FunRich 3.1.3.软件:进行基因注释分析,分别显示LMO2及共表达基因的细胞组成(cellular component,CC)、分子功能(molecular function,MF)、生物学过程(biological process,BP)、信号通路(biological pathway,BPA)。筛选条件:(1)Add dataset:输入LMO2和通过Coexpedia获得的Score>3 的14个基因;(2)gene enrichment:analysis:Cellular component、Molecular function、Biological process、Biological pathway;(3)临界值设定为P< 0.05。

1.2.7 R包 clusterProfiler:用作LMO2及其共表达的关键基因京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。富集显著性的阈值设定为P< 0.05。

1.3 统计学分析

采用数据库默认的统计学分析方法。乳腺癌与正常乳腺组织中 LMO2表达的比较采用单因素方差分析;LMO2与其关键基因的表达相关性采用Pearson分析;Kaplan-Meier 法绘制生存曲线,LMO2高、低表达组生存率的比较采用 log-rank 检验。P<0.05 为差异有统计学意义。

2 结果

2.1 LMO2基因在常见肿瘤组织中的基因表达

对 Oncomine 数据库进行检索分析后共纳入涉及LMO2基因相关性研究结果 453 项,挑选出高表达7项和低表达 41项差异有统计学意义的结果进一步分析。脑和中枢神经系统肿瘤中高表达2项;乳腺癌中低表达4项;结直肠癌中低表达6项;食管癌中低表达2项;头颈癌中低表达2项;白血病中低表达6项;肺癌中低表达14项;淋巴瘤中低表达2项;黑色素瘤中低表达2项。见图1。

图1 LMO2基因在多种肿瘤中的表达Fig.1 LMO2 gene expression in multiple tumors

2.2 LMO2在乳腺癌中的表达

在GEPIA 数据库中对乳腺癌(1 197例),乳腺癌组织(1 085例)及正常组织(112例)在mRNA水平上的表达情况进行比较,结果表明,LMO2在乳腺癌组织中的转录水平明显低于正常组织,且差异有统计学意义(P< 0.05)。见图2。

图2 LMO2基因表达水平在乳腺癌中明显低于正常乳腺组织Fig.2 LMO2 gene expression levels are significantly lower in breast cancer than in normal breast tissue

2.3 LMO2蛋白在正常乳腺组织与乳腺癌组织中的表达

HPA 数据库中的免疫组化染色结果证实,LMO2蛋白在乳腺癌组织中的表达明显低于正常乳腺组织。且乳腺癌患者病理组织中LMO2主要定位于细胞质或细胞膜。见图3。

图3 乳腺癌中LMO2蛋白表达水平低于正常乳腺组织Fig.3 LMO2 protein expression levels are lower in breast cancer than in normal breast tissue

2.4 LMO2在乳腺癌中的临床预后价值

采用 KM plotter 数据库评估LMO2的表达水平对肿瘤患者总生存期(overall survival,OS)的影响,提示低表达水平的LMO2 在乳腺癌中预示更差的总生存期(P=0.002 2)。进一步分析结果显示,LMO2低表达同样预示着乳腺癌患者更差的后进展生存期(post progression survival,PPS)(P=0.045)和 更差的无复发生存期(release free survival,RFS)(P<0.001)。见图4。

图4 LMO2在乳腺癌患者中的预后价值Fig.4 The prognostic value of LMO2 in breast cancer patients

2.5 LMO2在乳腺癌中的分子调控网络

本研究利用Coexpedia数据库筛选出LMO2基因在乳腺癌中调控的分子调控网络,得到LMO2的共表达基因共47个。其中score> 3的共表达基因有14个:ADGRL4、GIMAP6、PECAM1、TGFBR2、MEF2C、CD93、S1PR1、LHFP、GMFG、A2M、LDB2、KCTD12、PTPRB和CAV1。见图5 。

2.6 LMO2及其共表达基因的注释分析

采用 Funrich软件进行基因注释分析,细胞组成方面,8个基因主要分布在细胞膜,基因占比57.14%(P< 0.010)。分子功能方面分别在受体信号蛋白丝氨酸/苏氨酸激酶活性、补体活性、受体信号蛋白酪氨酸磷酸酶活性起着重要作用。生物学过程方面,7个基因在信号传导方面起着重要作用,基因占比46.67%(P=0.028)。信号通路方面,可能参与转化生长因子-β(transforming growth factor-β,TGF-β)受体信号转导、激活蛋白-1(activator protein-1,AP-1)转录因子网络)、上皮-间质转换等多种通路。见表1~4。

表1 LMO2共表达基因的细胞组成Tab.1 Subcellular localization of LMO2 co-expressed genes

表2 LMO2共表达基因的分子功能Tab.2 Molecular functions of LMO2 co-expressed genes

表3 LMO2共表达基因的生物学过程Tab.3 Biological processes mediated by LMO2 co-expressed genes

表4 LMO2共表达基因的信号通路Tab.4 Biological pathways occupied by LMO2 co-expressed genes

2.7 关键基因的差异性分析、相关性分析与KEGG富集分析

为了验证上述14个关键基因是否在乳腺癌中存在差异性表达,采用GEPIA进行差异基因筛选,筛选出在乳腺癌与正常组织之间有显著差异表达的基因3 559个,见图6。

图5 LMO2在乳腺癌中的共表达分子网络Fig.5 Network of LMO2 co-expressed molecules in breast cancer

14个基因中,表达显著上调的基因为CAV1(FC=1.008,P< 0.001),表达显著下调的基因有GIMAP6(FC=-1.142,P< 0.001)、TGFBR2(FC=-1.373,P<0.001)、LHFP(FC=-1.075,P< 0.001)和PTPRB(FC=-1.537,P< 0.001)。见表5。

表5 LMO2的关键基因在乳腺癌及正常组织中的表达水平Tab.5 Expression levels of LMO2 hub genes in breast cancer and normal tissues

通过GEPIA进一步相关性分析发现,LMO2在mRNA的表达水平与GIMAP6、TGFBR2、LHFP、PTPRB和CAV1等基因的mRNA表达呈显著正相关,其相关性系数r分别为 0.51、0.46、0.52、0.48、0.43。见图7。

对LMO2、GIMAP6、TGFBR2、LHFP、PTPRB和CAV1进行 KEGG通路富集分析,结果显示,上述6个基因富集于黏附连接、肿瘤内转录调控失调、细胞内吞等通路。见图8。

3 讨论

过去LMO2被认为在胚胎造血以及血管生成中起着重要作用,并通过不同的致癌机制驱动T-ALL形成[13]。在造血细胞和内皮细胞中,LMO2主要分布在细胞核内,而在上皮细胞和实体瘤细胞中则分布在细胞质内[9]。无论是在细胞核还是细胞质中,LMO2都发挥着复杂的功能。作为转录调节因子时,LMO2主要通过与多种转录因子相互作用并定位到DNA的结构域上,参与下游靶基因的调控[14]。而存在于细胞质时,LMO2作为癌基因或肿瘤抑制因子,与其他蛋白结合参与肿瘤的发病过程[15]。

图6 染色体上乳腺癌差异性表达基因Fig.6 Differentially expressed genes in breast cancer mapped to chromosomes

图7 LMO2与核心基因表达的相关性Fig.7 Correlation between LMO2 and expression of core genes

图8 LMO2与核心基因的KEGG富集分析Fig.8 KEGG pathways enriched with LMO2 and core genes

本研究通过Oncomine分析LMO2在各肿瘤中的表达情况。在有统计学意义的4项乳腺癌的研究中,LMO2集中表达高、低均有报道,可能与乳腺癌的不同亚型及样本量大小有关。利用GEPIA及HPA数据库,发现LMO2在乳腺癌组织中转录水平及蛋白表达水平均低于正常组织。此外,低表达LMO2预示着乳腺癌患者更差的OS。这些进一步提示LMO2可能在乳腺癌的发病过程中作为肿瘤抑制因子发挥作用,同时可以作为预后指标预测乳腺癌患者生存。

为了清楚LMO2参与调控哪些分子生物学网络,采用 Coexpedia数据库挖掘,并应用FunRich 3.1.3.软件着重分析score>3 的LMO2共表达基因,分析其中的分子功能和生物学过程作用。如ADGRL4、GIMAP6和PECAM等基因参与信号转导通路的建立,TGFBR2参与细胞增殖的调节,这些基因均可能在乳腺癌细胞增殖、侵袭、转移过程中与LMO2基因发挥重要作用。

进一步探究这些与LMO2关系密切的基因在乳腺癌和正常人群中是否呈差异性表达,结果显示,GIMAP6、TGFBR2、LHFP和PTPRB4个基因与LMO2相同,在乳腺癌中呈低表达,而CAV1基因则相反,呈高表达。其中GIMAP6、LHFP和CAV1参与上皮细胞向间质细胞转化(epithelial-mensenchymal transition,EMT),EMT是肿瘤发生发展的重要驱动因素,研究[16]已证明EMT的激活是产生癌症干细胞的主要机制。此外,TGFBR2与CAV1共同参与 TGF-β受体信号通路,TGF-β在乳腺癌早期起增殖抑制和凋亡诱导作用,在晚期可促进肿瘤的侵袭[17]。相关性分析结果显示,LMO2与GIMAP6、TGFBR2、LHFP、PTPRB和CAV1的表达均有明显的相关性。KEGG分析表明,这些基因富集于黏附连接、肿瘤内转录调控失调等通路,表明LMO2很可能与这些基因相互作用,共同参与乳腺癌的癌变、侵袭、转移。

乳腺癌是一种多因素、异质性疾病,需要临床敏锐性和多学科的诊断和治疗方法。本研究对多个肿瘤数据库进行挖掘,明确了LMO2基因在乳腺癌中转录水平及蛋白表达水平均下降。通过生物信息分析学技术发掘在乳腺癌发病过程中有潜在研究价值的重要基因,以及乳腺癌与正常组织间的差异表达基因,并对这些关键基因进行细胞组成、分子功能、生物学过程及信号通路等方面的注释,能够为临床上乳腺癌的治疗提供新靶点。

猜你喜欢

共表达生物学通路
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
丁酸梭菌的筛选、鉴定及生物学功能分析
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
谷稗的生物学特性和栽培技术
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
高世代回交玉米矮秆种质的转录组分析
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用