基于数据挖掘分析HOXA3在急性髓系白血病中的表达及意义
2021-02-24王莉华刘宪凯
张 媛,吴 隼,郭 燕,王莉华,刘宪凯,黄 琰
新乡医学院第一附属医院 血液内科,河南 卫辉453100
急性髓系白血病(acute myeloid leukemia,AML)是一种造血干细胞和祖细胞(hematopoietic stem and progenitor cells,HSPCs)的侵袭性克隆性疾病,HSPCs 获得突变后,导致骨髓分化受阻,产生具有自我更新能力的白血病干细胞(leukemia stem cells,LSCs),从而抑制正常的造血分化,引起贫血、出血、感染等一系列相关症状[1]。尽管随着AML 相关的分子机制逐渐被发现,患者的生存时间和治愈率得到了很大的提高,但仍然有近60%的患者会在2~3 a 后复发[2],因此,进一步探索与AML 发生、发展相关的分子机制及其治疗靶点具有重要意义[3]。
研究发现同源盒基因(homebox,HOX)家族是正常和恶性造血的重要调控因子[4]。HOX 基因家族是高度保守的转录因子,由A、B、C、D 四个亚族组成,每个亚族又包含9~11 个不同的基因[5]。HOXA5、HOXA9、HOXA13 等基因在白血病发生、发展中的作用已经有了相关研究,但HOXA3 在白血病中的作用及临床意义仍没有相关的阐述。
本研究基于生物信息学,利用Oncomine、TCGA、String-DB、DAVID等数据库探索AML中HOXA3 蛋白表达差异及其相互作用的蛋白,并研究其与AML 预后的关联。
1 资料与方法
1.1 Oncomine v4.5 数据库提取数据
Oncomine 数据库(https:/ /www.oncomine.org/resource/main.html)是癌症基因芯片数据库和整合数据挖掘平台,可以根据实际需要设定筛选条件,进行癌症与正常组织、癌症不同病理类型、癌症与药物治疗敏感性的差异性分析。本研究搜索设置条件为:①Gene:HOXA3;②Cancer Type:Leukemia;③Data Type:mRNA;④临界值设定条件(P value <0.001,fold change1.5,gene rank =Top 10%)。
1.2 String-DB v11.0 数据库
String-DB 数据库[6](https:/ /string-db.org/)是研究基因和蛋白之间相互作用关系的平台,其中包含已证实的和可预测的蛋白-蛋白相互作用数据库。本研究检索设定:HOXA3;Homo sapiens;medium confidence(0.400);No more than 50 interactors。
1.3 DAVID v6.8 数据库
将String-DB 数据库筛选出的与HOXA3 相互作用的50 个基因,使用DAVID[7](https:/ /david.ncifcrf.gov/)进行GO 富集和KEGG 通路分析,下载相关数据分析作图,获取与HOXA3 相互作用的基因改变的信号通路。
1.4 TCGA 数据库
从TCGA数据库(https:/ /www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)中下载LAML 相关的数据,使用R 3.6.3 软件处理LAML 的数据,进行HOXA3 相对表达量的分析,并下载LAML 的临床数据,将生存数据和HOXA3 的表达数据合并,用Survival 包进行作图和统计学检验。
1.5 细胞培养
kasumi-1(M2)、NB4(M3)、HL60(M3)、THP1(M5)、U937(M5)和TF-1(M6)六种白血病细胞由新乡医学院保存。细胞培养均用含10% 胎牛血清的RPMI 1640 培养基,培养箱条件为37 ℃、5% CO2恒温加湿。
1.6 Real-time PCR 检测HOXA3 的mRNA 表达水平
收集各组细胞,利用TRIzol 提取总RNA。按照诺唯赞公司的反转录试剂说明书进行逆转录,将cDNA 置于-80 ℃保存备用。采用SYBR Green 法进行PCR。所涉及的引物序列为:HOXA3-F:5′-ATGCAAAAAGCGACCTACTACG-3′;HOXA3-R:5′-TACGGCTGCTGATTGGCATTA-3′;GAPDH-F:5′-AGAAGGCTGGGGCTCATTTG-3′;GAPDH-R:5′-AGGGGCCATCCACAGTCTTC-3′。
1.7 统计学分析
采用SPSS 和R 软件进行相关的统计分析,以P<0.05认为有统计学意义。
2 结果
2.1 HOXA3 在不同肿瘤类型中的表达
在Oncomine 数据库检索HOXA3,共有519 个有关的研究结果,其中HOXA3 表达有统计学差异的研究结果共28 个,HOXA3 表达增高的研究有14个,表达降低的研究有14 个,见图1。在血液恶性肿瘤中,白血病中高表达的研究有3 个,淋巴瘤中高表达的研究有1 个,骨髓瘤中低表达的研究有1 个(临界值设定条件:P value<0.001,fold change 1.5,gene rank =Top 10%)。
图1 Oncomine 数据库中HOXA3在各种肿瘤组织中的表达情况
2.2 HOXA3 在白血病中的表达
对Oncomine 数据库中的HOXA3 表达进一步深入提取与白血病有关的研究信息,寻找与AML 相关的研究,通过设定筛选条件:①Gene:HOXA3;②Analysis Type:Cancer vs.Normal Analysis;③Cancer Type:Leukemia;④Data Type:mRNA;⑤临界值设定条件(P value <0.001,fold change 1.5,gene rank = Top 10%),共有7 个数据集涉及HOXA3 在白血病和正常组织中的表达,包括3 813 个样本。比较4 个与AML 有关的研究结果[8]发现,与对照组相比,HOXA3 在AML 中高表达,且具有显著性差异。
2.3 HOXA3 在AML 不同FAB 分型中的表达差异
将上述筛选条件中的Analysis Type 更改为Cancer Histology Analysis,重新筛选后,有19 个数据集符合条件,以TCGA Leukemia 为例,见图2A。HOXA3 在M3 中的表达低于其他类型的AML,且在M5中表达水平最高。将kasumi-1、NB4、HL60、THP1、U937 和TF-1 六种不同FAB 分型的白血病细胞株提取mRNA,反转录后进行qPCR,结果显示HOXA3 的表达与数据库结果一致,见图2B。
2.4 与HOXA3 相互作用基因的GO 富集与KEGG功能注释
下载TCGA 中AML 相关的数据,利用R 筛选出与HOXA3 共表达的基因,以相关系数≥0.4 为条件,共筛出780 个可能与HOXA3 具有共表达关系的基因。通过DAVID 数据库对上述与HOXA3 相互作用的基因进行GO 和KEGG 分析,发现这些基因在生物过程(Biological Process,BP)中主要影响细胞凋亡、白细胞迁移、造血发生、T 细胞稳态等方面,见图3A。在分子功能(Molecular Function,MF)中主要影响蛋白质结合、半胱氨酸型内肽酶激活参与的凋亡等,见图3B。细胞组分(Cellular Component,CC)中主要在细胞膜、细胞质等位置,见图3C。KEGG 代谢通路主要集中在P53、肿瘤、代谢相关等通路,见图3D。
2.5 HOXA3 蛋白互作网络
在String-DB 数据库中,检索分析与HOXA3 相互作用的蛋白,其中CTCF、PBX1、HOXB1、MAFB、KDM6A、KMT2C 等蛋白与HOXA3 关联密切(图4)。之前的文献报道PBX1 可以通过活化AKT/GSK3β 信号通路来改变细胞周期,从而促进毛囊间充质干细胞的增殖并抑制其凋亡[9],而MAFB 对胰岛β 细胞的功能有重要作用[10],提示HOXA3 可能通过调节细胞周期、糖代谢等影响白血病细胞的生物学功能。
2.6 HOXA3 基因表达与AML 患者预后的关系
上述分析证实AML 中HOXA3 呈高表达,为进一步分析HOXA3 与AML 患者预后的关系,在TCGA 数据库中的LAML 数据并用R 进行处理分析,利用Survival包绘图并作统计学分析,结果显示发现高表达HOXA3 的AML 患者生存期明显低于低表达者,提示HOXA3 与AML 患者的不良预后有关。
图2 HOXA3 在AML 不同FAB 分型中的表达
图3 HOXA3 相互作用基因的GO 富集和KEGG 通路分析
图4 String-DB 数据库中与HOXA3 相互作用的蛋白
3 讨论
HOX 基因家族与正常和异常造血相关,其差异表达与特定的谱系和造血分化阶段密切相关[11]。在小鼠造血干细胞中过表达HOXA10,导致髓系和B 细胞分化紊乱、巨核祖细胞扩增,从而导致白血病发生。缺乏HOXA9 的小鼠造血功能受到破坏,包括淋巴细胞、粒细胞数量减少,而过表达HOXA9 可导致T 细胞发育缺陷和AML 的发生。而且,在AML 中HOXA9 参与MLL 融合蛋白的形成,且HOXA9 的激活是一个独立的不良预后标志基因。报道[12]HOXA3 与很多恶性肿瘤的发生发展相关,HOXA3 通过调节EGFR/Ras/Raf/MEK/ERK 信号通路来影响结肠癌的发生发展,miR-338-3p 可以下调HOXA3 的表达从而抑制T 淋巴母细胞性淋巴瘤的发生。
本研究基于Ocomine 数据库分析了HOXA3 基因在不同恶性肿瘤中的表达情况,并且比较分析了4 个不同AML 数据集中HOXA3 的表达情况,发现HOXA3 在AML 中的表达高于正常对照组,且在M5中表达最高,在M3 中的表达低于其他FAB 分型的AML,同时也利用白血病细胞的qPCR 实验证实了这个结论。利用DAVID 数据库分析了与HOXA3 具有共表达关系基因的GO 富集和KEGG 通路分析,发现HOXA3 与细胞的凋亡、白细胞迁移、造血发生、肿瘤、代谢等相关,提示HOXA3 可能在白血病的发生发展中可能发挥着重要作用。同时,进行了生存分析,发现高表达HOXA3 的AML 比低表达组预后差。
虽然之前有很多关于HOX 基因家族和白血病的研究,但是关于HOXA3 和AML 的研究目前还没有相关报道,后续仍需要相关的体内、体外实验以及过表达和敲除实验来进一步验证。
4 结论
本研究首次分析了HOXA3 在AML 中的表达及其与不同病理类型和预后之间的关系,并且报道了与其相互作用的蛋白和信号通路,为AML 的诊断和治疗提供潜在的新靶点。