基于流式细胞术和生物信息学技术的AML患者骨髓细胞代谢分析研究
2021-12-22王浩雨付伟超于文颖梁昊岳
王浩雨,付伟超,于文颖,梁昊岳
(中国医学科学院血液病医院,中国医学科学院血液学研究所,实验血液学国家重点实验室,国家血液系统疾病临床医学研究中心,天津 300020)
0 引言
急性髓细胞白血病(acute myelocytic leukemia,AML)是最为常见的一类急性白血病,这类疾病的发病机制十分复杂,患者预后情况普遍不理想。探究AML患者骨髓细胞的组成情况和比例,进而分析AML患者的骨髓细胞代谢情况,对AML发病机制的研究具有重要作用[1]。在目前常用的分析方法中,使用流式细胞仪可以准确地检测样本中各种细胞的组成和比例,因此流式细胞术是开展AML基础和临床研究不可或缺的方法[2-3]。在AML患者骨髓中,正常细胞和AML细胞主要以单细胞形式存在,即为天然单细胞悬液[4]。研究人员可以使用不同的荧光素耦联抗体来分别标记AML患者骨髓中的淋巴细胞、单核细胞、粒细胞和AML细胞等细胞群[5]。传统的流式分析方法以流式散点图为依据来区分各种细胞群体,用散点图的聚群程度来计算各细胞群体的比例[6]。目前,应用包括t-分布邻域嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法、统一流形逼近与投影(uniform manifold approximation and projection,UMAP)算法和基于快速傅里叶变换加速插值的t-SNE(about fast Fourier transform-accelerated interpolation-based t-SNE,Flt-SNE)算法在内的3种FlowJo生物信息学方法,可以直观地描述淋巴细胞、单核细胞、粒细胞和AML细胞的分布和比例。与此同时,利用热图分析可以发现AML患者骨髓中各种细胞的抗原表达情况存在差异[7]。在基础和临床研究中,因具有快速灵敏、操作便捷、与生物信息学紧密结合的技术优势,基于流式细胞仪的多激光多色流式分析和高速高通量流式分选技术在白血病患者代谢研究中具有一定的应用价值。
AML患者骨髓细胞代谢与糖代谢相关基因如醛缩酶B(ALDOB)、异柠檬酸脱氢酶(IDH)、苹果酸脱氢酶2(MDH2)和琥珀酸脱氢酶B(SDHB),脂代谢相关基因如脂蛋白脂肪酶(LPL),酪氨酸激酶如髓过氧化物酶(MPO),维生素合成相关基因如视黄酸受体α(RARA)以及肿瘤相关基因如原癌基因(RET)密切相关。为了从基因水平探索AML患者骨髓细胞的代谢情况,本研究基于生物信息学方法,从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)数据库中获取通过细胞测序仪采集的健康者和AML患者骨髓细胞的表达谱数据,使用SeqGeqTM软件对测序数据进行归一化并整合分析,用t-SNE算法和UMAP算法降维方法分析各自的细胞分群情况,并分析骨髓细胞中与细胞代谢相关基因的表达情况。基于细胞测序仪采集的表达谱数据在研究AML患者的遗传背景、细胞分化和物质代谢等方面具有重要的作用,这些研究体现了以一代、二代和三代测序技术为基础的细胞测序仪在白血病患者的精准诊断、规范治疗和预后判定方面不可或缺的应用价值。
本研究将AML患者的骨髓细胞进行流式分析,特别是通过t-SNE算法、UMAP算法和Flt-SNE算法3种降维分析方式,描述AML患者骨髓细胞的分群情况,弥补了传统流式分析中因逐级圈门而不能直观呈现细胞群体检测结果的不足之处。同时,本研究侧重分析AML患者和健康者骨髓细胞的代谢相关基因的表达水平差异,从而揭示AML患者在骨髓代谢方面的缺陷,为探索AML的发病机制和研发以代谢为靶点的相关药物奠定基础。
1 材料和方法
1.1 材料与仪器
本文涉及的AML患者骨髓细胞来自本院病理中心,流式管(货号352054)以及CD16-FITC、CD117-PE、CD34-PerCP-Cy5.5、CD38-PE-Cy7等抗体均购自美国碧迪公司。所使用仪器包括CantoⅡ流式细胞分析仪和LWA自动裂解仪,均购自美国碧迪公司。
1.2 流式细胞检测及分析
收集1例AML患者的骨髓2~3 mL。取2支流式管,分别标记为对照管和测定管,对照管中加入同型对照抗体20μL,测定管分别加入标记CD16-FITC、CD117-PE、CD34-PerCP-Cy5.5、CD38-PE-Cy7、CD13-APC、HLA-DR-APC-Cy7、CD11b-BV421和CD45-V500抗体各20μL,每管分别加入AML患者的骨髓100μL;混匀后室温避光孵育15~20 min;使用LWA自动裂解仪裂解细胞,固定,洗涤;采用流式细胞仪检测;最后,使用FlowJoTMv10.6.1流式细胞分析软件(美国碧迪公司)进行流式细胞分析和生物信息学分析。
1.3 测序数据来源及分析
AML患者和健康者的表达谱数据来自NCBI GEO数据库,使用SeqGeqTMv1.7分析软件(美国碧迪公司)进行代谢相关基因的表达分析。
2 结果
2.1 AML患者骨髓细胞的流式细胞分析结果
通过FlowJoTM软件对获取的AML患者骨髓细胞的流式数据进行分析,发现CD45阴性区域细胞是AML细胞,占36.8%;CD45阳性并且颗粒度较小区域细胞是淋巴细胞,占12.9%;CD45阳性并且颗粒度较大区域细胞是粒细胞,占25.3%[如图1(a)所示];CD16和CD11b双阳区域细胞是单核细胞,占3.72%[如图1(b)所示];CD117阳性区域细胞是AML细胞,占36.8%,CD117阴性并且颗粒度较大区域细胞是粒细胞,占25.3%[如图1(c)所示];CD34和CD38双阳区域的细胞是AML细胞,占36.5%[如图1(d)所示]。依据CD45、CD117、CD34和CD38等表面标志圈选的AML细胞群比例具有一致性。
图1 AML患者骨髓细胞的流式细胞分析
2.2 基于流式细胞术的AML患者骨髓细胞的生物信息学分析结果
使用FlowJoTM的生物信息学分析模块对流式数据进行t-SNE算法、UMAP算法和Flt-SNE算法分析,发现AML患者细胞中包含淋巴细胞、单核细胞、粒细胞和AML细胞4群细胞,其中AML细胞群体所占比例最高,表明AML患者骨髓中的肿瘤负荷较高。t-SNE算法、UMAP算法和Flt-SNE算法分析结果相近,表明3种生物信息学方法都可以有效地识别骨髓细胞的类群,实现对流式数据的降维分析功能[如图2(a)~(c)所示]。但与UMAP算法和Flt-SNE算法相比,t-SNE算法分析对4种类群细胞的分群更为集中,淋巴细胞(蓝色)和单核细胞(红色)的各个亚群处在相近的位置区域,表明t-SNE算法可以很好地依据细胞亚群的异质性对细胞类群进行区分。在3种分析结果中,AML细胞群体聚集性较好,体现出AML细胞的均一性和较低的异质性。这些结果与AML细胞在患者骨髓中的分化过程具有较好的一致性,低分化的AML细胞对骨髓微环境中细胞代谢产生重要影响。
通过AML患者骨髓细胞的热图分析发现,骨髓细胞被分为Pop0、Pop1、Pop2和Pop3 4群[如图2(d)所示]。通过蛋白的表达情况分析,Pop0这类群细胞主要表达CD45蛋白,说明Pop0主要是淋巴细胞。Pop1这类群细胞主要表达CD45蛋白,且高表达HLA-DR蛋白,说明Pop1主要是粒细胞。Pop2这类群细胞主要表达CD34、CD38和CD117蛋白,说明Pop2主要是AML细胞。Pop3这类群细胞主要表达CD45、CD16和CD11b蛋白,说明Pop3主要是单核细胞。因此,Pop0、Pop1、Pop2和Pop3分别代表了淋巴细胞、粒细胞、AML细胞和单核细胞。
进一步通过FlowSOM聚类分析,发现与热图分析结果相同的Pop0、Pop1、Pop2和Pop3群体中Pop2(AML细胞)群体所占比例最高,其次为粒细胞、淋巴细胞和单核细胞,如图2(e)所示,自下而上的细胞群体比例逐渐降低。FlowSOM聚类分析结果与传统流式细胞分析的AML患者骨髓中AML细胞(36.8%)、粒细胞(25.3%)、淋巴细胞(12.9%)和单核细胞(3.72%)比例分布情况相符。
图2 基于流式细胞术的AML患者骨髓细胞的生物信息学分析结果
2.3 基于测序技术的AML患者和健康者的骨髓细胞生物信息学分析结果
基于NCBI数据库的健康者和AML患者骨髓细胞的测序数据,将SeqGeqTM测序分析软件用于数据的归一化和整合分析。根据表达谱得到的基因表达情况,应用t-SNE算法和UMAP算法对骨髓细胞进行分类分析。通过t-SNE算法分析发现,与健康者骨髓细胞群体相比,AML患者骨髓细胞群体明显增加了一群细胞,将二者合并分析后,发现增加的细胞群体为AML细胞,并且所占细胞群比例较高[如图3(a)~(c)所示]。UMAP算法分析也得到了类似的结果[如图3(d)~(f)所示],可以看出由于AML细胞挤压了骨髓微环境中正常细胞的生长空间,正常细胞群体比例出现了明显的缩减,这将影响骨髓细胞代谢和骨髓造血的正常功能。
图3 基于测序技术的AML患者和健康者的骨髓细胞生物信息学分析结果
通过对t-SNE算法结果中的不同细胞群体的表面标志物的识别,健康者的骨髓细胞可以被分为明显的4群细胞,即红细胞、淋巴细胞、单核细胞和粒细胞[如图4(a)所示],并且发现健康者骨髓细胞中ALDOB基因不表达,IDH、MDH2、SDHB、MPO和RARA基因表达量较高,LPL和RET基因表达量较低[如图4(b)所示]。
图4 基于测序技术的健康者骨髓细胞的代谢相关基因表达分析结果
同时,AML患者的骨髓细胞可以被分为明显的5群细胞,即红细胞、淋巴细胞、单核细胞、粒细胞和AML细胞[如图5(a)所示]。与健康者的骨髓细胞相比,AML患者的骨髓细胞中的LPL基因不表达,IDH、MDH2和SDHB基因的表达量明显升高,MPO基因表达水平明显降低,ALDOB和RET基因表达水平升高[如图5(b)所示]。
图5 基于测序技术的AML患者骨髓细胞的代谢相关基因表达分析结果
与健康者相比,AML患者的ALDOB、IDH、MDH2和SDHB基因的表达水平偏高,说明AML患者的糖代谢水平发生了显著变化,特别体现在细胞有氧呼吸中的三羧酸循环反应[如图6(a)~(d)所示]。同时,AML患者的脂代谢相关基因LPL的表达水平明显低于健康者,说明由于LPL不足,AML患者将富含甘油三酯的脂蛋白水解为游离脂肪酸的能力较差,导致患者存在高甘油三酯的风险,不利于患者的生存和预后[如图6(e)所示]。作为酪氨酸激酶的一种,MPO的表达水平影响着参与特定反应的氨基酸和蛋白质的消费速度。AML患者的MPO基因表达水平明显低于健康者,反映出AML患者骨髓细胞潜在的蛋白质代谢异常[如图6(f)所示]。AML患者中低表达的RARA基因不利于维生素和胡萝卜素的合成,而较低的维生素水平不利于细胞的生长和分化[如图6(g)所示]。肿瘤相关基因RET的高表达不仅影响着AML患者骨髓的糖脂代谢,还在细胞的分化、生长、迁移和存活中发挥作用[如图6(h)所示]。
图6 健康者和AML患者骨髓细胞的代谢相关基因表达结果
3 讨论
在AML的传统诊断方法中,流式细胞仪发挥着重要的鉴别作用[8]。传统流式分析结果表明,AML细胞的标志蛋白包括CD34、CD38和CD117等。在与正常血细胞(淋巴细胞、粒细胞和单核细胞)进行区分时,淋巴细胞和粒细胞的主要标志蛋白是CD45,但二者可依据颗粒度来进一步区分。单核细胞的标志蛋白主要为CD16、CD45和CD11b。本研究中,AML患者骨髓样本中AML细胞、粒细胞、淋巴细胞和单核细胞所占比例分别为36.8%、25.3%、12.9%和3.72%,符合AML患者骨髓细胞分布的规律,反映了AML细胞在骨髓中大量增生造成对其他各系造血细胞生长的负面影响。这些结果表明,通过流式细胞仪可以很好地区分AML患者骨髓细胞中的正常和异常造血细胞群体,在此基础上,流式细胞仪为恶性血液肿瘤患者的正常造血和恶性增殖性造血的比较研究提供了技术保障。
为了探索一种能更好地表征AML患者骨髓细胞分布情况的方式,基于流式细胞术的生物信息学分析方法(t-SNE算法、UMAP算法和Flt-SNE算法)被用于AML患者骨髓数据的分析[9]。结果表明,AML患者骨髓中AML细胞的比例最高,导致AML患者骨髓中的正常血细胞功能受损和血液系统功能紊乱。这一结果与经典流式分析所得到的结论一致,说明基于流式细胞术的生物信息学分析可以弥补逐级圈门方式的不足,直观地呈现骨髓细胞各群体的分布情况,提升了数据的可视化水平,很好地反映了AML患者骨髓异常造血的疾病状态。
为了研究AML患者的骨髓代谢情况,本研究分析了与骨髓细胞代谢相关的ALDOB、IDH、MDH2、SDHB、LPL、MPO、RARA和RET基因的表达情况。其中,ALDOB基因表达醛缩酶B,ALDOB基因变异导致遗传性果糖不耐受。IDH基因编码产生异柠檬酸脱氢酶,催化异柠檬酸氧化脱羧为α-酮戊二酸,这是三羧酸循环的限速步骤。MDH2基因产生的苹果酸脱氢酶,在柠檬酸循环中,催化苹果酸转变为草酰乙酸[10]。SDH是一种位于线粒体内膜上的复合酶,催化琥珀酸氧化为延胡索酸[11],由4个核编码亚基组成。SDHB是琥珀酸脱氢酶的一个亚基,其基因突变导致副神经节瘤和嗜铬细胞瘤[12]。LPL编码的脂蛋白脂肪酶可将甘油三酯分解为游离脂肪酸和单酸甘油酯。LPL在心肌、骨骼肌、下丘脑等组织中表达的减少或缺失均可导致机体出现严重的糖脂代谢紊乱[13]。MPO是一种在髓系分化过程中合成的血红素蛋白,是髓细胞的特异性标志[14],是中性粒细胞嗜苯胺蓝颗粒中的主要成分。RARA基因产生维甲酸受体,其与早幼粒细胞白血病基因之间的易位与急性早幼粒细胞白血病有关[15-17]。急性早幼粒细胞白血病是一种经全反式维甲酸治疗后完全缓解率较高的AML。RET基因编码的跨膜蛋白RET属于一种受体酪氨酸激酶,其参与的信号通路包括PI3K-AKT-mTOR途径[18-19]以及RASRAF-MEK-ERK途径,而RET基因突变可能导致肿瘤的发生[20]。
本研究发现,AML患者骨髓细胞的ALDOB基因表达量升高,醛缩酶B异常表达,导致AML患者骨髓细胞的糖代谢紊乱。AML患者骨髓细胞的IDH基因表达量异常升高,使异柠檬酸更多、更快地氧化脱羧为α-酮戊二酸。同时,AML患者骨髓细胞的MDH2和SDHB基因表达量也出现异常升高,使苹果酸和琥珀酸更多、更快地转变为草酰乙酸和延胡索酸。这些基因的异常表达导致AML患者出现糖代谢途径异常。在脂代谢方面,AML患者骨髓细胞的LPL基因不表达,使甘油三酯不能被分解为游离脂肪酸和单酸甘油酯,从而导致脂代谢途径异常。同时,AML患者骨髓细胞的MPO基因表达量显著下降,说明AML患者造血系统髓系细胞分化发生明显异常。AML患者骨髓细胞的RARA基因表达异常下降,说明AML患者骨髓细胞中急性早幼粒细胞白血病诱导风险加剧。AML患者骨髓细胞的RET基因表达异常升高,说明AML患者骨髓中发生了肿瘤细胞的异常扩增。这些结果表明,细胞测序仪可以精确地采集AML患者骨髓细胞的基因表达信息,为从基因的转录和表达水平等角度研究AML患者在代谢方面的缺陷奠定坚实基础。
综上所述,本研究基于流式细胞术和生物信息学技术,对AML患者的骨髓细胞分布和代谢情况进行分析。AML患者骨髓细胞与健康者骨髓细胞的代谢水平存在差异,这种差异可能来源于糖脂代谢等相关基因的异常表达。在未来的研究中,可以通过对骨髓代谢相关基因的序列进行进一步研究,探索AML患者骨髓细胞中与代谢相关基因的突变方式和数量,从而为AML等血液系统疾病的治疗提供新靶点。因条件所限,本研究中样本例数较少,但较好地反映了AML患者的骨髓代谢情况。在未来的工作中,将扩大样本规模,进一步应用流式细胞术和生物信息学分析,从遗传学角度探索AML患者的骨髓细胞代谢情况,为血液学和细胞生物学相关研究奠定基础。