多发性骨髓瘤患者与健康人脂肪基质细胞差异的关键基因测定及分析
2020-07-08宋宜来刘中国
宋宜来,刘中国
山西医科大学第一医院,山西太原 030001
多发性骨髓瘤(multiple myeloma,MM)是一种血液恶性肿瘤,其特征为骨髓中B淋巴细胞的克隆增殖,因此多发性骨髓瘤是一种B淋巴细胞淋巴瘤的血液系统疾病。近年来间充质干细胞(MSC)作为血液系统肿瘤治疗的新型方法得到了广泛的关注[1-4]。但是随着对MSC研究的不断深入,有人发现与源自正常供体(ND-hMSC)的MSC相比,MM患者来源的MSC(MM-hMSC)在遗传和功能上是不同的,自体MM骨髓间质细胞的移植不能解决间充质干细胞的来源问题[5]。为进一步探索间充质干细胞的来源问题,明确是否自体来源的脂肪间充质干细胞是一种理想的细胞来源,我们对健康人与MM患者的脂肪基质细胞进行了比较,为脂肪基质细胞的来源提供参考依据。
材料与方法
1 材料 GSE133346微阵列芯片数据包以及其平台文件GPL570-55999来自基因表达数据库(NCBI-GeneExpression Omnibus GEO)数据库,以“多发性骨髓瘤和脂肪基质细胞”为关键词搜索而来,包含样本24个,共分2组,分别为健康人和MM患者的脂肪基质细胞,每组12个人类样本。R语言软件以及操作指令代码来自在线平台 (Bioconductor http://www.bioconductor.org)。 蛋白质互作网络图(PPI)利用蛋白功能关系网络数据库STRING(http://string-db.org)构建后下载,并通过软件Cytoscape二次构建。注释、可视化和集成数据库在线数据平台(DAVID https://david.ncifcrf.gov)对差异基因进行基因聚类分析(GO聚类分析和KEGG通路分析)。肿瘤关键基因的生存预后分析由癌症数据在线分析、挖掘网站(UALCAN http://www.ualcan.path.edu/index.html)在线分析而得。
2 健康和MM患者脂肪基质细胞差异基因的筛选下载GSE133346微阵列芯片数据包,通过R语言软件对芯片进行质量监控,在确认芯片质量的情况下对芯片数据RMA法矫正。平台文件GPL570-55999对矫正后数据转换基因ID至国际通用名称。R软件包用于处理下载的文件以及转换和拒绝不合格的数据。对GSE133346数据进行背景校准、标准化以及log2转换。R语言软件筛选健康人和MM患者的差异基因,利用Limma数据包代码设置|log fold change (FC)|>1.5筛选出病患与健康人脂肪基质细胞上的差异基因。
3 差异基因的GO富集分析以及KEGG途径分析利用DAVID在线分析平台对筛选后的差异基因进行功能和通路上的富集分析[6]。由DAVID对GO富集功能进行注释,并对KEGG通路进行注释,分析后以TXT格式输出分析。在对差异基因的富集分析过程中,在富集内容条件允许下选取了前20个GO以及KEGG富集内容。
4 蛋白质互作网路分析筛选关键差异基因 筛选出差异基因输入STRING在线数据库[7],利用STRING预测蛋白相互作用,从STRING下载输出后输入Cytoscape离线软件,分析蛋白互作关系。中心节点(Degree)值取中位数,取Degree值大于中位数的基因。Degree值较高的基因是具有重要生理调节功能的关键的候选基因,并利用Cytoscape离线软件构建蛋白质互作网络。
5 MM脂肪基质细胞关键基因的生存分析验证利用癌症数据在线分析、挖掘网站(UALCAN http://www.ualcan.path.edu/index.html)对筛选出的关键基因进行验证[8]。在健康人和MM患者脂肪基质细胞中筛选出关键差异基因后,输入在线工具UALCAN分析关键基因的生存预后。关键基因输入UALCAN数据库后选取较健康来源脂肪间充质干细胞有明显差异的关键差异基因(P<0.05)。
6 统计学分析 利用R软件对基因资料做统计分析。以稳健的多阵列平均值(RMA)处理样本,最近邻居法(KNN)法寻找与有缺失值基因的表达谱相似的其他基因,并填充缺失值。P<0.05为差异有统计学意义。
结 果
1 健康人和MM患者脂肪基质细胞差异基因的筛选 通过R语言软件Limma包从20 458个基因中,以|log fold change (FC)|>1.5以及较健康人来源脂肪间充质干细胞有明显差异的关键差异基因(P<0.05)为标准筛选。差异基因148个,其中上调47个,下调101个(表1、图1)。
2 差异基因的GO功能和KEGG通路富集分析对筛选出的差异基因通过在线功能和通路分析软件DAVID分析,选取前20以内的功能富集内容(表2,表3,表4)。内容包括生物过程(biological processes,BP)、 细 胞 成 分 (cellular components,CC)及分子功能(molecular functions,MF)三个方面(图2)。生物过程相关的前5位内容分别是白细胞迁移、细胞黏附、细胞对成纤维细胞生长因子刺激的反应、口感发展以及细胞外基质组织。细胞成分相关的分别是细胞外泌体、内质网腔、细胞外区域、细胞表面以及质膜。分子功能相关的分别是胶原结合、肌动蛋白结合、血小板衍生生长因子受体结合、细胞外基质结构成分以及微管蛋白结合。差异基因的KEGG通路富集,分别有黏着力、调节肌动蛋白细胞骨架、ECM-受体相互作用、癌症中的胆碱代谢以及PI3K-Akt信号通路(图2、表 5)。
图1 健康人和多发性骨髓瘤患者脂肪基质细胞之间的差异基因表达情况[红色标记点表示基于倍数变化大于log2(1.5)的差异基因,并且同时P<0.05。绿色标记点表示基于倍数变化小于-log2(1.5),且P<0.05的下调的差异基因,灰色标记点表示无显著差异的基因]Fig. 1 Differential gene expression of adipose stromal cells in healthy controls and multiple myeloma patients (red dots indicate differential genes based on fold change greater than log2[1.5], with P<0.05. Green dots indicate down-regulated differential genes less than fold change based on -log2[1.5],with P<0.05, gray marked dots indicate genes without signif i cant differences)
表1 健康人和多发性骨髓瘤患者脂肪基质细胞的差异基因Tab.1 Differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients
表2 健康人和多发性骨髓瘤患者脂肪基质细胞差异基因的生物过程相关的GO富集分析Tab. 2 Analysis of GO enrichment related to biological processes of differentially expressed genes in adipose stromal cells from the healthy controls and the multiple myeloma patients
图2 健康人和多发性骨髓瘤患者脂肪基质细胞差异基因的GO功能富集以及KEGG途径富集A:生物过程; B:细胞成分; C:分子功能; D:KEGG途径;图中圆圈颜色指示P值的变化,大小表示差异基因的富集数量Fig. 2 GO function enrichment and KEGG pathway enrichment of differentially expressed genes in adipose stromal cells from healthy controls and multiple myeloma patientsA : biological process ; B: cellular components; C : molecular function; D : KEGG pathway; circled color indication P value change, the size indicates the enrichment amount of the differential genes
表3 健康人和多发性骨髓瘤患者脂肪基质细胞差异基因与细胞成分相关的GO富集分析Tab. 3 GO enrichment analysis of differentially expressed genes and cell components in adipose stromal cells in the healthy controls and the multiple myeloma patients
表4 健康人和多发性骨髓瘤患者脂肪基质细胞差异基因与分子功能相关的GO富集分析Tab. 4 GO enrichment analysis of differentially expressed gene and molecular function in adipose stromal cells in the healthy controls and the multiple myeloma patients
表5 健康人和多发性骨髓瘤患者脂肪基质细胞差异基因的KEGG 通路富集分析Tab. 5 KEGG pathway enrichment analysis of differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients
3 蛋白质互作网络分析关键差异基因 在筛选过程中,导出基因Degree值>3的基因,被认为是关键基因。关键基因30个,其中上调基因14个,下调基因16个。软件Cytoscape构建30个关键差异基因的蛋白质互相作用网络(图3)。通过R-heatmap软件绘制经拓扑学分析后共30个上调以及下调基因(图4)。
4 关键差异基因与肿瘤的关系 关键差异基因导入癌症数据在线分析、挖掘网站(UALCAN http://www.ualcan.path.edu/index.html),选取与健康人来源脂肪间充质干细胞有明显差异的关键差异基因 (P< 0.05)。发现基因 CSRP1、FSTL3、FYN、LAMB1、MYLK、PRRX1与MM发 展 相 关。 其中CSRP1、FYN和MYLK与MM发展正相关,而FSTL3、LAMB1、PRRX1与MM发展负相关(图5)。
讨 论
MMBD目前的治疗是使用双膦酸盐,或在某种程度上配合使用靶向药物治疗[9]。虽然可以在一定程度上改善MM的临床症状,但是疗效并不理想。因此开发新的治疗策略来对抗MM显得尤为重要。关于多发性骨髓瘤的治疗当前干细胞是一大热点,干细胞来源有骨髓、脂肪等,干细胞能否通过自体移植的方式治疗肿瘤也是当前研究的一个方向[10]。自体来源的骨髓干细胞作为便利的细胞来源得到了人们的关注,但是在实验中发现骨髓来源的干细胞有促进肿瘤发展的作用[11]。
CSRP1是一种骨架蛋白,与细胞基质降解有关。并且在前列腺癌和肾癌中作为标志物,且在肿瘤的发生中出现表达改变。FSTL1是一种具有多种生物学调节功能的分泌型糖蛋白,近年来相关的文献报道主要集中在炎症、自身免疫性疾病、改善缺血/再灌注损伤和免疫调节等方向,发现通过TGFβ1-Smad2/3信号通路可影响FSTL1在结直肠癌中表达[12-13]。FSTL1上调与肿瘤浸润深度、淋巴结转移及不良预后相关。FYN是Src激酶家族的59 kU成员,在最近的研究中发现FYN的抑制导致大肠癌细胞的选择性细胞死亡[14]。LAMB1在大肠癌患者血清样品中水平显著升高,为肿瘤的明显标记物[15-16]。MYLK可能通过激活VEGFA/VEGFR2和下游Ras/ERK信号通路促进膀胱癌的发展[17]。PRRX1的表达降低会刺激SDF-1/CXCR4信号传导,并与肝细胞癌中血液循环肿瘤细胞相关[18-19]。
图3 蛋白质相互作用网络图(方块尺寸大小代表蛋白的向关联数目,颜色的深度代表了不同基因的P值)Fig. 3 Protein interaction network diagram (The size of the square represents the number of related proteins, and the depth of the color represents the P value of different genes)
图4 筛选后的30个差异基因热图[基于以变化倍数大于log2(1.5)且P<0.05,同时Degree值>3]Fig. 4 Heat map of 30 differentially expressed genes after screening based on fold change greater than 1.5 and P<0.05,while degree value>3
图5 多发性骨髓瘤患者脂肪基质细胞中CRSP1, FSTL3, FYN, LAMB1, MYLK, RRX1表达水平对预后的影响Fig. 5 Effect of CSRP1, FSTL3, FYN, LAMB1, MYLK, PRRX1 expression levels in adipose stromal cells on prognosis of patients with multiple myeloma
在本文中,我们利用生物信息学分析的方法对自体脂肪基质细胞治疗MM的方案进一步研究挖掘了自体脂肪干细胞的相关基因改变。我们共寻找到6个相关的关键基因,并用在线数据库做了相应的验证。但是仍需相关患者标本的进一步实验验证。本数据库一共包括24个样本,其中12个为正常人,12个为MM患者。虽然样本量已满足分析要求,仍然需要其他数据库的分析后进一步验证。当前干细胞自体移植治疗MM是一种新的方案,MSC在MM治疗中的应用仍处于较为基础阶段。
本文中,我们通过对多发性骨髓瘤患者与健康人脂肪基质细胞微阵列数据的分析,得到了差异基因的生物功能相关的特征,并筛选出脂肪基质细胞与肿瘤相关的关键差异基因。关键差异基因可以为临床上自体脂肪基质细胞治疗MM提供相关的分子生物靶标参考。