浸润性乳癌PBMC核心基因分析及m RNA-miRNAlncRNA网络构建
2021-07-22刘皓曲一丹周昊赵俊江郑自文张坚
刘皓,曲一丹,周昊,赵俊江,郑自文,张坚
(1 青岛大学医学部,山东 青岛 266071;2 青岛大学附属医院普外科)
乳癌是常见的恶性肿瘤之一,在女性中其发病率高居全球首位[1]。目前,临床上对乳癌确诊依靠组织活检,根据组织中的肿瘤标记物对疾病进行诊治。但这种方法侵入性强,动态性检查效果差。随着乳癌病人对常规疗法的耐药性逐渐增加,需进一步寻找有效的分子靶标进行靶向治疗。外周血单个核细胞(PBMC)主要由包括淋巴细胞和单核细胞在内的机体免疫细胞组成,在人体的免疫防御系统中发挥至关重要作用。癌组织可能将癌细胞释放到血液中,被PBMC 吞噬并表达癌细胞含有的标志物,这种变化可能比存在于外周血中的肿瘤细胞更早被检测到。通过发现PBMC基因的变化,有助于对浸润性乳癌进行早期的诊断与治疗。生物信息学与微阵列技术可为深度研究肿瘤在基因组水平上的发展进程提供帮助。本文研究应用生物信息学方法,通过微阵列数据的挖掘与分析,确定浸润性乳癌病人PBMC中的核心(HUB)基因,预测并构建与其对应的调控网络,为探讨浸润性乳癌的生物学过程及临床诊疗提供理论依据。
1 材料与方法
1.1 数据获取
从基因表达综合数据库(GEO)(http://www.ncbi.nlm.nih.gov/geo/)中获取所需基因表达数据GSE27562(截止日期2019-05-25)。筛选条件:①样本总量>30;②样本资料来源于临床病人;③原始芯片数据提取,实验类型为Expression profiling by array。共采集了162例样本,选取其中的57 例经活检证实为浸润性乳癌病人的术前外周血样本,31例经乳房X 线摄影检查结果为阴性的健康人外周血样本。
1.2 差异基因分析
应用GEO 中GEO2R 在线分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r/)对差异基因进行分析。筛选标准:P<0.05,校正P值(adjustedP-value)<0.05,基因表达值倍数变化(FC)≥0.8。应用Metascape数据库将不同基因的名称转换成统一的标准缩写。
1.3 GO分析及KEGG分析
应用DAVID6.8(https://david.ncifcrf.gov/home.jsp)富集分析差异表达的基因,揭示其生物学功能。分别进行GO 功能注释分析和KEGG 信号通路分析,获得差异表达基因的基因功能和信号通路的功能。GO 富集标准:最小交集≥5、P≤0.05。KEGG 富集标准:最小交集≥3、P≤0.05。
1.4 蛋白互作(PPI)网络的构建
应用STRING 数据库(https://string-db.org)构建PPI网络。存在互作的阈值条件为:minimum required interaction score>0.4。使用CytoScape软件可视化PPI数据。
1.5 HUB基因的筛选
应用CytoScape软件中的cytohubba插件,选取MCC、Degree、Bottleneck方法分别筛选出前10个差异表达基因。将上述3种方法筛选到的基因提交至Veen(http://bioinformatics.psb.ugent.be/webtools/Venn/)在线工具,获取三者交集,交集的节点对应的基因为具有重要生理调节功能的HUB基因。
1.6 HUB 基因上游互作miRNA、miRNA-长链非编码RNA(lnc RNA)分析
应用mir DIP在线工具进行分析、预测HUB基因上游互作miRNA。获得m RNA-miRNA 相互关系文件并导入CytoScape软件进行网络可视化。筛选标准:Score class:top 1%,Integrated Score≥0.6,miRNA 至少与两个及两个以上HUB 基因互相关联。将符合标准的miRNA 提交至star Base在线工具,获得lncRNA 关系对。将miRNA-lnc RNA相互关系文件导入CytoScape软件进行网络可视化。筛选标准:CLIP-Data≥5,miRNA 至少与两个及两个以上的lncRNA 相互关联。
1.7 构建m RNA-miRNA-lncRNA 调控网络
汇总lnc RNA、miRNA、m RNA 的相应结果,建立相互关系文件。使用CytoScape软件构建可视化m RNA-miRNA-lncRNA 的三元关系调控网络。
2 结果
2.1 差异基因的筛选
共获得差异基因87个,其中上调基因59个,下调基因28个。其火山图见图1A。依据log FC 绝对值大小排序,排名前10 的上调差异基因分别为FOS、NR4A2、DDX6、USP9X、CXCL8、CTSZ、DUSP1、INO80D、EGR1及ARHGEF7,排名前10的下调差异基因则分别为PRKD2、HBD、PSPH、HBM、SLC25A37、HBG2、MS4A3、HINT3、CLC、ALAS2。
2.2 差异基因的基因功能和信号通路的功能
GO 分析结果显示,细胞组成(CC)主要涉及血红蛋白复合物、胞浆、血液微粒、胞外外体、膜、细胞间黏附连接等。生物过程(BP)主要涉及细胞内信号转导、血管生成正调节、RNA 聚合酶Ⅱ启动子转录的正调控、血凝、细胞间黏附等进程。分子功能(MF)则主要包含蛋白结合、钙黏蛋白结合参与细胞间黏附、血红素结合等(图1B)。KEGG 富集结果显示,差异基因主要与甲型流感病毒感染、单纯疱疹病毒感染、破骨细胞分化、炎症性肠病(IBD)、利什曼病、类风湿性关节炎等信号通路相关(图1C)。
图1 差异基因火山图及GO与KEGG分析结果
2.3 PPI网络与HUB基因
PPI网络共涉及67个节点和88个边缘。PPI富集P-value:<4.69e-14。PPI网络文件导入CytoScape软件中进行可视化(图2A),使用MCC、Bottleneck、Degree分析方法分别筛选出前10个候选基因(图2B),使用Venn在线工具获取3种算法的交集基因,将这些基因定义为HUB基因,分别为ALAS2、EGR1、FOS、DUSP1。见图2C、表1。
图2 PPI网络与HUB基因
表1 诊断候选基因筛选结果
2.4 HUB基因的上游互作miRNA、lnc RNA 以及circRNA
将4 个诊断候选基因提交至mir DIP 进行分析,结果显示62个上游互作miRNA 符合标准。利用CytoScape软件构建miRNA-lncRNA 相互关系网络(图3A)。ALAS2基因无符合后续筛选条件的miRNA。其他3个HUB基因与7个miRNA 符合后续筛选条件,并提交至star Base进行分析,结果显示共有119 个miRNA-lncRNA 关系对,符合筛选条件的lncRNA 基因为20个。见图3B、表2。
表2 符合条件的诊断候选基因与上游互作miRNA、lncRNA
2.5 lncRNA/circRNA-miRNA-mRNA 通路调控网络
汇总分析符合筛选条件的miRNA 及lncRNA和HUB 基因之间的关系,使用CytoScape软件展现的lncRNA、miRNA、m RNA 相互作用关系网络见图3C。
图3 lncRNA/circRNA-miRNA-mRNA网络结构及其通路调控
3 讨 论
对浸润性乳癌的诊断治疗研究一直是近年来的热点,但乳癌起病隐匿,早期临床症状不显著,容易错过最佳诊疗时机[2]。我国乳癌发病率和死亡率近年来有增高趋势。寻找乳癌非侵入性诊疗的新靶点对乳癌早期诊治至关重要。
癌细胞在一定情况下会进入到外周血中,被外周循环中的PBMC所吞噬,在PBMC中表达肿瘤细胞的标志物;同时,PBMC 自身就拥有部分循环肿瘤细胞和肿瘤干细胞。所以,理论上来讲可以通过PBMC对癌症进行检测。本研究寻找PBMC 差异基因并进行分析,有助于了解乳癌疾病进程以及发生发展机制,为乳癌的诊治提供理论支持。
微阵列技术和生物信息学分析已广泛用于基因组水平上筛选遗传变异,是明确人类肿瘤发生机制、确定潜在诊治靶向的有力工具。基于数据库的生物信息学技术有助于人们全面分析已知或新的基因组、蛋白质数据等。本文对比了GSE27562芯片数据集内经组织活检确诊的浸润性乳癌与非肿瘤病人的PBMC,两者基因表达存在差异,表明肿瘤组织的存在影响PBMC 中基因的表达。GO 分析结果表明,显著富集的模块在MF中的血红蛋白复合物上,其次是CC 的胞浆组分上,BP主要富集于RNA 聚合酶Ⅱ启动子转录的正调控、细胞内信号转导方面。表明乳房肿瘤病人的PBMC影响细胞增殖、转录活性,使其增强。KEGG 通路富集分析显示,差异基因主要与类风湿性关节炎、单纯疱疹病毒感染、破骨细胞分化、甲型流感病毒感染等发生发展有关。相关研究显示,乳癌可诱导破骨细胞的活化,延长破骨细胞的存活[3-4],推测这也与乳癌病人骨转移、骨溶解、骨质破坏相关。ANDTBACKA 等[5]研究显示,溶瘤病毒可以通过不断增殖与增强免疫应答的方式,使癌细胞裂解,发挥抗肿瘤的作用。溶瘤性单纯疱疹病毒能够感染肿瘤细胞并大量复制,肿瘤细胞受到其直接细胞毒的作用而死亡[6],这种方式不仅可以高效抗肿瘤并对人体影响较小。目前有研究显示,单纯疱疹病毒中的G47能通过HER-2磷酸化抑制HER-2阳性乳癌细胞的生长、增殖,并促进癌细胞凋亡[7],这种基于病毒的生物免疫疗法对前列腺癌[8]、神经内分泌肿瘤[9]的诊治有帮助。流感病毒基因能够携带外来DNA,使机体产生明显的细胞、体液免疫应答。流感病毒可以作为基因治疗载体,拥有潜在靶向攻击肿瘤细胞的能力。尽管类风湿性关节炎与乳癌的关系鲜有研究,但我们推测乳癌可能有影响人体发生类风湿性关节炎等免疫性疾病的风险,需实验进一步验证。本研究结果表明,浸润性乳癌病人的某些感染通路可以被活化,通过对这些通路进行免疫治疗可能减缓乳房肿瘤的发生发展。这些与通路相关的基因是治疗的新靶点。这些信号通路可能涉及乳癌的产生及发展过程中的各个环节与步骤,不同的环节相互作用对乳癌发生发展产生影响。应用病原感染激活免疫系统消灭肿瘤细胞,其基础理论与临床治疗均可行。
本文研究通过构建PPI网络,采用3种不同的方法筛选获得了HUB基因ALAS2、EGR1、DUSP1、FOS。ALAS2基因的产物是一种红系特异性线粒体定位酶,其编码的蛋白质催化血红素生物合成途径的第一步,但该基因与癌症的关系目前鲜有文献报道。EGR1基因编码的蛋白质具有转录调节功能,影响着细胞分化与有丝分裂的进程;还有研究表明,EGR1是一个抑癌基因,EGR1影响了乳癌、前列腺癌、胃癌的发生发展[10-12]。乳癌EGR1过表达病人经过内分泌治疗后往往预后良好[13]。FOS是一种原癌基因,其所属的基因家族能够编码亮氨酸拉链蛋白,其在信号转导、细胞增殖和分化中占据重要位置。国外研究显示,乳癌活检组织中FOS表达较正常组织明显增高,FOS的胞质活性为控制乳癌生长的潜在靶标[14]。DUSP1可以使MAP激酶MAPK1/ERK2去磷酸化,进而参与多个细胞过程。BOULDING 等[15]研究结果显示,DUSP1可以参与到上皮-间质转化(EMT)和乳癌干细胞调节的过程,从而干预乳癌的发生和进展。这些HUB 基因在PBMC中的表达影响着乳癌的生物进程。多个HUB基因在组织同时表达表明肿瘤或肿瘤基质与外周血PBMC之间存在关联;肿瘤基质分泌的蛋白与PBMC中的受体结合,影响着PBMC在外周血中表达的改变。这些基因的发现有助于促进乳房肿瘤非侵入性诊疗的发展。
miRNA 可以参与基因表达调控的重要进程中。本研究显示,miR-144-3p表达与乳癌的分期分级相关[16]。miR-181c-5p、miR-181d-5p、miR-181b-5p、miR-181a-5p均已经被证明参与乳癌的发生及转移的相关进程[17-19]。miR-543过表达可抑制细胞增殖和细胞周期,上调细胞凋亡,并通过直接靶向ERK/MAPK 抑制乳癌细胞的增殖[20]。miR-101-3p的表达上调及下调与乳房肿瘤细胞的侵袭性相关[21];同时,miR-101-3p可与多种靶基因结合,对乳癌发展、转移以及癌细胞的增殖过程产生抑制作用,并促进肿瘤细胞凋亡[22-24]。这些miRNA 影响着乳癌的发生、发展,可能成为诊治靶标。
Lnc RNA 被认为是多种癌症(包括浸润性乳癌)发生发展的生物标记物。本文研究共发现20个符合条件的上游lncRNA,其中XIST、SN HG7、SN HG5、SNHG1、OIP5-AS1、NORAD、NEAT1、MIR4458 HG、MALAT1、KCNQ1OT1等涉及乳癌的发生发展。其作用机制主要包括两个方面:①通过对miRNA 的调控,上调或下调靶向基因的表达,间接对癌症的发展发挥促进或者抑制的作用,这些Lnc RNA 包括SN HG7、SN HG5、SN HG1、XIST、OIP5-AS1和KCNQ1OT1[25-30];②通过直接对乳癌细胞信号通路进行调控影响其生物学进程,这些Lnc RNA 包 括NEAT1、NORAD、MALAT1[31-33]。本文研究发现的20个上游lncRNA 影响浸润性乳癌的发展、转移、增殖和侵袭等进程。目前,有关浸润性乳癌病人PBMC中lnc RNA 的生物信息数据、文献较少,相关m RNA、lncRNA 的研究有待进一步深入。
综上所述,本文使用综合的生物信息学分析方法,获得浸润性乳癌病人的PBMC 差异基因,并寻找到其中的HUB 基因。然后通过预测HUB 基因上游的miRNA、lncRNA,构建了m RNA-miRNAlncRNA 可视化网络以显示基因分子间的相互作用关系。本文结果为通过外周血PBMC 对浸润性乳癌进行早期诊断及临床精准治疗、靶向治疗提供可靠的理论基础与方向。