eRNA AP003059.2与乳腺癌患者预后的相关性分析——基于TCGA数据库
2021-09-19王卫忠何雪倩冯杜金陈燕敏赵钊
王卫忠 何雪倩 冯杜金 陈燕敏 赵钊
乳腺癌是全球范围内女性最常见的恶性肿瘤之一[1]。其发病率逐年上升,每年全球新发病例达115万,占全球女性恶性肿瘤的22.7%,死亡病例达41万,占所有女性恶性肿瘤死亡的14.1%,其死亡率在女性恶性肿瘤中位居第二,严重威胁妇女健康[2]。虽然近年来随着诊断和治疗技术的提高,乳腺癌的病死率已大大降低,但由于乳腺癌是一种高度异质性的肿瘤,不同乳腺癌患者的预后存在较大差异。发现新的乳腺癌预后生物标志物,以实现乳腺癌的个体化预后评估具有重要的临床意义。
研究表明,长链非编码RNA(long non-coding RNA,lncRNA)的表达或功能异常与癌症、退行性神经疾病在内的多种人类重大疾病的发生密切相关[3-4]。lncRNA的表达具有细胞或组织特异性,其或可成为潜在的癌症生物标志物[5]。增强子是基因组中顺式调节元件的主要类型,通过与靶基因启动子相互作用从而增强靶基因的转录。近年来发现增强子也能转录lncRNA,称为增强子RNA(enhancer RNA,eRNA)。在人类细胞中已经鉴定出数以万计的eRNA。eRNA可以介导靶基因的激活,从而在基因的转录调控中发挥重要作用。在癌症发生、发展过程中,癌基因或致癌信号通路的激活通常会伴随着增强子的激活以及eRNA的产生。已有研究表明eRNA在肿瘤发生中存在重要作用,暗示它们可作为临床治疗、预测预后的潜在靶标[6]。基底细胞癌中肌动蛋白相关蛋白T1(actin-related protein T1,ACTRT1)相关eRNA的突变可能削弱增强子的活性和ACTRT1的表达,从而导致Hedgehog信号通路的异常激活,促进肿瘤的发展[7]。在乳腺癌中可以检测到神经上皮细胞转化基因 1(neuroepithelial cell transforming 1,NET1)相关的eRNA高表达,这是一个位于癌基因NET1下游约90 kb的eRNA,敲低NET1e显著降低了乳腺癌细胞系MCF-7的增殖,并且NET1e表达水平与药物反应性相关[8]。但是,之前的研究主要集中在单个或几个eRNA与乳腺癌之间的关系,目前利用大数据筛选分析与乳腺癌相关的eRNA研究还不多见。基于此,本研究通过人类癌症基因组图谱(the cancer genome atlas,TCGA)数据库筛选出与乳腺癌预后相关的eRNA及其靶基因,分析其与临床特征的相关性,并对其在泛癌中的表达进行研究,现报道如下。
1 材料和方法
1.1 乳腺癌预后相关eRNA的筛选 下载获得由PreSTIGE算法[9]预测的组织特异性增强子表达的lncRNA及其预测靶标的列表,得到2 695个组织特异性增强子表达的lncRNA转录本以及2 303个相关预测靶基因。通过Ensembl基因组序列数据库将列表中的“Ensembl ID”转换为“gene symbol”,将 2 695 个 eRNA 转录本定位到对应的1 288个基因[10-11]。从UCSC Xena癌症基因组学数据分析平台下载TCGA数据库中33种肿瘤的RNA测序数据以及临床数据,研究TCGA中相应癌症数据中eRNA的表达水平及其临床特征相关性。通过基因共表达分析,以评估eRNA水平与靶基因之间的相关性。关键eRNA的筛选标准为与总生存期(P<0.05)以及与其靶基因共表达(r>0.4,P<0.001)明显相关。
1.2 统计学处理 采用R统计软件。采用Kruskal-Wallis H检验比较不同类型肿瘤之间的基因表达差异。采用非参数Wilcoxon符号秩检验比较匹配的肿瘤和非肿瘤样本间的基因差异。采用Spearman等级相关系数评估两组变量关系密切程度。采用Kaplan-Meier方法计算不同风险组的总体生存时间,进行log-rank检验。P<0.05为差异有统计学意义。
2 结果
2.1 乳腺癌预后相关eRNA筛选结果 通过分析TCGA数据库中1 217例乳腺癌患者的RNA测序数据,发现91个eRNA的表达水平与乳腺癌患者的总体生存率显著相关(P<0.05)。随后将这91个eRNA的表达水平与其靶基因的表达水平进行相关性分析,得到30个预后相关eRNA的表达水平与其靶基因的表达水平呈显著相关(Spearman等级相关系数r>0.4,P<0.001)。见表1。
表1 与乳腺癌预后相关的eRNA
2.2 AP003059.2是乳腺癌的关键eRNA 由表1可见,AP003059.2是与乳腺癌总体生存率相关性最强的eRNA。与AP003059.2低表达组相比,AP003059.2高表达组显示出更高的总体生存率(图1a)。AP003059.2的基因表达与靶基因ME3表达水平呈显著正相关(图1b)。通过limma包分析乳腺癌中与AP003059.2共表达相关的基因,主要包括苹果酸酶3(malic enzyme 3,ME3)、AP001148.1、ZNF540、CBX7、RAD51-AS1、AP000654.1、GTF2IRD2、LINC01359、PRSS23、RBM5、AP003059.1、TRMT9B、CROCCP3等13个基因。
图1 增强子RNA(eRNA)AP003059.2与乳腺癌患者预后的关系[a:AP003059.2高表达和低表达乳腺癌患者的总生存曲线比较;b:AP003059.2和苹果酸酶3(ME3)共表达关系分析]
2.3 eRNA AP003059.2与激素表达状态的相关性分析 与雌激素受体(estrogen receptor,ER)阴性肿瘤相比,ER阳性肿瘤表达更高水平的AP003059.2(P<0.001,图2a)。而与人表皮生长因子受体 2(human epidermal growth factor receptor 2,HER-2) 阴性肿瘤相比,HER-2阳性肿瘤表达较低水平的AP003059.2(P<0.001,图 2b)。与孕激素受体(progesterone receptor,PR)阴性肿瘤相比,PR阳性肿瘤表达更高水平的AP003059.2(P<0.001,图2c)。上述结果表明在不同激素受体表达乳腺癌中,AP003059.2的表达存在差异,可能为乳腺癌个体化治疗及预后分析提供新的靶标。
图2 雌激素受体(ER)、人表皮生长因子受体2(HER-2)、孕激素受体(PR)阳性与阴性乳腺癌中增强子RNA(eRNA)AP003059.2的表达差异(a:ER阳性与阴性乳腺癌比较;b:HER-2阳性与阴性乳腺癌比较;c:PR阳性与阴性乳腺癌比较)
2.4 eRNA AP003059.2在泛癌中的表达 通过对33种肿瘤中AP003059.2的表达与肿瘤总体生存率以及与ME3共表达相关性进行研究,发现仅在乳腺癌中,AP003059.2与肿瘤总体生存率以及ME3共表达存在相关性,表明AP003059.2在乳腺癌组织中特异性表达,具有组织特异性。见表2。
表2 33种肿瘤中AP003059.2表达水平与患者生存预后分析及与苹果酸酶3(ME3)基因表达相关性分析
3 讨论
eRNA是基因增强子区域内衍生的特定亚类lncRNA,能够以顺式作用影响相应基因的转录。为了增进对乳腺癌中eRNA的了解,本研究使用以下方法来鉴定BRCA中与预后相关的eRNA:(1)从已发表文献得到组织特异性增强子表达的lncRNA及其相关靶基因列表;(2)下载TCGA数据库中乳腺癌数据,分析eRNA的表达与乳腺癌总体生存率的相关性;(3)通过eRNA与靶基因的相关性分析进一步筛选。该方法筛选得到了影响乳腺癌发生、发展的相关eRNA,也可用于具有足够RNA测序数据的其他人类疾病eRNA的研究。
本研究结果显示,目前功能尚未注释的lncRNA AP003059.2被确定为与乳腺癌预后最相关的eRNA。在TCGA数据库的33种癌症中,AP003059.2的表达对乳腺癌总体生存率的影响最大,而与其他31种肿瘤存活率无明显相关性,具有明显的组织特异性,这或可使其成为预测乳腺癌预后的关键eRNA。AP003059.2位于ME3基因的增强子区域内,与ME3的表达之间存在很强的相关性。ME3是苹果酸酶家族的关键成员,在胰岛素释放和上皮细胞间质化等多个生理和病理过程中发挥重要作用[12]。ME3作为一种氧化性脱羧酶,可催化苹果酸转化为丙酮酸,是还原型辅酶Ⅱ再生和活性氧(reactive oxygen species,ROS)稳态所必需的。ROS既可以作为信号分子,又可以作为细胞死亡的介体,从而促进肿瘤细胞增殖或诱导肿瘤细胞死亡。已有研究证明胰腺癌组织中ME3的表达高于正常胰腺组织,ME3表达的增加可能在胰腺癌的发展中起重要作用,并作为胰腺癌发生和进展的生物标志物[13]。研究表明,苹果酸酶可能是抑制包括肺癌、神经胶质瘤、肝细胞癌、皮肤黑色素瘤和鼻咽癌在内的多种肿瘤生长和侵袭的靶标[14-15]。靶向ME3可能是抑制肿瘤生长的有效方法,高特异性的ME3抑制剂可以为相当一部分癌症患者提供有效的治疗方法[16]。
本研究也发现AP003059.2的表达与乳腺癌组织中的激素受体表达状态相关。与ER阴性的乳腺癌相比,ER阳性的AP003059.2水平更高;与PR阴性的乳腺癌相比,PR阳性的AP003059.2水平更高;而在HER-2阴性的乳腺癌中,AP003059.2水平更高。这些结果表明乳腺癌作为一种异质性很高的恶性肿瘤,必须综合考虑各种激素受体的表达情况,才能对不同类型乳腺癌的预后和个体化治疗方案作出精确判断。
由于AP003059.2是功能未注释的转录本,本研究试图通过鉴定除其预测的靶标ME3外的其他共表达基因来阐明其作用。除ME3外,本研究还发现其他12个与AP003599.2具有显著表达相关性的基因。但是转录本之间的相关性并不一定表示两者之间具有因果关系,AP003059.2是否具有相应靶基因的增强子活性仍有待通过实验确定。
总之,AP003059.2是乳腺癌的组织特异性eRNA,与乳腺癌的预后明显相关,或可作为乳腺癌患者潜在预后生物标志物和治疗靶标。