miR-182作为胃癌潜在生物学标志物的Meta分析及生物信息学分析
2020-08-05徐雪莲唐富天罗曼曼李玉民
徐雪莲 唐富天 张 凡 曾 蕾 罗曼曼 李玉民
胃癌是癌症相关的死亡的第3大原因,被认为是全球第5大肿瘤[1]。由于缺乏早期诊断标志物,大多数胃癌患者诊断时已处于晚期阶段,其5年总生存率仅约20%[2]。目前,已有几种肿瘤生物学标志物广泛应用于早期胃癌的临床诊断,包括α-甲胎蛋白(α-fetoprotein, AFP)、CA125、CA19-9和癌胚抗原(carcinoembryonic antigen, CEA)。但是,这些生物学标志物的特异性和敏感度不高[3]。因此,需要进一步探索对胃癌早期诊断的潜在生物学标志物。
miRNA是非编码的单链小RNA(约22个核苷酸),其可通过减少蛋白质翻译或增强信使RNA(mRNA)降解来调节基因表达。MiRNA可能是多种癌症的潜在诊断标志物,并且miRNA对于肿瘤的分类比mRNA更准确[4]。已有研究者提出miRNA可能作为胃癌诊断和预后评估的生物学标志物或胃癌治疗的靶标[5]。其中有研究结果表明,与正常组织比较,miR-182在胃癌组织中的表达明显增加[6~9]。但也有研究发现miR-182在胃癌中的表达是降低的[10,11]。因此,本研究通过使用多模式数据库和生物信息学分析方法进一步分析miR-182在胃癌中的表达水平和诊断价值,并探索其可能的分子机制,为胃癌患者的诊断、治疗及预后提供理论基础。
材料与方法
1.GEO数据获取:检索GEO数据库(https:∥www.ncbi.nlm.nih.gov/gds),检索式为:(stomach OR gastric) AND (adenocarcinoma OR neoplasms OR neoplasm OR carcinoma OR tumour OR tumor OR cancer OR malignant) AND (microRNA OR miRNA OR miR)。数据集的纳入标准:①数据集需包括胃癌组和对照组;②数据集至少有20个组织、血液、血清或血浆样本;③数据集中miR-182的表达数据均可获取。排除标准:①无对照组的数据集;②无法获取miR-182表达信息的数据集。最终获取14个GEO数据集,即GSE85589、GSE106817、GSE113486、GSE124158、GSE112264、GSE28700、GSE23739、GSE30070、GSE33743、GSE26595、GSE54397、GSE63121、GSE78775和GSE93415,并对实验组和对照组中miR-182表达的平均数和标准差进行计算。
2.TCGA数据获取:从TCGA数据库(https:∥cancergenome.nih.gov/)中提取胃癌和正常组织的miR-182表达数据,使用R3.6.0软件进行数据处理并计算胃癌组织与正常对照中miR-182表达的平均数和标准差。
3.文献检索:以(stomach OR gastric) AND (adenocarcinoma OR neoplasms OR neoplasm OR carcinoma OR tumour OR tumor OR cancer OR malignant) AND (microrna 182 OR miR 182 OR mirna 182 OR miRNA182 OR microRNA182 OR miR182 OR microRNA-182 OR miR-182 OR miRNA-182)为检索式检索PubMed、EMBASE、ScienceDirect和Cochrane数据库,以(胃癌 OR 胃腺癌 OR 胃肿瘤 OR 胃恶性肿瘤) AND (microrna 182 OR miR 182 OR mirna 182 OR miRNA182 OR microRNA182 OR miR182 OR microRNA-182 OR miR-182 OR miRNA-182)为检索式检索中国期刊全文数据库(CNKI)、万方和中国生物医学文献数据库。文献纳入标准:①研究中可提取胃癌与非癌对照miR-182表达的平均数和标准差;②研究对象为人类。排除标准:①无对照组的研究;②针对动物和细胞的研究;③重复的文献。图1展示了研究筛选及获取的流程。
4.统计学方法:由两名研究员独立提取数据集或文献中的信息,主要包括实验组及对照组的样本个数和miR-182表达数据。计算标准化的均值差(SMD)并获取相应的95%置信区间(CI),应用Q检验和I2检验进行异质性评估,当P> 0.05或I2<50%时表示没有显著异质性,应选择固定效应模型进行Meta分析,否则,需选择随机效应模型[12]。运用Begg′s检验评价是否存在发表偏倚,通过敏感度分析对纳入研究的稳健性进行评估。另外,由于文献中没有miR-182表达的原始数据,仅对TCGA和GEO数据集中的数据进行诊断性Meta分析,使用SPSS 23.0统计学软件来计算每个数据集的真阳性(TP)、真阴性(TN)、假阴性(FN)和假阳性(FP),并使用Stata 14.0统计学软件来建立汇总受试者工作特征曲线(SROC),曲线下面积(AUC)可表示miR-182对胃癌的诊断价值。在诊断性Meta分析中,通过绘制Deek′s漏斗图评估发表偏倚。
5.miR-182靶基因预测及生物学功能分析:使用DIANAmicroT、miRWalk、miRanda、miRDB和TargetScan 5个预测软件进miR-182靶基因的预测,筛选5个预测软件的交集基因作为靶基因进行下一步生物学功能分析。应用DAVID 6.8(the Database for Annotation, Visualization and Integrated Discovery, https://david.ncifcrf.gov/)数据库对获取的靶基因进行GO和KEGG富集分析。利用STRING(the Search Tool for the Retrieval of Interacting Genes database, https://string-db.org/)数据库和Cytoscape构建PPI网络,以获取关键基因(Hub基因)。
结 果
1.胃癌组织中miR-182表达水平的Meta分析
(1)Meta分析:从纳入的9个GEO数据集(GSE28700、GSE23739、GSE30070、GSE33743、GSE26595、GSE54397、GSE63121、GSE78775和GSE93415)一共获取了328例癌组织和187例非癌组织,从TCGA共获取了436例胃癌组织和41例正常对照。此外,同时纳入3项研究(124例胃癌组织和124例对照)用于miR-182表达的分析。由于在该Meta分析中存在较高的异质性(I2= 96.3%,P=0.000),故使用随机效应模型进行分析(表1)。胃癌组织中miR-182显著高于非癌对照组(SMD=1.09, 95% CI:0.26~1.92,图2)。由图3的敏感度分析可以看出,Yu等[10]的研究显示可能是导致异质性的原因,同时Begg′s检验(P=0.246)未发现发表偏倚。
表1 纳入研究的基本特征
(2) 诊断性Meta分析:GEO和TCGA数据的诊断性分析结果表明汇总特异性和汇总敏感度分别为0.75(95% CI: 0.50~0.90) 和 0.65(95% CI: 0.42~0.83),见图4A,SROC(AUC)=0.76(95% CI: 0.72~0.79),见图4B,Deek′s漏斗图中P=0.894,表明没有发表偏倚(图4C)。
2.血液/血清中miR-182表达水平的Meta分析:(1)Meta分析:该研究共纳入5个GEO数据集(GSE85589、GSE106817、GSE113486、GSE124158和GSE112264)和2项研究,共获取了327例胃癌样本和3269例正常对照样本(表1)。使用随机效应模型分析后的结果显示,胃癌血液/血清中miR-182也显著高于正常对照组(SMD=3.37, 95%CI:2.15~4.59,I2=97.8%,P=0.000,图2),Begg′s检验未发现发表偏倚(P=0.072)。
(2) 诊断性Meta分析:GEO数据的诊断性分析结果显示血液/血清miR-182诊断胃癌的汇总特异性和汇总敏感度分别为0.72(95%CI: 0.48~0.87)和0.90(95%CI: 0.74~0.97),见图5A,SROC(AUC)=0.90(95%CI: 0.87~0.92),见图5B,未发现明显的发表偏倚(Deek′s检验:P=0.95),见图5C。
3.miR-182靶基因的获取及功能分析:使用5个预测软件共获得14848个相关基因,通过取5个软件的交集获得329个靶基因。使用DAVID对miR-182靶基因进行GO和KEGG富集分析,共获得了58个GO富集项目(P<0.05)。GO富集分析主要包括生物过程(BP)、细胞成分(CC)和分子功能(MF)3部分,BP、CC和MF的前7个重要分析项目。BP包括36个项目(P<0.05,图6),靶基因主要涉及RNA聚合酶Ⅱ启动子转录的正调控、蛋白质转运和基因表达的调控等,CC包括14个项目(P<0.05),靶基因主要位于细胞质、转录因子复合物和膜等。MF包括7个项目(P<0.05),靶基因主要富集于RNA聚合酶Ⅱ核心启动子近端区域序列特异性结合、序列特异性DNA结合和蛋白质结合等。KEGG途径包括15个项目(P<0.05),靶基因主要参与Ras信号通路、PI3K-Akt信号通路和Hippo信号通路等。将329个靶基因输入STRING数据库进行分析然后将分析结果导入Cytoscape,通过PPI网络获得的具有最高degree的4个基因(NRAS、CREB1、FBXW7和SOX2)作为Hub基因,PPI网络详见图7。
讨 论
由于缺乏胃癌早期诊断生物学标志物,大多数胃癌患者发现时已处于晚期阶段[2]。本研究主要整合了来自GEO、TCGA和文献中的miR-182表达数据,以进行Meta分析和诊断性Meta分析来验证miR-182对胃癌的诊断价值,并通过生物信息学分析对其相应的分子机制进行了初步分析。
大部分研究认为miR-182在胃癌中是上调的,本研究结果与既往的大部分研究一致[6~9]。另外,诊断性Meta分析的结果表明,miR-182在胃癌中的表达水平较高,组织和血液/血清中SROC曲线下面积分别为0.76和0.90。因此,miR-182表达水平可将胃癌患者与健康人群区分开来,其可作为胃癌的诊断生物学标志物。
既往研究表明,miR-182在增殖、侵袭和上皮-间质转化等肿瘤发生的关键步骤中起着重要作用[13,14]。miR-182的功能复杂,其在不同癌症中分别具有抑癌或致癌作用。在卵巢癌中,miR-182表达上调会促进肿瘤转移[13]。miR-182的过表达可抑制FOXO3和与鸭小眼畸形相关的转录因子(MITF-M),从而促进黑色素瘤的迁移和存活[15]。在肝细胞癌中,miR-182通过抑制转移抑制因子1(MTSS1)的表达而促进肿瘤转移[16]。与上述研究相反,miR-182可靶向Met基因以抑制肺癌的转移和上皮-间质转化[17]。在肾细胞癌中,miR-182被下调,它可能通过靶向IGF1R来抑制细胞的侵袭和迁移[18]。
在胃癌中miR-182的功能尚不明确,不过已发现miR-182的几个靶基因在胃癌中起重要作用。Li等[6]指出miR-182在胃癌组织中增加,其可通过抑制RAB27A促进胃癌的进程。相反,一些研究证明miR-182是一种抑癌基因。Kong等[11]研究发现miR-182在胃癌中表达较低,它通过靶向cAMP反应元件结合蛋白1(CREB1)抑制胃癌细胞的增殖和集落的形成。此外,Tang等[19]表明,miRNA-182可通过下调胃癌中的ANUBL1抑制肿瘤增殖。
本研究共预测出4个基因(NRAS、CREB1、FBXW7和SOX2)可能是miR-182的相关靶基因。NRAS是5′-三磷酸鸟苷结合蛋白家族的成员,被认为是致癌基因,NRAS的激活与胃癌细胞的转移和肿瘤发生有关[20,21]。CREB1是亮氨酸拉链(bZIP)家族的成员,它是一个转录因子,其在癌症进展中起着至关重要的作用。Wang等[22]研究发现CREB1与胃癌的分期、转移和预后有关。如上所述,已有研究提出miR-182通过靶向CREB1来调节胃癌细胞的生长。FBXW7是Skp1-Cul1- F-box(SCF)的组成部分,其为抑癌基因,它的缺失可促进肿瘤进展[23]。Yakobori等[24]研究发现FBXW7的表达水平与胃癌的大小、淋巴转移和预后有关。SOX2是高度保守的转录调节因子,其在干细胞自我更新、细胞周期、细胞凋亡和增殖中起着至关重要的作用[25]。一些研究发现SOX2在胃癌中过度表达并具有致癌作用,然而其他研究表明,SOX2是胃癌中的抑癌基因[26]。
本研究纳入的部分文献中样本量较小,且部分研究为非随机对照试验,这可能是本研究异质性的主要来源。因此,进一步的研究应着重于对不同胃癌样本类型(例如组织、血浆、血清、血液等)进行miR-182表达的大样本随机对照试验,以进一步探讨miR-182对胃癌的诊断价值。
综上所述,与非癌对照比较,miR-182在胃癌组织和血液/血清中明显增加,这表明miR-182具有将胃癌患者与健康人群区分开来的潜在诊断价值,进一步的研究应集中于对不同胃癌样本类型中miR-182表达进行大样本随机对照试验。另外,NRAS、CREB1、FBXW7和SOX2基因在胃癌中的作用机制及与胃癌患者预后的关系值得进一步探索。