MiR-199a-3p在胰腺癌中的表达水平及生物信息学分析
2019-05-05孙晋津
余 冬,冯 霜,李 俊,孙晋津
(天津医科大学第二医院肝胆胰外科,天津300211)
胰腺癌是一种高致死率的疾病,恶性程度高,早期诊断困难,手术切除率低,对放化疗不敏感,容易复发和远处转移,预后极差[1]。近年来,由于癌症的早期发现和治疗方案的改善,大多数常见恶性肿瘤的5年生存率有所升高,但胰腺癌的生存率未见明显改善,其5年生存率仅为8%[2]。因此寻求新的诊断及治疗策略以达到早发现、早诊断、早治疗的目的尤为迫切。microRNA(miRNA)是一类长度约为22个核苷酸(nt)的非编码单链小RNA分子,在细胞内由70~80 nt的单链RNA前体经Dicer酶剪切加工而来。miRNA可以调节基因的表达,在肿瘤的发生和抑制、肿瘤的诊断和结局发挥重要作用[3]。有研究表明 miR-199a-3p 参与卵巢癌[4]、肝癌[5]、骨肉瘤[6]、结直肠癌[7]等多种癌症的发生和发展。然而,关于miR-199a-3p在胰腺腺癌中的研究及作用机制却鲜有报道,其相关的作用机制仍有待明确和解决。GEO(GeneExpression Omnibus)数据库是目前最大的完全公开的基因表达数据库,包括大量的基因微阵列和各种形式的高通量基因测序数据,并且可供自由下载和研究分析[8]。本研究基于GEO数据库的miRNA的测序数据,综合各个生物信息学分析软件,利用相关统计学方法,研究胰腺癌中的miR-199a-3p表达水平及其生物学功能。
1 资料和方法
1.1 数据资料及纳入和排除标准 从GEO数据库(Gene Expression Omnibus,http://www.ncbi.nlm.nih.gov/geo/)下载胰腺癌的miRNA数据,在GEO数据库使用如下关键字进行检索:(pancreas OR pancreatic)AND(cancer OR carcinoma OR tumor OR neoplasm*OR malignant*OR adenocarcinoma)AND(microRNA OR miRNA OR“micro RNA”)。芯片数据的纳入标准:(1)所测为人的胰腺癌样本,包括非编码RNA芯片数据;(2)有正常对照(包括正常胰腺组织或癌旁组织),至少超过2例;(3)芯片数据可以用来计算和对比。排除标准:(1)数据中无miR-199a-3p 相关可用的数据;(2)样本为血液的;(3)样本是胰腺癌细胞系的;(4)数据中不只有人的样本;(5)样本有药物等其他因素的干扰。
1.2 数据处理和统计学方法 采用SPSS17.0对数据进行分析,miR-199a-3p表达数据用±s表示,student’T用于两独立样本的检验,ROC曲线用于检验miR-199a-3p数据的诊断价值;review manager 5.3进行Meta分析,卡方检验和I2检验用于数据的异质性检验,P<0.05或I2>50%表示有显著异质性,并且应用随机效应模型,否则,选择固定效果模型。森林图用于检验数据的偏移,P<0.05表示有统计学意义。
1.3 miR-199a-3p生物信息学分析 用7个基因预测平台,包括 TargetScan[9]、MirDB[10]、DIANAmicroT[11]、miRWalk[12]、PITA[13]、RNA22[14]and NBmiRTar[15]预 测miR-199a-3p的靶基因。所预测的全部靶基因取其交集,至少被4个平台同时预测到的基因纳入潜在的靶基因。对全部潜在的靶基因利用DAVID在线分析工具[16]对GO功能和KEGG通路进行富集分析。
2 结果
2.1 数据收集 GEO数据库最终收集到6个胰腺癌的miR-199a-3p表达数据,分别是GSE24279、GSE32678、GSE41372、GSE43796、GSE60978、GSE71533,6 个GEO数据的信息如图1所示,GSE24279、GSE41372、GSE60978、GSE71533数据中胰腺癌的miR-199a-3p表达水平的平均值都高于正常胰腺组织,且差异有统计学意义(P值分别是P<0.001、P=0.003、P=0.001、P<0.001)。从 ROC 曲 线 可 以 看 出 ,GSE24279、GSE41372、GSE60978、GSE71533数据中胰腺癌表现出具有显著意义的诊断价值,对应的受试者工作特征曲线如图2所示。
图1 6个GEO数据库中miR-199a-3p在胰腺癌和正常对照中的表达水平Fig 1 Expression of miR-199a-3p in pancreatic cancer and normal pancreatic tissues in six GEO databases
图2 4个GEO数据中胰腺癌的miR-199a-3p的ROC曲线Fig 2 The ROC curve of miR-199a-3p in pancreatic cancer in four GEO databases.
2.2 Meta分析结果 6个数据库中胰腺癌miR 199a-3p的表达数据进行meta分析,异质性检验显示P<0.05或I2>50%,应用随机效应模型,SMD(标准均数差)为 1.36(95%CI:1.03-1.69,P<0.001),Meta 分析显示胰腺癌和正常胰腺组织的miR-199a-3p的表达水平有差异,差异有统计学意义。数据分析结果、森林图、漏斗图如图3所示。
2.3 生物信息学分析结果 预测221个miR-199a-3p潜在的靶基因。GO功能富集分析表明靶基因的功能主要富集在基因表达的调节,细胞代谢的调节,蛋白质域特异性结合等生物学过程(P<0.001)。KEGG通路富集分析结果显示主要富集在PI3K-Akt通路、黏着斑、肌动蛋白细胞骨架调控、癌症通路、Hippo通路、鞘脂通路、ErbB通路、MAPK通路等通路(P<0.05)。各项预测结果的前10项如表1所示。
图3 胰腺癌和正常胰腺组织之间的miR-199a-3p表达水平的组合SMD的森林图(A)和漏斗图(B)Fig 3 Forestplot(A)and funnelplot(B)of the combined SMD for miR-199a-3pexpression between pancreatic cancer and normal pancreatic tissues
表1 GO富集分析和KEGG信号转导通路富集分析结果各项预测的前10项Tab 1 Ten result smost strongly enriched by GO analysis and KEGG pathways analysis
3 讨论
目前miRNA是各个疾病和肿瘤的基因调控中重要组成部分,广泛参与生物体内的信号通路的调控及生物学行为。已经有越来越多的研究指出miR-199a-3p在各个癌症中基因表达、分子调控等方面都发挥着重要的作用。Kinose等[17]发现在卵巢癌中miR 199a-3p的靶基因为MET,并可通过降低c-Met的表达来抑制卵巢癌的进展,有望成为治疗卵巢癌播散的潜在靶标。Huang等[18]得出miR-199a-3p在肾癌中下调,其可抑制细胞增殖,且可抑制c-Met及其下游信号通路的表达。在结直肠癌中,Han等[19]证明NLK是miR-199a-3p一个靶基因,NLK的表达抑制结直肠癌细胞的生物学行为。在骨肉瘤中,Tian等[20]发现miR-199a-3p呈低表达,通过下调AXL mRNA和蛋白质的表达而负向促进骨肉瘤的进展,且和AKT途径调节骨肉瘤的进展相关。Koshizuka等[21]证明在头颈部肿瘤中miR-199a-3p靶向调节ITGA3来抑制肿瘤细胞的迁移和进展。在上述的肿瘤中miR-199a-3p调控相应的靶基因和信号通路并发挥着抑癌作用。而关于胰腺癌中miR-199a-3p的表达情况和作用机制的研究少见文献报道,仅有少部分对胰腺癌中miRNA的研究中有提及miR-199a-3p。国外有研究对5例胰腺癌和5例正常胰腺组织进行miRNA微阵列研究,结果分析显示胰腺癌中miR-199a-3p表达水平相比于正常胰腺组织呈上调[22]。值得注意的是在另一项研究中,通过65例胰腺癌和相应的正常胰腺组织行miRNA微阵列研究,得到相同的研究结果[23]。然而在国内的一项研究中,利用miRNA芯片技术筛选胰腺癌差异miRNA表达谱时,得出胰腺癌中miR-199a-3p呈下调,但正常胰腺与胰腺癌之间表达差异无统计学意义[24]。因此miR-199a-3p在胰腺癌中的表达尚不确切。另一方面,仅有检索到两篇文献有报道miR-199a-3p在胰腺癌的作用机制。其中之一发现在胰腺肿瘤中miR-199a-3p主要调节胰腺星状细胞的活化与促肿瘤效应,miR-199a-3p可作为靶向治疗的潜在靶点[25]。另一篇研究表明基因型的变异可干扰miR-199a/HIF1A调节环的调节来改变胰腺癌的风险和预后[26]。从目前的研究现状来看,miR-199a-3p在胰腺癌中的表达情况和机制仍未完全阐明,仍需进一步深入的研究。
本研究中,通过筛选并比较GEO数据库中胰腺癌和正常胰腺组织中miR-199a-3p的表达水平,综合多组GEO数据并进行Meta分析,发现胰腺癌中miR-199a-3p的表达水平高于正常组织,差异有统计学意义(P<0.001),4项数据的ROC曲线表明miR-199a-3p有着一定的诊断价值,可能成为一种新的诊断指标,为胰腺癌的早期诊断提供方向。miRNA主要与靶基因mRNA的3′-非翻译区(3′-UTR)互补配对,调节靶基因mRNA降解和蛋白合成,从而调控转录后靶基因的表达水平,最终影响细胞增殖、分化和凋亡等功能。基因调控是一个复杂的网络,利用生物信息学分析miR-199a-3p与其相关的靶基因,并探索靶基因的作用,以进一步了解miR-199a-3p的功能。本研究综合数个靶基因预测平台,更广泛的收集预测到靶基因,但同时也可能带来一定的差异性。对miR-199a-3p的靶基因GO功能分析,得出其主要富集在基因表达的调节,细胞代谢的调节,蛋白质域特异性结合等重要的生物学过程。靶基因的KEGG信号通路富集分析结果主要富集在PI3K-Akt信号通路、黏着斑、肌动蛋白细胞骨架调控、癌症通路、Hippo信号通路、鞘脂信号通路、ErbB信号通路、MAPK信号通路等信号转导通路。已经有研究指出约50%的胰腺癌呈现PI3K信号传导的激活增加,且和Akt的磷酸化有关,通常与肿瘤的未分化状态相关并且与不良预后相关[27]。同样也有研究报道MAPK信号通路[28]、ErbB信号通路[29]在胰腺癌中有着密切的联系。可见上调的miR-199a-3p可能与胰腺癌的发生发展有着密切的联系,为胰腺癌的研究提供新的研究方向和理论依据。本研究的分析结果综合了多个GEO数据库,增加了信息的可靠性,也存在一定的局限性,结果的准确性需实验进一步来验证。