泛癌整合分析miR-200家族靶标肿瘤基因异质性的研究
2019-02-12唐勇刘海洲陈曦吴健勇刘萤照杨林凯王琪
唐勇 刘海洲陈曦吴健勇刘萤照 杨林凯 王琪
微小 RNA(microRNAs,miRNAs)大约由 20 个内源性非编码RNA组成,真核生物miRNAs通过与mRNA结合调节基因表达[1]。近年来,研究证实miRNA在肿瘤发生和发展过程中起重要作用,可作为肿瘤诊断标志物及治疗的分子靶点[2-3]。其中,miR-200家族被发现可负调控下游E-Cadherin相关转录抑制因子ZEB1和ZEB2而调节上皮细胞间质转换(epithelial-mesenchymal transition,EMT)过程,可能抑制肿瘤转移[4],因而将其定义为一种潜在的治疗药物[5]。然而,研究者亦发现miR-200家族在不同类型癌症中显示出抑制或促进转移的相互矛盾作用,miR-200家族表达与肿瘤预后的关系也存在截然相反的报道[6]。miR-141、miR-200b和miR-200c被认为是影响原发性肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)的独立预后标志物[7]。过表达miR-200可抑制肺癌远处转移[8],但也可增强乳腺癌模型转移[9]。另有研究发现,miR-200家族对不同肿瘤的调控机制具有差异性[10]。因此,发现和解释miR-200家族的驱动生物学差异,将对基于miR-200家族的个体化治疗具有重要意义。
miR-200 家 族 共 包 括 miR-429、miR-200a、miR-200b、miR-200c和 miR-141等 5个 miRNAs分子。miR-200a、miR-200b、miR-429 具有相同的核心序列“AAUACU”,而miR-200c、miR-141核心序列为“AACACU”。miR-200家族因具有序列保守性,被认为存在相同的靶基因,并参与相似的生理调控功能,有助于分析其潜在调控机制。本研究利用癌症基因图谱(the Cancer GenomeAtlas,TCGA)收录的PanCanAtlas转录组数据,根据miR-200家族表达与患者预后的关系,对21种肿瘤进行分子分型,探讨miR-200家族调控肿瘤异质性的机制。
1 材料与方法
1.1 泛癌样本
研究对象来自TCGA分析工作组(AWGs)定义的泛癌(Pan-Cancer)样本,选择21种不同组织病理学的恶性实体肿瘤类型共7 642例样本进行分析。从PanCanAtlas项目网站(https://gdc.cancer.gov/aboutdata/publications/pancanatlas)分别下载患者的临床特征数据 TCGA Clinical Data Resource(TCGA-CDR)Outcome,miRNA转录组数据 pancanMiRs_EBadjOn-ProtocolPlatformWithoutRepsWithUnCorr--ectMiRs_08_04_16.csv和RNA-seq数据EBPlusPlusAdjustPANCAN_IlluminaHi-Seq_RNASeqV2.geneExp.tsv。
1.2 组织芯片样本
组织芯片(tissue microarray,TMA)制作选择广西医科大学附属肿瘤医院2009年5月至2014年12月的膀胱癌手术组织蜡块,所有标本均经临床及病理确诊,具有完整的临床及病理学资料。共纳入100例膀胱癌患者,平均年龄(64.13±9.57)岁,pTNM 分期T0期3例,T1~T2期 45例,T3~T4期 52例;肌层浸润88例。
1.3 miR-200家族与预后的相关性分析
TCGA临床终点统计根据PanCanAtlas生存工作组新开发的TCGA泛癌临床标准化数据集(TCGA Pan-Cancer Clinical Data Resource,TCGA-CDR[11]),以临床确诊至因任何原因引起死亡的时间为总生存期(overall survival,OS),每种肿瘤取 5个 miRNA 表达值。根据miRNA值中位数,将患者划分为高表达组和低表达组,并比较生存情况。
1.4 miR-200家族靶标基因预测
采用Mirwalk3在线网站(http://mirwalk.umm.uniheidelberg.de/search_mirnas/)对miR-200家族靶标基因进行预测分析,预测miRNA靶向结合3'非翻译区(untranslated region,UTR)或蛋白质编码区域(coding sequence,CDS)的 mRNA,以 Targetscan 和 miRDB 数据库均预测到的基因作为miR-200家族靶标基因合集。
1.5 WGCNA聚类分析
选择PanCanAtlas项目中膀胱癌、胃腺癌、肾乳头状细胞癌、肝细胞癌、胸腺瘤的RNA-seq数据,提取miR-200家族靶标基因集合的表达值。miR-200家族表达值作为输入表型,运行加权基因共表达网络分析(weighted correlation network analysis,WGCNA)R 语言包,假定基因网络服从无尺度分布,不同节点的相异系数大于0.8,找出miR-200关联性最高和协同表达的基因模块,模块内基因与输入表型相关系数≥0.2或≤-0.2视为显著互作。采用cystoscape中的cytohubba插件计算该模块中最核心的5个基因作为单个miRNA调控信号通路。
1.6 TMA免疫组组化学法检测
膀胱癌TMA为本实验室自制,以辣根过氧化物酶显色的免疫组织化学法检测芯片金属蛋白酶抑制剂 2(TIMP metallopeptidase inhibitor 2,TIMP2)的表达。结果由2位病理医师采取双盲法判定,评分不一致的切片取均值。综合每张切片的染色强度和阳性细胞数量进行判定。根据切片组织中细胞显色深浅分为5个评分等级:无显色记为0分,淡黄色记为1分,黄色记为2分,棕色记为3分,棕褐色记为4分。阳性细胞占同类细胞数的百分比评分:无阳性细胞记为0分,≤5%记为1分,6%~25%记为 2分,26%~50%记为3分,51%~75%记为4分,>75%记为5分。以上述2项的乘积为最终总积分。根据TIMP2值中位数,将患者划分为高表达组和低表达组,并比较生存情况。
1.7 实时荧光定量PCR检测组织miRNA表达
选取制作TMA的膀胱癌石蜡标本提取RNA,按照Qiagen公司的miScriptII Reverse Transcription Kit试剂盒说明书进行总miRNA的cDNA合成,荧光定量PCR反应体系的下游引物使用miScript SYBR Green PCR Kit试剂盒中提供的通用引物,上游引物由英潍捷基(广州)贸易有限公司合成。以人U6 snRNA为内参,采用相对定量法检测miR-200家族成员在膀胱癌组织的表达,以 ΔCt表示 miRNA表达量,ΔCt=[目的miRNA的Ct值(样本组)-U6的Ct值(样本组)]。
1.8 统计学方法
采用R Studio(版本号3.6.1)进行统计学处理。采用pearson相关系数分析miR-200家族表达水平与TIMP2蛋白表达的线性关系,生存率计算采用Kaplan-Meier法,Log-rank法比较生存差异,拟合Cox比例风险模型进行生存比较,计算预测因子的风险比率(hazard ratio,HR)及 95%可信区间(confidence interval,CI),HR<1为保护因素,反之为危险因素。以P<0.05为差异有统计学意义。
2 结果
2.1 miR-200家族与不同肿瘤预后的相关性
利用PanCanAtlas数据分析21种实体肿瘤的总生存时间,绘制生存比较森林图,结果显示,miR-429、miR-200a、miR-200b、miR-200c和 miR-141等 5个miRNAs分子与不同肿瘤生存时间显著相关。miR-200家族高表达是膀胱癌(HR=0.55~0.68,P=0.0001~0.0340)和胃腺癌(HR=0.61~0.72,P=0.0055~0.0170)预后的保护因素。但是高表达miR-200家族的肝细胞癌(HR=1.46~1.65,P=0.0061~0.0120)和胸腺瘤(HR=7.44~13.04,P=0.0002~0.0210)患者总生存时间明显较低表达组短。具有相同核心序列的miR-200家族成员(miR-200a、miR-200b、miR-429)高表达可显著提高肾乳头状细胞癌患者OS(HR=0.23~0.28,P<0.0001),而 miR-141和miR-200c高表达组是患者OS的危险因素(HR=2.53~2.90,P=0.0004~0.0016),图 1。
2.2 miR-200家族靶标基因在不同肿瘤间的异质性分析
Mirwalk3在线网站预测miR-200家族靶向结合的mRNA,Targetscan和miRDB数据库均预测到的基因共有356个,以此作为miR-200家族靶标基因合集。根据miR-200家族对肿瘤生存的影响,选取其与生存呈正相关的膀胱癌和胃腺癌、与生存呈负相关的肝细胞癌和胸腺瘤以及相关性不同的肾乳头状细胞癌进行miRNA靶标基因的肿瘤间异质性分析。WGCNA聚类结果显示,miR-200家族与5种肿瘤的相关模块基因均不一致,存在明显的肿瘤间异质性,其中膀胱癌、肾乳头状细胞癌和胸腺瘤可富集到显著相关模块,肝细胞癌和胃腺癌无相关性。
膀胱癌中,miR-200家族富集到1个负显著相关mRNA模块(图2A),包括7个靶基因(图2B),其中TIMP2、SULF1基因与miR-200家族表达显著相关(图2C)。利用TCGA的RNA-seq数据分析,结果显示TIMP2基因高表达是膀胱癌患者总生存时间的危险因素(HR=1.55,95%CI:1.16~2.08,P=0.0031,图 2D)。
在肾乳头状细胞癌中,miR-141和miR-429富集到1个共同的靶基因模块(图3A),miR-141对模块中包括EPHA2在内的8个基因显示出明显负相关(r<-0.2)。miR-429负调控靶向基因为VAT1L和ELAVL2(图3B),且与 EPHA2和 PTPN13基因表达呈正相关(r=0.325,0.282),见图 3C。胸腺瘤未富集到与 miR-200家族呈负相关的靶基因模块(图4A~B),且miR-429表达水平与EPHA2和PTPN13基因一致,PTPN13是影响胸腺瘤生存时间的危险因素(HR=4.65,95%CI:1.08~20.13,P=0.025,图 4C)。
2.3 膀胱癌miR-200家族靶向调控TIMP2的验证
选取本课题组自制的膀胱癌TMA验证miR-200家族对TIMP2的调控作用。荧光定量PCR检测miR-200家族成员表达,免疫组织化学法检测TIMP2蛋白表达(图5A),病理评分结果显示TIMP2蛋白在膀胱癌组织中的表达范围是0~12,中位值为4.33。miR-200家族成员与TIMP2蛋白表达的pearson相关性分析显示,miR-429、miR-200a、miR-200b、miR-200c和miR-141等5个miRNAs分子均与TIMP2蛋白表达呈负相关(r<-0.5,P<0.001,图 5B),且高表达 TIMP2 蛋白的膀胱癌患者总生存时间较低表达患者短(HR=0.68,95%CI:0.41~0.91,P=0.002,图 5C)。
3 讨论
图1 miR-200家族成员与21种实体肿瘤总生存期的关系Fig.1 Relationship between miR-200 family members and overall survival of 21 solid tumors
图2 miR-200家族靶向调控膀胱癌的基因富集分析Fig.2 miR-200 family targeted gene enrichment in bladder cancer
图3 miR-200家族靶向调控肾乳头状细胞癌的基因富集分析Fig.3 miR-200 family targeted gene enrichment in renal papillary cell carcinoma
图4 miR-200家族靶向调控胸腺瘤的基因富集分析Fig.4 miR-200 family targeted gene enrichment in thymoma
图5 膀胱癌组织中TIMP2蛋白表达与miR-200家族表达的相关性验证Fig.5 Correlation between TIMP2 protein expression and miR-200 family expression in bladder cancer
miR-200家族因被发现可抑制ZEB1/ZEB2基因,参与调节肿瘤细胞凋亡[12]及EMT途径[13],被认为在癌症预后判断及治疗中具有巨大潜力[14]。然而,利用miR-200家族预测不同肿瘤预后的结果完全相反[15-17]。miR-200对不同肿瘤预后影响的Meta分析亦得出完全相反结论,认为miR-200家族具有较高的预后风险异质性[18]。对于这一异质性结果,研究者最初考虑受种族、测试方法、样本大小和样本保存影响。然而,PanCanAtlas项目排除上述因素差异后,发现miR-200家族表达对肿瘤患者OS和PFS的预测仍存在显著异质性,因此我们推测miR-200家族特异性成员在不同器官或组织中的表达水平不同,以及不同肿瘤组织中miR-200家族靶基因的异质性,导致miR-200家族评估预后的差异。
本研究对排除实验因素影响的21种实体肿瘤,分析miR-200家族与患者OS的关系,结果显示miR-200家族高表达是膀胱癌和胃腺癌患者生存时间的保护因素,是肝癌和胸腺瘤患者生存时间的危险因素;miR-200a、miR-200b、miR-429 和 miR-200c、miR-141对肾乳头状细胞癌生存的影响则相反,证实miR-200家族核心序列差异对不同肿瘤预后的影响具有异质性。进一步对miR-200家族靶基因进行聚类分析,发现miR-200家族高表达可延长膀胱癌患者总生存时间,且显著负调控靶标基因TIMP2的表达,提示miR-200家族可能通过下调TIMP2基因表达而抑制肿瘤细胞转移,是膀胱癌潜在的良好预后判断指标。本研究同时采用自建的膀胱癌TMA验证,亦证实miR-200家族与TIMP2蛋白表达呈负相关,且TIMP2蛋白表达升高是膀胱癌的不良预后因素。
研究报道,EPHA2基因与肝癌、乳腺癌、前列腺癌和胰腺癌等增殖和转移有关,被认为是癌基因及治疗靶标[19]。本研究靶基因富集聚类分析显示miR-141可负调控肾乳头状细胞癌EPHA2基因表达,推测miR-141可能通过靶向抑制EPHA2表达,从而延长患者生存时间。而胸腺瘤分析结果显示miR-429与EPHA2和PTPN13表达均呈正相关,说明miR-429介导EPHA2和PTPN13表达可能导致肾乳头状细胞癌和胸腺瘤不良预后。研究发现PTPN13可通过引发src激酶失活而调节乳腺癌细胞侵袭性[20]。有研究认为miRNA通过靶向3'UTR的mRNA抑制转录和靶向CDS区抑制蛋白质翻译[21],但miRNA促基因表达的机制不明,miR-429靶向调控何基因后导致EPHA2和PTPN13升高的具体机制尚不清楚。
本研究表明,miR-200家族对不同肿瘤预后的影响具有异质性,miR-200家族靶标分子众多,而这些基因在不同组织及肿瘤亚型表达的差异可能导致了miR-200家族生物功能异质性,但具体机制尚不明确,有待未来选择更多肿瘤样本进一步研究。