NPC患者转移相关lncRNAs表达分析
2020-12-03郑先斌郭伟茜陶振超杨丽萍张洋洋黄一凡
花 蕾,郑先斌,2,郭伟茜,陶振超,周 燕,杨丽萍,张洋洋,黄一凡,孙 斌,杨 婧,何 健,高 劲
鼻咽癌(nasopharyngeal carcinoma, NPC)是我国常见的头颈部恶性肿瘤,2018年全球新发病例129 000例,中国占近一半,放射治疗是其主要治疗方式[1]。尽管近些年NPC临床诊疗水平不断提高,仍有20%~30%的患者发生远处转移,导致治疗失败,影响患者的整体生存率[2]。因此,NPC远处转移是临床面临的主要问题,鉴定NPC转移相关靶点尤为重要。
长链非编码RNAs(long non-coding RNAs,lncRNAs)是一类由大于200个核苷酸组成的RNAs。在细胞中,lncRNAs可以通过4种作用模式发挥生物学功能:① 调控下游基因转录;② 阻断分子的作用和信号通路;③ 将蛋白复合物定位到特定的DNA序列上;④ 起“中心平台”的作用[3-4]。目前,越来越多参与NPC发生发展的lncRNAs被发现。例如,HOX转录反义RNA(HOX transcript antisense RNA,HOTAIR)能够直接激活血管内皮生长因子A(vascular endothelial growth factor-A,VEGFA)[5]的转录,调控基质金属蛋白酶9(matrix metallopeptidase 9,MMP-9)和p21蛋白(protein 21,p21)的水平[6],参与NPC的进展。lncRNA-LET通过调控MAPK/ERK 通路的表达谱[7]或多梳蛋白zeste基因增强子类同源物2(enhancer of zeste homolog 2,EZH2)抑制[8],影响NPC细胞增殖。然而,lncRNAs与NPC转移相关的潜在机制少有报道。该研究通过高通量测序筛选出在转移与非转移NPC患者外周血样本中差异表达的lncRNAs,并预测其潜在机制。
1 材料与方法
1.1 标本收集选取2018年10月1日~2019年5月1日安徽医科大学附属省立医院西区(安徽省肿瘤医院)确诊为NPC的5例患者,所有患者均首次诊断为NPC。其中发生远处器官转移者3例,未发生转移者2例。抽取患者外周血标本5 ml,提取样本中上层血清,分装至无RNA酶小管,于液氮中冻存保存。所有研究对象均知情同意参加本项实验,且该过程经医院伦理委员会审查批准。
1.2 RNA提取和鉴定根据Takara RNAiso (Code No.9180/9109)说明书提取血清样品中的总RNA。提取完毕后,进行琼脂糖凝胶电泳,根据电泳条带检测总RNA完整性,并使用NanoDrop 1000分光光度计检测总RNA浓度及纯度。
1.3 文库构建测序文库构建采用每份样品中1~2 μg总RNA,先经过去除核糖体RNA处理,产物RNA用于下一步文库构建。基于dUTP的链特异性,将文库构建分为多个步骤,包括:将mRNA富集后的RNA进行片段化处理;通过逆转录合成第一链cDNA模板;加入dUTP形成互补链,合成双链cDNA;在各种聚合酶的作用下,使双链cDNA添加多聚A尾,且修复末端;Illumina特异性接头使用连接酶进行连接;最后经PCR扩增并纯化,得到RNA测序文库。
1.4 文库质检构建好的文库将使用Agilent 2100生物芯片分析系统进行质量检测,内容包括文库浓度、片段大小、是否含有接头等项目,并通过定量PCR方法进行文库的最终定量,根据定量结果及最终测序数据量的要求,混合不同样品的测序文库进入下一步测序流程。
1.5 上机测序混合处理完成的不同样品的测序文库,经过氢氧化钠溶液处理变性为单链DNA,稀释为特定浓度后,通过测序仪进行原位扩增,扩增出的片段末端使用测序仪检测150个循环。
1.6 测序数据分析和基因功能分析产生的测序数据通过测序质控后,将经过预处理过滤步骤产生的数据比对到参考基因组上,将比对结果进行统计分析后进行lncRNAs和转录本表达定量分析、lncRNAs表达水平分析、差异表达lncRNAs筛选、基因本体论(gene ontology,GO)、功能显著性富集分析(GO enrichment analysis)、京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路显著性富集分析等一系列分析,初步探讨NPC转移相关lncRNAs潜在机制。
1.7 统计学处理使用R软件中的Ballgown包进行样本表达水平的定量,以及组间的lncRNAs的差异表达分析。设定阈值为1.5倍差异,P<0.05,且组内FPKM均值≥0.5来筛选差异表达lncRNAs。
2 结果
2.1 文库质量评估及测序数据质量控制表1为lncRNAs在转移与非转移NPC中的表达谱,序列数和碱基数分别代表各样本的总序列及总碱基数。对每个样品的序列统计代表错误识别概率为0.1%的Q30,一般情况下认为Q30≥80%则认为测序质量合格。本研究所涉及样本测序数据Q30均≥90%,表明测序质量合格。
通过高通量测序,共鉴定出1 726条lncRNAs在5例NPC患者血液样本中表达,其中1 328条lncRNAs在NPC转移组中表达较高,398条lncRNAs在NPC转移组中表达较低。在转移组表达较高的lncRNAs中,有2条lncRNAs的表达量差异有统计学意义(Fold Change>1.5,P<0.05),在转移组表达较低的lncRNAs中,有12条lncRNAs的表达量差异有统计学意义(Fold Change>1.5,P<0.05),如表2所示,lncRNA ENST00000610778是表达差异较大的lncRNA,FC值为4 011.71,在转移组中含量低,非转移组含量高。
表1 测序数据量统计
表2 差异表达lncRNAs列表
2.2 lncRNAs相应基因的GO分析lncRNAs的功能往往与其相应周围编码蛋白的基因具有功能相似性,因此可以根据基因功能注释数据库GO对差异表达的lncRNAs周围编码基因按照功能进行分类及注释,GO注释内容包括:生物学过程(biological process, BP)、分子生物学功能(molecular function, MF)和细胞学组分(cellular components, CC)。经分析发现,差异lncRNAs的周围编码基因生物学过程主要集中于翻译、核糖体大亚基组装、SRP依赖的膜靶向共翻译蛋白、病毒转录、核转录mRNA分解代谢过程、翻译启动以及rRNA加工,涉及基因包括NACA、RPL3、RPL12,如图1A所示。分子生物学功能富集于核糖体结构成分,涉及基因包括RPL3、RPL12,如图1B所示。细胞学组分富集于胞质大核糖体亚基、黏着斑,涉及基因包括RPL3、RPL12,如图1C所示。
2.3 lncRNAs周围对应mRNAs的KEGG通路分析经过KEGG通路分析后发现,差异表达的lncRNAs对应同位基因在“核糖体”(Ribosome)通路富集。如图2、3所示。
图1 差异表达lncRNAs周围对应编码基因的GO注释气泡图
图2 差异表达lncRNAs对应周围编码基因的
3 讨论
人类基因组计划和DNA元件百科全书计划研究[3]结果显示,人类基因组中非编码的RNA占了大部分区域,其中的lncRNAs曾一度被认为是转录噪音。lncRNAs依据从基因组中被转录位置的不同,可被分为5大类:正义链、反义链、双向、内含子间、基因型[3-4],这种位置关系很大程度上与lncRNAs功能有关。随着生物信息技术以及分子生物学的发展,发现多种lncRNAs在生命活动中发挥重要作用,包括肿瘤转移。例如,一项lncRNAs与NPC转移相关的研究表明,AFAP1-AS1在体外实验中通过调节肌动蛋白丝完整性促进癌细胞转移[9],而另一项96例NPC石蜡包埋样本的回顾性分析发现,AFAP1-AS1在浸润淋巴细胞中高表达的患者更容易发生转移[10]。lncRNA H19也是NPC的促癌基因之一,能通过抑制miR-630 的活性而不是直接的相互作用来调节 EZH2 的表达,促进NPC细胞的侵袭转移[11]。也有新发现的lncRNAs在NPC中被探究,例如,LOC284454影响细胞骨架和黏附相关的Rho/Rac 信号通路,促进NPC的迁移和侵袭[12],lncRNA-n326322通过激活PI3K/AKT 和 ERK/MAPK通路促进NPC细胞的增殖和迁移[13]。除此之外,lncRNAs在NPC中也可直接与靶基因结合,通过靶基因影响其功能。NPCCAT1和LncRNA PXN-AS1-L可分别结合YY1和SAPCD2促进细胞增殖和迁移[14-15]。当然,也有部分lncRNAs在NPC中影响生物学功能的机制尚不明确。
本研究中,笔者通过严格控制入组标准,筛选出2例无转移的NPC患者,3例转移NPC患者,其中转移患者均为全身多发转移。并成功提取患者外周血中的总RNA,使用全转录组测序方法检测样本中的lncRNAs,结果显示,差异表达的lncRNAs有14条,表达差异较大的为lncRNA ENST00000610778,其对应的基因为AC245060.5,定位于22号染色体。在NPC转移患者的血清中含量低,在非转移NPC患者血清中含量高,与转移组比较,差异倍数为4 011.71。这些差异表达的lncRNAs对应的基因富集到不同区域,参与细胞信号通路的调节。通过生物信息学分析发现,基因中RPL3、RPL12均编码一种核糖体蛋白,分别定位于22号、9号染色体,真核细胞80S核糖体定位于胞质,由60S大亚基和40S小亚基组成,60S大亚基含有46个核糖体蛋白,40S小亚基含有33个核糖体蛋白。而RPL3、RPL12均为60S亚基的组成部分。参与GO注释生物学过程、分子生物学功能、细胞学组分以及KEGG通路。其中,参与的生物学过程最多,共有7个,包括翻译、核糖体大亚基组装、SRP依赖的膜靶向共翻译蛋白、该图为KEGG网站的核糖体通路具体组成,红框部分L3、L12分别为RPL3、RPL12的简称,代表RPL3、RPL12参与核糖体通路病毒转录、核转录mRNA分解代谢过程、翻译启动以及rRNA加工。分子生物学功能富集于核糖体结构成分,细胞学组分富集于胞质大核糖体亚基、黏着斑。值得注意的是,RPL3、RPL12在KEGG信号通路中主要参与核糖体通路,KEGG网站中对应编号为map03010,在中心法则中负责翻译过程,由此推测本研究中它们相应的lncRNA ENST00000465618、ENST00000497322/ ENST00000497825,也可能与蛋白质的合成有关,具有潜在研究价值。可针对这些具有潜在研究价值的lncRNAs,在分子水平、细胞水平揭示它们与NPC转移发生的相关性及具体作用机制,为NPC转移的诊断和治疗提供靶点。
图3 核糖体通路组成
尽管lncRNAs与NPC相关性研究逐渐深入,但真正应用到实际临床工作中还需更多投入。主要难点在于:① lncRNAs自身作用复杂,且存在相互串扰,还有可能存在其他潜在机制,本研究鉴定出的lncRNA ENST00000610778、lncRNA ENST00000465618、ENST00000497322/ENST00000497825前期研究很少,尚未有文献报道其具体功能及作用机制;② 一种lncRNA往往参与多种疾病的发生,NPC特异性的lncRNAs很少报道,转移特异性的lncRNAs更是少见,因此,需要更大的样本量去发现和鉴定相关的lncRNAs;③ 实验室研究转化以及与临床应用的整合面临挑战,需要多学科的交叉、整合与协作。后续本课题组将继续围绕上述lncRNAs对NPC生物学影响深入展开体外及体内研究,为lncRNAs在NPC的临床应用提供基础。
本研究补充了人体外周血样本中转移性NPC的表达谱,鉴定出与非转移性NPC患者差异表达的一系列lncRNAs,提示lncRNAs可能参与NPC的转移过程,利用lncRNAs与其相应基因的功能相关性,对它们参与的生物学过程以及信号通路进行预测,为lncRNAs在NPC转移过程中的生物学作用及潜在机制研究提供思路和方向。