胶质母细胞瘤长链非编码RNA表达谱分析
2021-06-30朱镇宇孙俊龙施金龙
朱镇宇,黄 翔,孙俊龙,施金龙
(1南通大学医学院,江苏226001;2南通大学附属医院神经外科)
胶质瘤是最常见的原发脑肿瘤[1],占成人中枢神经系统原发性恶性肿瘤的75%[2]。在世界卫生组织(WHO)2016年更新版中枢神经系统肿瘤分类中,胶质母细胞瘤(glioblastoma,GBM)属于Ⅳ级胶质瘤,恶性程度最高,预后不良。传统手术及放疗对GBM患者生存期改善的效果不佳,因此探索胶质瘤发生发展的分子机制对寻找新的诊疗方法具有重要意义。长链非编码RNA(long non-coding RNA,lncRNA)长度大于200个核苷酸[3-4],越来越多的研究报道LncRNAs异常表达可能参与胶质瘤的发病过程,包括细胞增殖、凋亡和转移[5-7]。LncRNAs异常表达可作为胶质瘤早期诊断的生物标志物,并可作为治疗靶点[8-9]。本研究通过高通量测序获取GBM的lncRNAs表达谱,对差异表达的lncRNAs进行基因本体(GO)富集化分析和通路富集化分析,以期探索GBM新的诊疗方法。
1 材料与方法
1.1 患者与样本招募 6例脑外伤患者和6例经组织病理学检查确诊的GBM患者,脑外伤患者中男性3例,女性3例,年龄35~64岁,GBM患者中男性3例,女性3例,年龄43~72岁。手术切取脑外伤患者正常脑组织和GBM患者肿瘤组织,于60 min内转移至-80℃保存。两组患者均无其他严重疾病,GBM患者未接受过化疗或放疗。本实验经南通大学伦理委员会批准,所有患者签署知情同意书。
1.2 RNA文库构建及RNA测序 使用Trizol试剂(Invitgen,Cat No.15596-026,USA)从脑组织样本中提取总RNA,使用Ribo-Zero rRNA去除试剂盒(Illumina,USA)从总RNA样品中去除rRNA,然后利用TruSeq Stranded Total RNA Library Prep Kit(Illumina,USA)构建RNA文库。对文库进行质量控制,应用BioAnalyzer 2100系统(Agilent Technologies,USA)进行量化。将10-pM文库变性为单链DNA分子,在Illumina Flow细胞上捕获,原位扩增成簇,扩增150个循环,并在Illumina HiSeq Sequencer上进行测序。用hisat 2软件将生成的高质量reads与人类参考基因组(UCSC hg19)比对。然后在EnSembl基因注释文件的指导下,使用cuffdiff软件以每百万映射读数转录本(FPKM)值为单位的片段来揭示lncRNAs的表达谱,随后鉴定差异表达的lncRNA。
1.3 GO富集分析 将GBM中差异表达基因(DEGs)映射到GO数据库(http://www.geneontolo gy),基于“GO::TermFinder”应用超几何分布检验,在DEGs输入列表中查找显著丰富的GO项(http://smd.stanford.edu/help/GO-TermFinder/GO_TermFinder_help.shtml),采用Bonferroni校正P值。以P≤0.05的错误发现率(FDR)作为阈值,满足此条件的GO项被定义为显著富集。
1.4 通路富集分析 根据京都基因和基因组学百科全书(KEGG),通路富集分析用来确定与通路相关的DEGs。经FDR校正的P≤0.05被定义为显著富集,以Cytoscape生成通路图形表示。
2 结 果
2.1 GBM组织与正常脑组织中差异表达的lncRNAs通过对6例正常脑组织和6例GBM组织进行高通量测序,获得968个差异表达的lncRNAs。与正常脑组织相比,GBM组织中有399个lncRNAs表达上调,569个lncRNAs表达下调(图1)。从中筛选出20个差异表达最显著的lncRNAs,其中5个表达上调(表1),15个表达下调(表2)。
图1 差异表达LncRNAs火山图
表1 GBM中显著上调的5个lncRNAs
表2 GBM中显著下调的15个lncRNAs
2.2 GBM中差异表达的lncRNAs GO富集分析GO分析显示了与分子功能(MF)、细胞成分(CC)和生物过程(BP)三个类别相关的条目(图2A-C),三个类别中10个最丰富的小分类(按富集分数降序排列)如图2D-F所示。
2.3 GBM中差异表达的lncRNAs通路富集分析 KEGG通路分析显示,差异表达的lncRNAs在多个重要通路上显著富集。图3A中点图显示重要通路8个最高富集分数(log10pvalue最低),图3B显示参与癌症通路的lncRNA调控作用。
图2 差异表达的lncRNA的GO富集分析
3 讨 论
随着新的研究技术的发展,越来越多的高通量测序用于分析肿瘤的基因表达,从而在肿瘤中发现越来越多的lncRNAs[10-11]。王湘玥等[12]通过高通量测序发现GBM瘤体和瘤周组织差异表达的lncRNA MIR210HG,并证实其可以抑制胶质母细胞瘤细胞凋亡,促进细胞增殖、侵袭和迁移,但具体调控机制有待深入研究。韩艳玲等[13]通过qRT-PCR发现GBM组织中lncRNA MTHFD2相对表达量明显高于正常对照组织,进一步研究证实下调lncRNA MTHFD2表达可降低GBM细胞的增殖和迁移能力,增强对化疗药物替莫唑铵的敏感性,提示其可能为GBM潜在的治疗靶标。GBM的预后不良,主要是由于缺乏准确的生物标志物,对发病机制缺乏了解,从而导致诊断延迟和治疗效果不佳。因此,迫切需要更好地了解胶质瘤的发病机制,寻找潜在的生物标志物和准确的治疗靶点。然而,目前尚无对在GBM中多种差异表达lncRNAs的各种功能进行描述的文献报道。
图3 差异表达的lncRNA的通路富集分析
相较于一代测序,二代测序具有通量高,成本低而准确性无较大差别的优点。本研究使用高通量测序技术,发现正常组织与GBM组织差异表达的968个lncRNAs,GBM组织中有399个lncRNAs表达上调,569个lncRNAs表达下调,从中筛选出20个差异表达最显著的lncRNAs,其中5个表达上调,15个表达下调。尚未有相关文献报道这20个差异表达最显著的lncRNAs在肿瘤中的作用。为了解GBM中差异表达的lncRNAs的功能作用,本研究采用GO富集分析和通路富集分析。GO分析表明,这些lncRNA在与GBM密切相关的单细胞行为、突触部分等显著富集。通路富集化分析也表明,差异表达的lncRNAs在“谷氨酸能突触”、“Ras信号通路”、“酒精成瘾”、“ErbB信号通路”中显著富集。
无论检测表达水平的技术和所使用的样本大小如何,因为表达是随机过程,实际的基因表达水平在个体中是可变的,分析数据可能不足以反映这些个体的实际表达水平。但是,生物变异性会随着样本规模的增大而降低,我们今后将采用更多的样本进行进一步研究。
综上所述,在本研究中与正常组织相比,GBM中存在众多差异表达的lncRNAs,这些lncRNAs在GBM重要生物学过程,细胞组分,分子功能以及多种信号通路中显著富集,为探索新的GBM诊疗方法提供可靠的研究方向。