利用生物信息学分析剪切因子QKI在胃腺癌中的表达及意义
2022-02-13宋哲瑶王星云何子康崔荣军
宋哲瑶,王星云,何子康,王 欢,沈 平,崔荣军
(1.牡丹江医学院生物化学与分子生物学教研室;2.牡丹江心血管病医院检验科,黑龙江 牡丹江 157011)
胃癌(Gastric cancer,GC)是最常见的恶性肿瘤 之一。目前,全球癌症发病率中胃癌占5.6%;在恶 性肿瘤中排名第五位;胃癌死亡率占恶性肿瘤死亡 率的7.7%,排名第四位[1]。胃腺癌(Stomach adeno-carcinomam,STAD)是胃癌中最常见的一种类型,其 生长迅速,侵袭性强[2],早期症状不明显。深入探 讨其发生发展的分子机制,寻找更为有效的治疗靶 点具有重要的临床意义。
可变剪切(Alternative splicingm,AS)又称选择 性剪切,指RNA前体通过选择不同的位点剪切、组 合产生不同的RNA变异体的过程,是真核生物增加 蛋白质组多样性和细胞复杂性的机制之一。有研究 表明,可变剪切与肿瘤的发生发展密切相关,错误的 剪切方式是导致肿瘤发生的原因之一[3]。根据拼 接模式,可变剪切分为7种类型,包括可变受体位点(Alternate Acceptor sitem,AA)、可变供体位点(Alternate Donor sitem,AD)、可变启动子(Alternate Promoterm,AP)、可变终止子(Alternate Terminatorm,AT)、外显子跳跃(Exon Skip,ES)、外显子互斥(Mutually Exclusive Exons,ME)和保留内含子(Retained Intron,RI)。剪切因子即参与mRNA前体剪切过程 的蛋白质因子,在可变剪切过程中,RNA剪接因子 可以充当原癌基因和肿瘤抑制基因,它的失调在肿 瘤的发生和发展中起着至关重要的作用,异常表达 可能会引起特定促癌剪切异构体的形成,从而导致 癌症的发生[4]。
在本研究中,我们结合胃腺癌大数据,利用生物 信息学技术进行表达谱差异分析、生存预后分析、可 变剪切网络构建和免疫细胞浸润分析等,筛选了胃 腺癌中与预后相关的SF,探讨其表达与临床信息间 的相关性和可能的作用机制,为胃腺癌预后和治疗 靶点的选择提供理论依据。
1 资料与方法
1.1 资料从癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov)下载RNA-seq数据和临床数据,共407例,其中胃腺癌375例,癌旁组织32例;从TCGA SpliceSeq数据库(https://bioinformatics.mdanderson.org/TCGASpliceSeq/)下载胃腺癌可变剪切数据;从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)获取GSE118916数据集,共30例,包括肿瘤组织15例,癌旁组织15例。
1.2 方法
1.2.1 胃腺癌中可变剪切调控网络的构建 为了评估可变剪切事件在胃腺癌中的整体情况,利用R语言对TCGA数据库中胃腺癌样本可变剪切数据进行分析,利用imputeR包对胃腺癌AS事件的NA值补缺并过滤掉胃腺癌样本中没有波动的AS事件。排除胃腺癌其他致死因素(如意外死亡等因素),仅纳入总生存期>90天的患者。采用单因素Cox回归分析筛选与胃腺癌患者生存相关的可变剪切事件P<0.05。根据胃腺癌RNA-seq数据提取SF的表达量,分析AS与SF在胃腺癌样本中的关系,选取符合|cor|>0.6,P<0.01条件者构建调控网络,Cyto-scape 3.9.0软件进行可视化。
1.2.2 剪切因子的预后分析 探讨AS-SF调控网络中特异性剪切因子与胃腺癌预后的相关性,基于TCGA胃腺癌组织和癌旁组织转录组数据,并综合GTEx正常胃组织测序数据,利用GEPIA 2.0在线工具分析AS-SF网络中特异性剪切因子在胃腺癌中的表达对患者预后的影响,并可视化绘制生存曲线。
1.2.3 基于TCGA和GEO数据库分析特异基因在胃腺癌中的表达 基于TCGA数据库RNA-seq数据,提取375例胃腺癌样本和32例癌旁样本表达谱数据,利用GEPIA 2.0在线工具分析基因表达差异;基于GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)GSE118916数据集测序数据(胃腺癌样本15例,癌旁样本15例),使用Sangerbox(http://sangerbox.com/)分析工具进行特定基因差异分析。
1.2.4 功能注释及临床相关性分析 为了进一步明确QKI在胃腺癌中的功能和参与的相关代谢通路,利用GEPIA 2.0(http://gepia2.cancer-pku.cn/)的"similar genes detection”功能获取胃腺癌组织中与QKI表达相关的前100个基因,进行基因本体(GO)功能富集分析和京都基因与基因组百科全书(KEGG)通路富集分析;基于TCGA-STAD的RNA-seq数据,进一步分析QKI表达与胃腺癌样本临床特征间的关系,按照特异基因表达值的中位数分为高、低表达两组,进行临床相关性分析。
1.2.5 特异性基因表达与免疫浸润相关性的分析 评估QKI的表达和拷贝数变异对胃腺癌免疫微环境的影响,使用TIMER(http://timer.cistrome.org/)在线工具分析QKI表达与免疫细胞浸润之间的相关性,相关免疫细胞包括B细胞、CD8+T细胞、CD4+T细胞、中性粒细胞、巨噬细胞和树突状细胞。
1.3 统计学方法统计学分析采用R 3.6.3软件 以及Strawberry Perl软件对数据进行处理与分析。 应用非参秩检验(Wilcox Test)分析QKI在胃腺癌组 织与正常组织之间的表达差异,采用logFC和P值 作为筛选条件;应用Kaplan-Meier分析QKI高低表 达组之间生存率的差异;用Kruskal(KS)检验分析 QKI表达与肿瘤分期,组织学分级和肿瘤大小及年 龄之间的关系。P<0.05视为差异具有统计学意义。
2 结果
2.1 胃凛癌中可变芽切事件分析分析结果显示胃腺癌中共有可变剪切事件9 926例。单因素Cox回归分析后,得到与胃腺癌患者生存相关的可变剪切事件412例(P<0.05),其中包括AA 31例、AD 41 例、AP 101 例、AT 53 例、ES 164 例、ME 3 例、RI 19 例。构建的AS-SF调控网络显示,剪切因子QKI、 CELF2、SNRPN、BAG2在调控网络中与多种可变剪 切事件相关(图1)。例如QKI对KIF1B-602-AT起 负调控作用,对 KIFlB-601-AT、CLSTNl-575-ES、 ARHGEF11 - 8338 -ES、PLEKHM2 - 767 -ES 起正向 调控作用。结果表明,在胃腺癌中存在与患者预后 相关的可变剪切事件,调控这些剪切事件的相关剪 切因子可能对胃腺癌的发生和发展有一定的作用。
图1 胃腺癌中预后相关可变剪切事件的调控网络
2.2 貫切因子的表达在胃徐癌中的预后分析GE- PIA线上工具绘制剪切因子QKI,CELF2,SNRPN,BAG2的生存分析曲线,结果显示剪切因子QKI的生 存曲线具有统计学意义(P<0.05),QKI高表达组的总生存率明显低于低表达组(P<0.05)(图2A),而其他三个剪切因子CELF2、SNRPN、BAG2对胃腺癌患者的生存预后没有统计学意义(图2B~2D)。结果表明,QKI是胃腺癌可变剪切事件中起关键性作用的剪切因子,其表达改变能够影响胃腺癌患者的预后。
图2 胃腺癌中特异性基因的表达水平与生存之间的关系
2.3 QKI在胃腺癌中的表达GEPAI和Sangerbox在线工具基于TCGA数据库和GEO数据库(GSE118916数据集)比较了QKI在胃腺癌与癌旁组织中的表达,结果显示无论在非配对的TCGA样本中,还是配对的GSE118916数据集中,QKI在胃腺癌组织均呈高表达(图3A~3B)。结果表明,QKI在胃腺癌中可能伴随肿瘤的发生其表达增加或者发挥促癌基因的作用。
图3 基于TCGA数据库和GEO数据库GSE118916分析QKI在胃腺癌中的表达
2.4 QKI的功能富集分析和Pathway分析利用GEPIA在线工具获得QKI相关100个基因,进行功能分析和KEGG分析。GO分析结果显示,其主要与跨膜受体蛋白激酶活性和生长因子等分子功能(MF)相关;与细胞-细胞外基质黏着连接、微绒毛、粘着斑等细胞组分(CC)有关;参与神经嶠细胞发育、间充质干细胞发育等生物过程(BP)(图4A)。KEGG分析结果显示,QKI及相关基因主要富集在细胞周期、细胞衰老等信号通路(图4B)。表明QKI可能与细胞周期调控有关,参与胃腺癌中的可变剪切过程。
图4 QKI的GO分析和KEGG分析
2.5 差异表达QKI在胃廠癌中的临床意义基于TCGA数据库中STAD的RNA-Seq数据和临床数据,根据QKI的表达量中位数,将375例胃腺癌样 本分为QKI高表达组和QKI低表达组,比较2组间 胃腺癌样本不同临床特征的差异。结果显示胃腺癌 的T分期在两组间有显著差异(P<0.05),其他临床 特征两组间无显著差异(P>0.05)(表1)。结果表 明,QKI的表达会影响胃腺癌的T分期,在胃腺癌发生和发展过程中有一定的作用。
表1 差异表达QKI与胃腺癌临床特征的关系
2.6 QKI的表达对胃腺癌免疫很环境的影响TIMER在线工具分析结果显示,QKI的表达与胃腺 癌的肿瘤纯度呈负相关,而与CD8+T细胞、CD4+T 细胞、巨噬细胞、中性粒细胞、树突细胞的浸润呈正 相关(图5A)。QKI的拷贝数变异影响了免疫细胞 的浸润,例如,臂级增益(Arm-level Gain)和高度扩 增(High Amplication)两种拷贝数变异方式显著降 低了 CD8+T细胞、嗜中性细胞和树突细胞的浸润(图5B)。而巨噬细胞、树突细胞的高浸润预示胃腺 癌的不良预后(图5C)。结果表明QKI的表达和拷 贝数变异能够影响胃腺癌患者的免疫细胞浸润的改 变,进而影响胃腺癌患者的生存。
图5 使用TIMER在线工具分析胃腺癌中QKI的表达与免疫细胞浸润水平的相关性
3 讨论
研究发现,异常的AS事件和相关SF被证明在 探索癌症生物学机制方面有着巨大的潜在价值,它 们的功能被证明与产生不同的细胞增殖、抗凋亡和 转移相关的肿瘤亚型有关[5-6],因此,研究胃腺癌中 的AS事件具有十分重要的临床意义。Montes等人 证明选择性剪接产生的蛋白多样性及其高度动态的 调控,在肿瘤细胞的表型可塑性中发挥着重要作 用[7]。Kim等人总结了胃肠道恶性肿瘤中的异常剪 接事件和变异表达,并分析了可变剪切事件在正常 组织和恶性组织中的意义[8]。
RNA结合蛋白信号转导和激活RNA(Signal transduction and activation of RNA,STAR)家族的成 员之一 QKI,作为RNA结合蛋白,通过转录后调节 目的mRNA的剪切、定位、稳定性和翻译效率来调 节细胞的生理和病理过程。研究发现,QKI在肿瘤 组织中的表达异常[9]。
在本研究中,我们首先构建了胃腺癌中AS-SF 调控网络,从网络中得到与胃腺癌中可变剪切事件 相关的剪切因子,进一步筛选出有预后价值的剪切 因子QKI。接着使用不同的数据库论证了 QKI在胃腺癌组织中的表达及其预后价值,发现QKI在胃腺癌的组织中表达上调且与胃腺癌患者不良预后相关。GO富集分析结果显示,主要涉及生长因子、细胞-细胞外基质黏着连接、间充质干细胞发育等基因功能;KEGG富集分析结果显示其主要富集在细胞周期、细胞衰老等通路。QKI的表达与肿瘤纯度和多种免疫细胞浸润显著相关,QKI的拷贝数变异能够引起免疫细胞浸润的改变。而巨噬细胞、树突细胞的高浸润预示胃腺癌的不良预后。
QKI是发育和病理过程中细胞分化的有效调节器。QKI蛋白可通过选择性剪接、细胞周期调控、上皮间质转化等机制参与肿瘤发生发展。研究发现QKI可以调节神经干细胞,血管,肌肉,单核细胞的细胞分化,包括调节可变剪切、RNA稳定性和基因转录等[10]。此外,QKI在癌症进展过程中也发挥着多种作用,影响上皮间质转化(Epithelial-mesenchymal transition,EMT)和相关的选择性剪接模式[11]。一些研究表明QKI在单核细胞向巨噬细胞分化和成熟中起作用,在巨噬细胞祖细胞中,QKI可以抑制巨噬细胞分化的关键调节因子集落刺激因子1受体酪氨酸激酶mRNA。此外,QKI的功能也与成熟巨噬细胞有关[12]。
综上所述,本研究通过生物信息学技术分析验证了剪切因子QKI在胃腺癌中高表达,并且QKI的表达与胃腺癌患者的生存预后显著相关。QKI表达与免疫微环境具有相关性,能够通过表达改变和拷贝数变异影响胃腺癌免疫细胞浸润,进而影响患者的生存。本研究为证明QKI作为胃腺癌患者预后评估及免疫治疗标志物的可能性提供了理论依据,有待进一步在临床试验中深入研究。