基于GEO和TCA数据库鉴定血清外泌体miR-23a在结肠癌中的诊断及预后价值
2022-10-24贾二娜周长玉
贾二娜,郭 博,周长玉*
(吉林大学中日联谊医院 1.消化内科;2.胸外科,吉林 长春130033)
结肠癌是世界范围内发病率位居第三的恶性肿瘤,年发病率高达1400万人,死亡率高达69.4万人[1]。在我国,结肠癌是癌症相关死亡疾病的第5大原因。约有75%的结肠癌诊断时已发展至临床晚期,5年生存率仅有14%;而早期诊断可显著降低死亡率,5年生存率可达到90%[2]。目前,对于结肠癌高风险人群推荐的筛查方法主要有结肠镜和粪便潜血实验[3]。粪便潜血实验对早期诊断和高危人群筛查的敏感性有限[4]。结肠镜虽然具有较好的敏感性及特异性,但是具有有创性、费用昂贵,耗时且耐受性差[5]。血清CEA不仅敏感性低,且特异性差,多种良性疾病均可出现CEA增高[6]。外泌体是指来源于各种细胞分泌的直径在40-100 nm之间的小囊泡,可作为载体,运载RNA(如miRNA)、蛋白质、脂质及代谢产物,在细胞间及细胞与组织间进行信息传递,在肿瘤的发生发展中起着尤为重要的作用[7]。多项研究报道,miR-23a在结肠癌组织及细胞中显著高表达,促进结肠癌细胞转移和增殖[8]。本研究基于GEO及TCGA数据库筛查及验证miR-23a在结肠癌患者血清外泌体中是否异常表达,是否有希望成为新型无创性的早期诊断及预后标志物。
1 材料和方法
1.1 数据集的筛选
进入NCBI-GEO数据库(https://www.ncbi.nlm.nih.gov/geo/),用关键词查询和选择结肠癌血清外泌体相关的miRNAs表达数据集,从中获得GSE39833数据集,该数据集是基于GPL14767平台,包含了结肠癌患者及健康对照者血清学外泌体miRNAs的表达水平及部分临床资料(年龄,性别及病理学分期)。应用R(4.1.0版本)软件在线下载TCGA数据库(https://portal.gdc.cancer.gov/)中结肠癌miRNAs的表达数据集及结肠癌患者的临床资料(年龄、性别、TNM分期等)。
1.2 GEO数据处理
选择GSE39833数据集中Ⅰ-Ⅱ期结肠癌患者40例和健康对照11例,应用在线工具GEO2R分析两组之间血清外泌体差异表达的miRNAs,并作火山图。GEO2R是GEO自带的在线工具,用于筛选GEO系列中的两个或更多样本组间的差异基因,默认应用Benjamini-Hochberg方法测定错误发现率。
1.3 TCGA数据集验证差异表达的miRNAs
应用TCGAbiolinks包下载TCGA数据库中结肠癌组织的miRNAs表达数据集,包括444例结肠癌组织和8例邻近的正常组织。应用DEseq2包分析两组之间差异表达的miRNAs,筛选出验证的目标miRNA。以目标miRNA的中位值为分界线,将结肠癌患者分为高表达组和低表达组,剔除生存期小于30天的患者,然后采用Log-rank方法进行Kaplan-Meier生存分析并绘制生存曲线。最后,通过逐步Cox回归分析确定目标miRNA是结肠癌预后的独立危险因素。
1.4 统计学方法
所有统计学计算均采用R软件(4.1.0版本)。|log2FC|>1,P<0.05和调整后的P<0.05作为识别差异表达miRNAs的阈值。P<0.05表示差异有统计学意义。
2 结果
2.1 差异表达分析
GSE39833和TCGA数据集中结肠癌患者的一般资料详见表1。在GSE39833数据集中,经在线GEO2R工具共鉴定到163个差异表达的miRNAs,12个miRNAs表达下调,151个miRNAs表达上调 (见图1)。与健康对照组比较,miR-23a显著高表达于结肠癌患者血清外泌体中(log2FC=2.384,P<0.05和adj.P<0.05);在TCGA数据库下载的结肠癌数据集中,共鉴定出368差异表达的miRNAs,158个miRNAs表达下调,210个miRNAs表达上调。结果验证miR-23a显著高表达于结肠癌组织中,log2FC=2.5949,P<0.05和adj.P<0.05。
表1 GSE39833和TCGA数据集结肠癌患者的一般资料
图1 GSE39833数据集中差异表达miRNAs筛选火山图
2.2 miR-23a高表达的预后评价
剔除TCGA数据集中生存时间小于30天的结肠癌患者,最终纳入299例患者。根据miR-23a表达的中位值将上述299例结肠癌患者分为高表达组和低表达组,进行log-rank生存分析。结果显示,miR-23a高表达组患者总生存时间显著短于低表达组(P=0.035,见图2)。
图2 TCGA数据集中结肠癌患者Kaplan-Meirer生存曲线
2.3 确定miR-23a是结肠癌预后的独立危险因素
将TCGA数据集中结肠癌患者的临床特征包括年龄、性别、TNM分析以及miR-23a表达情况进行逐步Cox回归分析,探索结肠癌预后的独立危险因素。单因素Cox回归分析结果表明年龄(HR=1.90,P=0.0388)、M分期(HR=0.49,P=0.0082)以及miR-23a(HR=2.05,P=0.0145)与结肠癌的预后相关;进一步将年龄、M分期及miR-23a进行多因素Cox回归分析,结果显示M分期(HR=0.53,P=0.0305)和miR-23a(HR=2.22,P=0.0481)与结肠癌患者预后显著相关,miR-23a是结肠癌预后重要的独立危险因素(见表2)。
表2 Cox回归分析TCGA数据集中结肠癌的独立危险因素
3 讨论
外泌体是细胞外囊泡的一种,普遍存在于各种体液中,如血液、唾液、尿液、乳汁等。外泌体来源于细胞膜内陷内吞,可携带核酸、蛋白质、脂质及代谢物被释放到细胞外[9]。当外泌体在细胞外循环时,这些外泌体可被临近或远处的细胞吸收,在细胞间传递信息或者调节细胞功能[9-10]。大量研究已经证实外泌体具有来源组织或细胞的特性,在生理及病理过程中发挥着举足轻重的作用。尤其来源于特定免疫细胞的外泌体,如树突状细胞和B细胞,可介导对病原体和肿瘤的免疫调节[11-12]。肿瘤细胞来源的外泌体,通过肿瘤基因和肿瘤相关miRNA在肿瘤细胞之间以及肿瘤细胞和肿瘤基质之间的转移,在肿瘤的发生、转移以及治疗应答中发挥着重要的作用[13-14]。基于外泌体的上述特征,外泌体可作为有潜力的诊断标志物用于肿瘤的诊断和预后评估。
外泌体核酸包括mRNA,miRNA,lcnRNA等多种核酸分子。MiRNA是小分子非编码RNA,通过与靶mRNA的3’非编码区或开放阅读框结合,介导转录后基因沉默,在各种生理及病理过程中被广泛研究。外泌体miRNA具有负调控作用,通过调节靶基因表达水平影响肿瘤的发生和发展。例如,来自乳腺癌细胞的外泌体miR-105降低内皮细胞ZO-1基因表达,促进乳腺癌肺转移和脑转移[15]。Goldie等人曾报道,在各种小RNA分子中,miRNA在外泌体中含量最高。正如一些研究所述,miRNA不是随机进入外泌体中的。在不同的病理状态下,外泌体中miRNA种类及表达水平存在一定的差异。胶质瘤患者外泌体中miR-21的表达水平显著低于健康对照组。与健康对照组比较,非小细胞肺癌患者血浆外泌体中Let-7f和miR-20b表达水平明显较低。外泌体miRNA已经频繁作为肿瘤诊断的标志物被报道。外泌体miR-27a和miR-130a可作为结肠癌诊断和预后的标志物,在独立验证试验中,miR27a的诊断AUC值为0.82,miR-130a的AUC值为0.79[16]。
miR-23a的编码基因位于19号染色体的p13.13位,通过抑制抑癌基因的表达从而促进癌细胞增殖、转移和浸润。多项研究显示,在结肠癌细胞及组织中,miR-23a表达水平均显著升高[8,17-18]。过度表达的miR-23a与晚期结肠癌以及结肠癌淋巴转移浸润相关。MiR-23a可绑定在PDK4 mRNA的3’非编码区,抑制mRNA和 PDK4蛋白的表达,进而抑制PDH基因活性影响结肠癌细胞的增殖[19]。另有研究显示miR-23a通过调节 MARK1基因的表达促进结肠癌细胞增殖和转移[8]。因此,miR-23a可作为有希望的结肠癌诊断和预后标志物指导临床。
本研究通过分析GSE39833数据集表明,与健康对照组比较,结肠癌患者血清外泌体中miR-23a显著高表达,并通过TCGA数据集验证,得到相同的结果。进一步应用生存分析和逐步Cox回归分析,证实miR-23a与结肠癌患者预后显著相关,是结肠癌预后的独立危险因素。然而,本研究结果均基于在线数据库分析所得,结果与既往研究结果一致,具有一定的指导作用,但结论尚需要大样本前瞻性临床研究进一步证实。