APP下载

基于GEPIA数据库分析正常胰腺组织和胰腺癌组织中排名靠前的差异基因及其对患者生存预后的影响

2022-12-15罗磊

河南医学研究 2022年22期
关键词:差异基因生存期胰腺癌

罗磊

(郑州大学附属郑州中心医院 肝胆胰微创外科,河南 郑州 450000)

胰腺癌是消化系统常见的恶性肿瘤之一,具有较高的致命性以及较强的侵袭能力。据统计,胰腺癌患者的5 a生存率仅为2%~9%[1]。虽然胰腺癌在消化系统肿瘤中的占比很低,但它在美国癌症相关死亡原因中排第4名,且近些年来胰腺癌的病死率在不断增加[2]。有研究预计截至2030年胰腺癌将会超过结肠直肠癌和乳腺癌成为第二大死亡癌症[3]。目前,根治性切除手术是胰腺癌唯一的治愈性治疗方法,可将患者的5 a生存率提高至20%~30%[4]。由于胰腺癌早期的临床症状不明显,大多数患者在确诊时肿瘤已经发生了远处转移,达到胰腺癌晚期阶段,因而只有小部分患者符合根治性手术切除的条件[5]。预后不良的原因主要包括胰腺癌早期进展迅速、早期转移、缺乏典型的临床表现以及缺乏比较敏感的筛查方法[6-7]。新辅助疗法、放射疗法、化学疗法、靶向分子疗法和免疫治疗法已用于胰腺癌患者的治疗中并取得了一定的效果。但胰腺癌患者的整体生存情况仍然不尽如人意,因此寻找合适的靶向治疗位点对胰腺癌的个体化精准治疗是十分必要的。GEPAI基因表达分析互动分析数据库是一个基于网络服务器数据库,其功能分为表达分析和自定义数据分析2个主题,可用于分析各种癌症与正常组织的基因表达差异以及整体存活率等。GEPIA数据库提供包括预后分析、肿瘤和正常差异表达分析、基因相关分析等数据。TCGA和GTEx等大型财团项目已经产生了大量的RNA测序数据,为数据挖掘和更深入地了解基因功能创造了新的机会。虽然某些现有的网络服务器很有价值并且被广泛使用,但这些工具仍然没有充分解决实验生物学家所需的多种表达分析功能。GEPIA提供关键的交互式和可定制功能,包括差异表达分析、剖析图、相关性分析、患者生存分析、相似基因检测和降维分析。只需单击GEPIA即可进行全面的表达分析,促进了广泛研究领域的数据挖掘、科学讨论和治疗发现过程。GEPIA为癌症基因组学大数据向最终用户提供综合信息提供了桥梁,从而帮助释放当前数据资源的价值。GEPIA可在http://gepia.cancer-pku.cn/获得[8]。本研究通过生物信息学方法从GEPAI数据库中筛选出胰腺癌与正常组织表达具有差异的排前10名的基因,并对所选差异基因对生存、预后的影响进行分析,讨论其在胰腺癌发生发展以及疾病进展中的作用,为胰腺癌的诊断以及治疗及相关探索提供参考。

1 资料与方法

1.1 差异基因获得在GEPAI数据库(http://gepia.cancer.pku.cn)首页选择“Differential Genes”(差异基因)功能,设定条件“Dataste”(数据集),选择“PAAD”[胰腺癌(pancreatic adenocarcinoma,PAAD)],|log2FC| cut off值设置为1.0,q-value cut off值设置为0.01,在“Differential Methods”(差异方式)中选择“ANOVA”(LIMMA是广义线性模型的一种,对每个基因的表达量进行线性拟合,包括ANOVA分析以及线性分析等。根据分析目的,本文采用网站默认的ANOVA分析),在“Chromosomal Distribution”(染色体分布)选项中选择“over-expressed”(过表达),然后进行数据的后续相关分析。

1.2 对所得基因进行生存分析GEPAI数据库首页选择“Surval”(生存)、“Surval Plots”(生存图),在Gene框中依次键入上续步骤中筛选得到在肿瘤和正常组织中差异排名靠前的基因。“Methods”(方法)中选择“Overall Survival”(总体生存期),Group cut off(截断值)选择“Median”(中位数),cut off-High(%)(最高截断)和cut off-Low(%)(最高截断)均选择“50”,“Hazards Ratio”(风险比率HR)选择“Yes”,“95% Confidence Interval”(95%置信区间)选择“Yes”,“Axis Units”(横轴的单位)选择“Months”(月),“Datasets Selection”(数据集选择)选择“PAAD”,点击“Plot”进行绘制即可得到筛选得到在肿瘤和正常组织中差异排名靠前后的基因的生存曲线。

2 结果

2.1 基因在癌组织和癌旁正常组织中的差异表达在GEPAI数据库中选择匹配TCGA(癌症基因组图谱),正常组织以及GTEx(基因型和基因表达量数据库)数据共包含癌症组织179例,正常组织171例,设置|log2FC| cut off:1,q-value cut off:0.01。胰腺癌组织和正常组织的差异表的基因共有9 219个,排前10名的差异基因分别为:RP11-40C6.2、S100P、TFF1、CTSE、CEACAM6、IGHG1、KRT17、MMP11、MSLN、C19orf33。肿瘤组织的基因表达情况为红色模块,正常组织的基因表达情况为灰色模块,见图1~10。

图1 C19orf33基因在癌组织和正常组织的差异表达

图2 TFF1基因在癌组织和正常组织的差异表达

图3 CEACAM6基因在癌组织和正常组织的差异表达

图4 CTSE基因在癌组织和正常组织的差异表达

图5 IGHG1基因在癌组织和正常组织的差异表达

图6 KRT17基因在癌组织和正常组织的差异表达

图7 MMP11基因在癌组织和正常组织的差异表达

图8 MSLN基因在癌组织和正常组织的差异表达

图9 RP11-40C6.2基因在癌组织和正常组织的差异表达

图10 S100P基因在癌组织和正常组织的差异表达

2.2 基因的表达对肿瘤患者生存期的影响设置|log2FC| cut off为1,q-value cut off为0.01,验证所得基因与整体生存率的关系,见图11~20。

图11 C19orf33基因表达的胰腺癌患者的生存分析

图12 TFF1基因表达的胰腺癌患者的生存分析

图13 CEACAM6基因表达的胰腺癌患者的生存分析

图14 CTSE基因表达的胰腺癌患者的生存分析

图15 IGHG1基因表达的胰腺癌患者的生存分析

图16 KRT17基因表达的胰腺癌患者的生存分析

图17 MMP11基因表达的胰腺癌患者的生存分析

图18 MSLN基因表达的胰腺癌患者的生存分析

图19 RP11-40C6.2基因表达的胰腺癌患者的生存分析

图20 S100P基因表达的胰腺癌患者的生存分析

3 讨论

近年来胰腺肿瘤的发病率和病死率逐渐上升。尽管胰腺癌的检测和治疗手段取得了一定的进展,但只有约4%的患者在被诊断该疾病后生存期能够达到5 a。对于肿瘤组织局限于胰腺的恶性疾病患者,存活率更高,目前根治性手术切除是治愈的唯一机会[9]。然而80%~85%的患者在治疗时已经进展为癌症晚期,失去最佳手术时机。此外,胰腺癌对大多数化疗药物敏感度低,药物疗效欠佳[10]。因此,需要探究胰腺肿瘤发生和进展的机制。有很多风险因素在胰腺癌的发生发展中起作用,如吸烟、慢性胰腺炎家族史、男性、糖尿病、体质量高、非O型血型、职业暴露(接触氯化烃溶剂以及镍等)、非裔美国人、高脂肪饮食、低蔬菜和叶酸饮食、幽门螺杆菌感染及牙周病[11]。

在胰腺癌的发生发展过程中很多基因发生突变,使细胞结构和功能发生改变从而影响细胞生物学行为,导致肿瘤细胞更具有侵袭性和迁移能力。本研究利用网库数据库筛选出胰腺癌患者正常与肿瘤组织中差异排名靠前的基因,分别为RP11-40C6.2、S100P、TFF1、CTSE、CEACAM6、IGHG1、KRT17、MMP11、MSLN、C19orf33。对上述基因进行生存分析,发现对胰腺癌患者预后影响较大的为MMP11、C19orf33和KRT17基因。

基质金属蛋白酶(matrix metalloproteinase,MMP)为具有锌依赖性内肽酶,是肿瘤基质的重要成分,调节和塑造肿瘤微环境,在癌症患者体内被激活,表达升高。MMP可介导多种生理和病理过程,包括基质降解、组织重塑、炎症和肿瘤转移等。MMP11作为乳腺癌相关基因,在正常成人器官中几乎不表达,在大多数侵袭性原发性癌及其转移灶中表达,在肉瘤和其他非上皮恶性肿瘤中表达较低[12]。MMP11在癌症进展中的作用为其表达促进小鼠体内的肿瘤增殖、恶性上皮细胞归巢,通过重塑细胞外基质促进癌症进展[13-14]。MMP11缺失可增加患者无肿瘤存活率并调节局部或远处侵袭[15]。胃癌细胞中敲低MMP11mRNA可在体外和体内抑制肿瘤生长[16-18]。但MMP11基因在胰腺癌中的相关报道较少,本研究中MMP11的高表达会降低患者的整体生存期,不利于患者的预后。

C19orf33基因由4个约1 kbp的外显子组成,位于HAI-2基因下游的11 kbp处,为肝细胞生长因子激活物抑制剂2型相关小肽,大量存在于包括胃肠道在内的各种组织中,并且在富含赖氨酸的区域(外显子4)具有核定位信号[19]。有研究表明,与正常乳腺组织相比,乳腺癌组织中的C19orf33蛋白过度表达并与细胞侵袭相关。C19orf33的2个转录本在猿猴病毒40永生化人成纤维细胞中首次被发现。C19orf33编码的蛋白质在胎盘发育和先兆子痫中发挥作用,可分别通过调节上皮-间充质转化或与Hippo通路YAP1协调作用抑制乳腺癌细胞系或甲状腺乳头状癌细胞的进展,且C19orf33高表达可能与淋巴结转移和对紫杉醇的反应更差有关。功能丧失实验揭示了C19orf33在乳腺癌细胞系中的生物学功能,以及与上皮间质转化之间的关系,预测可作为未来治疗乳腺癌的潜在靶点[20]。同时,卵巢癌中C19orf33mRNA为正常卵巢细胞的4.9倍,且与卵巢癌患者的预后紧密相关[21],但C19orf33基因在胰腺癌中研究报道较少。本研究结果显示C19orf33基因低表达的胰腺癌患者生存率明显高于高表达患者,C19orf33基因表达会降低患者的生存期,且表达水平与胰腺癌患者的预后呈负相关。

角蛋白(keratins,KRT)是影响毛发形成的蛋白质家族,皮肤外层KRT含量丰富,可保护上皮细胞免受损伤。Depianto等[22]首先报道了KRT17可促进皮肤上皮增殖和肿瘤生长,在基底样皮肤肿瘤中诱导的KRT17基因消融可延缓基底样滤泡性错构瘤的发生及生长。以往的研究表明,KRT17在许多癌症中过度表达,尤其在宫颈癌细胞中,可作为参与癌变、迁移和化疗耐药的预测因子[23]。也有研究表明KRT17敲低后可显著抑制胰腺癌细胞的增殖、迁移和侵袭[24]。本研究结果显示,KRT17基因低表达可使胰腺癌患者的生存期延长,且其表达程度与患者的预后呈负相关。

综上所述,胰腺癌组织与胰腺正常组织排名靠前的差异基因分别为RP11-40C6.2、S100P、TFF1、CTSE、CEACAM6、IGHG1、KRT17、MMP11、MSLN、C19orf33。随后对上述基因进行生存分析,发现对胰腺癌患者预后影响较大的基因为MMP11、C19orf33和KRT17。MMP11、C19orf33基因表达使胰腺癌患者的整体生存期缩短,KRT17基因的表达使胰腺癌患者的整体生存期延长。但本研究仅使用GEPIA数据库进行分析,存在一定的局限性,数据挖掘的结果及基因的具体作用还需要结合相关实验验证。

猜你喜欢

差异基因生存期胰腺癌
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
胰腺癌治疗为什么这么难
能谱CT在术前预测胰腺癌淋巴结转移的价值
吸烟会让胰腺癌发病提前10年
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
感染性心内膜炎手术治疗的疗效观察
肝癌TACE术后生存期小于1年及大于3年的相关影响因素分析
SSH技术在丝状真菌功能基因筛选中的应用
肾阳虚证骨关节炎温针疗效的差异基因表达谱研究