APP下载

生物信息学分析胰腺癌组织关键基因表达及其意义

2021-06-22王乾合赵立然朱克祥

医学研究杂志 2021年5期
关键词:差异基因胰腺癌胰腺

王乾合 赵立然 朱克祥

胰腺癌(pancreatic carcinoma)是一种恶性程度极高的消化道肿瘤,在恶性肿瘤中是导致癌症相关死亡的第3大原因。此外,胰腺癌的发生率正在逐年上升,据统计2019年在美国因胰腺癌而死亡人数为45750例[1]。欧盟癌症数据库统计结果显示,胰腺癌在所有恶性肿瘤的发生率中排名第7位,病死率排名第4位,发生率与病死率大致相同,5年生存率不足8%[2]。胰腺癌早期患者通常无明显症状,这一特征对胰腺癌的早期诊断造成了一定程度的困难。据统计只有约10%的胰腺癌患者能够接受手术治疗,但是术后易复发和转移,患者5年生存率仅为25%。近年来胰腺癌的治疗方案有了很大的改进,但由于患者的个体差异,其预后的敏感度和特异性仍不尽如人意。糖类抗原19-9(CA19-9)是胰腺腺癌临床诊断和监测治疗中最常用和最有效的血清肿瘤标志物。其诊断胰腺癌的特异性和敏感度分别为46%~98%和69%~93%[3]。因此,研究胰腺癌的病理机制,寻找早期检测标志物,提高胰腺癌患者的生存时间和预后迫在眉睫。

生物信息学作为一门新的学科,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。本研究结合人类肿瘤相关的基因表达汇编(gene expression omnibus,GEO)数据库,筛选差异基因并进行深入分析,为胰腺癌的发生、发展提供理论依据。

材料与方法

1.数据来源:从GEO数据库(https:∥www.ncbi.nlm.nih.gov/gds/)获取胰腺癌的表达谱芯片(GSE62452),该数据集为全基因组mRNA表达芯片,其包含69例癌组织样本,61例癌旁组织样本。

2.数据处理:使用GEOquery包从GEO数据库获取胰腺癌相关芯片数据(GSE62452),利用Limma包进行差异分析,差异基因阈值设为| log(fold change)|>1且P<0.01。

3.差异基因的富集分析:使用R语言的clustreProfiler包对上调基因和下调基因进行KEGG(kyoto encyclopedia of genes and genomes)、GO(gene ontology)富集分析,以P<0.05作为纳入标准。

4.蛋白互作网络分析:将差异基因导入STRING(https:∥stringdb.org/)在线分析网站构建蛋白互作网络(protein-protein interaction,PPI),以combined score≥0.4为纳入标准。将所得结果导入Cytoscape软件进行可视化分析,并进一步筛选关键基因。

5.关键基因生存分析:使用GEPIA(http:∥gepia.cancer-pku.cn/)数据库对胰腺癌的关键基因在胰腺癌和正常组织中的表达进行再次验证,绘制Kaplan-Meier生存曲线探索关键基因表达高低与预后的关系。

结 果

1.差异基因筛选结果:通过对基因芯片GSE62452分析,以| log(fold change)|>1且P<0.01为标准共得到286个显著差异基因,包含上调基因189个,下调基因97个。使用Volcano Plot包绘制火山图(图1)。

图1 差异基因火山图

2.差异基因富集分析:对上调和下调基因分别进行GO、KEGG分析, GO分析表明上调基因生物进程涉及细胞组织黏附、细胞外基质组织构成等功能,下调基因与脂类消化、细胞壁破裂等功能密切相关(表1)。

表1 胰腺癌组织差异基因GO富集分析结果

KEGG通路富集分析结果显示,上调基因主要涉及蛋白消化与吸收、PI3K-Akt等信号通路(图3),下调基因主要与胰腺分泌等信号通路密切相关(图4、表2)。ECM-受体相互作用和胰腺分泌分别是上调基因和下调基因富集的主要通路(图5、图6)。

图5 上调基因KEGG分析结果

图6 下调基因KEGG分析结果

表2 胰腺癌组织差异基因KEGG富集分析结果

图3 上调基因GO分析结果

图4 下调基因GO分析结果

3.构建PPI网络:将差异基因导入STRING在线网站进行蛋白互作网络分析,所得结果导入Cytoscape软件筛选关键基因,最终得到20个关键基因(ITGB4、PLA2G1B、CTRC、CPB1、SYCN、ITGA2、ALB、CELA3B、PLAU、MMP11、LAMB3、PNLIP、CLPS、CPA1、ITGB6、PRSS3P2、LAMC2、LAMC3、MMP7、CPA2)。这些核心基因相互关联,可能在胰腺癌的发生、发展中发挥协同作用(图7)。富集分析结果表明,20个核心基因主要涉及ECM-受体相互作用、黏着斑、PI3K-Akt信号通路等。

图7 20个关键基因蛋白互作网络

4.生存分析及核心基因验证:利用GPEPIA数据库对20个关键基因进行验证。生存分析显示,MMP11、LAMB3以及PLAU与胰腺癌预后密切相关(图8),在芯片数据GSE28735分析45例胰腺癌组织和配对的癌旁正常组织对核心基因进行验证,在两个GEO数据集中,PLAU、MMP11及LAMB3在胰腺肿瘤组织中显著上调(表3)。

表3 胰腺癌中PLAU、MMP11及LAMB3在两个数据集的差异表达

图8 生存曲线

讨 论

在美国,胰腺癌是癌症相关死亡的第4大原因,且发生率还在不断上升,预计到2030年将成为第2大常见恶性肿瘤[4]。胰腺癌的危险因素包含吸烟、家族史、慢性胰腺炎、年龄增长、男性、糖尿病、肥胖、非O血型、叶酸饮食以及幽门螺杆菌感染和牙周疾病[5]。近年来胰腺癌的诊断取得了一定程度的进步,超声内镜造影(CE-EUS)、EUS弹性成像或EUS引导下细针穿刺活检肿块均有助于检测发现早期胰腺癌,尤其是对于影像学无法识别的无症状胰腺肿块[6]。到目前为止,还没有针对胰腺癌的特异性生物学标志物。对于这种致命疾病的早期诊断,仍然需要新的、更敏感的生物学标志物。

本研究采用生物信息学方法对胰腺癌GSE62452芯片进行分析,共获得286个差异基因,其中包含上调基因189个,下调基因97个。GO和KEGG富集分析结果显示上调基因涉及细胞组织黏附、细胞外基质组织构成等功能以及蛋白消化与吸收、PI3K-Akt等信号通路相关。下调基因与脂类消化、细胞壁破裂等功能和胰腺分泌等信号通路密切相关。通过蛋白互作网络筛选出20个关键基因,利用GEPIA数据库对关键基因进行生存分析验证,显示基因MMP11、LAMB3及PLAU可能与胰腺癌的发生、发展密切相关。

纤溶酶原激活物尿激酶(PLAU)是一种丝氨酸蛋白酶,主要表达于内质网腔,在炎症与癌症进程中均发挥着重要作用,例如,能够调节细胞迁移、增殖、黏附,同样也参与肝脏、肌肉以及轴突再生。PLAU结合其受体PLAUR启动蛋白水解级联反应,将纤溶酶原转化为纤溶酶。PLAU参与多种癌症中的发展,例如胃癌、结肠癌、胰腺癌。PLAU的活性也是乳腺癌和非小细胞肺癌预后和预测因素的生物学标志物[7]。研究结果显示,胰腺癌中PLAU表达明显上调[8]。本研究发现PLAU在胰腺癌中明显上调,与上述文献结果一致,但有关PLAU在胰腺癌中的实验验证尚未见报道,需要开展进一步研究予以验证。

基质金属蛋白酶-11(matrix metalloproteinase, MMP11)是MMP家族的一种蛋白水解酶,基质蛋白(MMPs)是一种锌依赖性的内肽酶家族,主要参与细胞外基质降解和组织重塑。目前为止已经发现了24种哺乳动物基质金属蛋白酶,这些酶参与胚胎发育、血管生成、伤口愈合、细胞凋亡、排卵、神经生长等生理过程。其活性受天然组织特异性抑制剂蛋白(TIMPS)的控制, MMPs与TIMPS的失衡与癌症的进展和转移密切相关,MMPs同样在骨关节炎、类风湿关节炎、牙周病、肺气肿、皮肤溃疡、动脉粥样硬化、主动脉瘤以及中枢神经系统疾病中扮演着不可或缺的角色。研究证实癌症相关成纤维细胞中的外泌体miRNA-139通过抑制MMP11表达抑制胃癌的进展[9]。Eiro等[10]研究246例女性浸润性乳腺癌患者显示,癌症相关成纤维细胞表达的MMP11是预测乳腺癌总生存期和无复发生存期最有效的独立因素。Lee等[11]通过生物信息学分析得出MMP11可作为胰腺癌患者预后标志物。

层粘连蛋白亚基β3(LAMB3)是编码组成 LM-332的三聚体蛋白之一,由角质细胞分泌的细胞外基质蛋白,是基底层重要的生物活性成分,影响着细胞分化、迁移和黏附以及细胞增殖和存活[12]。LM-332的α3、β3和γ2链分别由3个不同的基因LAMA3、LAMB3和LAMC2编码。LAMB3对于结肠、胰腺、肺、宫颈和前列腺中肿瘤细胞的侵袭性和转移能力是不可或缺的[13]。在甲状腺乳头状癌中,LAMB3通过调节c-MET/Akt信号介导转移瘤行为[12]。Kita等[14]研究表明LAMB3能够作为食管鳞状细胞癌诊断和预后的标志物。有研究表明,LAMB3可作为头颈部鳞状细胞癌的预后生物学标志物,LAMB3沉默可增强顺铂等抗癌药物的敏感度[15]。在胰腺癌中,Zhang等[16]通过实验证明LAMB3可以通过调节PI3K-Akt信号通路来介导胰腺导管细胞癌腺癌的细胞周期停滞和凋亡,并改变PDAC的增殖、侵袭和转移行为。Huang等[17]通过使用皮下异种移植肿瘤模型证明miR-24-3p/LAMB3轴在胰腺导管腺癌的进程中起着至关重要的作用,并表明miR-24-3p/LAMB3轴可能代表了胰腺导管腺癌新型治疗靶点。此外有研究证明,LAMB3可作为胰腺导管腺癌的预后生物学标志物[18]。

对差异基因进行功能与通路富集分析结果表明,细胞外基质受体相互作用、黏着斑、胰腺分泌、蛋白消化与吸收等信号通路与胰腺癌的发生、发展机制有着密切的联系。黏着斑激酶(FAK)是一种胞质蛋白酪氨酸激酶,在多种实体癌中过表达和激活。FAK通过影响肿瘤微环境中的癌细胞以及基质细胞来促进肿瘤进展和转移[19]。据文献报道,雌激素G蛋白偶联雌激素受体(GPER)信号通路可能是参与FAK乳腺癌进展的转导机制之一[20]。黏着斑激酶表达强度与胃癌患者的远端转移程度相关。文献结果显示,MMP11通过黏着斑激酶/Src激酶(FAK/Src)途径增加了口腔鳞状细胞癌细胞的运动能力[21]。抑制LAMB3能够激活FAK信号通路,驱动肿瘤的生长[22]。然后,PLAU与FAK间的关系尚未见报道,仍需开展深入研究。

猜你喜欢

差异基因胰腺癌胰腺
ICR鼠肝和肾毒性损伤生物标志物的筛选
胰腺癌治疗为什么这么难
同时多层扩散成像对胰腺病变的诊断效能
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
STAT1和MMP-2在胰腺癌中表达的意义
早诊早治赶走胰腺癌
哪些胰腺“病变”不需要外科治疗
SSH技术在丝状真菌功能基因筛选中的应用
18例异位胰腺的诊断与治疗分析
中西医结合护理晚期胰腺癌46例