APP下载

光化性角化病与皮肤鳞状细胞癌差异表达基因和通路的生物信息学分析

2020-09-02秦思黄舒婷温炬李华润郑晓欢郑荣昌李婷

皮肤性病诊疗学杂志 2020年4期
关键词:差异基因受体通路

秦思, 黄舒婷, 温炬,2, 李华润,2, 郑晓欢,2, 郑荣昌,2, 李婷,2

(广东省第二人民医院 1.皮肤性病科,3.全科医学科,广东 广州 510317;2.南方医科大学第二临床医学院,广东 广州 510282)

光化性角化病(actinic keratosis, AK)作为一种癌前病变,可发展为侵袭性鳞状细胞癌(cutaneous squamous cell carcinoma, cSCC),因此所有的AK都应予以积极治疗,并且建议定期随访。AK和cSCC均是角质细胞异常的皮损,在临床表现上较难鉴别。目前在生物信息学的提示下,已有多种方法通过对特异性生物标志物的检测帮助确诊和鉴别以上两种疾病[1]。Azimi等[2]运用生物信息学分析发现AK和cSCC病变与细胞凋亡程序的衰减有关。针对AK的二期临床试验也使用到了新分子相关的药物,如促凋亡药物(VDA-1102、SR-T100、Oleogel-S10、ICVT、依氟鸟氨酸)、免疫调节剂(异维甲酸、维甲酸)和化学预防药物(烟酰胺、紫苏醇、T4N5脂质体)等[3]。但由于相关的副作用和昂贵的费用,患者对这些治疗的接受度和依从性通常较差,因此,开发新的药物和治疗方法尤为重要。本研究通过生物信息学方法探究AK在进展为cSCC的过程中起到重要作用的关键基因和通路,为针对AK寻找新的治疗方法和预防其向cSCC进展提供理论参考和研究方向。

1 材料与方法

1.1 基因芯片的获取及微阵列分析

从美国国立生物技术信息中心(national center for biotechnology information,NCBI) GEO(gene expression omnibus) 数据库获取两个含有AK皮肤组织以及cSCC组织的数据集(GSE32979和GSE45216)。数据集GSE32979是基于GPL6102 Illumina human-6 v2.0 expression beadchip平台,由Hameetman等[4]上传,包含了13个AK组织以及13个cSCC组织。数据集GSE45216是基于GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array平台,由Lambert等[5]上传,包含了10个AK组织以及30个cSCC组织。通过GEO中在线分析工具GEO2R整合、分析及下载数据,以.txt格式储存。

1.2 差异基因的确定

将芯片数据进行标准化、汇总、提取表达矩阵等处理。以P<0.05,基因表达中差异倍数|log2FC|>1为标准筛选差异基因(differentially expressed genes, DEGs),绘制韦恩图、火山图以及热图。

1.3 功能富集分析

通过在线基因功能分析工具The Database for Annotation, Visualization and Integrated Discovery (DAVID)数据库(https://david.ncifcrf.gov/)分析差异基因表达富集的功能以及通路,以P<0.05作为具有显著性意义的标准筛选生物过程(biological process, BP)、分子功能(molecular function, MF)、细胞成分(cellular components, CC)及Kyoto encyclopedia of genes and genomes (KEGG)通路的富集分析结果。

1.4 蛋白质相互作用网络构建与分析

运用STRING在线工具(https://string-db.org)分析DEGs对应的蛋白,并构建PPI蛋白互作网络图,筛选功能蛋白。再用Cytoscape软件分析、整合候选基因,MCODE插件筛选出重要的基因相关性最高的互作模块。

2 结果

2.1 cSCC与AK的差异基因

研究共对比了23个AK组织和43个cSCC组织的基因芯片,运用GEO2R在线工具,在GSE45216和GSE32979中分别筛选出了54 676和48 702个差异基因。通过特定条件(P<0.05,|log2FC|>1)筛选后,GSE45216筛出246个上调差异基因和159个下调差异基因。GSE32979筛出398个上调差异基因和530个下调差异基因,见图1。取两个数据集的交集(图2),其中75个候选差异基因由40个共表达的上调差异基因和35个共表达的下调差异基因组成,详见表1。热图(图3)中包含了GSE32979中最为显著的40个共表达差异基因。

图1 火山图(绿点代表下调差异基因,红点代表上调差异基因)Fig.1 Volcano plot for two GEO profiles(Green dots represent down-regulated differential genes,red dots represent up-regulated differential genes).

图2 两个GEO芯片序列的共表达差异基因Fig.2 Co-differentially expressed genes of two GEO profiles.

表1 两个GEO数据集芯片中75个共表达的差异基因(候选差异基因)Tab.1 75 co-differentialy expressed genes of two GEO profiles(candidate differential genes)

图3 GSE32979热图Fig.3 Heatmap of data in GEO profile GSE32979.

2.2 AK与cSCC的差异基因GO富集分析

使用P<0.05的标准过滤75个候选基因GO富集分析的结果如图4所示。候选基因主要富集的细胞成分为:细胞外间隙、外泌体、黏着斑、皱褶、细胞外基质;主要富集的生物进程为:血管再生、纤维蛋白溶解、雄激素受体信号通路、内肽酶活性的负调控、受体介导的内吞作用的正调控;主要富集的分子功能为:钙离子结合、钙依赖性蛋白结合、表皮生长因子受体结合、丝氨酸型内肽酶抑制剂的活性、GTP酶的活性。

图4 候选基因在三个功能组的GO富集分析Fig.4 GO enrichment analysis of candidate genes among three functional groups.

2.3 cSCC与AK的差异基因KEGG通路富集分析

KEGG分析发现75个共表达的差异基因主要富集的前5位通路分别为:黏着斑通路(通路ID:has04510,基因:ACTB, ITGA5, ACTN1, SHC1,LAMC2), 肥厚型心肌病(通路ID: has05410, 基因:ACTB, ITGA5, TPM4), 上皮细胞的细菌入侵(通路ID: has05100, 基因:ACTB, ITGA5, SHC1),扩张型心肌病(通路ID: has05414, 基因:ACTB, ITGA5, TPM4)和阿米巴病(通路ID: has05146, 基因:SERPINB1, ACTN1, LAMC2),其中黏着斑通路富集情况最显著(P<0.05),见图5。

图5 候选基因的KEGG通路富集分析Fig.5 KEGG pathway enrichment of candidate genes.

2.4 PPI蛋白互作分析

将75个候选基因用STRING数据库分析并绘制PPI网络图,筛选出80个蛋白节点,98条边,富集P值为3.28e-13。采用Cytoscape软件中MCODE插件对PPI网络进行分析,筛选出Degree值最高的2个模块(表2)以及10个枢纽基因(SERPINE1、ACTN1、ITGA5、MMP1、CXCL1、PLAUR、GRB2、MMP10、TSG101、VPS37B),枢纽基因的各功能见表3。图6为MCODE得分最高的模块1展示图。其中椭圆形中基因名称为模块1中的枢纽基因,蓝色代表上调基因,黄色代表下调基因。

3 讨论

本研究通过对GEO数据库中的基因表达谱数据集GSE32979和GSE45216中的AK组织和cSCC组织进行分析,获得了40个共表达上调差异基因和35个共表达下调差异基因作为研究的候选基因;同时构建了这些候选基因的蛋白互作网络,通过degree的标准筛选了前10个枢纽基因,意味着这些枢纽基因很可能在AK向cSCC发展的过程中起着重要的作用。

表2 Degree值最高的2个PPI模块细节

表3 Degree值最高的10个枢纽基因细节

图6 蛋白质相互作用网络中模块1枢纽节点Fig.6 Cluster 1 and Hub genes in the PPI network.

GO分析结果表明,这些候选基因主要富集在细胞外间隙、外泌体、黏着斑、细胞外基质、皱褶等细胞成分中,具备有钙离子结合、表皮生长因子受体结合、钙依赖性蛋白结合、丝氨酸型内肽酶抑制剂的活性、GTP酶活性的分子功能,参与了血管再生、内肽酶活性的负调控、受体介导的内吞作用的正调控、纤维蛋白溶解、雄激素受体信号通路等生物进程,这些生物进程都影响着AK向cSCC发展。KEGG分析结果显示,差异基因主要富集的通路为黏着斑、肥厚型心肌病、上皮细胞的细菌入侵、扩张性心肌病、阿米巴病通路,其中黏着斑通路最具有显著性,且包含ACTB、ITGA5、ACTN1、SHC1和LAMC2。其中ACTN1被认为是将肌动蛋白固定在多种细胞内结构上的蛋白,参与调节细胞粘附[6]。有研究表明,ACTN1水平的升高可以促进细胞的迁移和极性的丧失,ACTN1的沉默可延长肿瘤患者生存时间[7]。ITGA5、 LAMC2也有介导细胞的附着迁移和进入组织的功能。PPI网络分析得到的模块1及10个枢纽基因主要富集在信号受体结合、蛋白酶结合、钙离子结合等分子功能范围内,与候选基因所显示的GO富集情况相互佐证。

丝氨酸蛋白酶抑制剂E(serpin peptidase inhibitor clade E,serpin E)1,也称纤溶酶原激活物抑制剂1,主要功能是下调纤维蛋白溶解。Azimi等[8]研究发现,与AK相比,cSCC中SERPINA1含量有差异,它参与细胞外基质的粘附/去粘附平衡及降解过程,影响肿瘤细胞迁移及扩散[9]。有研究表明,SERPINE1和基质金属蛋白酶1(matrix metalloproteinase 1,MMP1)在头颈鳞状细胞癌中表达明显上调[10],这种上调可以保护头颈癌细胞免于顺铂治疗后的细胞凋亡,可能与肿瘤的复发有一定关系,并与肿瘤的预后不良和转移风险相关[11-12]。MMPs是与肿瘤发生相关的最重要的蛋白酶家族,MMP1、MMP10可以裂解或降解不同的胶原蛋白,近年来也有相关研究证明,以上两个基因在调控鳞状细胞癌的肿瘤微环境中发挥重要作用[13]。此外,还有生长因子受体结合蛋白2(growth factor receptor bound protein 2,GRB2),在细胞表面生长因子受体和Ras信号通路之间提供关键连接的适配器蛋白。已有研究表明通过抑制GRB2活性,可以抑制鳞状细胞癌中癌细胞的增殖和侵袭[14]。因此在预防AK向cSCC发展的进程中,SERPINE1、MMP1、MMP10、GRB2可能可以作为新的预防和治疗靶点。

纤溶酶原激活剂尿激酶受体(plasminogen activator kinase receptor plaur,PLAUR)是一种糖基磷脂酰肌醇锚定的膜蛋白[15],与细胞信号转导相关。目前已有研究表明,抑制PLAUR可降低各种癌症的肿瘤生长、侵袭、血管生成和转移[16-17]。可溶性PLAUR已被确定为前列腺癌[18]、乳腺癌[19]、卵巢癌[20]等多种肿瘤的血浆生物标志物。成纤维细胞分泌蛋白趋化因子CXCL1被证明参与了癌细胞的转化、生长和侵袭且具有肿瘤特异性[15]。肿瘤易感基因101(TSG101),是囊泡转运过程的调节因子。多项研究表明TSG101沉默会导致乳腺癌和前列腺癌细胞生长停滞和细胞死亡[21],而其过度表达可发挥致癌作用[22],同时还在化疗耐药中起着关键作用[23]。因此,有关AK向cSCC发展机制的研究中,PLAUR、CXCL1、TSG101或可作为研究靶点。

综上所述,本研究筛选出来的75个候选基因主要通过黏着斑通路参与了AK向cSCC发展的机制,其中的10个枢纽基因更有利于进一步理解其过程。本研究为探究AK向cSCC发展的机制提供了新的依据,为预防AK恶变进行治疗干预寻找潜在的新生物靶点提供了理论基础。但本研究中数据分析可能因为数据平台的不同存在一定的异质性,后期仍需要进一步的分子生物学实验进行临床验证。

猜你喜欢

差异基因受体通路
α7-烟碱乙酰胆碱受体在肺癌发生、发展及治疗中的作用
维生素D受体或是糖尿病治疗的新靶点
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
SphK/S1P信号通路与肾脏炎症研究进展
血管紧张素Ⅱ及其受体在疼痛中的研究进展
SSH技术在丝状真菌功能基因筛选中的应用