APP下载

肝癌与2 型糖尿病的共同相关基因研究

2022-11-06张梦娜王海洲

武汉大学学报(医学版) 2022年1期
关键词:差异基因肝癌样本

张梦娜 王海洲 刘 静

武汉大学中南医院消化内科/湖北省肠病临床研究中心/肠病湖北省重点实验室湖北 武汉 430071

肝细胞肝癌(hepatocellular carcinoma,HCC)目前是世界上死亡率排名第三的恶性肿瘤[1]。根据最新的癌症报告显示,在中国,肝癌的发生率仅排在了肺癌和胃癌之后[2]。提高肝癌患者预后的关键是进行早期诊断与筛查,从而避免延误诊断和治疗。另一方面,糖尿病是一种常见的代谢和内分泌疾病,同样是影响人类健康的另一大威胁[3]。糖尿病能引起机体内多个器官受损,进而导致多种并发症,比如糖尿病肾病、糖尿病眼病病变、糖尿病足以及糖尿病心血管并发症等等。同时中国的糖尿病患者逐年增加,截止到2013 年,中国成年人糖尿病患病率约为10.9%[4]。已有多篇荟萃分析和临床研究观察了糖尿病对肝癌患者生存的影响,分析结果建议将糖尿病作为肝癌预后的独立危险因素[5,6],但是其具体机制仍不清楚。

近年来,随着高通量芯片技术的发展,为利用基因表达谱研究肝癌与糖尿病的核心基因提供了可能[7]。本研究中,我们从公共数据库中下载了肝癌和2 型糖尿病的基因表达矩阵,通过比较疾病组与健康对照组筛选出重叠差异基因,进而挖掘出导致2 型糖尿病和肝癌的共同差异基因和生物学途径,为糖尿病相关性肝癌研究提供参考,但是具体的生理病理机制需要进一步实验验证。

1 材料与方法

1.1 数据来源和预处理基因表达数据从美国国立生物技术信息中心(NCBI)的GEO(Gene Expres‑sion Omnibus)数据库中下载。数据库GSE7014 包括 20 个 2 型糖尿病样本和 6 个健康对照样本[8],数据库GSE45267 包括48 个原位肝癌样本以及39 个正常组织样本。数据库GSE121248 包含69 个肝癌样本和38 个癌旁样本,以上芯片平台均为GPL570(Affymetrix Human Genome U133 Plus 2.0 Array)。利用“Affy”R 包对数据进行预处理。

1.2 筛选差异基因我们利用“limma”R 包对疾病组和正常对照组筛选差异基因(Differentially Ex‑pressed Genes,DEGs)[9]。 阈 值 设 定 为 FDR(false discovery rate)<0.05,|log2FC|>1.5。DEGs 热 图则利用“heatmap”R 包绘制。

1.3 基因富集分析(Gene Ontology,GO)、蛋白质互作网络(Protein⁃Protein Interaction,PPI)与鉴定核心基因我们利用在线DAVID 数据库(https://david. ncifcrf. gov)对 DEGs 进行基因功能富集分析,利用“ggplot2”R 包绘图。阈值设定为FDR<0.05。 再 利 用 STRING 数 据 库(https://string‑db.org)研究共同差异基因蛋白与蛋白之间的相互作用。接着导入Cytoscape 软件构建PPI 网络,阈值评分>0.7 为临界值,通过MCODE 插件筛选核心节点蛋白。最后通过在线数据库ONCOMINE(https://oncomine.org)对核心基因进行验证。

1.4 生存分析使用在线数据库GEPIA(http://gepia.cancer‑pku.cn/)对核心基因进行生存分析。

2 结果

2.1 差异基因筛选结果通过对肝癌数据库GSE45267 筛 选 结 果 显 示 获 得 1 694 个 DEGs(921个上调,773 个下调),对肝癌数据库 GSE121248 筛选同样获得 1 925 个 DEGs(1 009 个上调,914 个下调,图 1A)。其中交集 DEGs 有 1 235 个(图 1B)。再筛选糖尿病数据库GSE7014,共获得2 508 个差异基因(1 253 个上调,1 254 个下调,图 1C),将肝癌交集DEGs 和糖尿病DEGs 取交集,获得328 个重叠DEGs,其中共同 DEGs 包括 78 个上调的 DEGs1 和98 个下调的DEGs3。而且,82 个在2 型糖尿病中下调的基因(DEGs2)和70 个在肝癌中下调的基因(DEGs4)被认为是独立于肝癌或糖尿病的DEGs。表 1、2 分别显示了 DEGs1 和 DEGs3 以 GSE7014 为标准的排名前10 的基因。

图1 筛选肝癌和糖尿病的共同差异基因

表1 DEGs1 中差异显著的前10 个基因(Top10)

2.2 基因富集分析我们接着将四类DEGs 进行GO 分析,结果显示在共同差异基因中,DEGs1 的生物学功能主要富集在调控DNA 损伤和修复(图2A),DEGs3 的功能主要是化学刺激、防御反应、炎症反应、细胞凋亡和程序性死亡等功能(图2B)。在独立差异基因中,DEGs2 分析结果无统计学差异(FDR>0.05),而DEGs4 则可能和有机氮化合物分解代谢相关(图2A)。

图2 肝癌和糖尿病的共同差异基因的功能富集分析

表2 DEGs3 中差异显著的前10 个基因(Top10)

2.3 蛋白互作网络与核心基因验证接下来,我们挑取共同差异基因(DEGs1 和 DEGs3)用STRING 数据库进行 PPI 分析(图 3),筛出核心节点蛋白8 个,分别为丝氨酸蛋白酶家族E 成员1(ser‑pin family E member 1,SERPINE1)、丛 生 蛋 白(clusterin,CLU)、血小板反应蛋白 1(thrombospon‑din 1,THBS1)、丝甘蛋白聚糖(serglycin,SRGN)、染色体结构支持蛋白(structural maintenance of chromosomes,SMC4)、极光激酶 A(aurora kinase A,AURKA)、OPA 相互作用蛋白 5(Opa interacting protein 5,OIP5)、MUTS 同系物 2(mutS homolog 2,MSH2)。通过ONCOMINE 数据库验证,上述的核心基因在肝癌中的表达和我们的预测结果一致,均有显著性差异(图4)。

图3 共同差异基因的蛋白质⁃蛋白质相互作用网络图

图4 在线数据库ONCOMINE 中,8 个核心基因在正常肝组织和肝癌组织表达的箱式图

2.4 核心基因预后分析我们通过GEPIA 数据库的肝癌患者的基因表达数据和临床信息对8 个核心基因进行生存分析,其中MSH2、OIP5、AURKA、SMC4、SERPINE1 高表达预示不良预后,CLU 低表达与不良预后相关,均有显著性差异(图5)。结合ONCOMINE 数据库中8 个核心基因在正常肝组织和肝癌组织的表达的箱式图,与正常组织相比,MSH2、OIP5、AURKA、SMC4 在肝癌中高表达,CLU 在肝癌中低表达,预示不良预后;SERPINE1在肝癌中低表达,预示预后较好。

图5 在线数据库GEPIA 中,8 个核心基因在肝癌中的预后分析

3 讨论

目前,随着高通量测序技术的发展,通过对疾病的转录组进行分析获取差异表达基因,进而以此为靶点研究其内在机制已广泛应用于癌症治疗研究[10]。本研究为了探索肝癌与2 型糖尿病的内在联系与分子机制,筛选作为糖尿病相关肝癌的新型生物标志物,从数据库中下载肝癌和糖尿病芯片进行生物信息学分析,找寻共同的差异基因并分析其生物学功能。

筛选差异基因结果显示,一共分为四种类别的重叠差异基因,DEGs1 是两种疾病中表达都上调的基因(78 个),而 DEGs3 是表达都下调的基因(98个),DEGs2 是在肝癌中表达上调而糖尿病中表达下调的基因(82 个),DEGs4 是在糖尿病中表达上调而肝癌中下调的基因(70 个)。因此,我们将DEGs1和DEGs3 认为是共同差异基因,将DEGs2 和DEGs4 认为是独立差异基因。

通过GO 分析发现,DEGs1 的功能主要与DNA损伤刺激相关。DNA 损伤在肝癌发生发展中起重要作用[11,12],而糖尿病引 起 的 氧化应激也是 引 起DNA 损伤的主要危险因素之一[13,14]。而在表达都下调的差异基因中(DEGs3),基因的功能多与应激、防御、炎症、免疫、程序性死亡、凋亡以及对有机物的反应等相关。这和目前的研究报道相符合,当机体处于肝癌或糖尿病的病理状态下,上述的信号通路大多被抑制。而在DEGs2 和DEGs4 中,虽和有机氮化合物的代谢相关,但由于这两类DEGs 在两种疾病中表达情况相反,因此这两类基因的具体功能需进一步的探索。

最后,利用STRING 数据库和Cytoscape 软件的分析结果我们发现了8 个核心基因,并对以上的基因进行文献挖掘,证实其与肝癌和糖尿病的相关性。在肝癌中,AURKA 被证实在多种癌症中是一种原癌基因,可通过抑制p53 基因影响肝癌细胞侵袭,而p53 缺失进一步导致糖尿病及肥胖等代谢性疾病[15,16]。肥胖是糖尿病的重要危险因素之一,OIP5 近年刚发现和肥胖相关,其能促进前脂肪细胞和成熟脂肪细胞的增殖,促进脂肪增生导致肥胖[17]。而肝癌中,OIP5 作为 miR‑15b‑5p 的靶基因,通过 Akt/mTORC1 和 β‑catenin 信号通路影响肝癌的增殖和转移性[18]。THBS1 被发现保护胰腺 β 细胞进而可能成为糖尿病的一个保护性因素[19],但在肿瘤中THBS1 既是内源性血管生成抑制剂,也可促进血管生成,因此在肿瘤中的表达和功能相当复杂,比如在乳腺癌、胆管癌和膀胱癌等中表达下降,而在肝癌和结肠癌中表达上升促进癌转移[20]。SERPINE1 属于丝氨酸蛋白酶抑制剂,编码纤溶酶原激活物抑制剂‑1(PAI‑I),具有抗炎和抗血管生成活性,被发现在丙型肝炎阳性的肝癌样本中低表达[21],同时在中国人群中,其基因多态性也和2 型糖尿病有关[22]。MSH2 同样被发现与糖尿病足溃疡和糖尿病合并冠心病相关[23,24]。CLU 又名载脂蛋白J,参与多种生理病理过程,影响肝癌侵袭,但其血清含量的高低也与胰岛素抵抗密切相关[25,26]。由此推测,上述基因同时与肝癌和糖尿病相关,并且通过GEPIA 数据库对8 个核心基因进行生存分析发现MSH2、OIP5、AURKA、SMC4 在肝癌中高表达,CLU 在肝癌中低表达,与肝癌不良预后相关;SER‑PINE1 在肝癌中低表达,与预后较好相关,

综上所述,我们利用生物信息学方法对肝癌和2 型糖尿病的转录组芯片进行挖掘,找出重叠差异基因进而分析其功能,发现2 型糖尿病相关肝癌的病因可能由于DNA 损伤刺激,进而抑制机体炎症、免疫及防御反应所致。本研究为之后研究两种疾病的相关性提供了分子靶点的参考,但是,需要进一步进行分子验证。

猜你喜欢

差异基因肝癌样本
舒适护理在肝癌介入护理中的应用
规划·样本
人大专题询问之“方城样本”
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
随机微分方程的样本Lyapunov二次型估计
TACE术联合手术治疗中晚期肝癌患者65例临床观察
SSH技术在丝状真菌功能基因筛选中的应用
“官员写作”的四个样本