磷脂酰肌醇聚糖锚定生物合成类U在卵巢癌组织中的表达及临床意义的生物信息学分析
2022-10-17陈琳傅芬陈秋连
陈琳,傅芬,陈秋连
1 新余市人民医院产科,江西 新余 338000
2 南昌大学第二附属医院妇产科,南昌 330006
卵巢癌是病死率较高的妇科恶性肿瘤之一[1]。2018年,全球新增约300 000例卵巢癌确诊病例,病死约185 000例[2]。卵巢癌早期症状不典型,不利于早期筛查,多数患者确诊时已进展至晚期,预后较差[3-4]。手术切除和铂类药物化疗是晚期卵巢癌的一线治疗方案[5-6],但研究显示,卵巢癌细胞对常规化疗药物表现出了耐药性,一般来讲,铂耐药预示着极差的预后。如卵巢癌细胞表现出耐药性,卵巢癌患者的总生存率仅为12~24个月,因此,寻找合适的诊断方案对提高患者的总生存率有重要意义[7-8]。
美国食品药品管理局(FDA)提出,糖类抗原125(carbohydrate antigen 125,CA125)可以作为卵巢癌一线治疗后复发的预测指标[9],但灵敏度和准确度不高。寻找特异性的生物标志物对预测卵巢癌的发生发展及患者的预后至关重要。磷脂酰肌醇聚糖锚定生物合成类U(phosphatidylinositol glycan anchor biosynthesis class U,PIGU)是糖基磷脂酰肌醇转氨酶(glycosylphosphatidylinositol transamidase,GPI-T)复合物的重要亚单位[10]。GPI-T复合物介导糖基磷脂酰肌醇(glycosylphosphatidylinositol,GPI)锚与锚定蛋白结合,主要由5个亚基组成[11-12]。既往研究表明,GPI-T复合物在肿瘤发生发展中发挥着至关重要的作用。研究显示,GPI-T复合物某些成分的过表达促进了肿瘤的发生发展,如乳腺癌、膀胱癌、淋巴瘤和非小细胞肺癌[10]。PIGU过表达预示着肝癌患者的不良预后,但其与卵巢癌的关系未见报道[13]。前期生物信息学筛查发现,PIGU在高级别卵巢癌中异常高表达,且其高表达与患者的不良预后密切相关。
本研究通过生物信息学分析GPI-T复合物相关基因在卵巢癌中的表达及预后价值。通过癌症基因组图谱(The Cancer Genome Atlas,TCGA)、基因 型-组 织 表 达(Genotype-Tissue Expression,GTEx)数据库比较GPI-T复合物相关基因在卵巢癌组织和正常卵巢组织中的表达情况,利用Kaplan-Meier Plotter(KMPLot)、基因表达综合(Gene Expression Omnibus,GEO)数据库分析PIGU对卵巢癌患者预后的预测价值。本研究对PIGU蛋白进行蛋白质相互作用网络的构建及功能分析,阐释PIGU在卵巢癌发生发展中潜在的分子机制,现报道如下。
1 资料与方法
1.1 TCGA、GTEx数据库提取数据
TCGA是由美国国家癌症研究所(National Cancer Institute,NCI)和美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)于2006年联合启动的项目,收录了各种人类肿瘤(包括亚型在内)的临床数据、基因组变异、信使RNA(messenger RNA,mRNA)表达情况、微小RNA(microRNA,miRNA)表达情况、甲基化等数据,是肿瘤研究重要的数据来源。本研究从TCGA数据库(https://portal.gdc.cancer.gov/)下载279例卵巢癌患者的全基因组表达量矩阵,包括卵巢癌mRNA表达、组织学分级、临床分期和生存情况的数据。
GTEx是一个全面的公共资源,研究组织特异性基因表达和调控,数据库中的样本收集自54个非病变组织,涵盖近1000例个体。GTEx数据库主要用于分子分析,包括全基因组测序(whole genome sequencing,WGS)、全外显子组测序(whole exome sequencing,WES)和全转录组测序(whole transcriptome sequencing,RNA-Seq)。正常对照从GTEx生物库获取。本研究从GTEx数据库(https://xenabrowser.net/hub/)下载88例卵巢癌正常组织的全基因组表达量矩阵,对GPI-T复合物相关基因进行差异分析。
1.2 生存分析
KMPLot数据库(http://kmplot.com)是一种基于网络的工具,能够对基因组学、转录组学、蛋白质组学或代谢组学的研究数据进行单变量和多变量Cox比例风险生存分析[14]。本研究通过KMPLot数据库,根据表达量的中位数将卵巢癌患者分为高表达组和低表达组,进行生存分析和生存曲线的绘制。
1.3 GEO数据库分析
GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)是高通量微阵列和下一代序列功能基因组数据集的国际公共存储库[15]。为进一步验证PIGU基因在卵巢癌中的重要性,本研究自GEO数据库中下载了GSE18520(对 照10例∶卵 巢 癌53例)和GSE26712(对照10例∶卵巢癌185例)数据集,进行基因差异分析。
1.4 蛋白质相互作用网络构建
GeneMANIA数据库(http://genemania.org/)是一个交互式、可视化的在线蛋白质相互作用预测工具[16-17]。GeneMANIA利用基因组学和蛋白质组学数据,对给定的基因查询列表进行分析,通过识别出功能相似的基因,来获得目标基因的相互作用蛋白。本研究设置基因列表为PIGU,构建蛋白质相互作用网络,以获得相互作用蛋白。
1.5 功能富集分析
WebGestalt数据库(http://www.webgestalt.org/)是一个网页工具平台,用于分析来自大规模组学研究的基因列表。在2019年的更新中,WebGestalt数据库支持12个生物体、342个基因标识符、155 175个功能类别及用户上传的功能数据库[18]。本研究利用WebGestalt工具进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Ge-nomes,KEGG)分析,以揭示PIGU及其关键互作分子参与卵巢癌发生发展进程的潜在分子机制。
2 结果
2.1 GPI-T复合物相关基因在卵巢癌与正常卵巢组织中表达情况
下载TCGA数据库中卵巢癌患者卵巢癌组织及GTEx数据库中卵巢正常组织的全基因组的表达量矩阵,分析GPI-T复合物相关基因,包括磷脂酰肌醇聚糖锚定生物合成类K(phosphatidylinositol glycan anchor biosynthesis class K,PIGK)、PIGU、磷脂酰肌醇聚糖锚定生物合成类T(phosphatidylinositol glycan anchor biosynthesis class T,PIGT)、糖基磷脂酰肌醇锚定附着蛋白1(glycosylphosphatidylinositol anchor attachment 1,GPAA1)、磷脂酰肌醇聚糖锚定生物合成类S(phosphatidylinositol glycan anchor biosynthesis class S,PIGS)的表达差异,结果显示,与卵巢正常组织相比,卵巢癌组织中PIGS表达明显下调,PIGK、PIGU、PIGT、GPAA1的表达均明显上调,差异均有统计学意义(P<0.01)。(图1、表1)
图1 GPI-T复合物相关基因在卵巢癌组织及卵巢正常组织中的表达差异热图
表1 TCGA与GTEx数据库中GPI-T复合物相关基因在卵巢癌组织及卵巢正常组织中相对表达量的比较
2.2 GPI-T复合物相关基因与预后的关系
通 过KMPLot数 据 库,根 据PIGU、PIGT、GPAA1、PIGK、PIGS相对表达量的中位数分为高表达组和低表达组,分析总生存期(overall survival,OS)和无进展生存期(progression-free survival,PFS),结果显示,PIGU表达与卵巢癌患者的OS、PFS均有关(P<0.05),PIGU高表达卵巢癌患者的OS、PFS均低于PIGU低表达患者,差异均有统计学意义(P<0.05)。(表2、图2、图3)
图2 PIGU高表达组(n=326)和PIGU低表达组(n=329)卵巢癌患者的OS曲线
图3 PIGU高表达组(n=306)和PIGU低表达组(n=308)卵巢癌患者的PFS曲线
表2 GPI-T复合物相关基因与卵巢癌患者OS、PFS的关系
2.3 GEO数据库验证PIGU的重要性
GSE18520(对 照10例∶卵 巢 癌53例)和GSE26712(对照10例∶卵巢癌185例)数据集GPI-T复合物相关基因的差异表达结果显示,PIGU基因在卵巢癌组织中的相对表达量均明显高于卵巢正常组织(P<0.01),进一步证实了PIGU在卵巢癌发生发展中的重要作用。(表3、表4)
表3 GSE18520数据库中GPI-T复合物相关基因在卵巢癌组织及卵巢正常组织中相对表达量的比较
表4 GSE26712数据库中GPI-T复合物相关基因在卵巢癌组织及卵巢正常组织中相对表达量的比较
2.4 PIGU蛋白质相互作用网络构建
通过GeneMANIA网站预测PIGU的蛋白质相互作用网络,结果发现了包括PIGS、PIGK、PIGT、GPAA1等在内的20个关键互作分子。(图4)
图4 PIGU蛋白质相互作用网络
2.5 KEGG通路分析结果
将PIGU及预测的关键互作基因在WebGestalt网页工具平台进行KEGG通路分析,揭示了PIGU及其关键互作分子的潜在分子机制,证实PIGU通过调控糖基磷脂酰肌醇-锚定生物合成、内质网蛋白加工、代谢通路和N-聚糖生物合成通路,影响了卵巢癌的发生发展。(图5)
图5 PIGU基因及关键互作分子的KEGG通路分析
3 讨论
卵巢癌是病死率较高的妇科恶性肿瘤,尽管近年来手术和化疗在卵巢癌的治疗中取得了重大突破,但卵巢癌患者的生存率并没有明显提高。卵巢癌高病死率可以部分归因于早期诊断困难,60%的患者确诊时已进入晚期,5年总生存率仅为29%[3]。卵巢癌的一线标准治疗方案包括肿瘤细胞减灭术联合铂类/紫杉醇化疗,尽管此治疗方案对80%~90%的患者有效,但多数患者还是会出现复发和对化疗药物耐药[19]。肿瘤的异质性或许可以部分解释治疗的局限性,患者的临床特征与其分子特征密切相关,如在上皮性卵巢癌中会出现鼠类肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、鼠类肉瘤病毒癌基因同源物B1(v-raf murine sarcoma viral oncogene homolog B1,BRAF)或erb-b2受体酪氨酸激酶2(erb-b2 receptor tyrosine kinase 2,ERBB2)基因体突变。同时,缺乏TP53突变的病灶进展过程是逐步的,利于早期诊断[20]。还有研究指出,高浆液性卵巢癌患者中,50%以上存在同源重组缺陷。由于基因甲基化和突变,DNA同源修复的相关基因会发生突变,如乳腺癌易感基 因(breast cancer susceptibility gene,BRCA)、RAD51C等纯和缺失,最终导致基因组不稳定性增加[21]。由此可以看出,卵巢癌是一种高度异质性的肿瘤。异质性也是导致个体疗效差异、后期复发的重要因素,同时也是部分靶向药物治疗失败的关键原因[22]。因此,对卵巢癌基因及相关分子通路的研究可以更好地指导比标准化化疗更具有特异性的新型靶向药物的开发。目前,复发卵巢癌治疗方案的选择标准,如妇科肿瘤学评分(Arbeitsgemeinschaft Gynaekologische Onkologie,AGO)、美国斯隆-凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center,MSKCC)提出的MSK均处于临床研究阶段,且评分阳性并不能完全反映患者情况,还需要多个因素的综合评估[23]。提示迫切需要寻找新的肿瘤标志物来预测卵巢癌的发生发展及预后,更利于有针对性的临床筛查和治疗方案的选择。
本研究利用多个生物信息学平台对卵巢癌的相关数据进行分析,结果显示,GPI-T复合物相关基因中,PIGU、PIGT、GPAA1、PIGK在卵巢癌组织中表达上调,且PIGU高表达与卵巢癌患者的不良预后密切相关,表明PIGU是一个潜在的致癌基因。此外,基于2个GEO数据集的表达差异分析也进一步验证了PIGU在卵巢癌中的重要性。有研究指出,PIGU在肝癌细胞中高表达,可能通过激活核因子κB(nuclear factor-κB,NF-κB)通路和促进免疫逃逸来促进干细胞肝癌的进展[13];功能分析表明,PIGU可促进肝癌细胞的存活、细胞周期进展、细胞迁移和侵袭,并抑制细胞凋亡[24]。但目前缺少PIGU与卵巢癌的研究报道,因此,关于PIGU在卵巢癌中的作用及分子机制还缺少在基础研究层面的进一步验证。
本研究通过GeneMANIA预测PIGU的蛋白互作网络,结果发现了包括PIGS、PIGK、PIGT、GPAA1在内的20个关键互作分子。随后,本研究对PIGU及预测的关键互作基因进行KEGG通路分析,揭示了PIGU及其关键互作分子的潜在分子机制。表明PIGU参与了卵巢癌的发生发展进程,初步展现了PIGU及其互作基因的相关作用机制,为进一步深入研究奠定了基础。
综上所述,本研究系统地分析和评估了GPI-T复合物相关基因在卵巢癌组织中的表达及对患者预后的预测价值,PIGU高表达提示卵巢癌患者的预后较差。由此推断PIGU的相对表达量可以作为卵巢癌诊断和预后评估的一个重要指标。本研究的不足之处在于只是在转录组层面验证了PIGU高表达与卵巢癌的相关性,由于蛋白质的相对表达量在一定程度上不与相关基因转录组水平呈正比,可能无法全面反映PIGU蛋白质的含量及相关功能。此外,本研究结果还需要通过进一步体外实验验证并进行临床数据分析,来证实PIGU在卵巢癌发生发展中的分子机制。