MAGEA4和MAGEC1基因在肝细胞癌组织中表达变化及潜在转录调控机制的生物信息学分析
2023-02-11梁子谦黄李浩赟孙浩嘉吴晓娜苏颜雄贺菽嘉
梁子谦,黄李浩赟,孙浩嘉,吴晓娜,苏颜雄,贺菽嘉
1 广西医科大学临床医学系,南宁 530021;2 广西医科大学基础医学院生物化学与分子生物学教研室;3 广西高校生物分子医学研究重点实验室
肝细胞癌(HCC)是全球恶性肿瘤相关死亡的第三大原因。目前HCC 的治疗手段包括手术、射频消融、经肝动脉化疗栓塞以及酪氨酸激酶抑制剂、免疫检查点阻断治疗等,然而患者的预后仍不理想。深入探讨HCC 发生发展的相关分子机制,有助于发现HCC 潜在的治疗靶点,对改善患者预后具有重要意义。黑素瘤相关抗原(MAGE)是一类重要的癌—睾丸抗原,该家族中的部分成员在多种类型恶性肿瘤中呈高表达,而在正常组织中限制性低表达,是肿瘤免疫治疗的潜在靶标[1]。MAGEA4和MAGEC1属于Ⅰ类MAGE家族成员,与肿瘤的关系十分密切,其中MAGEA4 在非小细胞肺癌、乳腺癌、子宫内膜癌等多种恶性肿瘤中存在异常表达[2-4],MAGEC1 在乳腺癌、结直肠癌、HCC 组织中存在异常表达[5-7]。然而既往研究中样本例数较少、来源不同等因素的影响,MAGEA4 和MAGEC1 表达在HCC 发生发展中的作用目前尚不明确。2021 年3 月—2022 年3 月,本研究通过检索、收集、统计处理HCC 相关数据集,通过大样本量的数据分析综合探究MAGEA4 和MAGEC1 在HCC 和癌旁正常肝组织中的表达水平、预后意义及潜在转录调控机制,以期为HCC 的诊断治疗提供新的思路。
1 资料与方法
1.1 基因芯片数据信息来源 从TCGA 数据库下载TCGA-LIHC 数据集的RNA 测序数据(包含HCC组织407 例,癌旁正常肝组织58 例),数据形式为FPKM;利用R 软件(4.1.0)将FPKM 矩阵转化为TPM 矩阵,利用R 软件包limma 将表达矩阵标准化。同 时 从GEO 数 据 库 下 载GSE10143、GSE20140、GSE87630、GSE107170 4 个RNA 芯片数据集,分别包含HCC 组织80、35、64、173 例,癌旁正常肝组织307、34、30、116 例。共纳入HCC 组织759 例,癌旁正常肝组织545例。
1.2 MAGEA4、MAGEC1 在HCC 组织中的表达分析 利用GraphPad Prism 8 软件绘制散点图分析MAGEA4、MAGEC1 在HCC 与癌旁正常肝组织中的表达差异,并分析在HCC 组织中MAGEA4 与MAGEC1表达的相关性。
1.3 MAGEA4、MAGEC1 区分HCC 和癌旁正常肝组织的能力评估 绘制受试者工作特征(ROC)曲线,以中位数区分MAGEA4 和MAGEC1 的高表达和低表达,依据曲线下面积(AUC)评估MAGEA4 和MAGEC1 表达区分HCC 和癌旁正常肝组织的能力。AUC 0.5~<0.7 提示低区分能力,0.7~<0.9 提示中等区分能力,≥0.9提示高区分能力。
1.4 MAGEA4、MAGEC1对HCC预后影响的分析 利用TCGA-LIHC 队列的随访数据,使用Kaplan-Meier 生存曲线分析MAGEA4 和MAGEC1 与HCC 预后的影响。使用Cox 回归分析计算风险比(HR),HR>1提示为预后危险因素,<1提示为预后保护因素。
1.5 调控MAGEA4、MAGEC1 表达的转录因子和miRNA 的预测 使用Cistrome DB 数据预测上游调控MAGEA4、MAGEC1 表达的转录因子,选择score≥0.3 的转录因子并取交集。使用TargetScan Human v8.0 预测与MAGEA4、MAGEC1 具有靶向关系的miRNA,选择score≤-0.2 的miRNA 并取交集。采用R 语言ggseqlogo 包绘制转录因子的序列图,Cytoscape3.6.1 软件绘制转录因子-miRNA-mRNA 网络图。使用JASPAR 数据库寻找转录因子与MAGEA4、MAGEC1转录起始位点上游的结合位点。
1.6 统计学方法 采用GraphPad Prism5.0 软件。计量资料以± s 表示,组间比较采用独立样本t 检验,相关性分析采用Pearson 相关分析法。采用Log-Rank 检验比较两组生存率的差异。P<0.05 为差异有统计学意义。
2 结果
2.1 HCC与癌旁正常肝组织中MAGEA4、MAGEC1表达比较 在纳入的5个HCC 数据集中,MAGEA4、MAGEC1 在HCC 组织中的表达水平均高于癌旁正常肝组织(P均<0.05)。见表1、2。在TCGA-LIHC、GSE10143、GSE107170 数 据 集 中,MAGEA4 与MAGEC1在HCC组织中的表达均呈正相关(r分别为0.322、0.299、0.482,P均<0.01),在GSE20140、GSE87630数据集中,MAGEA4与MAGEC1在HCC组织中的表达无明显相关性(r分别为-0.139、0.186,P均>0.05)。
表1 MAGEA4在HCC和癌旁正常肝组织中的表达 比较(± s)
表1 MAGEA4在HCC和癌旁正常肝组织中的表达 比较(± s)
注:与数据集内HCC组织比较,*P<0.05,**P<0.01。
数据集TCGA-LIHC HCC组织 癌旁正常肝组织GSE10143 HCC组织 癌旁正常肝组织GSE20140 HCC组织 癌旁正常肝组织GSE87630 HCC组织 癌旁正常肝组织GSE107170 HCC组织 癌旁正常肝组织n 407 58 80 307 35 34 64 30 173 116 MAGEA4-1.733 ± 3.286-2.733 ± 1.761**9.914 ± 0.474 8.926 ± 0.716**7.188 ± 1.353 6.707 ± 0.070*2.660 ± 0.091 2.623 ± 0.059*3.185 ± 0.897 3.029 ± 0.134**MAGEC1 1.071 ± 5.078-2.485 ± 1.785**10.770 ± 1.114 8.825 ± 0.792**6.939 ± 0.479 6.699 ± 0.045**2.709 ± 0.130 2.619 ± 0.053**4.246 ± 1.443 3.597 ± 0.367**
2.2 MAGEA4、MAGEC1对HCC和癌旁正常肝组织的区分能力 ROC 曲线提示,MAGEA4 区分HCC 和癌旁正常肝组织具有轻到中度准确性(AUC=0.545~0.858),MAGEC1 区分HCC 和癌旁正常肝组织具有轻到高度准确性(AUC=0.613~0.931),见OSID 码图1。
2.3 MAGEA4、MAGEC1 表达对预后的影响 MAGEA4 高表达和低表达HCC 患者的5 年生存率分别为33.9%、54.4%,MAGEA4是HCC预后的危险因素(P=0.000 43,HR=1.97)。MAGEC1 高表达和低表达HCC 患者的5 年生存率分别为46.9%、51.6%,二者比较差异无统计学意义(P=0.300 00),见OSID码图2。
2.4 MAGEA4 和MAGEC1 潜在的转录调控因子 通过预测,与MAGEA4 和MAGEC1 均具有靶向关系的miRNA 为hsa-miR-1827。TargetScan Human v8.0分析发现,该miRNA 与MAGEA4 的3'-非翻译区(3'-UTR)存在7mer-A1 的结合模式,与MAGEC1 的3'-UTR存在8mer的结合模式。见OSID码图3。进一步分析发现2个与MAGEA4和MAGEC1具有潜在调控关系的转录因子,即MYC 和TFAP2A,预测它们与MAGEA4、MAGEC1转录起始位点上游的结合序列见表2。
表2 转录因子与MAGEA4、MAGEC1转录起始位点上游 的结合序列(结合分数>0.8)
3 讨论
MAGE 家族是人类发现的第一个癌—睾丸抗原。研究显示,多种MAGE 基因在HCC 组织中呈异常表达,并且与肿瘤临床分期及患者总生存率相关;表达失调的MAGE家族成员可能通过参与G蛋白偶联受体通路在信号传导中发挥重要作用,从而影响HCC的发生发展[8]。MAGEA4和MAGEC1参与多种恶性肿瘤的发生发展,过表达的MAGEA4 在非小细胞肺癌中通过抑制Caspase-3 的活性从而抑制细胞凋亡,因而有利于肿瘤细胞的生长[9];而过表达的MAGEC1 可抑制Caspase-9 和Caspase-12 的活性,发挥抑制骨髓瘤细胞凋亡的作用[10]。因此推测,MAGEA4 可能是T 细胞免疫治疗一个有潜力的靶点[11-12],MAGEC1 可能通过抑制细胞凋亡从而参与恶性肿瘤的发展。目前关于MAGEA4 和MAGEC1在肿瘤中表达的文献较少,转录调控机制仍不清楚,因此我们借助公共高通量数据库TCGA和GEO中的HCC 数据集,减少实验条件的局限性,并排除人种、临床分期、病理类型等肿瘤异质性带来的偏倚,通过多中心大样本分析,结果显示MAGEA4 和MAGEC1在HCC 组织中呈高表达。进一步通过Pearson 相关分析,发现MAGEA4与MAGEC1在HCC组织中的表达呈正相关,提示二者可能共同参与了HCC 的发生发展。
MAGE 家族在肿瘤中的预后价值一直是学者的关注点。一项研究通过多因素Cox 回归分析表明,MAGEA4 是非小细胞肺癌患者预后的独立危险因素[9]。另一项研究显示,MAGEC1 蛋白的表达与HCC 患者总生存期降低有关[6]。本研究通过生存分析发现,MAGEA4 是HCC 患者预后的危险因素,与HCC 患者总生存率降低相关;而MAGEC1与HCC 患者的预后无明显相关,提示MAGEC1 可能具有与家族其他成员不同的生物学功能;抑或是MAGEC1 的基因表达与蛋白合成并不同步,在转录、转录后、翻译和翻译后可能受到不同的调控因子影响。
转录因子识别和直接结合特定DNA 序列后,可通过直接激活转录、募集RNA 聚合酶Ⅱ或结合增强子起到激活转录的作用;也可通过结合沉默子、募集阻遏物使转录抑制[13]。miRNA通过与mRNA的3'-UTR互补结合,使mRNA降解或抑制翻译,在基因表达的转录后调控中发挥重要作用[14]。本研究推测hsamiR-1827 以 及转 录因 子MYC、TFAP2A 可能 调 控MAGEA4、MAGEC1 的表达,从而参与HCC 发生与进展的调控。有研究发现,环状RNA hsa_circ_0003141 作为竞争性内源RNA 参与hsa-miR-1827/UBAP2 轴的调控[15]。转录因子MYC 通过靶向上调纤连蛋白FN1 的表达而促进HCC 的侵袭、发展[16];转录因子TFAP2A 在HCC 中的作用仍不清楚,但已有文献报道其可以通过miR-204-5p/TFAP2A 反馈环路促进宫颈癌细胞的增殖、迁移及上皮间充质转化[17]。
综上所述,本研究首次采用大样本量综合研究的方法揭示了MAGEA4 和MAGEC1 在HCC 组织中的高表达,且两者的表达呈正相关,高表达的MAGEA4 与HCC 患者的不良预后有关。此外,本研究还对MAGEA4、MAGEC1 的转录调控机制进行了初步预测,发现hsa-miR-1827 以及转录因子MYC、TFAP2A 对MAGEA4、MAGEC1 具有潜在的转录调控作用。MAGEA4 和MAGEC1 可作为HCC 潜在的免疫治疗靶点,具有广泛的应用前景。