APP下载

基于TCGA构建口腔鳞癌自噬相关基因风险预测模型及验证

2023-02-04王锦航彭士雄赵建广陈彦平崔子峰

疑难病杂志 2023年1期
关键词:蛋白差异肿瘤

王锦航,彭士雄,赵建广,陈彦平,崔子峰

口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)约占头颈癌的90%[1]。目前临床中多应用肿瘤分期或组织学分级等指标来评估OSCC患者的预后,存在导致部分低危患者接受过度治疗的可能或导致部分高危患者因治疗不足而面临复发和转移的风险,造成患者的预后差异较大[2],可见,临床上仍需挖掘OSCC中潜在的生物标志物用于评估患者的预后。

自噬是维持内稳态的关键,然而研究中逐渐发现自噬也可有助于肿瘤的发生或发展,如可使癌细胞发生免疫逃逸从而导致细胞的增殖[3-4]。目前已有学者尝试通过自噬相关机制为OSCC寻找新的治疗策略,但研究主要集中于自噬相关基因(autophagy related gene,ARG)在OSCC发展或治疗中的作用,缺乏通过大数据来筛选和鉴定ARG中可用于预测OSCC患者预后的生物标志物。本研究将癌症基因组图谱(the cancer genome atlas,TCGA)数据库中OSCC相关ARG表达数据与临床病理特征及预后数据相结合,探究ARG风险预测模型在OSCC预后中潜在的临床应用价值,报道如下。

1 资料与方法

1.1 数据获取与处理 本研究应用R软件行数据处理和统计分析。从TCGA数据库中共获取501例OSCC样本和44例癌旁样本的RNA-seq数据。在OSCC样本中498例具有完整的预后数据,432例具有完整的性别、年龄、肿瘤分化程度、肿瘤分期和T分期数据。通过Ensembl提供的“Homo_sapiens.GRCh38.104.chr.gtf.gz”文件行基因名称注释。

1.2 差异表达ARG的筛选 从HADb数据库中获取人ARG基因共232个,limma包以FDR<0.05和|logFC|>1为条件筛选出RNA-seq数据中差异表达的ARG。ClusterProfiler、Org.Hs.eg.db、Enrichplot和Ggplot2包行基因本体论(gene ontology,GO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)富集分析,以p.adjust和qvalue均<0.05为条件发现差异表达ARG的主要生物学特征。

1.3 预后相关差异表达ARG的筛选 结合OSCC中差异表达ARG和预后数据,Survival包行单因素Cox分析后将P<0.05的数据进一步应用Glmnet包纳入Lasso回归分析,以达到简化模型参数的目的。后再次通过Survival包对以上结果行多因素Cox分析筛选出预后相关的差异表达ARG。

1.5 Western-blot验证模型中基因在OSCC中的表达 因既往研究尚未阐明模型中BAK1在OSCC中的表达情况,故应用Western-blot检测BAK1蛋白在OSCC中的表达。收集2021年7月—2022年1月河北医科大学第四医院口腔颌面外科行手术治疗的OSCC患者17例的癌组织及相应癌旁组织样本(距肿瘤边缘>2.0 cm),且术后病理证实为OSCC和正常组织。所有患者术前均未接受任何肿瘤相关治疗。本研究已通过医院伦理委员会审批(2020KY283),患者及家属均知情同意并签署知情同意书。

RIPA裂解液(碧云天公司)提取组织蛋白,BCA蛋白浓度测定试剂盒(碧云天公司)测定蛋白浓度。10% SDS-PAGE分离蛋白,将蛋白电转至PVDF膜。用含5% 脱脂奶粉的封闭液浸泡PVDF膜,室温摇床封闭2 h。PVDF膜浸泡于一抗(BAK1,1∶2 000;β-actin,1∶5 000,Affinity公司)孵育液中,4℃ 孵育过夜。洗去多余一抗,PVDF膜浸泡于HRP标记二抗(1∶50 000,武汉博士德生物工程有限公司)孵育液中,37℃摇床孵育2 h。洗去多余二抗,显色曝光。使用BandScan分析胶片灰度值,根据目标蛋白和内参条带的灰度值之比计算相对表达量。结果应用Graph Prism软件行t检验分析,以P<0.05为差异具有统计学意义。

2 结 果

2.1 OSCC中差异表达ARG的筛选 在RNA-seq数据中筛选出EIF4EBP1、BAK1、RGS19、HIF1A、CTSL、VMP1、SPNS1、TNFSF10、TP63、BID、VEGFA、SPHK1、EGFR、SERPINA1、DDIT3、EIF2AK2、ITGB4、ITGA3、APOL1、IRGM、BIRC5、FADD、ITGA6、IFNG、NRG1、IL24、CDKN2A等27个上调ARG和NRG2、NRG3、MAP1LC3C、PRKN、HSPB8、CCL2、FOS、TP53INP2、PTK6、NKX2-3等10个下调ARG(FDR<0.05,|logFC|>1)(图1A、B)。箱线图可视化了上述基因在OSCC和癌旁样本中的表达(图1C)。

注:A、C.37个差异表达ARG的表达情况;B.差异表达ARG的筛选,红色为上调,绿色为下调,黑色为无差异

2.2 差异表达ARG的富集分析 差异表达ARG的GO富集分析表明,主要涉及自噬相关机制的生物学过程(图2A)。KEGG富集分析表明,主要涉及细胞凋亡及人巨细胞病毒(human cytomegalovirus,HCMV)和人乳头状瘤病毒(human papillomavirus,HPV)感染等途径(图2B)。

注:A.GO富集分析前5位;B.KEGG富集分析前10位

2.3 预后相关差异表达ARG的筛选与风险预测模型的构建 合并OSCC中差异表达ARG和预后数据后行单因素Cox分析获得6个符合P<0.05的ARG,包括FADD、NKX2-3、ITGA6、CTSL、BAK1、ITGA3(图3A)。进一步通过Lasso回归分析(图3B、C)及多因素Cox分析(图3D)筛选出FADD、NKX2-3、BAK1作为预后相关差异表达ARG,用于风险预测模型的构建。即RS =(1.558 5×FADD)+(-0.557 8×NKX2-3)+(1.547 1×BAK1)。

注:A.单因素Cox分析确定6个P<0.05的ARG;B、C.Lasso回归分析选择最佳参数;D.多因素Cox分析确定3个预后相关差异表达的ARG

2.4 风险预测模型的分析 基于TCGA的相关数据显示,以RS中位数分布的高、低风险组,见图4A,组内患者的生存状况及模型内3个预后相关差异表达ARG的表达情况,见图4B、D。Kaplan-Meier生存分析表明,高风险组的5年生存率低于低风险组(P<0.001)(图4C)。单因素Cox分析表明,RS与患者的预后显著相关(P<0.001)(图4E);多因素Cox分析表明,RS可作为OSCC患者的独立预后指标(P<0.001)(图4F);ROC曲线表明,与包括性别、年龄、肿瘤分化程度、肿瘤分期和T分期在内的传统临床病理特征相比,该预测模型具有较高的诊断优势(AUC=0.614)(图4G)。

注:A.基于RS中位数的高、低风险分组;B.组内患者的生存状况;C.高、低风险组的Kaplan-Meier生存分析;D.模型内ARG表达情况;E.模型的单因素Cox分析;F.模型的多因素Cox分析;G.模型的ROC曲线分析

2.5 风险预测模型的临床效用 模型与临床病理特征间的相关性分析表明,仅在较高T分期(图5A)和较大年龄(图5B)患者中可发现模型的RS显著增高(P<0.05)。

注:A.模型与T分期的相关性;B.模型与年龄的相关性

2.6 Western-blot验证OSCC中BAK1蛋白的表达 Western-blot检测结果显示,在OSCC癌组织中BAK1蛋白的表达高于癌旁组织(t=3.197,P=0.033),见图6。

图6 Western-blot 检测BAK1蛋白在OSCC中的表达

3 讨 论

自噬在肿瘤形成和癌症治疗中起着复杂且矛盾的作用,在肿瘤发生的早期自噬可通过促进肿瘤坏死以抑制肿瘤生长,而随着肿瘤继续发展自噬却可通过促进血管形成或远处转移等加速肿瘤进展[5-6]。尽管目前已发现部分ARG与OSCC的进展相关,但仍缺乏对ARG中潜在预后或临床意义的阐明。本研究将TCGA数据库中的OSCC转录信息和人ARG列表进行分析,获得了在OSCC中差异表达的ARG共37个。既往研究表明,自噬抑制后增加的FOXO3a可刺激促凋亡基因BBC3/PUMA的转录[7];HCMV可通过调控细胞周期、凋亡、迁移及肿瘤侵袭性和血管生成等参与疾病发展[8];而HPV与头颈部鳞癌(HNSCC)之间存在明显的联系,约有26%的HNSCC对HPV呈阳性,其中HPV16为最常检测到的类型[9]。这与本研究对37个差异表达ARG的富集分析结果相类似,在OSCC中差异表达的ARG多涉及自噬相关机制,以及多与细胞凋亡、HCMV感染和HPV感染等途径相关。进一步将上述ARG表达数据与预后数据相结合,构建出包含FADD、NKX2-3、BAK1的风险预测模型。Kaplan-Meier生存分析、单因素和多因素Cox分析及ROC曲线结果表明,该模型具有较准确的生存预测性,与传统临床特征相比该模型还具有较高的预测优势,以及在T分期和年龄中可表现出临床效用。可见该模型内的FADD、NKX2-3、BAK1可能成为OSCC患者潜在的预后生物标志物或治疗靶标。

BAK1可诱导线粒体外膜通透化以释放凋亡因子从而使细胞发生凋亡,这是细胞凋亡中的关键步骤[10]。但查阅既往文献尚未发现OSCC中BAK1的相关研究,因此本研究通过Western-blot检测了BAK1蛋白在OSCC中的表达,试验结果同数据分析结果一致,验证了BAK1在OSCC中呈高表达。FADD位于人11q13.3号染色体,而11q13.3染色体常被发现在多种癌症中扩增[11-12]。本研究的数据分析推测表达上调的FADD可能是OSCC的促进因素,这种推测在以往的研究中均得到了证实[12-14],其表明了FADD在OSCC中呈高表达,特别是在免疫组化蛋白中过表达,并且与较高的临床分期及淋巴结转移相关,或可作为有效的预后指标之一。NKX2-3作为模型中唯一的保护因素,可激活负责细胞分化、迁移和成熟等信号传导途径[15]。NKX2-3在口腔、咽腔、鳃弓外胚层和下颌骨的牙源性上皮中表达,其主要作用是在内皮细胞中表达MAdCAM-1,而MAdCAM-1可通过结合整合素47和L-选择素在淋巴细胞归巢至黏膜组织中起关键作用[16]。有研究表明,NKX2-3可抑制MAPK通路来抑制人结肠癌细胞和肝癌细胞的生长[17]。本研究的数据分析推测高表达的NKX2-3可能是OSCC进展的抑制因素,但目前仅有研究通过qRT-PCR和免疫组化验证了其在OSCC中呈低表达[18],具体作用机制尚待进一步阐明。

综上所述,本研究通过对TCGA数据库中OSCC相关的ARG转录信息及临床病理特征和预后数据进行分析,筛选出FADD、NKX2-3、BAK1等3个与预后相关差异表达ARG,构建的风险预测模型可有效评估OSCC患者的预后。虽研究尚存在如模型需在其他队列中进行验证及需实验阐明具体调控机制等局限性,但本研究的数据可为未来临床中对不同风险的OSCC患者实现个体化诊疗提供新的思路。

利益冲突:所有作者声明无利益冲突

作者贡献声明

王锦航:实施研究过程,分析试验数据,论文撰写;彭士雄:分析试验数据,论文撰写;赵建广:资料搜集整理,分析试验数据;陈彦平:提出研究思路,论文修改;崔子峰:设计研究方案,论文审核

猜你喜欢

蛋白差异肿瘤
相似与差异
与肿瘤“和平相处”——带瘤生存
找句子差异
生物为什么会有差异?
猪胎盘蛋白的分离鉴定
ceRNA与肿瘤
自噬蛋白Beclin-1在胆囊癌中的表达及临床意义
SAK -HV 蛋白通过上调 ABCG5/ABCG8的表达降低胆固醇的吸收
床旁无导航穿刺确诊巨大上纵隔肿瘤1例
C-Met蛋白与HGF蛋白在舌鳞癌细胞中的表达及临床意义