NDC1基因在结肠癌中诊断及预后价值的生物信息学分析:一项基于TCGA数据库的研究
2022-01-24胡明超朱宝松
胡明超,朱宝松
截至目前为止,结直肠癌(colorectal cancer,CRC)是当前世界范围内癌症导致相关发病率和死亡率的最主要原因之一[1]。每年约有165万例新发病例以及83.5万例死亡病例并呈逐年增多的趋势,结直肠癌的发病率和死亡率分别位居世界第三及第二[2]。结直肠癌患者的最终预后结果在很大程度上取决于癌症确诊时所处的分期,此外,当肿瘤进展到晚期时,可能已经发生了腹股沟淋巴结转移甚至是远处转移[3]。由于缺乏有效的早期诊断方法,20%左右的患者在首次确诊时即被诊断为肝转移,而其余60%的患者在术后的后续治疗中会出现复发甚至是转移[4]。癌胚抗原19-9(Carbohydrate antigen199,CA199)是一种糖蛋白,但是它在结直肠癌诊断中的作用仍然很有限,目前为止,大多数研究得出的结论是CA 19-9的诊断敏感性远低于癌胚抗原(carcinoembryonic antigen,CEA),然而CEA也未被推荐用于大肠癌的早期筛查。近年已有研究探讨了编码CEA的mRNA分子在CRC检测中的作用,但结果并不如人意[5],而其他肿瘤相关抗原比如CA 195、CA 50等的研究同样也没有得到敏感性和特异性很高的结果[6,7]。因此,寻找具有高敏感性以及特异性的生物标志物来识别早期肠癌患者或对中晚期患者进行预后的评估与判断,从而指导临床对肠癌进行更精准、更有效的治疗方法具有重要意义。结肠腺癌(colon adeno carcinoma,COAD)是结肠癌中最常见的类型,本研究通过癌症基因图谱(The Cancer Genome Atlas,TCGA)的COAD数据集NDC1基因的表达在结肠腺癌中的诊断和预后价值,以期为结肠癌的临床诊疗提供新的靶点。
1 材料与方法
1.1 数据来源
TCGA数据库是由美国国家癌症研究所(National Cancer Institute,NCI)和国家人类基因组研究所(National Human Genome Research Institute,NHGRI)合作建立的癌症研究项目。本研究从该数据库(https://cancergenome.nih.gov,访问日期:2021年7月23日)下载所有COAD的level 3 HTSeq-FPKM格式的RNAseq数据以及对应的临床病理资料[8,9]。排除临床信息及基因表达信息不完整的数据,最后共计纳入480例患者的基因表达情况以及对应的临床数据。
1.2 统计学分析
生物信息学的分析及绘图工作使用R版本3.6.3中进行计算,统计学分析使用SPSS 19.0软件,Wilcoxon秩和检验用于分析NDC1在正常和肿瘤组织中的表达差异。NDC1的表达与临床病理特征之间的关系采用或卡方检验或Fisher精确概率法进行分析。此外,评估CPEB3表达在预后中的作用,则使用Kaplan-Meier生存曲线和多因素Cox回归。在单因素logistics回归中P<0.1的变量纳入多变量Cox回归模型。检验值取α=0.05,P<0.05认为有统计学差异。
2 结果
2.1 NDC1基因在结肠癌组织以及癌旁正常组织中的差异化表达
笔者从TCGA数据库下载了480例COAD患者的NDC1 mRNA测序数据以及相对应的临床资料而后进行重新整理,其中COAD组织为480例,NDC1表达量的中位数分别为3.797(3.411~4.118),癌旁正常组织NDC1基因的表达数据共41例,表达量为3.09(2.897~3.297),两者差异有统计学意义(P<0.05),图1A)。同时我们在41对配对组织中的NDC1的表达量存在差异化表达的情况(P<0.05,图1B)。
图1 NDC1基因在结肠癌组织以及癌旁正常组织中的表达A:在COAD组织和正常组织中的表达情况散点图;B:在COAD组织对应的癌旁正常组织的散点图
2.2 NDC1基因对COAD的诊断效能
以NDC1基因在COAD组织和癌旁正常组织中的表达量绘制受试者ROC曲线,结果表明NDC1基因对COAD有较高的诊断价值(AUC=0.8515,P<0.000 1,图2)。
图2 NDC1对COAD的诊断价值(ROC曲线)
2.3 NDC1基因表达和COAD患者临床病理特征的关系
我们对从数据库下载的NDC1基因表达情况及对应患者的临床参数进行整合并进行统计学分析,去除临床数据缺失的病例后归纳罗列成表,χ2检验发现NDC1高表达组相比于低表达组有着更低的淋巴结转移数、更好的病理分期以及更少的肿瘤淋巴侵犯,差异有统计学意义(P<0.05),而NDC1的表达情况与患者的性别、年龄无关、肿瘤侵犯深度、远处转移、周围神经侵犯无明显相关性(P>0.05),详见表1。
表1 NDC1基因的表达情况和结肠癌临床病理特征的关系
2.4 NDC1基因表达和COAD患者预后的关系
在本研究内容中我们登录GEPIA网站(http://gepia.cancer-pku.cn)检测了NDC1基因和COAD患者的预后关系,结果显示,相比于基因的高表达,NDC1基因低表达与COAD患者较低的总体生存率(overall survival,OS)密切相关(logrank,P<0.05,图3A),而与无病生存率(diease free survival,DFS)无明显相关(logrank,P>0.05,图3B)。
图3 NDC1基因表达和COAD患者预后的关系A:NDC1基因和COAD患者总体生存率的关系;B:FHOD1基因和COAD患者无病生存率的关系
2.5 影响COAD患者预后的临床病理特征单因素及多因素Cox分析
单因素分析的结果显示患者的年龄、T分期、N分期、M分期、病理分期、淋巴侵犯以及NDC1基因的表达都是影响COAD患者的预后因素(P<0.05)。而后笔者将P<0.1的因素纳入多因素COX分析,结果显示年龄、M分期、病理分期是COAD患者预后的独立因素(P<0.05)详见表2。
表2 影响COAD患者预后的临床病理特征单因素及多因素Cox分析
3 讨论
截至目前为止,结直肠癌被认为是女性中仅次于乳腺癌的第二大高发的恶性肿瘤,而在男性中是仅次于肾癌以及前列腺癌的第三大高发的恶性肿瘤[10]。已有研究表明的结直肠癌的5年生存率可以得益于早期诊断的比例高达90%,但肿瘤已进展到晚期甚至是已经发生远处转移时,患者的生存率将会降到15%[11]。CEA、CA 199以及CA 195等常规肿瘤标志物在肠癌中的研究并没有得到令人满意的高敏感性以及特异性[5]。NDC1基因,也被称为TMEM48并编码相应蛋白,属于TMEM家族,其中许多成员均充当通道作用允许特定物质的通过[12]。已有研究阐明NDC1对细胞核孔复合体以及核包膜的正确组装至关重要[13],而这些过程又进一步影响着许多的细胞过程,如基因组的稳定性、DNA的复制以及修复[14]。至今为止NDC1在肿瘤中的研究相对较少。一项基于60例非小细胞肺癌患者的研究结果显示,肺癌组织中NDC1的表达明显高于健康组织,其次,NDC1的过表达与患者的不良预后、淋巴结转移、肿瘤大小增加和短生存期有关[15]。Jiang[16]等人在宫颈癌的基础研究中也阐明了NDC1基因可以通过激活Wnt/β-catenin通路从而对宫颈癌的进展发挥促进作用。以上的研究均说明了NDC1基因有潜力成为恶性肿瘤诊断以及预后评估的高效生物学标志物。笔者团队的研究从TCGA数据库下载了所有COAD患者的RNA-Seq数据集以及对应的临床病理参数。首先分析TCGA-COAD所有数据中肿瘤组织和正常组织中NDC1的差异化表达并发现NDC1在正常组织中的表达明显低于肿瘤组织,这一研究结果与先前的Jiang以及Qiao的研究结果符合,以此也证明了NDC1在COAD中是一个有差异化表达的基因并有区分肿瘤良恶性的诊断潜力,而后我们根据肿瘤以及癌旁正常组织中NDC1的表达情况绘制ROC曲线,结果也证明了NDC1在肿瘤诊断中有着较高的特异性以及效能。而后我们通过检索GEPIA网站,在下载并整理相应的COAD患者临床数据后得出了FHOD1高表达的患者有着更多的转移淋巴结。笔者利用GEPIA数据库进行生存分析也证明了NDC1基因高表达的COAD患者有着更低的总体生存率,这一发现与先前的研究证明了NDC1是恶性肿瘤预后的危险因素不同,在我们研究中,NDC1对COAD起着保护性基因的作用,同样,NDC1与患者的临床病理特征相关性的研究中也证实了NDC1基因对COAD的保护性作用,即高表达NDC1的COAD患者有着更低的淋巴结转移数、更好的病理分期以及更少的肿瘤淋巴侵犯。在单因素COX回归分析中也显示了NDC1可以作为COAD患者预后的独立影响因素。本研究的研究结果均证明了NDC1在COAD的发生发展中起着保护性基因的作用并有潜力成为结肠癌诊断及预后评估的新型生物学标志物。但是,本研究的结果仍然存在一定的局限性,由于这仅是来源于TCGA数据库中的COAD数据,并且部分数据存在缺失及不足,因而可能导致一定程度的统计学结果偏倚,因此,我们后期针对NDC1基因的研究将会从细胞系的实验以及更多的结肠癌患者两方面同时进行研究,并深入挖掘NDC1与结肠癌发病机制的关联。
综上所述,NDC1作为一个保护性基因有望成为结肠癌诊断及预后评估的新型生物学标志物。