鼻咽癌易感性基因计量学分析及关键基因筛选
2020-09-22徐婉银伦永志
徐婉银 熊 悦 伦永志
莆田学院药学与医学技术学院 医学微生态学福建省高校重点实验室,福建省莆田市 351100
鼻咽癌(Nasopharyngeal carcinoma,NPC)是高发于中国南方省份的一种上皮源性恶性肿瘤,具有明显的地域特性和种群差异。因为鼻咽癌早期症状复杂且缺乏明显特征,发病部位比较隐匿,所以鼻咽癌患者大多死于肿瘤的转移而非原发疾病[1-2]。故此,早期诊断有无肿瘤的转移并了解其转移渠道对鼻咽癌的临床治疗至关重要。随着现代分子生物学技术的发展,使我们对鼻咽癌相关分子标志物(如癌基因、抑癌基因、miRNA、细胞因子及其受体等)有了更深刻的认识。目前国内外对鼻咽癌相关分子标志物的研究日新月异[3],本研究通过对近12年来国内外鼻咽癌易感性基因的相关文献进行文献计量学和生物信息学的统计分析,了解鼻咽癌易感性基因的研究趋势和发展动态,提取关键基因,以期为鼻咽癌的分子诊断与研究提供基础。
1 材料与方法
1.1 文献检索 检索鼻咽癌易感性相关基因研究的文献,检索数据库限定为NCBI Pubmed、中国知网(CNKI)和Web of science,时间限定为2008年1月—2020年1月。Pubmed检索式:gene AND risk AND nasopharyngeal carcinoma;Filters:Publication,时间2008年1月1日—2020年1月1日。中国知网检索式:主题词为 “鼻咽癌 ”“易感性”“基因”,模糊匹配。Web of science检索式:主题词为“gene”“risk”“nasopharyngeal carcinoma”,时间为2008—2020年,检索日期为2020年1月1日。
1.2 文献纳入与排除 纳入标准:(1)纳入的临床研究均与鼻咽癌易感基因及基因产物相关;(2)纳入的文献形式包括会议论文、会议摘要及论著;(3)纳入的文献均可以获取足够信息的摘要或全文资料。排除标准:(1)排除针对基因结构、基因统计、Meta分析等的研究文献;(2)排除书信、书籍、综述及个案报道等;(3)排除与患鼻咽癌风险相关的非基因研究;(4)出版年份、题目及作者相同但来源数据库不同的文献,按1篇统计;(5)研究物种限定为人类,排除细胞株体外研究及动物体内实验;(6)排除其他与本研究目的不符的文献。
1.3 文献计量学分析 借助EndNote X9软件对最终纳入的鼻咽癌易感性基因相关文献进行管理并形成文献数据库,利用Microsoft Excel 2010软件的统计功能,分别从作者、发表期刊、出版年、研究机构等角度进行计量学分析[4]。
1.4 鼻咽癌易感性相关基因的挑选及名称标准化 统计纳入文献所研究的基因或基因产物,通过HUGO数据库(http://www.genenames.org/)进行基因名称的标准化,而其余未能被识别的基因则通过NCBI Gene数据库手工查询。
1.5 鼻咽癌易感性相关基因生物信息学分析 将应用文献计量学统计分析获得的鼻咽癌易感性相关基因上传至在线软件STRING 11.0(https://string-db.org/),对鼻咽癌易感基因表达的蛋白质进行网络构建,并将所得的网络数据导入Cytoscape 3.7.1软件处理, 同时使用其插件Centiscape 2.2计算网络及其各个节点的拓扑特性,设置Betweenness值和degree值筛选出瓶颈(Bottleneck)基因和关键(Hub)基因。
2 结果
2.1 文献检索 从Web of science数据库中检出文献520篇,从Pubmed数据库中检出文献337篇,从CNKI数据库中检出文献117篇,共计974篇,去重后按照纳入标准进一步筛选,确定纳入文献348篇。
2.2 文献计量学分析 结果显示,鼻咽癌易感性相关基因的研究文献在2008—2016年间总体呈上升趋势,而2016—2019年的文献量逐渐下降,其中2014年与2016年文献量升高尤为显著,发文量最高的年份是2016年,为52篇(图1)。
图1 2008—2019年鼻咽癌易感性相关基因相关文献出版年分布
共有195种生物医学期刊上发表鼻咽癌易感性基因的相关文献,文献量达348篇。其中以Oncotarget刊文15篇高居榜首,Tumor Biology 14篇次之,发文量在5篇及以上的期刊还有Plos One(10篇)、Molecular Carcinogenesis(8篇)、Bmc Cancer(5篇)、Human Immunology(5篇)。
12年间在鼻咽癌易感性相关基因方面发文量最多的作者是中山大学的曾益新,发表相关文献16篇。为避免数据统计的重复和遗漏,统计对象设定为第一作者所在机构,结果显示有125个研究机构进行相关研究,国内以中山大学发表文献最多,达到30篇,其次3个研究机构分别为广西医科大学(26篇)、中南大学(21篇),右江民族医学院(20篇)。
纳入研究的鼻咽癌易感性基因文献统计共有283个第一作者,涉及25个国家或地区,其中中国以246篇的发文量高居榜首,发文量>5篇的国家或地区主要有突尼斯(19篇)、中国台湾(17篇)、美国(12篇)、印度(8篇)、葡萄牙(6篇)和马来西亚(6篇)。
2.3 蛋白质互作网络分析 将483个鼻咽癌易感性相关基因上传至在线软件STRING构建鼻咽癌易感性相关基因表达产物的互作关系网络,共计有216个基因参与了蛋白质互作分析网络构建(图2),由168个节点及723条边构成(图3)。Degree为节点连接的边的总数目,度值范围为1~48.00,平均度值为8.61。Betweenness为关系网络中经过某节点的最短路径的数量,数值范围为0~8 316.81,平均值为303.98。Hub基因为Degree≥均数+1SD的蛋白所对应的基因,共有22个,Bottleneck基因为Betweenness≥均数+1SD的蛋白所对应的基因,共有8个。同时为Hub基因和Bottleneck基因的基因对互作关系网络尤为重要,即为关键基因(表1),分别为TP53、JUN、PIK3CA、AKT1、VEGFA、IL6和TNF,如图3所示黄色节点,主要具有细胞增殖、细胞周期调控、细胞周期负调控、DNA损伤反应等功能,这些关键基因将是该领域未来的研究热点。
表1 筛选获得的关键基因
3 讨论
从文献计量学角度分析,国内外对于鼻咽癌易感性相关基因的研究主要集中在鼻咽癌的高发地区和科研影响力比较大的机构,其中中国占据重要地位。通过应用生物信息学方法分析入选的348篇文献中所涉及的483个基因,得出的互作关系网络图表明,鼻咽癌易感性相关基因均处于相互作用的复杂关系网络中,其中有多个基因位于网络中的关键位置,提示这些关键基因是重要的作用靶点和研究热点。
蛋白质互作关系网络中的关键基因具有稳定基因调控网络的重要作用,其变化将引起大量下游基因的表达变化,对整个网络而言它们的改变是至关重要的[5]。TP53是一种调节转录的序列特异性DNA结合蛋白,它具有诱导细胞周期阻滞和凋亡的能力,能通过防止癌基因突变来预防癌症[6]。有研究显示,TP53基因突变可增加正常细胞癌变的概率和肿瘤的发病率,TP53基因SNP rs117562731位点多态性与鼻咽癌的发病风险显著相关,此位点的突变有可能是导致鼻咽癌发生和发展的一个重要因素[7]。TP53密码子72 pro/Pro基因型与局部鼻咽癌患者的无进展生存期(Progression-free-survival,PFS)和总生存时间(Overall survival,OS)相关,这种多态性的基因分型有助于预测鼻咽癌患者的临床预后[8]。同时有研究证明TP53密码子72snp是局部晚期鼻咽癌放疗预后的独立预测因子,特别是烟龄在20年以上的患者群体中。基于以上研究,我们强烈主张应禁止吸烟,以提高放射治疗的疗效,特别是对于携带与局部复发或远处转移高危相关的SNPs的患者[9]。肿瘤血管的生成是肿瘤产生及发展的关键,血管内皮生长因子(Vascular endothelial growth factor,VEGF)常通过触发血管反应引起病理障碍,包括病理血管生成和组织水肿[10]。VEGF-2578 C等位基因携带者患鼻咽癌的风险显著,就预后指标而言,VEGF-2578 C等位基因携带者与肿瘤大小和晚期肿瘤分期所定义的鼻咽癌侵袭型之间存在显著相关性[11]。有研究人员探讨VEGF-2578C/A基因多态性与中国人鼻咽癌的关系,指出VEGF-2578A等位基因携带者患鼻咽癌风险显著增加,而-2578CC基因型鼻咽癌患者具有更高的肿瘤侵袭性,与-2578A等位基因携带者相比,分化差且处于晚期[12]。在广西人群中VEGF-460 C 等位基因是鼻咽癌发生的易感基因,可明显增加鼻咽癌患者淋巴结转移的风险[13]。同时有研究表明VEGF-1154G/A多态性位点与鼻咽癌的发病风险具有相关性[14]。AKT1是一种抗凋亡蛋白激酶,其底物之一是MDM2蛋白。AKT1是细胞信号转导的关键节点,在肿瘤的发生中起着重要作用。AKT1对MDM2的磷酸化促进MDM2进入细胞核,在细胞核中发挥下调p53活性的作用。有研究发现AKT1基因SNP4-5 AA中的一个双SNP核心单倍型与NPC风险增加显著相关[15], AKT1基因中的两个位点(单独或联合rs3803300和rs2494738)与预后相关[16]。白细胞介素6(IL-6)在EBV感染患者鼻咽组织巨噬细胞中表达,IL6-634基因的GG基因型与鼻咽癌复发风险相关,G等位基因是鼻咽癌复发的保护基因[17]。与正常鼻咽组织相比,鼻咽癌组织中c-Jun表达上调,Egr-1表达下调,c-Jun和Egr-1蛋白可以作为鼻咽癌早期诊断和预后预测的新的潜在生物标志物[18]。基因突变可以区分肿瘤的放射敏感性和放射抗性。癌基因突变可导致肿瘤的发生,并可为临床抗癌治疗提供潜在的治疗靶点[19]。探讨鼻咽癌放射敏感性与放射抵抗患者的肿瘤易感基因改变是否存在差异中,观察到5个针对AKT1、PIK3CA、MET、TP53和STK11的放射敏感性特异性突变,提示PI3K/AKT和p53通路的遗传改变参与了放射治疗的反应[20]。在病毒感染免疫反应中,肿瘤坏死因子(Tumor Necrosis Factor,TNF)是一种由活化的巨噬细胞或单核细胞产生的促炎性反应的细胞因子,TNFA AA基因型携带者与鼻咽癌发病风险显著相关[21]。
图2 鼻咽癌易感性相关基因表达产物构建的蛋白质互作关系网络图
图3 鼻咽癌易感性相关基因相互作用的关系网络图
鼻咽癌是由多种因素引起,其中遗传多态性不仅与鼻咽癌的患病风险显著相关,而且还影响鼻咽癌的侵袭进展和预后。了解遗传变异对患者临床结局的影响,可以更好地寻找鼻咽癌的生物标志物进行个体化治疗,而临床精确的治疗和预后依赖于有效的生物标记物,这些标记物具有更强的筛选、诊断和监测肿瘤的能力。近年来依赖生物信息学的知识及方法参与癌症的治疗(基因治疗和分子靶向治疗),已经取得了显著的成就和临床效益[22]。本研究基于生物信息学的方法对鼻咽癌易感性基因进行总结剖析,以确定关键基因作为潜在的生物标记物,并了解鼻咽癌靶向治疗的研究进展。通过开展更加精细的研究与临床相结合,对预防和早期诊治鼻咽癌、明确鼻咽癌的发生机制具有重要的意义[23]。