食管癌易感性相关基因文献计量学及生物信息学分析
2018-08-23
(莆田学院药学与医学技术学院 医学检验系,福建 莆田 351100)
由于临床发现的食管癌大多为晚期,有效治疗方式缺乏,生存期往往较短。因此,针对食管癌高危人群进行定期筛查是发现早期食管癌、提高食管癌生存率的有效方法。近年来针对食管癌易感基因的研究很多,为了更好的了解食管癌易感性基因的研究动态和发展趋势,并发现其中的关键基因,本研究运用文献计量学方法和生物信息学方法对相关基因的研究文献及所涉及的相关基因进行系统分析。
1 材料与方法
1.1 文献检索
从中国知网(CNKI)、NCBI Pubmed数据库中检索2005年1月至2016年12月食管癌易感性相关基因研究的文献。中国知网检索式:A:主题=食管癌 and 主题=易感性 and 主题=基因(模糊匹配)。Pubmed检索式:gene AND risk AND esophageal neoplasms。
1.2 文献纳入与排除
纳入全部与食管癌易感性相关基因及基因产物相关的临床研究。纳入与排除标准:文献形式包括论著、会议论文及会议摘要,排除综述、个案报道、回信书籍及社论等;纳入文献需包括能提供足够信息的摘要,或可以获取全文资料,排除无法获取摘要的文献;排除与患食管癌风险相关的非基因研究;纳入临床研究文献,排除针对基因的结构、机制等研究文献;物种限定为人类,排除细胞株体外研究及动物体内实验;排除针对基因统计、Meta分析;排除重复文献,不同数据库来源,作者、题目及出版年相同的文献按1篇统计;检索时间限定为2005/01/01-2016/12/31,文献语种为中文和英文;排除其他与研究目的不符的文献。
1.3 文献计量学分析
利用Endnote X6软件对最终纳入食管癌易感性相关基因文献进行管理,并借助Excel 2003软件分别从出版年、作者、研究机构、发表期刊等角度进行计量学分析。
1.4 食管癌易感性相关基因的挑选及名称标准化
对纳入文献所研究的基因或基因产物进行统计,通过HUGO数据库查询相应的基因标准名称,未能识别的基因通过NCBI Gene数据库进行手工逐一检索标准名称。
1.5 食管癌易感性相关基因生物信息学分析
利用HUGO对相关基因进行名称标准化,用在线软件STRING对食管癌易感性相关基因表达产物构建蛋白质相互作用网络。将STRING软件构建的食管癌易感性相关基因相互作用网络图导入Cytoscape软件可视化,用其插件CentiScape计算网络及各个节点的拓扑特性,设置度值和Betweenness值筛选出关键基因和瓶颈基因。
2 结果
2.1 文献检索
从CNKI数据库中检出文献434篇,从Pubmed数据库中检出文献1041篇,2个数据库共检出文献1475篇,根据研究内容确定符合要求的文献共324篇。
2.2 文献计量学分析
结果显示,食管癌易感性相关基因的研究文献在12年间总体呈间歇性波动趋势,发文量最高的年份为2011年与2014年。见图1。
图1 2005-2016年食管癌易感性相关基因相关文献出版年分布
324篇论文发表在145种生物医学期刊上,平均每刊发文2.23篇,其中Carcinogenesis刊文10篇居首位。发文量5篇或以上的期刊为Dis Esophagus 9篇,World J Gastroenterol 7篇,Tumor Biol 7篇,PLoS One 7篇,Asian Pac J Prev 6篇,Mol Biol Rep 6篇,中华肿瘤防治杂志6篇,中国公共卫生6篇,中华流行病学杂志 6篇,Biomakers 5篇,肿瘤 5篇。
中国的Li Y(河北医科大学第四医院)为发文量最多的的作者,发表相关文献19篇,12年间在食管癌易感性相关基因方面作者发文量超过10篇的作者还有3位,分别为Wang N(河北医科大学第四医院),Mittal B(桑杰·甘地医学研究所遗传学系)和Guo W(河北医科大学第四医院)。
为避免重复统计,以第一作者所在机构作为统计对象,共有176个研究机构进行食管癌易感性相关基因方面研究,其中印度的桑杰·甘地医学研究所遗传学系发表文献最多,达到10篇,其次4个研究机构分别为河北医科大学第四医院、东南大学公共卫生学院,克什米尔大学,江苏大学附属人民医院,发文量分别为8、5、4、4篇。
2.3 蛋白质相互作用网络
324篇文献中共涉及132个基因,经HUGO进行基因名称标准化后上传至在线软件STRING9.1,对食管癌易感性相关基因表达的蛋白质进行网络构建。121个基因参与网络构建,网络外围有9个基因产物与其他蛋白或主网络无联系,分别为ALDH7A1、CRNN、SPINK7、CCL26、CD1A、CMC2、PLCL1、INTS7和 ADAMTS9,提示上述节点对整个网络无影响。
图2 食管癌易感性相关基因表达产物构建蛋白质相互作用网络图
2.4 关键基因及瓶颈基因分析
将STRING软件构建的食管癌易感性相关基因相互作用网络图导入Cytoscape软件可视化,剔除网络外围的基因,用其插件CentiScape计算网络及各个节点的拓扑特性,见图3。网络是由个112节点2587条边组成。度数为节点连接的边的总数目,最大度值为131,最小为2,平均度值为22.47。本研究规定度数≥均数的蛋白所对应的基因为关键基因(Hub基因),共有42个。Betweenness为网络中所以最短途径中经过该节点的数量比例,最大2350.54,最小为0,平均为138.66,本研究规定Betweenness≥均数的蛋白所对应的基因为瓶颈基因(Bottleneck基因),共有39个。同时为Hub基因和Bottleneck基因的对相互作用网络非常重要,分别为 VEGFR、MMP9、IL6、RAD51、CCND1、CD44、MDM2、PTGS2、TP53、EGFR、ATM、BRCA2、TNF,见图4。
图3 食管癌易感性相关基因相互作用网络图
图4 食管癌易感性相关的关键基因与瓶颈基因
3 讨论
食管癌的发病是由多个基因交互作用引起的,也与环境因素有关联。亚硝酸胺、霉菌、烟草及饮食过烫均会促进食管癌的发生。研究显示,尽管在相近的环境条件下,罹患食管癌的人也并非占多数,所以个体的遗传因素可能对食管癌的发生有较大的影响[1]。对食管癌相关基因的研究文献进行计量学分析,显示2005-2016年间该领域研究总体发展相对平缓,近5年中以2014年的突破较大。目前食管癌的发病率逐年上升,研究食管癌易感性相关基因,对临床通过基因诊断的方法有效预测食管癌的发生有指导意义。
通过对所选研究文献涉及的132个基因进行生物学信息分析,构建蛋白质相互作用网络,有多个基因处于网络核心位置,这些基因表达产物相互之间有密切的功能性的关联,VEGFR、MMP9、IL6、RAD51、CCND1、CD44、MDM2、PTGS2、TP53、EGFR、ATM、BRCA2、TNF等基因对食管癌基因诊断领域的研究有重要意义。基因对食管癌的主要涉及表观遗传学、过表达和突变等方面。BCL2抗凋亡基因ala43ala基因型和BCL-2 rs2279115多态性均能显著增加食管癌的发病风险[2-4]。RAD51-G135C位点多态性改变、PTGS2基因的失调也是食管癌的关键易感因素[5-6]。MDM2 SNP309多态性和SNP309G-del1518 +单体型[7-9]肿瘤。EGFR 497Arg> Lys和EGF + 61A> G多态性的基因相互作用协同增强食管癌的风险[10]。肿瘤坏死因子对食管癌的发生过程有较大影响,其中TNF-βNcoI A / A基因型最为常见[11]。在国外的报道中,BRCA2基因与食管鳞癌的家族聚集性存在关联性[12]。在针对食管癌发病机制的研究中发现,TP53的基因多态性可以增加对食管癌的敏感性[13]。在STRING构建的蛋白质网络作用图中,TP53处于网络的核心位置。但近年来我国学者在TP53与食管癌易感性相关的研究较少,TP53在早期食管癌的诊断应用值得关注,有望发掘潜在的食管癌分子标记物。
精准医学是未来肿瘤研究的方向,对患者进行基因测序,利用个人基因组信息、疾病体细胞突变信息等,进行的疾病精准诊断和依赖靶向药物等的精准治疗技术[14-15]。分子生物学的发展为肿瘤的靶向治疗提供了新的手段[16]。应用生物信息学方法对食管癌易感性相关基因进行研究,预测食管癌的发生发展,仍为未来食管癌研究的热门方向。