基于CiteSpace对前列腺癌相关分子研究现状和热点的文献计量学分析
2023-06-15古力曼木黑亚提
卜 珂, 古力曼·木黑亚提, 陶 宁
(新疆医科大学公共卫生学院, 乌鲁木齐 830017)
前列腺癌是中老年男性最常见的癌症之一,2022年全球约有140万名男性被诊断为前列腺癌,在西方发病率居男性恶性肿瘤之首,是仅次于肺癌的男性第二大癌症死因[1]。现阶段中国前列腺癌发病率也在逐年升高,在中国男性泌尿生殖系统恶性肿瘤中居首位[2],患者发现晚、预后差,是中国前列腺癌患者高死亡率的主要原因[3]。研究表明,早期诊断且接受治疗的患者预期寿命在10年内可能高达99%,然而,晚期前列腺癌(远处转移)患者的总生存率在5年内仅为30%左右[4]。前列腺癌早期发病隐匿,不易被发现,大多数患者初诊时即为晚期。随着分子研究的深入,前列腺癌的相关基因组学以及肿瘤标志物、分子信号通路等已经成为近几年该领域的研究重点[5],有助于提高前列腺癌的诊断率,为前列腺癌的精准治疗提供依据。为进一步了解前列腺癌基因组学和分子研究的研究现状,从宏观视角探讨前列腺癌未来可能的研究热点和趋势,本研究利用可视化软件对相关研究文献进行文献计量和可视化图谱展示,以期为前列腺癌的诊断和治疗提供参考。
1 资料与方法
1.1 文献来源与检索策略中文文献来源于中国知网、万方和维普数据库;英文文献选自Web of Science和PubMed数据库。发表时间为2011年1月1日-2022年10月31日。中文数据库检索方式为高级检索,检索式为“主题=前列腺癌基因表达 OR 主题=前列腺癌信号通路 OR 主题=前列腺癌分子机制 OR主题=前列腺癌分子生物标志物”。Web of Science核心数据库中使用普通检索以“(主题=Gene expression of prostate cancer)OR(主题=Signal pathway of prostate cancer)OR(主题=Molecular mechanism of prostate cancer)OR(主题=Molecular biomarker of prostate cancer)”为检索式。PubMed数据库中使用高级检索,检索式为:(All Fields=Gene expression of prostate cancer) OR (All Fields=Signal pathway of prostate cancer) OR (All Fields=Molecular mechanism of prostate cancer)OR(All Fields=Molecular biomarker of prostate cancer),文献收集时间为2022年11月1日,数据库文献筛选流程见图1。
中文数据库1. 万方: n=1 7222. 维普: n=6813. 知网: n=1 821英文数据库1. PubMed: n=2 2842. Web of Science: n=3 016↓ NoteExpress合半文献,统一以“refworks”格式导出↓ CiteSpace软件格式转换并去重↓ 去重后剩余文献中文文献: n=2 502英文文献: n=2 794
1.2 文献纳入标准前列腺癌基因组学和分子机制相关研究领域的期刊论文、学位论文。
1.3 文献排除标准主题与前列腺癌基因组学和分子机制研究不相关者、主题与前列腺癌基因组学和分子机制研究相关但为重复发表者、新闻报道、会议等。
1.4 数据处理将中文数据库的文献导入文献管理软件NoteExpress中,统一以“refworks”格式导出并存为以“download_**”命名的文本文档,导入到CiteSpace软件进行去重以及格式转换;Web of Science核心数据库的文献以纯文本中的“全纪录与引用的参考文献”格式导出,保存并重命名为“download_**”;PubMed数据库筛选的文献以NBIB Formatted File形式导出,在CiteSpace中进行格式转换。
1.5 研究方法本文是以文献计量学的方法对前列腺癌基因和分子研究进展相关文献进行可视化展示与分析。采用CiteSpace分别对中英文文献的发文基本情况和该领域高频关键词进行可视化知识图谱的绘制。CiteSpace软件阈值和参数设置如下:时间范围为2011年1月-2022年10月,Years Per Slice为1,g index设置为25,Node Types依次选择作者、机构、国家和关键词展开可视化分析,Pruning算法选择常用的Pathfinder、Pruing sliced networks和Pruing the merged network,其他均为默认设置。
在对发文国家、机构、作者以及关键词共现分析时,图谱中节点依次代表国家、机构、作者以及关键词;频次和中介中心性在共现分析中用以度量节点的重要程度,中介中心性是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比,用来描述节点在网络中作为桥梁连接其他关键词的能力[6]。聚类分析将关键词分类并划分为不同色块,每一个色块对应一个聚类,聚类标签值越小,表示该聚类所包含的关键词越多[7]。突现分析能够捕捉词频共现度突然发生骤增的关键词,突现图中红色条柱表示对应关键词词频的爆发年份。时间线图分析以时间为轴,将关键词平铺在时间轴上清晰展示该领域重要关键词在不同年份的发展情况。
2 结果
2.1 发文趋势分析共收录中文文献2 502篇,英文文献2 794篇,2011-2022年期间发文量年度分布如图2所示。2011-2021年中英文文献年度发文量持平,波动范围在50篇左右。2022年至今英文文献年发文量水平较高,高出中文发表文献200篇以上,总体发文量保持稳定。
图2 发文趋势图
2.2 发文国家、机构分布对近10年国内外关于前列腺癌基因组研究和分子研究领域相关文献进行分析,经过国家共现分析得到发文量最高的五个国家分别是美国(1 112篇)、中国(621篇)、加拿大(204篇)、意大利(194篇)和德国(186篇),其中美国发文量最多,影响力最大(图3)。机构共现分析得到发文量排行前10所的机构(表1),中文数据库中发表该领域文献量最多的机构是武汉大学人民医院泌尿外科,发文量26篇;英文数据库中发表相关文献最多的机构为杜克大学医学中心病理科,共计发文127篇。
表1 排名前10的发文机构
图3 发文量排名前10位的国家分布
2.3 发文作者分布共有586位中文文献作者和523位英文文献作者纳入作者合作网络分析(图4、5),图谱中每一个节点代表一位作者,节点直径与发表文献数量呈正相关,节点之间的连线代表作者之间具有合作关系,图谱由多个子网络构成,中文作者合作网络中最突出的是杨泽为代表的合作团队,该团队合作网络最丰富,且有6人发文量>10篇;英文作者合作网络中发文量位于首位的作者是ANGELO M DE MARZO(音译:安吉洛·梅德·马佐),共发表24篇前列腺癌基因组学相关研究的文献(表2)。
表2 发文量排名前5的作者
图4 中文文献发文作者图谱
图5 英文文献发文作者图谱
2.4 关键词分析对纳入文献进行关键词共现分析,共得到521个中文关键词和596个英文关键词,频次最高的中文关键词是细胞增殖(245次)、中心性最高的是甲基化(0.44);英文关键词中频次和中心性最高的分别是gene expression/基因表达(293次)和醋酸阿比特龙(0.32),结果见表3、4。聚类分析共得到17个中文聚类(图6)和21个英文聚类(图7)。为详细呈现高频关键词在该研究领域的兴衰历程,依次对中英文关键词进行突现分析并绘制时间线图,突现强度前10的中英文关键词如图8、9所示,对应的时间线图见图10、11。
表3 中文高频关键词
表4 英文高频关键词
图7 英文文献关键词聚类图谱
图8 中文关键词突现图谱
图9 英文关键词突现图谱
图10 中文关键词时间线图
图11 英文关键词时间线图
3 讨论
通过对相关文献进行发文趋势分析和作者机构合作网络分析,得到前列腺癌基因和分子研究领域发文量缓慢增长且处于较高发文趋势,表明近几年前列腺癌基因和分子研究一直是该领域的研究重点。美国在该研究领域影响力较大,发文量居首位。武汉大学人民医院泌尿外科和杜克大学医学中心病理科是该领域主要发文机构。从国家、机构、作者的合作网络分析中可以看出,国外机构的发文量水平远高于国内机构,且国外作者的合作网络更加丰富,不同合作团体之间具有良好合作关系。
以杨泽和安吉洛·梅德·马佐为主的团队是该领域核心发文团队。以杨泽为主的研究团队主要研究基因突变与前列腺癌患病风险的关联性以及雄激素受体(AR)信号通路的研究[8-10]。BRCA2是65岁以下男性早发性前列腺癌中最常见的基因改变[11],目前研究表明,BRCA2发生突变,与癌症更快进展为晚期以及较短生存期有关[12-13]。除此之外,在前列腺癌进展中AR起着重要作用,在几乎所有的原发性和转移性前列腺癌中都有表达,不论分级如何,AR信号均在前列腺癌中活跃并支持癌细胞存活和生长[14],因此被认为是治疗前列腺癌的一个有吸引力的靶点。新一代的AR抑制剂恩杂鲁胺被证明可以显著提高去势抵抗性前列腺癌患者的生存率,然而并不能长期适用以改善患者预后[15],最新研究将恩杂鲁胺与EPI-001两种雄激素受体抑制剂共同结合到同一分子中表现出更高的癌细胞杀伤能力[16],还有更多的研究正在关注基因突变对AR信号通路的调节作用以及分子标志物的研究[5, 17]。安吉洛·梅德·马佐为代表的研究团队主要研究基因重排在前列腺癌中的表达及临床意义以及影响前列腺癌侵袭性的细胞因子的研究[18-20]。最新研究包括白细胞介素1β(IL-1 beta)表达对前列腺癌侵袭性风险的影响[21],乳铁蛋白CpG岛高甲基化与前列腺癌早期mRNA和蛋白表达的解耦[22]、通过定制的4-plex DiLeu等压标记对遗传性前列腺炎小鼠模型的定量蛋白质组学分析[23]。
通过关键词分析可知,该领域包括细胞水平和分子水平的研究,基因表达、基因检测和治疗是当下主要研究方向。高频关键词包括基因表达、甲基化、雄激素、基因治疗等。转录调节、翻译后修饰和启动子的高甲基化导致的表观遗传沉默与肿瘤的发生相关[24],其中甲基化在中文关键词中的中心性最高,DNA甲基化是人类癌症中最有潜力的早期发现和评估预后的生物标志物之一[25],Ke等[26]的研究发现启动子的高甲基化导致抑癌基因表达下调,与患者较差预后相关。此外,因治疗和基因检测也是当下重要的高频关键词,随着高通量基因测序等技术的发展,基因检测与治疗成为当下的研究热点,Zhao等[27]通过对转移性癌症的全甲基组、全转录组测序鉴定了甲基化与致癌驱动基因AR、MYC和ERG等的RNA表达相关的基因间区域,展现了晚期前列腺癌的DNA甲基化景观,为肿瘤治疗及预后提供了新方向。
综上所述,本文通过绘制前列腺癌基因和分子研究领域文献的知识图谱,将目前研究现状可视化展示并系统梳理了该领域研究现状和研究热点,发现前列腺癌分子研究正受到极大关注,相关发文量一直处于高水平,研究团队有稳定的合作关系,研究内容主要集中于前列腺癌基因检测、治疗以及相关预后标志物;肿瘤侵袭性、基因检测、肿瘤微环境可能成为研究重点和未来趋势,发现更多潜在治疗靶点和分子标志物可以为前列腺癌的精准治疗提供理论依据。