APP下载

基于CiteSpace的“三阴性乳腺癌脑转移”研究可视化分析

2023-11-10徐佳伟徐思怡虞程栋余腾骅孙正魁

实用癌症杂志 2023年10期
关键词:图谱可视化聚类

徐佳伟 汤 雷 徐思怡 虞程栋 余腾骅 陈 雯 孙正魁

乳腺癌是全球常见的癌症,且发病人数不断上升,其中三阴性乳腺癌(triple negative breast cancer,TNBC)占乳腺癌的10%~20%[1-2]。TNBC是一种难以控制的乳腺癌亚型,由于其缺乏雌激素、孕激素和人表皮生长因子受体2(HER-2)受体,临床上缺乏有效的治疗靶点,因此TNBC预后较差[3]。远隔器官的转移往往是TNBC不良预后的原因,而其转移部位多见于淋巴结、骨骼、肺、肝和脑,研究显示乳腺癌是转移至大脑的第二常见实体瘤,因此对TNBC脑转移进行相关研究具有重大的临床意义[4-5]。 目前,三阴性乳腺癌脑转移相关的研究优先级显现出一定的先后顺序,但在相关结论上却尚存争议,缺乏研究从计量分析角度梳理现有文献[6-7]。同时,许多学者对三阴性乳腺癌脑转移的研究一般局限于对文献的综合阅读和个人临床经验的总结,缺乏必要的完整性和宏观性[8]。

文献计量学作为一种可视化分析研究成果的新方法,通过对已发表文献的国家、作者、机构和关键词等进行分析,为研究者提供文献的定性和定量特征,从而描述某一领域当前的发展趋势,揭示该领域的前沿[9-10]。文献计量学已经在包括炎症、遗传学和癌症等研究领域证明了其意义非凡[11-13]。并且,文献计量分析为疾病研究做出了巨大贡献[14]。然而,目前还没有三阴性乳腺癌脑转移领域的科学成果研究评估,因此对三阴性乳腺癌脑转移的研究现状进行探究显得意义重大。因此,本研究系统分析了2007-2021年12月31日期间三阴性乳腺癌脑转移领域的相关科研成果,深入探讨作者、机构和国家之间的关系。此外,我们还全面分析了关键词、引用参考文献,确定了本领域研究重点以及核心热点,以期为未来研究提供借鉴。

1 材料与方法

1.1 一般材料

研究中与三阴性乳腺癌脑转移相关的所有出版物均来自科学网核心馆藏(Web of Science Core Collection,WOSCC),时间截至2021年12月31日。选择高级检索,在“主题”范围内,以“三阴性乳腺癌”和“脑转移”为检索式,检索时间自定义为2007年1月1日至2021年12月31日,最终获取学术文献510篇。排除综述论文、会议摘要、信函、图书等其它类型的文献,最终共获得学术期刊文献393篇。文献由三位作者(徐思怡、虞程栋和汤雷)独立检索和筛选,如果三者检索结果有区别,则发起组内讨论共同确认。

1.2 方法

本研究以知识图谱为基础,将符合筛选条件的393篇学术期刊文献,以纯文件格式从科学网核心馆藏(Web of Science Core Collection,WOSCC)导出,将数据导入 CiteSpace(V 6.1.R3 advance)中进行数据转换以进行文献可视化分析。自定义时间跨度(Time Slicing)为2007年1月至2021年12月,时间分区(Years Per Slice)为1年,分别选择作者(Author)、机构(institution)、国家(country)、关键词(Key Words);剪裁方式选择关键路径法(pathfinder)、 精简切片网络(pruning sliced networks)和精简合并网络(pruning the merged network)以简化网络图谱,降低网络密度,增强网络可读性;其余设置为默认,绘制相应的知识图谱。

2 结果

2.1 三阴性乳腺癌脑转移研究的时间发展趋势

研究在删除了117条不合格筛选条件的文献后,共获得393篇文献。本研究领域发文量在15年间呈阶梯型上升趋势,在研究早期,全球学者并未将三阴性乳腺癌脑转移作为研究重点。2010年之前年度发文量不超过10篇,此后研究发文量呈现上升趋势,2020年至2021年,三阴性乳腺癌脑转移研究年度发文量达峰值60篇,较上一年度发文增长量达14篇(图1)。由此可见三阴性乳腺癌脑转移研究正引起越来越多学者的兴趣。

图1 全球三阴性乳腺癌脑转移相关文献时间分布图

2.2 三阴性乳腺癌脑转移研究的核心作者、作者合作网络分析

我们团队运用 CiteSpace绘制作者合作网络图谱(图2),以节点大小代表作者发文量多少,以连线的粗细代表作者之间合作的紧密程度。分析发现在全球三阴性乳腺癌脑转移图谱中,共有 424 个节点,749条连线,可视化图谱网络密度为 0.0084,这说明邻域内各作者之间的合作关系较为松散,但仍然形成了具有一定内部合作关系的代表性研究团队。

图2 全球三阴性乳腺癌脑转移作者合作网络图谱

2.3 三阴性乳腺癌脑转移研究的国家、机构分析

自2007年以来,已有46个国家/地区发表了三阴性乳腺癌脑转移研究的相关文章。根据CiteSpace创建的可视化图谱(图3)显示了出版物的国家/地区的分布和数量。结果提示,在全球范围内参与三阴性乳腺癌脑转移相关研究的国家不多,且各国文章产出较少,因此在本领域有很大的研究空间等待进一步发掘。其中来自美国的出版物最多(n=155),其次是中国(n=61)、韩国(n=31)、和德国(n=30)。

图3 全球三阴性乳腺癌脑转移国家合作网络图谱

研究发现,共有310个机构参加三阴性乳腺癌脑转移的研究。发文量最多的10所研究机构中有9所机构来自美国,另外一所来自中国,其中丹娜·法伯癌症研究院(Dana-Farber Cancer Institute)发表的论文数量最多(n=20),其次是北卡罗来纳大学(The University of North Carolina System)(n=11)。中国参与三阴性乳腺癌脑转移研究的主要机构有中山大学、四川大学和复旦大学等,且未与国外其他机构形成紧密的合作(图4)。

图4 全球三阴性乳腺癌脑转移机构合作网络图谱

2.4 三阴性乳腺癌脑转移研究的关键词共现分析

关键词共现分析是通过统计关键词在同一文献中出现的频率,分析关键词之间的内在关系和亲密程度。作为可以体现文献核心研究内容的关键词,研究利用CiteSpace 制作关键词共现图谱可视化展示关键词的共现关系,可以发现本研究领域的核心内容及研究热点(图5)。分析发现图谱中共有 350个节点,780条连线,网络密度为 0.0128。关键词共现图谱中具有较高中介中心性的关键词包括二期临床研究(0.25)、卡培他滨(0.25)、血管生成(0.22)、新辅助化疗(0.22)及屏障(0.16),说明三阴性乳腺癌脑转移系统治疗的临床研究为目前研究领域的关注热点。

图5 全球三阴性乳腺癌脑转移关键词共现网络图谱

2.5 三阴性乳腺癌脑转移研究的关键词聚类分析

在可视化图谱中,对关键词进行聚类分析,可以进一步研究本领域的研究类团及结构特征。降低网络密度,增强网络可读性,裁剪选择最小生成树(Minimum Spanning Tree),另外使用LLR算法形成名词短语标签,从聚类标识词的提示可以推出每一组模块的主要研究方向以及相应的热点文献,从而依靠阅读热点文献可以找到本研究领域的最新进展。我们团队基于此理论绘制了全球三阴性乳腺癌脑转移关键词聚类可视化图谱。通常认为,关键词聚类分析中Q 值大小与聚类效果呈正相关,而S值的大小则与关键词聚类的合理程度呈正相关。当Q>0.3 则可认为聚类社团结构显著,在本图谱中 Q=0.9002>0.3,因此,我们认为本研究所产生的 知识聚类较清晰地反映了当下全球在三阴性乳腺癌脑转移领域的研究主题分布,通过对本知识图谱的分析有助于我们深入了解目前研究方向的结构及内容。通过我们制作的知识图谱可以发现,全球三阴性乳腺癌脑转移的研究方向依频次由高到低分别集中在:乳腺肿瘤、腺癌、细胞、肿瘤转移、化疗、三阴性乳腺癌、循环肿瘤细胞、晚期乳腺癌、微环境、开放标签、立体定位放射外科等方面。

2.6 三阴性乳腺癌脑转移研究的关键词时间线图可视化分析

构建三阴性乳腺癌脑转移研究的关键词时间线图可将本领域不同研究类团的发展过程可视化呈现出来,我们团队以关键词所在年份以及所属聚类标签为基础,分别构建可视化图谱的X与Y轴。依据出现的时间顺序将同一聚类中的关键词排布在时间线上,进而将同一聚类中关键词随研究时期推移而改变的情况可视化呈现。通过对各聚类中关键词的历史跨度分布情况的分析我们发现,在时间分布方面,聚类相对集中,主要包括#0三阴性乳腺癌,#2循环肿瘤细胞,#3三阴性,#6乳腺癌,#8脑转移。显而易见,这些相对集中的聚类主要出现在在2008~2013年之间,这表明这些聚集是全球三阴性乳腺癌脑转移研究中最受欢迎的方向。

2.7 三阴性乳腺癌脑转移研究关键词突现分析

关键词突现是指研究领域内某关键词运用频次在短时间内显著增加,通过对其的检测、分析不仅可以反映某一时间段内的研究前沿以及其随时间发展的演变情况,还能揭示理论趋势或是领域内正在出现的新主题,以此预测未来可能的研究方向。我们以粗线表示在特定期间内使用突然增加的关键字,细线则表示特定期间内使用相对不受欢迎的关键词(图6)。我们团队通过关键词突发检测将增生、诊断、通路、冲突、位点、结局确定为近3年的热门话题,反映了目前领域的研究人员越来越关注三阴性乳腺癌脑转移的诊断以及患者治疗相关问题。

图6 三阴性乳腺癌脑转移研究关键词突现可视化

3 讨论

文献计量分析根据已发表记录可视化为我们的研究提供了本研究领域的当前热点和趋势变化的可能性[17-18]。在本研究中,我们通过对Web of Science核心数据库进行系统的文献检索,累计查找了在2007~2021年期间全球范围内发表的有关三阴性乳腺癌脑转移的393篇文章。基于此总结了全球三阴性乳腺癌脑转移研究合作情况、发展趋势以及出现的新主题。在本研究领域内,美国的绝对生产率排名最高,其次是中国和韩国和德国。在2010年之前,与三阴性乳腺癌脑转移研究相关的出版物数量不足10篇,此后相关的出版物发表数量呈现上升趋势。根据我们绘制的知识图谱分析发现,全球三阴性乳腺癌脑转移的研究方向依频次由高到低分别集中在:乳腺肿瘤、腺癌、细胞、肿瘤转移、化疗、三阴性乳腺癌、循环肿瘤细胞、晚期乳腺癌、微环境、开放标签、立体定位放射外科等方面。说明这些方向是全球三阴性乳腺癌脑转移研究中最受欢迎的方向。另外,关键词突现分析指明目前该领域的研究人员越来越关注三阴性乳腺癌脑转移的诊断以及患者治疗相关问题,这可能是未来的研究热点。

然而,我们的研究存在一些局限性。首先,我们只从WoS核心集合中检索出版物,因此,本研究并未纳入所有相关出版物。其次,虽然数据库不断更新,但我们只收录了2007年1月至2021年12月的出版物,这可能会导致一些最新的研究成果被排除在外。

猜你喜欢

图谱可视化聚类
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
绘一张成长图谱
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
一种层次初始的聚类个数自适应的聚类方法研究