APP下载

基于CiteSpace的结直肠癌肿瘤微环境近十年研究热点分析

2023-03-17赵奕涵曹田宇赵晓迪卢瑗瑗空军军医大学西京消化病医院国家消化系统疾病临床研究中心肿瘤生物学国家重点实验室陕西西安700陕西中医药大学第二临床医学院陕西咸阳7046西北大学生命科学学院陕西西安70069

空军军医大学学报 2023年2期
关键词:发文聚类数据库

赵奕涵,王 晨,曹田宇,赵晓迪,卢瑗瑗(空军军医大学西京消化病医院,国家消化系统疾病临床研究中心,肿瘤生物学国家重点实验室,陕西 西安 700;陕西中医药大学第二临床医学院,陕西 咸阳 7046;西北大学生命科学学院,陕西 西安 70069)

结直肠癌(colorectal cancer,CRC)是全球第三大常见恶性肿瘤和第二大致死癌症,据估计,截至2020年,其发病人数为190万,死亡人数为90万[1]。虽然有常规治疗和化疗,但彻底治愈CRC仍然是难以跨越的鸿沟。肿瘤微环境由肿瘤细胞、成纤维细胞、内皮细胞、间充质干细胞、免疫细胞、细胞外基质以及多种细胞因子和趋化因子组成,肿瘤微环境对治疗效果和疾病走向都有重大影响[2]。目前,关于CRC肿瘤微环境的研究仍不够透彻,亟须研判研究趋势,为科学研究和临床治疗指明方向。

CiteSpace软件是基于Java语言的可视化分析数据软件,可对研究文献的各要素进行裁剪分析,如从国家、机构、关键词、参考文献等层面去展现,帮助学者直观、全面了解该领域的发展动态。本文基于陈超美博士开发的CiteSpace软件对Web of Science(WOS)核心数据库中CRC肿瘤微环境的相关文献进行分析,通过对发文量、国家、作者、机构、共引文献及关键词的可视化分析,绘制相关图谱并解读所得数据。通过可视化手段来呈现学科知识结构、规律和分布情况,展现该领域的全景信息,为CRC的进一步研究与治疗提供参考[3]。

1 方法

本文的数据来源均检索自WOS 核心数据库,以“(colorectal cancer) AND (microenvironment)”为主题进行检索,检索时间从2012- 01- 01至2022- 01- 07,并从中筛选类型为“article and review”的文献。共检索到目标文献3 827 篇,并统计每年发文量。将检索到的目标文献从WOS 核心数据库中以纯文本格式导出,导出文件命名为download-X。随后导入到CiteSpace V (5.8.R3)®软件中并将格式转换为软件可操作格式。参数设置:Time Slicing 为2012—2022年,Year Per Slice设置为2;术语设置:主题词来源和关键路径为系统默认值,节点类型分别选取国家、作者、机构、被引文献、关键词,并对关键词进行聚类和突变分析;设置阈值为系统默认值;最终运行 CiteSpace 软件生成图谱。运行 CiteSpace 软件后,主要观察指标为国家、作者、机构、被引文献和关键词等生成的图谱(图1)。

图1 基于CiteSpace的CRC肿瘤微环境研究脉络

2 结果

2.1 发文量分析

某领域在一定时期内的发文量可反映该领域的研究速度,也说明研究者对此领域的关注度。十年文献总计3 827篇,H-index 指数为130,每项平均被引次数29.6,被引频次总计113 295,去除自引103 522;施引文献76 570,去除自引73 993(图2),2012—2021年,发文量大体呈上升趋势(2022年时间过短,未算入),在 2018年,发文量首次超过400篇。

图2 WOS中CRC肿瘤微环境十年发文量

2.2 国家分析

对WOS数据库文献进行分析,以国家为节点,运行CiteSpace 软件,88个国家中发文量超过100篇的有10个国家(表1),发文频次前3位的国家是中国(1 054篇)、美国(905篇)、意大利(287篇)。经数据分析发现,国际社会关于CRC肿瘤微环境的交流十分密切,尤其是发文量较高的国家之间的合作更为广泛。

表1 WOS中CRC肿瘤微环境发文排名前十的国家

2.3 作者可视化分析

对所得数据库文献进行分析,以作者为节点,运行 CiteSpace 软件,有377位作者发表相关文献。发文量超过20篇的作者有3位。其中,来自美国哈佛医学院的SHUJI OGINO教授以发文量26篇高居首位,其聚焦于早发CRC危险因素,结合基因和肿瘤微环境以预防治疗早期CRC[4]。排名第二的是法国的免疫学家JEROME GALON,发文22篇,聚焦于CRC肿瘤分期,研究肿瘤微环境内肿瘤细胞和免疫细胞二者在各个阶段复杂动态的相互作用[5]。第三名是来自美国纽约的ANDREW T CHAN教授,发表相关文章21篇,从药物、肠道微生物、饮食、环境等宏观因素入手,分析CRC肿瘤微环境的影响因素[6]。

2.4 机构可视化分析

对WOS数据库文献进行分析,以机构为节点,运行CiteSpace软件,共计368所机构发表相关文献。发文量前5位分别是中山大学 (85篇 )、复旦大学 (70篇 )、上海交通大学(69篇)、哈佛医学院(67篇)、浙江大学(59篇),结果见表2。值得一提的是排名前五的机构,有四所是中国高校,这说明我国高校关于CRC肿瘤微环境研究投入巨大且是研究主力。

表2 WOS中CRC肿瘤微环境发文排名前十的机构

2.5 被引文献的被引分析

高频次被引文献代表该学科的热点,对WOS数据库文献进行分析,以被引文献为节点,运行CiteSpace软件,得到277个节点,274条连线。在被引文献中,综述类文献占比较大,有助于把握CRC肿瘤微环境的发展规律和趋势。如表3所示,被引频次第1位的文献面向临床免疫治疗,纳入41例CRC患者,对比CRC肿瘤微环境内错配修复缺失与错配修复完善两种情况,为错配修复缺失的CRC患者选择PD-1抗体治疗提供较高的参考依据[7];被引频次第2位的被引文献主要从流行病学角度阐述CRC是死亡率排名前三的肿瘤[8];被引频次第3位的被引文献通过分子分型比较、生物学特征分析、临床变量间关联和基因表达对CRC肿瘤进行分类,为CRC肿瘤靶向治疗提供参考[9];被引频次第4位的被引文献针对肠道菌群中的梭杆菌与CRC肿瘤微环境开展研究,并且发现梭杆菌招募肿瘤浸润免疫细胞, 产生了一个有利于CRC肿瘤进展的促炎微环境[10];被引频次第5位的被引文献针对CRC肿瘤微环境进行检测,对多个免疫检查点深入研究,将靶向抑制剂、肿瘤基因型与CRC肿瘤微环境紧密结合起来[11]。总结来看,频次较高的被引经典文献主要关注CRC肿瘤微环境对临床治疗疗效的影响,尤其是以免疫检查点和分子亚型为落脚点进行研究。

表3 WOS 中CRC肿瘤微环境引用频数排名前十的文献

2.6 关键词分析

2.6.1 关键词共现图谱 关键词是文章的核心,能清楚、敏捷地反映此领域的热点。关键词共现是基于文献内容,从文章中提取出关键词,并进行分析。对WOS数据库文献进行分析,以关键词为节点,运行 CiteSpace软件,得到659个关键词(图3),出现频数超过200的关键词,共计16个(表4)。除去检索主题词,出现频次较高的关键词分为 4类。一是细胞相关关键词:T细胞、干细胞;二是转移相关关键词:上皮间质转化;三是疾病走向相关关键词:生存、预后、进展;四是代谢相关关键词:生长因子、炎症因子。

图3 WOS数据库中CRC肿瘤微环境关键词关系图谱

表4 WOS中CRC肿瘤微环境频数排名超过200的关键词

2.6.2 关键词聚类分析 在关键词图谱的基础上,进一步聚类分析,即按照主题关联性将这些关键词分为若干聚类,不同聚类代表该领域不同侧重点,模块越大的聚类包含关键词越多。如图4所示,共14个关键词聚类结果:# 0癌症干细胞(cancer stem cells)、# 1炎症(inflammation)、# 2预后(prognosis)、# 3血管生成(angiogenesis)、# 4生存(survival)、# 5活性(activation)、# 6肿瘤微环境(tumor microenvironment)、# 7微卫星不稳定(microsatellite instability)、# 8转移(metastasis)、# 9免疫治疗(immunotherapy)、# 10结直肠癌(colorectal cancer)、# 11肿瘤相关成纤维细胞(cancer-associated fibroblasts)、# 12生长(growth)、# 13转移性结直肠癌(metastatic colorectal cancer)。

图4 WOS数据库中CRC肿瘤微环境关键词聚类图谱

2.6.3 关键词突变分析 从时间维度上展示知识演进,可直观地看出研究方向的更新。引用突变词是指含该关键词的文献在短时间内被大量引用,不但针对研究现状,而且反映后续的研究热点。2012—2015年的研究热点主要是:内皮生长因子、肿瘤生长、转移、体内、生长因子、调节性T细胞、基因表达、内皮细胞、卵巢癌(表5)。2016—2018年的热点词主要是:间质成纤维细胞、淋巴结转移、肿瘤发生。2018至今热点词主要是:PD-l抑制剂、共识分子亚型、错配修复缺失、免疫检查点抑制剂。

表5 WOS数据库中CRC肿瘤微环境突变排名前20的关键词

3 讨论

通过对近10年CRC肿瘤微环境可视化指标分析发现,从发文量来看,2014年后,年发文量保持约200篇,年发文量总体呈上升趋势,表明人们关于CRC肿瘤微环境的研究热度不减。从发文国家和发文作者来看,中国、美国、意大利等国家发文量较多,说明这些国家对CRC肿瘤微环境相关领域的研究投入很大且科研水平高速发展,另一方面我国发文量排在首位,提示我国综合科研实力强,并且我国学者正在逐渐追赶西方国家。从发文机构来看,CRC肿瘤微环境研究发文量在60篇以上机构有4家,形成了一定规模的核心研究机构群。

结合被引文献、关键词聚类结果以及关键词时间维度的演变,对相关主题词展开以下分析:共识分子亚型将CRC分为4个具有不同生物学特征的分子亚型,这可能构成临床分层,并成为分子亚型靶向干预的基础,共识分子亚型贯穿CRC肿瘤微环境的研究全景,因此更好地识别分子亚型对特异性治疗靶点和治疗反应都至关重要[12]。此外,微卫星(microsatellite,MS)不稳定的研究同样至关重要,微卫星是指细胞基因组中以少数几个核苷酸为单位串联重复的 DNA 序列。DNA 错配修复功能发生异常时,MS出现的复制错误未被纠正并持续累积,使得MS序列长度或碱基组成发生改变,称为微卫星不稳定性(microsatellite instability,MSI),且这一分子特征主要存在于CRC肿瘤、胃癌和子宫内膜癌等相关实体瘤中[13]。同时,MSI可以作为检测的筛查工具,作为患者预后的标志物,以及对化疗和免疫治疗反应的预测标志物[14]。值得一提的是,免疫系统和CRC肿瘤微环境更是密不可分,这体现在聚类分析结果中的免疫治疗和2019至今的突变关键词——免疫检查点抑制剂。不仅如此,程序性细胞死亡配体-1阻断性抗体用于治疗错配修复缺陷和MS高度不稳定性的转移性CRC患者取得巨大成功[15-16],而且近些年针对细胞毒性 T 细胞活化抗原-4和程序性死亡受体1阻断剂展开大量研究,这为发现其他共抑制受体提供了动力,抑制这些共抑制受体可用于提高当前免疫治疗的应答率[17]。虽然研究内容反复变更,但增敏免疫治疗仍是该领域未来研究的重点和难点。

除检索主题词为聚类模块外,癌症干细胞所占份额最大,为研究焦点。癌症干细胞对化疗或放疗不仅具有耐药性,而且具有自我更新和“改造”原始肿瘤的能力,与难治性癌症的恶性特征关系密切,对CRC的治疗是巨大的挑战[18]。研究表明,癌症干细胞肿瘤发生可能与Hedgehog(Hh)、Notch和Wnt/β-catenin信号通路调控有关,因此调节这些信号通路的治疗可能会为癌症治疗提供新的策略[19]。血管生成、肿瘤生长和转移是该领域另一关注点,血管过度生长,促血管生成因子的释放促进肿瘤生长和转移[20],这一过程受多种血管生成因子调节,如血管内皮生长因子、血栓形成蛋白-1、血小板衍生生长因子、转化生长因子、内皮细胞生长因子和成纤维细胞生长因子[21-27]。再者,检测CRC肿瘤中异常表达的细胞因子,探究其对CRC肿瘤的生长、转移和血管生成的意义,寻找治疗CRC肿瘤患者新的诊断标志物或靶点,是2012—2015年的研究热点,也是CRC肿瘤微环境另一重要研究方向。

本研究也存在一定的局限性,仅以WOS核心数据库的文献展开分析,难免存在少许偏倚。今后,我们将结合软件的发展,进一步细致分析CRC肿瘤微环境研究现状及未来发展趋势。

猜你喜欢

发文聚类数据库
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
数据库
数据库
数据库
数据库
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例