子宫内膜癌预后研究的文献计量学分析
2021-02-04王钟锐胡跃梅叶晓影庄金满黄玉秀何斐
王钟锐,胡跃梅,叶晓影,庄金满,黄玉秀,何斐
(福建医科大学 1.公共卫生学院预防医学系,福州 350122;2.公共卫生学院流行病与卫生统计学系,福州 350122;3.附属第一医院妇产科,福州 350001)
子宫内膜癌(endometrial carcinoma,EC)是女性生殖系统常见的肿瘤之一,全球年龄标准化发生率和死亡率分别为8.4%和1.8%[1]。尽管EC的诊疗技术迅速发展,但仍有5%~15%的EC患者存在复发风险[2],病死率较高,生存率较差,在发展中国家EC患者的病死率约为34%,5年生存率为67%[3]。现有研究[4-7]证实EC预后与肌层浸润深度、腹膜细胞学阳性、国际妇产科联盟标准分期(International Federation of Gynecology and Obstetrics,FIGO)、病理分级、癌抗原125(cancer antigen 125,CA125)、雌孕激素受体、原癌基因HER-2、肿瘤增殖抗原Ki-67、p53基因异常表达等因素相关。
CiteSpace由美国德雷赛尔大学的陈超美教授研发,用于分析前沿领域及其知识基础,识别科学文献发展趋势[8]。目前尚无使用CiteSpace对EC预后进行文献计量学分析的研究。因此,本文运用CiteSpace软件对国内外EC预后的文献进行定量考察和可视化分析,分析对比国内外研究进程和研究热点,以期为EC的预后研究提供参考。
1 材料与方法
1.1 文献检索与数据来源
本研究的数据来源于Web of Science(WOS)数据库核心集和中国知网(China National Knowledge Infrastructure,CNKI)数据库。基于WOS数据库核心集的检索策略如下:TS=((“endometrial carcinoma”OR“endometrial cancer$” OR “carcinoma of endometrium”OR “endometrial neoplasm$” OR “endometrial adenocarcinoma” OR “endometrium cancer” OR“endometrium carcinoma” OR “adenocarcinoma of endometrium”)NEAR(prognosis OR Prognostic OR outcome$))。基于CNKI数据库的检索策略如下:主题字段搜索“子宫内膜癌”、“预后”,文献语言为中文。检索完成后按如下标准纳入:(1)文献类型为article;(2)研究主题和EC预后相关;(3)文献发表时间为建库至2020年2月13日。WOS数据库和CNKI数据库分别获取有效文献1 409篇和579篇。
1.2 统计学分析
本研究使用CiteSpace5.5.R2分别对国家、机构、作者、文献及关键词的数据进行分析。CiteSpace软件设置:时间限定为1958年至2020年,时间切片设置为1年,取前10%的分析数据成图,其余参数均为默认值。在关键词时间线分析中,使用python 3.7.0分离WOS数据库中来源于中国的文献,分别对WOS数据库中的国际文献及WOS中的国内文献/CNKI的文献绘制时区图。为方便读图,此处将时间范围限制在1990年至2020年,并将CNKI的中文关键词人工翻译为英文。
2 结果
2.1 年发文量与国家合作网络分析
1958年至1978年EC预后研究未受重视,全球少有发文,年发文量自1987年开始缓慢增长,在2009年后开始出现大幅度增长,说明近年来EC的预后受到越来越多科研工作者的关注,预后研究逐年增多。CNKI年发文量与WOS数据库呈现的趋势大体一致,说明我国科研方向紧跟国际前沿,并为前沿研究贡献力量。1958年至2020年WOS和CNKI数据库论文发表的数量和趋势见图1。中、日、美为研究的核心国家,发文量分别是美国321篇、日本204篇、中国194篇,见图2。
2.2 发文机构合作网络分析
WOS中EC预后研究的科研机构主要以高校为主。在国内从事EC预后研究的机构相对集中,上海交通大学、哈尔滨医科大学等高校(及其附属医院)发文总量较大,同时国内研究机构极少与国外机构合作。国际上,卑尔根大学和霍基兰大学医院发文量较高,且与其他机构建立了密集的合作网络,可能在本领域的研究中占据相对核心的位置。见图3、表1。
图1 1958年至2020年EC预后发文数量分布情况Fig.1 Bibliographic records related to EC prognosis in the CNKI and WOS core collection,published from 1958 to 2020
图2 WOS中EC预后国家合作网络图Fig.2 Map of the country co-authorship network of EC prognosis related articles based on the WOS database
CNKI数据库的机构合作图谱提示,国内EC预后研究的主要力量是各大高校的附属医院,且倾向于独立完成研究,较少开展科研合作,尚未形成有规模的合作网络。见表1。
图3 WOS中EC预后机构合作图谱Fig.3 Map of the institute co-authorship network of EC prognosis related articles based on the WOS database
表1 在WOS和CNKI中发文前五的机构作者Tab.1 Institutes producing the highest number of EC prognosis related articles based on the CNKI and WOS databases
2.3 作者合作关系分析
WOS数据库作者合作网络呈现出部分集中、整体分散的现象(图4)。发文超过10篇的4位高产作者领导了图中的核心科研网络,且近年均相对活跃,分别是Jone TROVIK(Haukeland University Hospital,n=13)、David E COHN(The Ohio State University,n=13)、Helga B SALVESEN(University of Bergen,n=12)、Camilla KRAKSTAD(University of Bergen,n=12)。除核心网络外,其他网络少有连接且相对独立,可能多以小组为单位进行。
CNKI分析结果与WOS相似,即科研研究多以小组的方式进行,缺乏组间合作。主要有2个高产作者领导的核心科研团队:第一是由魏丽慧、王建六领导,但近几年相对沉寂;其次是薛凤霞领导的团队,该团队近年来仍有成员在进行EC预后的研究。发文量居前五位的作者有魏丽惠(北京大学人民医院,n=14)、王建六(北京大学人民医院,n=11)、彭芝兰(四川大学华西第二医院,n=7)、李美艳(邯郸市中心医院,n=6)和薛凤霞(天津医科大学总医院妇科,n=6)。
图4 WOS中子宫内膜癌预后作者合作图谱Fig.4 Map of the author co-authorship network of EC prognosis related articles based on the WOS database
2.4 文献共被引分析
通过对Web of Science数据库共被引文献进行聚类分析并以时间线排布,可以清晰了解EC预后研究知识基础的演变过程[8]。共得到16个主要聚类,目前仍在活跃的聚类有:#1,淋巴结切除术(lymphadenectomy);#3,分子生物标志物(molecular biomarker);#4,L1-细胞黏附分子(L1 cell adhesion molecule,L1cam);#6,长链非编码RNA(long non-coding RNA,lncRNA)等,其中L1cam聚类近期发文量迅速增长,高引用量的文章中有2篇包含在该聚类中,可能是目前的前沿研究领域。文献共被引时间轴图见图5,参考文献被引次数最多的10篇文献见表2。
2.5 国内外研究关键词时间线及突现关键词
表2 EC预后参考文献中被引次数最多的10篇文献Tab.2 Top 10 most cited documents in EC prognosis related articles
随着时间的发展,EC预后研究的关键词也不断变化,由国外EC研究关键词时区图可以看出(图6),早期的EC研究领域集中于表达(expression)、诊断(prognosis)和生存(survival)等,随后从这些领域中衍生出了大量的细分研究,近期研究较多的关键词是淋巴结转移(lymph node metastasis);2010年至2019年共检测到19个突现关键词(图7),突现词的生命周期普遍不长,说明研究热点的换代速度极快,国外至今仍在进行的研究热点有诊断(diagnosis)、扩散(proliferation)和子宫切除术(hysterectomy)。
图6 国外EC研究关键词时区图Fig.6 Time zone view of the keywords co-citation network of EC prognosis related articles based on the WOS database
图7 2010年至2020年国外EC突现关键词Fig.7 Top 19 keywords with the strongest citation burst on the WOS database
国内研究关键词时区图显示(图8),国内研究主题较为集中,每一阶段都有相对主导的研究关键词,近期研究较多的关键词有长链非编码RNA、通路(pathway)、扩散(proliferation)、和临床病理特征(clinicopathological feature)。国内研究关键词突现见图9,2010年至2019年共检测到14个突现关键词,国内仍在进行的研究热点有通路(pathway)、细胞凋亡(apoptosis)和扩散(proliferation)。
图8 国内EC研究关键词时区图Fig.8 Time zone view of the keywords co-citation network of EC prognosis related articles based on the WOS database
图9 2010年至2020年国内EC突现关键词Fig.9 Top 14 keywords with the strongest citation burst on the CNKI database
3 讨论
全球EC预后研究共经历了1987年和2009年2个明显增长点。研究的国家以中美日3国为主,国际合作方面以卑尔根大学和霍基兰大学医院为首构建了密集合作网络;国内以上海交通大学和哈尔滨医科大学的研究团队为主,研究起步较晚但发展较快。欧美科研人员及机构注重各团队间的合作,在科研发展中更具优势;国内的机构和科研人员倾向国内科研合作或独立进行研究,较少开展国际间的科研合作和交流,尤其是各大院校的附属医院主要依托自身的临床资源,独立开展科研工作,较少与其他机构合作,可能存在“数据孤岛”乃至“科研孤岛”的现象。
EC预后的研究领域较为分散,主要集中在2个主要的研究方向:(1)基于临床治疗的预后研究(循证医学)。这方面的研究从早期的基于FIGO分级,到腹膜细胞学检查,再发展到近期子宫腺肌症的相关性研究,这一方向相对发展缓慢。腹膜细胞学阳性与EC预后不良显著相关,阳性患者相对于阴性患者5年复发率较高(46.9% vs 18.4%)[9]。子宫腺肌症合并EC往往预后较好,在Kaplan-Meier分析中,5年总生存率为100%[10]。(2)基于生物标记物和基因的EC预后研究。从1984年发现p53基因有抑癌活性之后,这一领域研究迅速发展,研究主要涉及p53基因/p53蛋白、环氧化酶2(cyclooxygenase-2,COX-2)、CA125、lncRNA、胸苷磷酸化酶、E-脂肪结合蛋白(E-fatty acid-binding protein,e-fabp)、葡萄糖调节蛋白78(glucose-regulated protein 78)、L1cam等8个聚类,这些都是EC病程发展的主要标记物,如COX-2和分化程度、肌层浸润有关[11]。CA125高含量和L1cam的高表达都预示着更高的淋巴结转移可能性[12-13],导致EC预后差。lncRNA AFAP1-AS1的高表达也预示更低的生存率[14]。
本研究首次分析了国内外EC预后研究的差异情况,结果显示,国内外主要的研究关键词基本一致,但总体的研究热点存在差异,且存在一定的时间差。国外EC预后的研究自1990年开始兴起,相较于国内领先1年。在主要的研究节点上,国内研究晚于国外,如p53基因/p53蛋白的研究反应在图中的时间差是8年,免疫组化的应用时间比国外晚5年,针对肿瘤扩散的研究比国外晚1年。且目前国内细分研究仍然较少。
本研究首次从EC预后的年发文量、国家、机构、期刊、作者、参考文献等方面分析了EC预后的研究前沿及其知识基础的变化过程,并实现了严格的国内外关键词研究时间线对照和WOS与CNKI的混合分析。本研究仍然存在一定局限性:(1)在清理无关文献时未排除存在人工误差的可能性;(2)部分数据库(如 PubMed、Scopus、维普、万方等)未进行分析;(3)文献计量分析是使用网络学的指标进行分析,结果与实际研究情况可能存在微小差异。
综上所述,美日等国家在EC的研究上仍然处于领先地位,但中国与国际先进水平的差距逐渐缩小。在分子和基因水平方面,EC及其预后的研究仍然有较广阔的前景。