APP下载

基于CiteSpace的中医药治疗肺癌知识图谱可视化分析*

2020-04-06胡孔法

世界科学技术-中医药现代化 2020年10期
关键词:发文图谱聚类

王 松 ,杨 涛 ,胡孔法 **

(1. 南京中医药大学中医药文献研究所 南京 210023;2. 南京中医药大学人工智能与信息技术学院 南京 210023)

随着现代生活节奏的加快和环境的改变,恶性肿瘤的发病率逐年升高,已经成为全球致死率较高的疾病之一,严重威胁人类的健康。肺癌是我国最常见的恶性肿瘤之一,也是我国癌症中发病率与死亡率最高的疾病。2015 年死亡病例约63.1 万例,排名恶性肿瘤死亡例数之首,并且肺癌在男女性恶性肿瘤死亡原因中均占首位[1]。近年来,大量研究证实中医药在治疗肺癌方面已经取得显著成效,并且中医药治疗肺癌的文献数量也在飞速增长,通过传统的检索方式已经不能满足及时获取学科最新动态的需求,亟需一种新的具有客观性、科学性的方法来研究学科的最新进展。科学知识图谱是以知识为对象,以文献计量学、网络分析学、科学学等为理论基础,运用信息可视化技术等方法,从而揭示科学知识的发展进程与结构关系的一种知识图形与知识谱系[2]。CiteSpace 软件是由美国德雷塞尔大学陈超美教授开发,它是一款信息可视化分析软件,通过将时间划分为均匀的片段,然后在每个片段中形成共现网络,再将这些网络合并形成大的可视化网络,它将某一领域的结构、规律和分布情况通过可视化知识图谱的方式直观、形象地呈现出来,为深层次挖掘领域的研究热点及前沿信息提供参考[3,4]。因此本文基于文献计量学方法,应用CiteSpace软件对2009 年-2018 年的中医药治疗肺癌相关文献绘制知识图谱,对该领域的研究现状、研究热点及研究趋势进行系统梳理,以期为临床工作者及科研人员今后的研究提供参考。

图1 中医药治疗肺癌相关论文的时间分布图

1 资料与方法

1.1 数据来源

以“(中药OR针灸)and肺癌and治疗”为主题词在中国知网(CNKI)中文数据库进行检索,检索时间从2009 年 1 月 1 日-2018 年 12 月 31 日,检索时间为 2019年9月16日,获得1054篇文献,排除会议通知、新闻报道、广告等与主题无关的文献后,最终获得1050 篇文献。

1.2 研究方法

以CiteSpace3.9.R6 软件内置功能,将从中国知网上导出的Refworks 格式文献进行格式转化后导入CiteSpace3.9.R6。参数设置中时间跨度从2009 年至2018年,每1年为一个时间切片,当节点类型选取作者(Author)和机构(Institution),每个切片阈值Top N 设为50,图谱修剪方式选择pathfinder、pruning sliced networks 和 pruning the merged network;当节点类型选取关键词(Keyword)时,为使图谱达到最佳的聚类效果,时间切片设为2 年,每个切片阈值(c,cc,ccv)为(2,2,20)、(4,3,20)、(4,3,20),图谱修剪方式选择Minimum Spanning Tree,分别对纳入的1050 篇文献进行相关分析,绘制知识图谱,形成可视化分析。

图谱中节点分别代表作者、机构和关键词,节点的圆圈大小代表频次,圆圈直径越大代表该节点频次越高,圆圈宽度代表不同的年份相关内容出现的频次,节点间连线代表共现频次,线条越粗代表出现频次越高,关系越密切。

2 结果与分析

2.1 中医药治疗肺癌年发文量分析

对纳入的1050 篇文献按发表时间进行统计(图1),可知2009 年-2013 年中医药治疗肺癌相关文献量呈平稳上升趋势,平均每年发文量达到101篇;2013年以后文献数量虽然有所下降,但是发文量仍然较多,年均发文量达109 篇,根据中国知网目前发文情况对2019 年发文量预测为112 篇左右,推测2019 年整年发文量会有所回升,可见中医药治疗肺癌研究领域发文趋势较为稳定。

表1 中医药治疗肺癌研究高产作者列表

2.2 作者合作网络可视化分析

通过应用CiteSpace3.9.R6软件对中医药治疗肺癌研究文献作者合作网络进行共现分析,绘制出作者合作关系图谱(图2),其中节点数440 个,连线数226 条,网络密度0.0023,徐振晔发文量最高为12 篇,发文量≥5 篇的作者有20 人(表1),由其作者合作网络(图3)可以看出本研究领域没有形成广泛联系的作者合作网络,结构整体较为松散,而出现了多个团队,不同团队间合作比较微弱,但团队内合作紧密,如姜敏、胡凯文、刘传波和李泉旺之间以及李和根、徐蔚杰、周蕾、朱丽华之间等连线均较粗,合作次数较多。同时,图谱中散落的独立节点显示出一部分学者独立进行科学研究,还有一部分学者以两两合作的方式进行研究。此外,利用CiteSpace3.9.R6软件的Burst检测分析功能,发现徐振晔(突现强度3.4216)、冯正权(突现强度3.3056)(表2)等形成较高的突现强度,徐振晔在2010 年至2012 年发文量较高,在研究领域较为活跃,冯正权在2013年至2014年发文量突增,影响力较大。

2.3 机构合作可视化分析

科研机构在提升国家科研水平创新性方面具有至关重要的作用,通过对不同科研机构所发表论文进行分析,可以了解中医药治疗肺癌研究领域中研究力量的分布情况。首先对纳入的1050 篇文献所属机构中具有相同含义或高等院校中所属院系的情况进行归并,如“上海中医药大学附属龙华医院肿瘤科”规范为“上海中医药大学附属龙华医院”,“北京交通大学计算机与信息技术学院”规范为“北京交通大学”。

图2 中医药治疗肺癌的作者共现图

表2 中医药治疗肺癌研究的作者突现分析表

利用CiteSpace3.9.R6软件绘制中医药治疗肺癌研究相关文献的发文机构共现图谱(图4),节点数352个,连线数107 条,网络密度为0.0017,可以看出中医药治疗肺癌的研究机构主要是中医药大学及其附属医院,中医药治疗肺癌研究高产机构(表3)以上海中医药大学附属龙华医院为代表,发文32 篇,发文量最高,紧随其后的是中国中医科学院广安门医院、南京中医药大学、上海中医药大学、浙江中医药大学等。同时可知发文量不少于7 篇的机构之间合作较多(图5),核心研究机构如上海中医药大学附属龙华医院和中国中医科学院广安门医院辐射带动作用比较突出,与其他医疗机构以课题项目等合作形式进行紧密联系,形成围绕这些核心机构的学术共同体。

2.4 关键词可视化分析

2.4.1 关键词共现分析

图3 中医药治疗肺癌的作者共现图(发文量≥5篇)

关键词是对文献研究主题和核心内容的高度概括,基于关键词共现分析,可以了解某一领域不同研究热点分布及发展情况。该研究领域关键词存在具有相同或相近含义但表达方式不同的情况,如“肺癌”与“肺肿瘤”,对此进行统一规范,保证分析结果准确性。运行Citespace3.9.R6软件对中医药治疗肺癌研究的关键词进行分析(图6),共形成节点140 个,连线178 条,网络密度为0.0183,该研究领域发文量≥20 篇的关键词有20 个(表4),其中非小细胞肺癌出现频次最高为477 次,肺癌出现次数311 次,除此之外的高频关键词主要与中医药治疗相关,如“中药”“中医药疗法”“中医药治疗”等,中医药在治疗肺癌研究中注重患者的“生存质量”。

中介中心性是是衡量节点在网络中信息交流能力的重要指标[5]。通过对该研究领域关键词中介中心性(中心性≥0.1)的计算,得到17 个高中心性关键词(表5),代表目前中医药治疗肺癌研究领域中关注度高、影响力大的热点问题主要集中在采取中医药(或联合放、化疗等)治疗肺癌患者,并进行临床疗效观察,以及对患者生活质量的改善程度等方面。

2.4.2 关键词聚类分析

图4 中医药治疗肺癌的机构共现图

图5 中医药治疗肺癌的机构共现图(发文量≥7)

在关键词共现分析的基础上进行聚类,得到中医药治疗肺癌关键词聚类图谱(图7),形成8 个聚类,模块化Q值为0.6615(>0.3)表明聚类是有效的,平均轮廓值为0.5215(>0.5)表明聚类成员一致性较高,聚类结果是合理的。每一个色块代表一个聚类,色块内的节点都属于所在聚类范围,为进一步分析中医药治疗肺癌领域研究情况(表6)。聚类标签是以相关文献题名显示,聚类标签部分列举,但都代表与之相关的研究主题方向,各聚类的平均轮廓值均大于0.5,表明各类别研究主题比较集中[6]。

表3 中医药治疗肺癌研究高产机构列表

由关键词聚类图谱及列表可以看出,目前中医药治疗肺癌研究热点主要集中在以下方面:

图6 中医药治疗肺癌关键词共现图谱

表4 中医药治疗肺癌高频关键词列表(频次 ≥20)

表5 中医药治疗肺癌高频关键词列表(中心性 ≥0.1)

(1)中医药治疗肺癌临床疗效观察。

图7 中医药治疗肺癌关键词聚类图谱

表6 中医药治疗肺癌关键词聚类情况列表

目前中医药在恶性肿瘤综合治疗中发挥重要作用,其疗效也受到越来越多医生和患者的关注和认可。聚类#2和#6可以看出临床上多采用中药汤剂、中药注射液及中成药等治疗方式,如复方苦参注射液、扶正法、益气化痰法、化痰祛瘀法、益气养阴法等已成为中医药治疗肺癌的特色,临床应用广泛,治疗效果较好[7]。聚类#0主要是关于中医药治疗肺癌合并恶性胸腔积液并发症的研究,恶性胸腔积液是晚期肺癌常见并发症,应用中医药治疗此病已经累积多年经验,能够在保证患者生存质量的同时尽可能使胸水消退[8]。

(2)名老中医诊治肺癌的规律分析。

聚类#7 主要是关于对现代名老中医诊治肺癌的辨证用药经验的研究方向。名老中医是将中医药理论与临床诊疗结合的佼佼者,其在长期的治疗实践中形成自己独特的对疾病的认识以及用药特点,极具传承价值,对中医药实现发展创新也具有重要意义。通过复杂网络等数据挖掘方法从多个角度,多个层面对名老中医在辨证诊治肺癌的用药规律、临床经验和学术思想等方面进行总结和归纳,对指导临床诊疗具有重要意义,拓宽辨证思路,为中医传承和发展奠定基础。

(3)中医药治疗肺癌的生物学机制研究。

肺癌的发生、发展是受多基因调控的多因素、多步骤的复杂过程,它与细胞增殖和凋亡等都有不可分割的关系[9]。聚类#4和#5显示随着分子生物技术不断发展,肿瘤研究向细胞水平和分子水平不断深入。从聚类中可以看出,应用中药相关制剂对肺癌小鼠模型如对血管内皮生长因子(vegf)、蛋白酪氨酸磷酸酶(PTEN)、mdm2 基因、Fas/Fasl 蛋白等因素影响的研究,为临床应用提供客观依据[10,11]。

(4)中西医结合治疗肺癌研究。

聚类#1 和#3 显示目前临床上多采用中医药联合放疗、化疗或热疗等现代医学手段治疗肺癌,但药物在进行放疗、化疗、热疗杀伤肿瘤细胞的同时,也损伤了正常细胞,给患者带来严重的毒副作用,在此基础上发挥中医药治疗的优势,有助于恢复患者体质,减轻毒副反应,延缓疾病的发展,明显改善患者生存质量,延长患者的生存期[12]。中西医结合疗法不仅是治疗肺癌的有效手段,也成为该领域研究重点。

2.4.3 关键词突现分析

突现词是在特定时间段内通过关键词频次的变化将频次高的词探测出来,关键词突现分析在某种程度上可以反映领域内某研究方向的热度,即研究前沿或研究热点[13]。通过对中医药治疗肺癌研究领域内关键词突现分析(表7),可知2014 年开始中药注射剂相关研究,以及同年开始数据挖掘相关研究,并持续到2018 年;自2015 年开始对用药规律进行研究,并持续至今,可见该研究方向已逐渐成为主流,研究内容也在逐渐具体深入,有望持续作为研究热点,引领中医药治疗肺癌领域进展。

表7 中医药治疗肺癌研究的关键词突现分析表

3 讨论

本文以2009-2018 年CNKI 收录的有关中医药治疗肺癌的1050 篇文献为研究对象,借助CiteSpace3.9.R6软件对文献的作者、机构、关键词进行可视化分析,绘制相应知识图谱,揭示近10年中医药治疗肺癌研究的研究力量与发展动态。

通过对中医药治疗肺癌相关文献发文量分析得出,年发文量在2013 年和2017 年经历了两个高峰,文献量在100 篇的基数上下波动,可见近10 年发文量较为平稳,整体处于相对稳定的状态。由文献作者和机构相关图谱中可以看出,发文量最高的是上海中医药大学附属龙华医院的徐振晔,其次为同单位的李和根,并且姜敏、胡凯文、刘传波、李泉旺之间与李和根、徐蔚杰、周蕾、朱丽华之间等内部合作比较频繁,形成多个高产团队,但不同团队之间合作还不够密切,地域也相对分散。中医药大学及其附属医院是研究中医药治疗肺癌的主要力量,以上海中医药大学附属龙华医院和中国中医科学院广安门医院为代表,高产机构之间合作较为密切,不仅有同地区机构之间的合作,也存在跨地域之间合作。

关键词共现和聚类图谱反映中医药治疗肺癌的热点及前沿趋势。从高频关键词可见,中医药治疗肺癌的相关研究中主要是非小细胞肺癌和胸腔积液,非小细胞肺癌作为一种典型的老年型疾病,有50%的患者在确诊时年龄已超过65 岁,有30%-40%的患者确诊时年龄已超过70岁,80岁以上的患者患病率也达到10%[14]。目前临床上对非小细胞肺癌的治疗方案多采用放疗和化疗,但大多数非小细胞肺癌患者在确诊时身体素质较差,已经无法耐受放疗与化疗,极大可能引发多种并发症,毒副反应也较为强烈,而胸腔积液是肺癌的常见并发症。中医药治疗肺癌研究着重中医药疗法和中西医结合疗法,中医药治疗是以辨证论治为基础,重视临床疗效,因其整体性和无毒性的特有优势,不仅可以为西医治疗减毒增效,并且在改善患者临床症状、提高生存质量和延长生存期方面取得较满意的效果。在临床治疗的过程中保证患者生存质量是领域内亟需解决的重要问题并已经引起学者们的高度重视。

从关键词的聚类图谱和明细表中看出目前中医药治疗肺癌领域研究方向主要包括以下方面:①中医药治疗肺癌的临床疗效观察。②名老中医诊治肺癌的规律分析。③中医药治疗肺癌的生物学机制研究。④中西医结合治疗肺癌研究。由此可见中医药治疗肺癌涉及其治法、临床表现、临床疗效、经验传承等中医药研究各个方面。

中医药治疗肺癌也注重与现代医学的发病机理相融合,采用中医药与现代医学手段联合治疗肺癌并且已经成为该领域的研究重点,在中西医结合的基础上,更好地发挥中医的特色,充分发挥中西医结合优势,改善临床症状,提高患者生存质量,延长生存期。从关键词突现情况可以发现“数据挖掘”和“用药规律”在近几年持续作为突现词,说明它们一直是中医药治疗肺癌的研究热点。其中数据挖掘在于能够发现数据之间的隐含规律,是中医药领域研究的重要手段之一,也为中医药研究提供技术支持,并且通过数据挖掘方法能够精准地对治疗肺癌患者的辨证思路和处方用药规律进行分析,也能够为今后临床上治疗肺癌方药的选择提供理论基础,为中药实现创新奠定基础,这有望持续作为研究热点,对临床研究进行指导[15]。

经上述综合分析可知,目前中医药治疗肺癌领域正处于蓬勃发展时期,针对中医药治疗肺癌研究现状,笔者提出以下建议:①建议各学者之间多多进行沟通交流,不同团队之间相互学习。②建议不同研究机构间加强合作,共同探讨,彼此分享优秀经验,促进跨地区交流。③研究学者应更加注重辨证论治,以患者生存质量为基本考量,充分发挥中西医结合的优势,注重临床疗效观察,加强临床方药的灵活运用,更好地为患者提供服务。

猜你喜欢

发文图谱聚类
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究