聚类、共现视角下主流知识演化路径探究
2021-09-24张晴
摘要:目的 理清我国医学影像领域的知识演化脉络,探寻作者、机构之间的合作网络,寻求研究主题的演化路径。方法 以中国知识资源总库(CNKI)为数据源,检索建库至2020年收录的关于国内医学影像领域的相关文献,利用聚类、共现分析法,采用CiteSpace 5.7.R2绘制该领域作者、机构的合作图谱,通过SciMat探寻该领域的热点主题和主流知识演化路径。结果 共纳入1002篇医学影像相关文献,发文时间1986-2020年。总发文量与作者总人次变化趋势基本同步,1986-2000年,总发文量和作者总人次缓慢低速增长;2001-2012年,二者呈波浪式上升趋势;2013-2020年,二者呈直线上升。国内作者、机构之间多局限于短期、程度较浅、相同地区之间的合作,研究主题内容变化明显,演化关系复杂,在4个方向呈现6条演化路径:医学影像的应用;医学影像诊断和成像技术;医学影像的数据挖掘和信息技术;医学影像的处理。结论 随着我国医学影像领域研究的进一步深化,未来该领域的合作有望突破区域限制,呈现高质量的发展态势。
关键词:医学影像;聚类分析;共现分析;SciMat;CiteSpace
中图分类号:R445 文献标识码:A 文章编号:2095-5707(2021)05-0019-07
DOI: 10.3969/j.issn.2095-5707.2021.05.004 开放科学(资源服务)标识码(OSID):
Research on the Evolution Path of Mainstream Knowledge from the Perspective of Clustering and Co-occurrence - Taking the Field of Medical Imaging as an Example
ZHANG Qing
(School of Health Economics and Management, Nanjing University of Chinese Medicine, Nanjing 210023, China)
Abstract: Objective To clarify the evolution of knowledge in the field of medical imaging in China; To explore the cooperation network between authors and institutions; To seek the evolution path of research topics. Methods Taking CNKI as the data source, the relevant literature in the field of medical imaging in China collected from the establishment of the database to 2020 was retrieved. The research methods of clustering and co-occurrence analysis were used to draw the cooperation map of authors and institutions in the field with the help of CiteSpace 5.7.R2, and the hot topics and the evolution path of mainstream knowledge in the field were explored with the help of Scimat. Results A total of 1002 medical imaging related articles were included, and the publication time was 1986–2020. The total number of publications and the total number of authors were basically synchronized. From 1986 to 2000, the total number of publications and the total number of authors increased slowly at a low rate; from 2001 to 2012, the two showed a wave-like upward trend; from 2013 to
基金項目:江苏省一流本科专业(信息管理与信息系统)建设成果;大学生创新创业训练计划校级项目(202010315XJ030)
第一作者:张晴,E-mail: 3532609535@qq.com
2020, the two were rising linearly. Domestic authors and institutions were mostly limited to short-term, relatively shallow, and co-regional cooperation. The content of research topics changed significantly, and the evolutionary relationship was complicated. There were 6 evolution paths in 4 directions: the application of medical image, medical imaging diagnosis and imaging techniques, data mining and information technology for medical images, and medical image processing. Conclusion With the further deepening of research in the field of medical imaging in China, the cooperation in this field is expected to break through regional restrictions and show a trend of high-quality development in the future.
Key words: medical imaging; cluster analysis; co-occurrence analysis; SciMat; CiteSpace
医学影像学是现代医学实验基础上的循证医学,影像是现代医学最重要的诊断依据,众多医疗数据多来源于医疗影像[1]。在大数据时代背景下,医疗影像诊断的方式也更加智能化[2]。现阶段医学影像学科发展势头正猛,相关的研究文献和研究者较前期显著增加,该领域的研究热点和研究内容随着时间的推移不断变化,科学、有效地识别医学影像领域的热点内容和前沿性主题有助于研究者准确把握该领域的发展动态,从而高效地从事科研活动。与此同时,探查医学影像领域作者与机构之间的合作关系及其研究的关注点,有助于从全局洞察该领域的研究现状,为后期研究提供参考。基于此,笔者采用可视化分析软件CiteSpace和SciMat,以该领域的科研论文为研究对象,对作者、机构、关键词等进行分析,探寻合作网络及主题演化路径,理清医学影像学的发展脉络,为该领域今后的发展探明方向。
1 资料与方法
1.1 数据来源与检索策略
以中国知识资源总库(CNKI)为数据来源,采用主题检索的方式,限制主题词为“医学影像”,检索建库至2020年的全部数据,检索时间2021年3月14日。
1.2 纳入与排除标准
纳入标准:⑴研究型文献,如期刊上发表的论文、学位论文、会议论文等;⑵外文文献中国内作者、机构发表的论文;⑶作者、机构、关键词等信息齐全的文献。
排除标准:⑴资讯类文献,如消息、简介、声明等;⑵外文文献中非国内作者、机构发表的论文;⑶缺少作者、机构、关键词等信息的文献。⑷报纸类、标准类、研究成果类文献。
1.3 研究方法
利用Excel2016统计年度发文量,分析发文量与作者人次的关系;利用CiteSpace 5.7.R2的共现分析方法,分析作者、机构间的合作关系,揭示作者合作群与机构合作群;利用SciMat v1.1.04提供的关键词聚类分析和共现分析,获得该领域的热点主题,并按聚类主题之间的语义关系展开主题词流向分析,实现研究主题的演化状态分析与演化路径分析。
1.4 参数配置
1.4.1 CiteSpace参数配置 Time Slicing选择1986-2020(起始时间根据纳入的文献中最早发文时间设置),Years Per Slice选择1,Term Source选择标题、摘要、作者、关键词及增补关键词;Node Types按照分析的顺序依次选取作者和机构;Links Strength选取Cosine算法,Scope选择Within Slices;Selection Criteria模块选取g-index并设置k值为25;Pruning模块选择Pathfinder和Pruning sliced networks。
1.4.2 SciMat参数配置 分析单元选择作者、关键词和增补关键詞,数据精简阈值为2、3、3,矩阵类型为共现矩阵,网络精简阈值为1、1、1,选取余弦指数为标准化网络的相似度指标,选取简单中心算法作为聚类算法,选择全部文献量作为分析主体,选取Jaccards index作为演化图和重叠图的相似度指标。
2 结果
经人工去重并按纳入排除标准筛选后,获得1002篇医学影像相关文献,其中,中文文献981篇,外文文献21篇。发文时间1986-2020年。
2.1 发文时间分析
合理的时间区间划分是绘制主题演化图的必要步骤[3],采用固定时间窗口法[4]统计年度发文量及作者人次(见图1),以避免数据平滑性,并将研究区间划分为1986-2000、2001-2012、2013-2020。
1986-2000年,总发文量95篇,作者总人次170,处于缓慢发展期;2001-2012年,总发文量432篇,作者总人次855,总发文量和作者人次呈波浪同步上升趋势,研究成果显著,国内学者研究开始活跃;2013-2020年,总发文量475篇,和上一时期基本持平,但作者总人次达1042,呈直线上升趋势,国内学者研究更加活跃,但相应的成果并不显著,发展处于平缓期。
整体而言,国内学术界对于医学影像领域的研究呈现缓慢波浪上升的发展趋势,总发文量与作者总人次变化趋势基本同步。3个时期的发文量和作者人次区分度明显:早期,总发文量和作者总人次缓慢低速增长;中期,两者呈波浪式上升趋势;后期,两者直线上升。
2.2 作者合作网络分析
通过CiteSpace 5.7.R2绘制医学影像领域的作者合作图谱,见图2。节点代表作者,节点大小代表作者的发文频次,节点之间的连线代表合作关系,图中共有582个节点,298条连线,网络密度为0.001 8。
该图共显现较为明显的6个合作团队,分别是以刘小艳、刘文亚、陈凝、宋宏伟、王骏、冯楠、吴虹桥、陈君坤等组成的团队,合作区间为1986-2020年,主要关注医学影像后处理技术、弥散加权成像、ROC曲线[5]等;以张志常、徐东雨、娄岩、刘尚辉等组成的团队,合作区间为1986-2014年,主张将大数据融入医学应用中,关注计算机与医学影像的应用;王世威、韩浙和许茂盛在2015年关注医学影像共享平台的搭建、影像系统、患者主索引、存储池;张雪林和田军章在2006年共同探讨数据挖掘对于医学影像诊断报告质量和效率的作用;李永毅和吕晓琪于2011年共同探讨多平面重建、图像显示、挂片协议等;曲哲和林国庆于2004年共同探讨数据挖掘技术在医学影像领域的应用。医学影像领域虽形成一定的合作网络,但合作多属同机构短期合作,合作力度和密度均较小。筛选排名前10位的高发文作者与高中心性作者,见表1。
东部战区总医院(原南京军区南京总医院)王骏发文频次、中心性均位列第一,其主要关注医学影像后处理技术、医学影像技术质量控制与安全保证、X射线摄影、弥散加权成像等,2010年开始涉足分子影像学,与南通大学附属医院刘小艳之间的合作较多且合作力度较大,二者的引文计数和中心性均较高,提示二者在该领域影响力较大,信息传递能力较强。
2.3 研究机构合作网络分析
通过CiteSpace 5.7.R2绘制医学影像领域的研究机构合作图谱,见图3。
图中共有516个节点,187条连线,网络密度为0.001 4。各研究机构间存在合作,其中有6个较为明显的合作机构。
以南京军区南京总医院、南京铁道医学院、南通大学附属医院、常州市妇幼保健院、南通大学为主形成的合作网络,聚焦于江苏省,融合高校、医院,成为江苏省内部合作成熟度较高的组织。
以中国医科大学附属第一医院、北京协和醫院、吉林油田总医院、吉林医药学院附属医院、吉林市妇产医院、卫生部中日友好医院、北京大学人民医院为核心形成的合作网络围绕医院展开,内部结构相对复杂,但合作力度相对较浅。
以重庆医科大学、重庆大学、空军医学高等专科学校、总装备部重庆军事代表局为核心形成的合作网络围绕高校展开,该合作网络中重庆医科大学与重庆大学和总装备部重庆军事代表局合作力度较大,与空军医学高等专科学校合作力度较小。
以中国药科大学、中国药学会、北京航空航天大学、胜利石油管理局中心医院为核心的合作网络呈现“科研机构+医院”的形式,该合作网络属于跨省合作,结构简单,内部各机构合作力度较小。
以中国科学院为中心,包括南方医科大学、北京大学、上海大学、清华大学、南京航空航天大学、上海交通大学、华侨大学、南方医科大学第三附属医院、上海联影智能医疗科技有限公司、广州军区广州总医院、佛山原子医疗设备有限公司、广州米图信息科技有限公司、广东食品药品职业学院、中国核工业北京401医院、成像技术高精尖创新中心、中国工程院的合作机构。该合作网络涉及范围较广,呈“高校+高校附属医院+科研机构+公司”的形式,内部结构复杂,合作相对宽泛,学科发展成熟度较高。
整体而言,医学影像领域的合作多聚焦于高校及科研机构,合作网络中涉及的医院大多属于各高校的附属医院;以中国科学院、北京大学、上海交通大学、南方医科大学、南京航空航天大学为核心的合作网络合作范围广泛、力度较大,其余机构相较之成熟度略低。
2.4 研究主题聚类演化状态分析
利用SciMat v1.1.04绘制医学影像领域各时期的研究主题聚类图,见图4。圆圈代表聚类主题,圆圈大小代表该聚类主题在该时期的相关文献量,越大表明该聚类主题在该时期受关注度越高,研究热度越大。横轴代表中心度,纵轴代表密度,中心度越大,聚类主题的中心地位越明显;密度值越大,聚类主题发展越成熟。左上象限代表发展较好、但较为孤立的主题;左下象限代表新兴或衰退的主题;右上象限代表引擎类主题;右下象限代表重要的、未得到充分发展的主题[6]。
⑴1986-2000年共聚为5个研究主题,分别是右上象限的诊疗显像、医学影像数据库、医学图像处理和左下象限的CT、核医学影像。
诊疗显像、医学影像数据库、医学图像处理是该时期发展较好且较为重要的研究主题。诊疗显像包含关键词磁共振、神经内科;医学图像处理包含关键词医学影像检查技术、数字化医学影像、数据挖掘、医学应用;医学影像数据库包含关键词医学影像信息系统、医院信息化、影像工作站。
核医学影像[7]和CT属于该时期开发不足、边际联系较弱的新兴主题。核医学影像包含关键词影像引导手术(IGS)、脑血管疾病;CT包含关键词超声、计算机图像数字化。二者内部结构较为松散,关键词较少且联系较弱。
⑵2001-2012年共聚为8个研究主题,分别是右上象限的磁共振、医学应用、存储技术、医学图像处理,左下象限的虚拟仿真、现代医学,坐标轴上的小波变换、优化图像质量。
医学图像处理包含关键词数字影像、体绘制、模型、特征提取、算法、平板探测器[8]、面绘制、动态范围、增强扫描、诊疗显像、医学图像的三维重建;磁共振包含关键词成像技术、核医学影像、CT、医学影像诊断、计算机X线摄影、体层摄影术、分子医学影像、影像技术学、诊疗显像;医学应用包含关键词X射线、神经网络、发射型计算机、专家系统、教学、单光子、医疗影像设备;存储技术包含关键词信息技术、医学影像信息系统、数字影像、临床、关键技术、数据挖掘。以上4个皆为引擎类主题,医学图像处理由上一时期继承发展而来,发文量明显上升,受关注度有所提升;磁共振的中心度最大,为该时期影响力最大的研究主题,也是研究的中心性主题;医学应用和存储技术主题内部结构紧凑,各关键词间联系紧密,有持续发展的潜力。
现代医学和虚拟仿真属于该时期新兴主题,与其他主题联系较弱,未来极易萎缩。现代医学包含关键词影像、影像学技术;虚拟仿真包含关键词可视化、基因疗法。二者内部结构松散,关键词数量较少,在该时期的发展处于萌芽期。
优化图像质量包含关键词DR(数字化X线摄影)、医疗人工智能;小波变换包含关键词图像配准、医学影像融合技术、图像压缩技术。二者结构松散,内部关键词较少,未来易被其他主题词吸收,逐渐成为左下象限的萎缩主题。
⑶2013-2020年共聚为7个研究主题,分别是左上象限的医学影像融合技术、信息技术,左下象限的教学,右上象限的成像技术、数据挖掘,右下象限的医学影像诊断、医学图像处理。
医学影像融合技术和信息技术在该时期发展较为稳定,已成为该领域的专业性研究主题。医学影像融合技术包含关键词放射治疗、模型、3D医学影像;信息技术包含关键词医疗、计算机图像数字化、医学影像共享。
教学属于该时期新兴的研究主题,包含关键词虚拟仿真、医学影像信息系统、临床、教育。
成像技术和数据挖掘属于该时期影响力较大并呈现持续发展的中心主题。成像技术包含关键词磁共振、核医学影像、CT、数字化医学影像、超声、生物医学影像、分子医学影像、医疗影像设备、诊疗显像、医学图像的三维重建;数据挖掘包含关键词医疗人工智能、影像组学、机器学习、存储技术、算法、医学影像数据库、医学应用、计算技术。
医学影像诊断和医学图像处理属于该时期基础性、还没有发展起来的主题。医学影像诊断包含关键词肺结节、疾病检出率、合理选择、现代医学影像技术、乳腺癌、规范化;医学图像处理包含关键词医学影像分割、医学影像技术专业、辅助诊疗、现代医学、建设、影像技术学、医院信息化。二者内部关键词较多且联系较紧密,整体结构完整,未来具有较大的发展潜力和能力。
2.5 研究主题演化路径分析
利用SciMat v1.1.04绘制医学影像领域各时期的研究主题演化路径图(见图5),圆圈代表关键词聚类而成的研究主题,圆圈大小代表与研究主题相关的文献量,直线、虚线分别代表主流、支流的演化方向,线条粗细和颜色深浅与两端聚类主题的相关性成正比。
根据图5可知,随着时间推移,医学影像领域的研究主题数量不断增加,内容不断丰富,发文量逐渐递增且新的主题不断出现。1986-2000年,研究人员主要关注基础性研究主题,相关文献量较少,主题受关注度较低且与下一时期的联系不紧密;2001-2012年,随着科学技术的进步和社会医疗需求的提升,大量新生主题不断涌现,主题受关注度也有所提高,与下一时期的主题联系比较紧密;2013-2020年,由早期演化发展而来的基础性主题逐渐演化成稳定的专业主题,新的研究主题出现并成为中心性主题,受关注度较高。总体而言,医学影像研究领域的发展并不成熟,目前正处于发展阶段,本文研究的3个时期的主题变化较大,后期各聚类主题之间的演化关系較为复杂,从1986年至今,在4个方向上呈现出6条演化路径。
2.5.1 医学影像的应用 医学图像处理、诊疗显像、CT—>医学应用、虚拟仿真—>教学
该条演化路径由早期的医学图像处理的主流方向和诊疗显像的支流方向发展而来,主要关注临床应用、应用与发展;计算机辅助教学、实验教学、实习教学、混合式教学、教学探讨、教学质量、教学方法、教学改革、教学研究;虚拟解剖、肝脏虚拟手术、虚拟仪器技术、虚拟膀胱镜、虚拟手术刀、虚拟现实技术。
2.5.2 医学影像诊断和成像技术 ⑴诊疗显像、核医学影像、CT—>磁共振—>成像技术;⑵诊疗显像、核医学影像、CT—>磁共振—>医学影像诊断
这2条演化路径由早期的诊疗显像、核医学影像、CT研究主题的主流方向演化而来,主要关注放射性核素显像、核素心肌显像、正电子发射断层显像术;核医学、核医学影像组学、心脏核医学、核医学显像;CT/MRI图像配合标准技术、CT成像、多层螺旋CT;MRI图像处理、磁共振成像、多参数核磁共振成像、磁共振弹性成像、心脏磁共振、功能磁共振成像;非电离成像、4D医学成像、多模态成像、光声成像、荧光成像、生物医学成像;计算机辅助诊断、辅助诊断模型、诊断显像。
2.5.3 医学影像的数据挖掘和信息技术 ⑴医学图像处理、医学影像数据库—>存储技术、医学应用—>数据挖掘;⑵医学图像处理—>存储技术、现代医学—>信息技术
第1条演化路径由早期的医学图像处理和医学影像数据库演化发展而来,主要关注医学影像数据、数据预处理、数据采集、数据模型、数据交换、数据库设计、异构数据集成、动态数据交换;云存储、光盘存储、存储网络、断层全息存储、图像存储;医疗大数据、特征数据库、医学影像数据库、数据库知识发现、数据库管理技术、数据库系统。该条演化路径上的研究主题一直处于右上象限,在各时期都是该领域影响力大、与外部区域主题相关度高的引擎类主题,发文量明显递增,越来越受到研究者的关注,具有极大的发展潜力和能力。
第2条演化路径由早期的医学图像处理的支流演化发展而来,主要关注远程信息技术、现代信息技术、信息安全。该条演化路径由早期引擎类研究主题吸收新兴的现代医学,演化发展而成具有专业性、稳定性的信息技术,该条路径的发展潜力相对其他路径较小,未来极易被其他主题词吸收。
2.5.4 医学影像的处理 医学图像处理—>医学图像处理、优化图像质量—>医学图像处理
该条演化路径由早期的医学图像处理吸收优化图像质量演化发展而来,主要关注医学影像后处理技术、计算机图像处理技术、医学图像处理程序设计、医学图像配准、数字图像处理、词影像处理;图像增强、影像质量、技术质量管理。该条演化路径呈现了该领域基础性、持续性发展的医学图像处理主题,该方向较稳定且具有较强的演化发展潜力和能力,未来值得探讨。
3 小结
整体而言,国内学术界对于医学影像领域的研究呈现缓慢、波浪式上升的发展趋势,总发文量与作者总人次变化趋势基本同步。国内学者、机构之间的合作并不紧密,形成的合作网络也多局限于短期合作,学者之间更多的是以同机构内部、师承关系进行合作,机构合作也大多局限于某一地区,跨地域合作较为少见,未来可加强不同研究机构的作者之间的长期、深入合作。
随着时间的推移,该领域的研究主题不断丰富,内容不断深化,新的研究主题不断出现。前期、中期、后期的研究主题变化较明显,相互的演化关系较为复杂,在4个方向呈现6条演化路径。医学影像的应用和医学图像的处理演化过程较为稳定,医学影像的应用未来可开拓更广的范围,具有较大的发展潜力;医学影像诊断、成像技术、数据挖掘与信息技术是新增的热点主题,演化过程复杂多样,涉及许多不同的聚类主题,具有较高的研究地位,将持续成为研究热点。
参考文献
[1] 李晓华.大数据视角下的医学影像技术的发展与应用探究[J].科学技术创新,2020(3):150-151.
[2] 郑兆芳,吴成林,刘佳龙.大数据视角下医学影像技术的发展与职业健康探究[J].吉林劳动保护,2020(5):29-30.
[3] Aliakbar P, Mohammad K, Bahareh K, et al. Mapping the intellectual structure of the coronavirus field (2000–2020): a co-word analysis[J]. Scientometrics, 2021,126:6625-6657.
[4] 宋超,陳悦,汪玲,等.热点论文分布特征与影响因素分析——兼评时间窗口与学科间差异[J].图书情报工作,2019,63(16):84-94.
[5] WU Y G. True verification probabilities should not be used in estimating the area under receiver operating characteristic curve[J]. Statistics in Medicine, 2020, 39(27):3937-3946.
[6] XIE H L, ZHANG Y W, DUAN K F. Evolutionary overview of urban expansion based on bibliometric analysis in Web of Science from 1990 to 2019[J]. Habitat International, 2020, 95.
[7] 骆清铭,周欣,叶朝辉.生物医学影像学科发展现状和展望[J].中国科学:生命科学,2020,50(11):1158-1175.
[8] 陈卓,黎雁翩,张龚敏,等.医用诊断X射线机现场体系考核的思考及建议[J].中国医疗器械信息,2020,26(15):3-4,97.
(收稿日期:2021-04-06)
(修回日期:2021-04-27;编辑:郑宏)