APP下载

2015年~2019年我国医疗大数据领域研究热点分析

2021-06-02祝雅如齐文娟吴雅琴

医学信息 2021年10期
关键词:发文聚类领域

苗 豆,祝雅如,齐文娟,吴雅琴

(内蒙古医科大学计算机信息学院1,人文学院2,内蒙古 呼和浩特 010110)

随着医疗信息技术的发展,越来越多的医院使用各类医疗信息系统(如HIS、EMR等)开展医疗服务[1]。由此在医疗领域产生了海量的医疗数据,并且健康医疗大数据正在从理论和概念逐步走向应用和实践[2]。知识图谱是以科学知识为对象,显示科学知识的发展进程与结构关系的一种图形。借助知识图谱,人们可以洞察人类知识体系的各个领域和结构,构建复杂的知识网络,预测学科和知识前沿的发展趋势与研究热点。知识图谱作为符号主义发展的产物,是人工智能技术和系统中的重要组成部分,其在百科知识、生物信息、社交网络、社交网络以及网络安全等领域被广泛运用[3,4]。本文使用CiteSpace,VOSviewer对医疗大数据领域的研究热点进行计量学分析,并利用软件绘制科学知识图谱,以期为医疗大数据领域的相关研究提供参考。

1 资料与方法

1.1 数据来源 以中国知网(CNKI)期刊数据库为数据来源,检索主题词为“医疗大数据”和“medical big data”,检索时间限定为2015年~2019年,具体日期为2019年12月29日,共得到3537篇文献数据。纳入符合主题的期刊论文,剔除重复文献、会议论文、报纸、辑刊等与本文主题相关性较弱的文献,最终得到3123篇有效文献。

1.2 方法 将CiteSpace设置时区分割年份为2015年~2019年,时间跨度分段长度为1年,术语选择为突显术语,节点类型可选择为关键词、主题,其中关键词共现数据选择Create→Create a map based on bibliographic data,在T type of analysis选择Co-occurrence,在Unit of analysis中选择All keyword,加载自定义的词集,合并、替换或删除一些因写法不同(术语简称、全称的不同表达等)造成重复的关键词。VOSviewer中,分析类型选择Co-authorship→Authors,Co-occurrence→All keyword,计数方法选择全计数(Full counting),分析医疗大数据的研究热点。

1.3 数据统计分析 使用CiteSpace.5.6.R3和VOSviewer对医疗大数据相关文献的发文量及年代分布,学术研究核心学者,以及关键词频次、中心性、突现等进行可视化分析,全面展示医疗大数据研究的相关内容。

2 结果

2.1 文献发文量 2015年~2018年有关医疗大数据领域的发文量呈上升趋势,2018年发文量高达660篇,2019年发文量略有回落,发文量分布见图1。

图1 2015年~2019年医疗大数据发文量趋势

2.2 作者合作网络 对纳入分析的3123篇有效文献进行核心作者合作网络制作,见图2。可视化结果展示所分析文献的核心作者共分有5大类,每类中发文量突出的分别是张政波、曹德森、黎檀实、薛万国、刘军等人。其中,作者张政波是北京市国际科技合作基地负责人,在创新型医疗器械和装备研发、电子健康档案的二次分析利用等领域有较大贡献;作者曹德森曾与张政波、薛万国、黎檀实共同研究发表过急救大数据与Datathon活动等有关医疗大数据领域的论文;作者黎檀实在医药卫生领域有较大影响力,他主要在医疗大数据和医疗器械等领域展开研究;作者薛万国在医疗建设领域有独到的见解,从1988年开始从事医院信息化方面的研究开发与推广应用工作,他提出在做好病历共享的同时,还要注意病人隐私保护的问题;作者刘军在医学外科方面较为擅长,曾发表过肿瘤学以及外科学的相关学术论文。

图2 核心作者合作网络

2.3 关键词共现分析 利用VOSviewer进行关键词共现分析,所有关键词节点围绕“大数据”节点呈放射状展开,其中较为突出的节点有“医疗”“大数据时代”“智慧医疗”“人工智能”“数据挖掘”“云计算”等,见图3。

图3 关键词共现网络

2.4 高频关键词聚类 利用CiteSpace进行关键词聚类分析,医疗大数据研究领域关键词聚类共聚为10类,分别是“大数据”“医疗大数据”“精准医学”“大数据应用”“健康医疗大数据”“数据共享”“大数据时代”“数据挖掘”“移动医疗”和“信息资源共享”,见图4;每一聚类所包括的聚类标签见表1。

图4 关键词聚类分析可视化网络

表1 医疗大数据研究领域关键词聚类分布

2.5 关键词突现分析 使用CiteSpace得到医疗大数据突现关键词,主要包括精准、数据资源、移动医疗等,见图5。

图5 2015年~2019年医疗大数据突现关键词

3 讨论

3.1 发文量分析 从刊载文献发文量来看,2015年~2018年发文量呈上升趋势,2019年略有回落,分析其中原因之一是本文所用数据的检索时间为2019年12月29日,很多期刊2019年所发表文献还未能在CNKI检索,故分析数据中2019年文献数量有所下降。2016年,国家出台《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,文件指出:健康医疗大数据应用发展将带来健康医疗模式的深刻变化,有利于激发深化医药卫生体制改革的动力和活力,提升健康医疗服务效率和质量,扩大资源供给,不断满足人民群众多层次、多样化的健康需求,有利于培育新的业态和经济增长点。相关文件的出台也在一定程度上推动了医疗大数据研究、应用的进一步增长。

3.2 作者分析 在作者合作网络中,每个节点代表一位作者,节点的大小代表作者发文量,节点的颜色代表按照默认的聚类方法得到的作者所属类群,网络中的连线代表了作者合作关系,线宽代表合作强度。作者合作网络表明,虽然形成了一些合作作者群,但深入分析会发现,合作作者大多来自同一个科研机构,覆盖面相对比较小,国内还未形成较大范围的医疗大数据研究作者群。为进一步促进医疗大数据应用向纵深发展,今后亟待加强医疗大数据更广范围的合作。

3.3 研究热点分析 关键词是文献分析的重要组成部分,它高度精炼了文章的内容,通过分析关键词可以获知某领域的研究热点。根据关键词聚类结果,可将我国医疗大数据研究热点分为以下4个方面:

①基于健康医疗大数据的数据应用及模型设计:在经过多年的医疗信息化建设后,各级各类医疗机构的医院信息系统存储了大量的数据,从规模上来讲形成了健康医疗大数据,但在应用层面上,这些规模庞大的数据很多处于“沉睡”状态。现代医学越来越依赖于具体数据的采集和判断[5],如何借助于技术使这些沉睡的数据真正服务于医疗,服务于患者,提高医疗服务质量成为研究者关注的热点之一。②健康医疗大数据质量、数据资源共享及数据安全研究:大量的健康医疗数据分散在医疗机构不同的系统中,如何在保证数据安全的前提下,为研究者提供符合研究要求的高质量数据,并且高效共享健康医疗数据也是近些年研究者关注的热点。③健康医疗领域的技术探究:健康医疗大数据的应用离不开相关的大数据技术,如何将在其它领域应用成熟的技术使之在医疗领域发挥更大作用,同样也受到研究者的关注。④移动医疗应用:2015年,移动医疗借助“互联网+”东风,在医疗行业大放异彩。从概念到产品落地,再到如何切实有效的服务于患者,使患者在就医、问诊、复诊、转诊等各个环节真正体会到移动医疗的好处,也使得移动医疗成为近几年研究者关注的热点之一。

3.4 研究前沿分析 关键词突现分析可以了解研究领域的前沿热点。“突现”是指一个变量的值在短期内有非常大的波动。突现关键词分析有助于鉴定出某一段时期内最突出的文献知识,即文献信息的挖掘与文献知识扩散、文献知识吸收和文献知识扫描的发展进程[6]。在本研究所设定的时间范围内,从时间序列上来看,2015年~2016年的突现词为“精准”“移动医疗”“数据资源”“卫生医疗”和“现代医学”,表明在这个时期,该领域的学者对与之相关的研究内容关注度较高。“大数据中心”和“分级诊疗”的有关内容在本研究时间段内,则集中出现在2018年和2019年。分级诊疗制度的建立是实现我国合理配置医疗资源、促进基本医疗卫生服务均等化的重要举措。推进分级诊疗制度建设是我国深化医药卫生体制改革的工作重点。国家计划到2020年完成分级诊疗的核心目标,即基本建立符合我国国情的分级诊疗制度[7]。为实现此目标,加快“互联网+医疗健康”发展,完善国家级全民健康信息平台也就同样成为了工作重点,由此医疗机构大数据中心建设也在近几年成为学者关注和研究的重点之一。

综上所述,近几年医疗健康大数据在基础研究、临床应用等方面发挥了不可替代的作用。总体上看,我国已在医疗大数据的开发与利用上取得很大进展,在该领域研究中处于重要地位。健康医疗大数据成为当前该领域学者研究的一个重要热点,这为后续学者研究和实验提供了参考。

猜你喜欢

发文聚类领域
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
领域·对峙
校园拾趣
爷孙趣事
以牙还牙
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
新常态下推动多层次多领域依法治理初探
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例