医学信息学的研究维度、目标任务与研究热点
2016-03-25
1 医学信息学的交叉学科属性
1989年于瑞士成立的国际医学信息学协会(IMIA)对促进信息科学与技术在医疗卫生领域、医学信息学、卫生信息学与生物信息学研究中的应用发挥着主要作用。IMIA最早可追溯到1967年成立的国际信息处理联合会(IFIP)致力于与卫生有关的计算委员会TC4,目前IMIA还与世界卫生组织(WHO)与国际卫生信息管理联合会(IFHIMA)有密切的联系[1]。从IMIA的诞生与发展演化来看,医学信息学研究的快速发展离不开信息科学与技术在医疗卫生领域的广泛应用。因此,医学信息学被认为是信息科学与技术在医疗卫生领域的应用拓展。进一步来说,信息科学作为方法与工具,医疗卫生科学是其应用领域之一,这也是医学信息学呈现出明显交叉学科属性的本质原因。
信息科学与技术的飞速发展给作为其应用领域之一的医疗卫生带来了新的发展,进而不断地拓展和深化医学信息学的学科内涵与外延。医学信息学既有近邻交叉学科的成分,也有远缘交叉学科的性质[2]。因此,在不同的时期,国内外各个医学信息学协会、学者都给出了其对于医学信息学内涵的不同理解。从大多数针对医学信息学内涵的不同理解来看[3-12],其共同之处是都或多或少地体现出对医学信息学交叉学科属性的标识。也有学者从医学信息学研究的结构分析视角[13]、领域高频主题词共词聚类分析视角[14]以及学科共被引可视化图谱分析[15],定量揭示其所具有的交叉学科特性。正是由于医学信息学具有的典型交叉学科特性,使其能不断地从与其紧密关联的学科中进行理论与方法的借鉴与移植,从而不断促进该学科的发展和演变。当前的医学信息学已沿着范式理论的轨迹发展成为一门综合各相关学科精华的边缘交叉学科[16]。尽管目前医学信息学已取得了较快的发展,但作为一门交叉学科仍然很年轻。特别是在面对新一轮的信息化浪潮,医学信息学已表现出在学科理论与应用实践两者发展上的失衡态,以及学科研究的泛化现象。国外学者比国内学者更重视对医学信息学学科理论的研究[17]。明确学科目标任务等基本理论问题是加强学科建设并促进学科发展的前提和基础[18]。探讨学科的研究纬度及其研究热点有利于进一步推动学科研究的拓展与深化。因此,当前有必要对医学信息学的研究维度、目标任务、研究热点等问题进行深入的探讨。
2 医学信息学研究的维度与目标任务
学科领域研究维度是基于学科领域研究视角的提炼与深化,不同的研究维度往往对应着不同的研究目标任务。学科领域的研究维度与目标任务对于学科领域的理论框架体系与研究方法论具有重要的指导作用。为进一步推动医学信息学学科的建设与发展,有必要对医学信息学的研究维度进行相应的探讨。信息链是由事实、数据、信息、知识和智能(情报)5个链环所构成[19],是情报学和信息管理领域的重要研究对象,从事实、数据到信息,从信息到知识,从知识到智能(情报)的链环转换过程反映出人类认知的演进过程[20]。医学信息作为信息的子门类,也存在着相应的信息链[21]。医学信息链从层次结构演变与属性特征的视角展示了对医学信息上下游各要素间关系的理解。换句话说,医学信息学可视为围绕医学领域涉及整根完整“信息链”的管理过程,即“MF-MD-MInf-MK-MInt”,分别指代医学事实、医学数据、医学信息、医学知识、医学情报(智能)。对于医学信息链下游来说,医学信息学应将研究重点放在MF向MD转变的编码组织加工环节,以及MD向MInf转变的有序化和结构化过程,面向物理属性;对于医学信息学上游来说,应将研究重点立足于促进并实现MInf向MK分析提升,以及MK向MInt的激活和转化过程,这也是医学信息学学科满足医学临床解决方案和国家各级层面医疗卫生领域战略情报的需求。基于医学信息链的医学信息学研究维度划分见图1。
图1 基于医学信息链的医学信息学研究维度划分
图1中,从医学信息到医学知识、医学情报(智能)的实现过程是作为医学信息学研究内容的医学情报学研究。从整个医学信息链来看,医学信息学的研究维度取决于学科领域研究人员对面向认知行为属性的医学情报(智能)的理解。根据医学情报(智能)面向对象的理解分析,可将医学信息学研究维度划分为知识维度、行动维度、决策维度、智慧维度4类。同时,通过对医学信息学研究维度的划分可以进一步来探讨不同研究维度下的医学信息学研究目标任务。
2.1 医学信息学研究知识维度及其目标任务
知识维度下,医学信息学研究把医学情报视为激活后的医学知识,并重点关注医学知识的组织、加工、检索、评价与创新等医学知识管理活动。此研究维度下的医学信息学研究目标任务,一方面是促使图1中的医学信息链从MF、MD和MInf逐渐向面向认知行为属性的MK和MInt转换,另一方面是实现从医学语法层面到医学语义和语用层面的提升,即实现医学知识组织与管理、医学知识计量与检索。
2.2 医学信息学研究行动维度及其目标任务
行动维度下,医学信息学研究把医学情报视为一种医学生产行动,并重点关注处于不同医学情报生产环节的不同层次情报产品。此研究维度下的医学信息学研究目标任务是MF、MD、MInf、MK和MInt所对应的不同医学情报生产行动及其对应医学情报产品的生产与应用。
2.3 医学信息学研究决策维度及其目标任务
决策维度下,医学信息学研究面向科学决策,把医学情报视为服务医学战略规划与决策的支撑,并重点关注如何通过医学情报决策功能的发挥,实现其成为医疗卫生组织机构生存与战略规划发展的支撑要素。此研究维度下的医学信息学研究目标任务是通过医学信息分析与预测实现为医疗卫生组织结构的决策服务功能,凸显出医学信息学对医疗卫生领域的“尖兵-参谋”功用。
2.4 医学信息学研究智慧维度及其目标任务
智慧维度下,通过把医学情报视为具有智能特性的医疗智慧化服务,重点关注如何借助基于情报的医疗智慧化实现医疗卫生服务及其体系的最优化。此研究维度下的医学信息学研究目标任务是通过远程医疗、医疗物联网、移动医疗、医院信息化、医药电商平台、大数据、云计算等技术的综合应用与融合,并进行相应的情报智能分析来实现医疗卫生领域的智能化及医疗卫生服务的个性化与智慧化。医学信息学在精准医学发展过程中所起的重要作用[22]是医学信息学研究智慧维度的体现,即基于临床医疗知识库的决策支持系统来推动精准医疗的智能化和个性化发展,这也是医学信息学研究智慧维度下的重要任务。
3 近5年医学信息学研究热点的研究纬度
有研究者对PubMed数据库对2000-2011年间的医学信息学领域研究主题进行数据挖掘分析,发现医学信息学重点关注的研究主题变化[23]。通过对研究领域的主要研究热点进行探测分析,有利于明确研究重点及其演变[24-26]。探析基于国际医学信息学研究热点的研究纬度,能够明确学科研究重点的基础和当前学科研究纬度结构,更好地为国内医学信息学研究提供参考借鉴。学科领域内高影响力期刊所刊载的学术论文往往反映学科领域较为关注的研究主题。因而学科领域内具有高影响因子的期刊常作为分析学科领域研究热点的重要情报源。本文选取期刊引用报告JCR 2014版Web of Science学科分类“Medical Informatics”下影响因子前10的期刊(表1)分析。
表1 JCR 2014版医学信息学领域影响因子前10的10种期刊
注:序号为5的期刊IeeeTransactionsonInformationTechnologyInBiomedicine于2013年更名为IeeeJournalofBiomedicalandHealth
Informatics,该期刊篇数771=更名前的248篇+更名后的523篇。
各期刊2011-2015被SCI-E收录的文献类型为Article的学术论文,检索时间为2016-03-29。
首先,下载表1中所有期刊近5年(2011-2015年)发表的共5 820篇学术论文的文献数据。
然后,从文章的标题字段中抽取名词术语(选择二进制计数为计数方式),同时制作相应的同义词库文件对抽取后的名词术语进行处理,主要处理包括三方面内容:一是单数形式全部合并为其复数,如child合并为children,adolescent合并为adolescents,physician合并为physicians等;二是同义词进行合并,如EHR,EMR、electronic patient record和electronic medical record合成electronic health record,及telecare medical information system,telecare medicine information system,telecare medicine information systems合并为telecare medicine information systems等;三是去掉专指性不强的词汇,如study,call等。
最后,利用科学知识图谱绘制工具VOSViewer(Version 1.6.3)[27],对从标题中抽取处理后的名词术语进行共现聚类图谱探讨近几年医学信息学研究领域的热点主题。从5 820篇文献中共抽取14 825个名词术语,再通过同义词库表对名词术语进行相应处理后得到14 695个名词术语,选择名词术语频次大于等于10的216个名词术语作为高频名词术语,计算他们之间的相关系数值,并选择相关系数值最大的前60%,即130个名词术语构建共现聚类图谱(图2)。
图2 论文标题抽取的医学信息学高频名词术语共现聚类知识图谱
图2中,节点越大代表节点对应的名词术语频次越高,其中频次大于100的高频名词术语反映互联网、随机双盲对照试验、检测、分类、干预、疾病等在近5年受到重点关注。节点颜色用以区分名词术语对应的不同聚类。图2显示,基于论文标题抽取的医学信息学高频名词术语被划分为六大聚类,按照各个聚类中所包含高频名词术语的数量,依次对应的近5年医学信息学领域六大研究热点分别是临床信息学与生物医学信息学、医院信息系统、基于互联网的健康信息和卫生保健、医疗健康信息技术应用调查及其案例分析、医学知识发现、远程医疗。
3.1 临床信息学与生物医学信息学研究
临床信息学与生物医学信息学研究共包含40个高频名词术语,进一步细分5个研究子领域,分别是医学领域的系统综述与文献数据挖掘,主要包括的高频名词术语有review,data mining,quantitative analysis,literature,context-driven,drug-drug interaction,report;医疗卫生信息交换及其在疾病护理中应用,主要包括的高频名词术语有clinical note,feature extraction,health information exchange,medicine,HIV care,natural language processing,expert system,clinical narrative,state,measure;生物医学本体构建研究,主要包括的高频名词术语有ontology,biomedicine,semi,rule,machine learning;基因数据分类与基因表达数据优化,主要包括的高频名词术语有gene expression data,classification,optimization;医疗智能诊断,主要包括的高频名词术语有artificial neural network,genetic algorithm,diagnosis,disease,individual,presence,breast cancer,colorectal cancer,predictor,detection,estimation,test,preference,simulation,segmentation。
3.2 医院信息系统研究
医院信息系统研究共包含38个高频名次术语,可进一步细分为3个研究子领域:医院医疗信息系统仿真及其应用分析研究,主要包括的高频名词术语有emergency department,intensive care unit,workflow,scenario,integration,architecture,influenza,nurse,clinician,performance,simulation study、,future direction,meta analysis;医院信息系统技术接受及其决定因素研究,主要包括的高频名词术语有hospital information system,cloud,RFID,physicians,acceptance,barrier,determinant,solution,Taiwan,adoption,empirical study, introduction,findings,qualitative study;临床病历数据及电子健康档案系统的互操作与标准化,主要包括的高频名词术语有clinical data,electronic health record system,interoperability,standardization,secondary use,patient safety,recommendation,insight,challenges,lesson,opportunity。
3.3 基于互联网的健康信息和卫生保健研究
基于互联网的健康信息和卫生保健研究共包含17个高频名次术语,目前主要研究基于网络的面向目标群体健康与卫生保健的干预有效性问题,主要包括的高频名词术语有web,randomized controlled trial,effectiveness,influence,self management,adherence,year,adults,adolescents,young adults,intervention,depression,weight loss,pain,Smartphone,physical activity intervention,pilot study。
3.4 医疗健康信息技术应用调查及其案例分析研究
医疗健康信息技术应用调查及其案例分析研究共包含15个高频名次术语,主要包括的高频名词术语有internet use,health information technology,computer,exploratory study,Parkinson,characterization,China,cross sectional survey,Japan,sex,men,smoking cessation,text messaging,acceptability、reliability。
3.5 医学知识发现研究
医学知识表示与发现共包含12个高频名次术语,其可进一步细分为2个研究子领域,分别是:社交媒体在医疗领域应用实践研究,主要包括的高频名词术语有content analysis,twitter,facebook,engagement,action,drug,telemedicine,economic evaluation;临床医学系统术语研究,主要包括的高频名词术语有SNOMED CT (Systematized Nomenclature of Medicine-Clinical Terms),concept,implication,communication technology。
3.6 远程医疗研究
远程医疗研究共包含8个高频名次术语,目前主要研究远程医疗信息系统及其信息安全问题,主要包括的高频名词术语有telecare medicine information systems,authentication scheme,key agreement scheme,privacy protection,security,wireless body area networks,life,improvement。
通过对研究热点的研究维度进行探析发现,目前医学信息学研究热点侧重于面向卫生健康问题解决、医疗智能诊断与临床决策的知识发现与语义分析,并且越来越突出对泛在网络环境与社交媒体环境下医疗信息系统与技术的应用研究;在研究维度上表现为以医学信息学研究的知识研究纬度为主,以决策研究纬度和智慧研究纬度为辅。
4 结语
探讨与医学信息学相关的理论基础有利于进一步推动其体系建设与发展成熟,特别是针对医学信息学研究纬度及其目标任务的探讨非常有助于其体系的进展和深化。鉴于目前针对医学信息学研究维度及其目标任务的探讨性研究较少,本文从基于信息链的视角对医学信息学的研究维度、目标与任务进行了研究,并提出了医学信息学研究维度分别是知识维度、行动维度、决策维度、智慧维度。研究结果显示,当前的研究热点主题分别是:临床信息学与生物医学信息学、医院信息系统、基于互联网的健康信息和卫生保健、医疗健康信息技术应用调查及其案例分析、医学知识发现、远程医疗。与Schuemie基于MEDLINE数据库(1993-2008年)有关医学信息学文献数据的聚类结果对比发现,医疗卫生信息系统和医学知识表示研究是医学信息学领域近25年来持续性的研究热点[28]。此外,通过对近5年医学信息学研究热点的进一步分析,发现目前医学信息学研究热点正实现从医疗卫生数据获取、加工与存储转变为面向卫生健康问题解决、医疗智能诊断与临床决策的知识发现与语义分析,并且越来越突出对泛在网络环境与社交媒体环境下医疗信息系统与技术的应用研究。从近5年研究热点的分析探测来看,目前医学信息学研究热点主要以医学信息学研究的知识纬度为主,以决策纬度和智慧纬度为辅。