基于Sci2的国外医学信息学文献引文耦合分析
2015-03-13陈云香
曹 霞 陈云香 崔 雷
(中国医科大学附属盛京医院图书馆沈阳110004) (中国医科大学信息管理与信息系统(医学)系沈阳110013)
•医学信息研究•
基于Sci2的国外医学信息学文献引文耦合分析
曹 霞 陈云香 崔 雷
(中国医科大学附属盛京医院图书馆沈阳110004) (中国医科大学信息管理与信息系统(医学)系沈阳110013)
以JCR收录的25种医学信息学期刊为数据样本,利用可视化工具Sci2软件对所采集的文献进行引文耦合分析,绘制医学信息学研究领域的知识图谱。通过对施引文献进行聚类,对该领域不同时间段的代表作者和代表文献及其研究方向和热点进行分析,揭示引文耦合图谱的特点和发展态势。
医学信息学;知识图谱;Sci2;文献引文耦合
1 引言
医学信息学(Medical Informatics)兴起于20世纪70年代后期,是以医学、信息管理学、系统论和计算机科学技术为理论基础,以医药信息化管理为目标,涵盖医学信息采集、存储与传输、生物医学信号处理、医学图形和图像处理、医学知识系统和智能系统、计算机仿真和医药信息工程等众多概念和范畴的一门新兴交叉学科[1]。随着医学信息学在生物医学研究、医学教育、医学卫生管理方面的应用逐渐深入,对该领域的研究文献数量也不断增加[2]。
引文耦合包括文献引文耦合、期刊引文耦合、作者引文耦合等。本文涉及的文献引文耦合是施引文献通过其参考文献(被引文献)建立的耦合关系,即两篇或多篇施引文献共同引用了1篇或多篇参考文献,则这两篇文献具有引文上的耦合关系,其中两篇文献共有的参考文献的篇数代表耦合强度[3]。Sci2(Science of Science)是一款知识图谱分析软件,在绘制知识图谱和可视化方面拥有很多优势,但国内研究人员目前对该软件研究甚少[4]。本研究采用定量分析法,选取JCR收录的医学信息学领域最具影响力的25种期刊为数据样本,利用Sci2知识图谱分析软件研究学科发展,更加直观地呈现医学信息领域的研究状况[5-6]。
2 资料与方法
2.1 数据来源
本文以2013年JCR(Journal Citation Report)期刊引文报告收录的医学信息学领域的25种期刊作为数据来源,检索时间范围为2005年1月1日-2013年12月31日,将文献类型限定为 “article ”,“ review”,“ proceedings paper” ,最终共得到17 910篇科学论文[7]。将数据分为2005-2007年、2008-2010年、2011-2013年这3个时间段进行文献引文耦合分析。这种对不同时间段的深入研究,可以更好地呈现国外医学信息学领域研究的动态变化[8]。
2.2 数据处理
3 国外医学信息学知识图谱呈现和解读
3.1 2005-2007年医学信息学文献引文耦合图谱
2005-2007年在JCR收录的25种医学信息学期刊中,共检索出4 196篇文献,在对这4 196篇文献进行可视化分析过程中,通过其调试窗口(Console)可知,该文献引文耦合网络中,共包含93 470个节点,其中有89 551个是孤立节点,为了网络优化,应删除这些孤立节点,留下3 919个节点进行分析。节点间的连线共有72 005条,无自我循环,也无平行边,边最大的权重为37,最小的权重为1,该图谱节点之间有着很强的关联性,其中最大的网络包括3 881个节点。利用MST-Pathfinder算法根据权重相似性对网络进行优化缩减,最后将72 005条边缩减到3 900条,缩减率为18.463。将耦合强度≥25的文献在图谱中显示出来,共得到9组强耦合文献,文献在图谱中的分布,见图1。
(1)第1组文献的耦合强度为37,第2组文献的耦合强度为26。这3篇文献主要以Zhou为中心,主要研究时间推理在医学决策支持系统、医疗语言处理、电子医疗记录和生物信息系统中的重要作用,提及利用人工智能和医学自然语言处理系统(MLP)来处理时间表示和推理等时间信息。
(2)第3组文献的耦合强度为36,第4组文献的耦合强度为28。这3篇文献主要以Rosenbloom为中心,探讨医嘱录入系统用户界面的设计,通过可见的超链接来加强上下文相关的教育材料和患者信息的可用性,能够显著提升CPOE的利用率以及CPOE对临床决策支持的影响。
综上所述,结直肠癌中受miR-1254所调控的DEG,以及其所富集的生物过程、参与的信号通路、PPI网络虽有待进一步探究和证实,但却可为后续miR-1254对结直肠癌发生机制的研究提供方向和指导。通过认识miR-1254所调控的基因网络,可全面了解其可能作用的靶基因,应用适当的RNA修饰或特殊的递送途径等方法,尽可能避免“脱靶”效应,以寻找治疗结肠癌更有效、安全的方法。
(3)第5组文献的耦合强度是33。主要研究聚乙烯和钛铝钒颗粒的不同配合比对肿瘤坏死因子α和对脂多糖诱导肿瘤坏死因子α mRNA表达的影响。
(4)第6组文献的耦合强度为32。讲述通过统计分类表,利用统计学方法,多尺度分形分析技术和一个大范围的分类体系来描述乳腺肿块X线的形态学和诊断学特征。在局部纹理和数据分形分析基础上使用线性、神经以及支持向量机来描述乳腺肿块X线特征。
(5)第7组文献的耦合强度为28,主要探讨临床信息检索技术对临床医生、家庭医生以及医学生的影响,临床信息检索技术对于临床医生的学习和记忆的提高都有积极的作用。
(6)第8组文献的耦合强度为27。通过将细胞神经网络和弹性变形进行类比,提出一种模拟软体物体变形的新方法。该方法不仅可以预测典型的生物组织行为,还可以提供各向同性、各向异性、非均质材料、局部以及大范围的变形。
(7)第9组的耦合强度为26。主要探讨进行健康风险沟通的方法,包括数字、文字以及视觉的形式。但因为某一结果缺乏一致的测试形式,各个形式之间的随机对照研究以及相关细节和机制的理论基础,目前仍然无法评估到底哪一种类型的方法最有效。
图1 2005-2007年文献引文耦合图谱
3.2 2008-2010年医学信息学文献引文耦合图谱
检索得出,2008-2010年共有5 354篇医学信息学文献,在进行可视化分析过程中,通过其调试窗口可知,该文献引文耦合网络中,共包含130 557个节点,其中有125 422个是孤立节点,这些孤立节点,留下5 135个节点进行分析。节点间的连线共有115 038条,无自我循环,也无平行边,边最大的权重为37,最小的权重为1,该图谱节点之间关联性较强,其中最大的网络包括5 115个节点。利用MST-Pathfinder算法根据权重相似性对网络进行优化缩减,最后将115 038条边缩减到5 124条,缩减率为22.451。整个图谱中,耦合强度≥25的耦合文献有7组,文献分布具体,见图2。
(1)第1组文献的耦合强度为37。主要介绍一款肌肉结构模型,提出该模型算法和数学分析,通过修改输入参数和控制输出运动单位纤维密度的分布,来获得一个逆过程。
(2)第2组文献的耦合强度为32。主要探讨在生存模型中的设限对贝叶斯网络学习的影响,运用爬山算法和独立性算法来学习贝叶斯网络。模型表明,当处理中间设限时,加权方法是最优选择。
(3)第3组文献的耦合强度为31。主要探讨团队合作是如何形成的,提出序列性、平行性、同时性3种区分团队的理论概念,提出群组间的一种中间阶段——半平行团队合作。
(4)第4组文献的耦合强度为30。主要探讨基于群组的审核一体化医学语言系统中缺失的层次关系,运用递归过程定位缺失层次关系。
(5)第5组文献的耦合强度为25。文章主要目的是识别和描述在住院和门诊服务中医生使用电子病历和医嘱录入系统意识行为,随着用户对健康信息技术(IT)的兴趣日益递增,医疗健康信息技术的接受度以及使用也越来越重要。
(6)第6组文献的耦合强度为25。主要通过使用医嘱录入系统(CPOE)来降低用药错误和药物不良事件等相对危险度,通过领域控制研究和前后检测研究方法评价所有类别的CPOE,得出电子处方能够降低用药错误和药物不良事件等风险。
(7)第7组文献的耦合强度为25。主要探讨近年来Meta分析在医学研究中的发展,重点概述了非均质性和随机效应分析,在不同领域应用时的特殊考虑和评价研究中的偏误等。
图2 2008-2010年文献引文耦合图谱
3.3 2011-2013年医学信息学文献引文耦合图谱
检索得出,2011-2013年共有8 360篇医学信息学文献,在进行可视化分析过程中,通过其调试窗口可知,该文献引文耦合网络中,共包含189 176个节点,其中有181 574个是孤立节点,删除这些孤立节点,留下7 602个节点进行分析。节点间的连线共有236 003条,无自我循环,也无平行边,边最大的权重为64,最小的权重为1,该图谱节点之间关联性较强,其中最大的网络包括7 420个节点。利用MST-Pathfinder算法根据权重相似性对网络进行优化缩减,最后边缩减为7 522条,缩减率为31.375。整个图谱中,抽取权重≥40的6组强耦合文献的标签进行显示,见图3。
(1)第1组文献的耦合强度为64。主要研究视网膜影像的血管分割方法,分析探讨了视网膜血管提取算法、技术和方法论,通过DRIVE和STARE这两个视网膜影像数据库,针对每个区域的受试工作者特征曲线,使用精确度、真阳性率、假阳性率、敏感性、特异性等方法来运行该算法。
(2)第2组文献的耦合强度为52。主要通过随机对照试验,在病人和医护人员之间使用电子症状报告来改善医疗保健服务的质量。
(3)第3组文献的耦合强度为50。主要探讨大规模卫生信息技术,其实施需要复杂的战略规划和系统组织。电子健康档案是现在国际上改善医疗安全性和医疗质量的核心。
(4)第4组文献的耦合强度为48。主要研究临床决策支持干预的药物处方设计,描述临床决策支持干预系统中的医疗处方的设计属性,强调感性、认知特点、提高人机交互和病人安全等功能。
(5)第5组文献的耦合强度为43。主要研究利用互联网提供量身定制的生活方式——电子邮件定期提醒,探讨提示内容和时间的影响。
(6)第6组文献的耦合强度为43。主要研究在基础科研中利用计算机心房模型辅助理解病理机制和治疗方法。
图3 2011-2013年文献引文耦合图谱
3.4 医学信息学文献引文耦合分析总结
本文将2005-2013年的医学信息学文献以3年为一个周期,划分为3个不同的连续时间段进行耦合分析。通过制作分析各个时间段文献的引文耦合图谱,可以很清楚地发现,2005-2013年医学信息学文献呈现明显的增长趋势,在图谱中表现为节点和连线增多,构建的网络也越来越大,越来越复杂,不同时间段研究的热点也各有不同。2005-2007年,代表作者有Zhou、Ancker、Rosenbloom等,研究的主要内容是时间推理系统的医学应用、医嘱录入系统设计、利用统计分类表描述乳腺肿块X线形态学和诊断学特征、临床信息检索技术、临床数据挖掘学习等。2008-2010年,代表作者有Navallas、Stajduhar、Berlin、Chen、Holden等,研究的主要内容有肌肉结构模型开发、贝叶斯网络学习、团队合作、一体化医学语言系统层次缺失审核、医嘱录入系统的电子处方功能等。2011-2013年,代表作者有Fraz、Johansen、Cresswell、Horsky等,研究的主要内容有视网膜影像血管分割方法、电子症状报告和电子健康档案改善医疗质量、临床决策支持系统的药物处方设计、电子邮件定期提醒、计算机心房模型辅助治疗。通过对3个时间段研究内容的总结,反映出医学信息学涉及的研究领域越来越广泛,包括计算机、医学、管理学等,已经逐渐成为一个成熟的多领域交叉学科[10]。
4 结语
本文以JCR收录的25种医学信息学期刊为数据样本,利用可视化工具Sci2软件绘制出医学信息学研究领域的知识图谱,系统全面地对不同时间段进行文献引文耦合分析。主要的研究结论如下:(1)2005-2013年医学信息学领域的研究文献总体呈现上升趋势,随着时间的推移,网络内节点越来越多,各节点间的联系也越来越紧密,说明在该领域中,作者间的合作增加,学术交流也日趋频繁。(2)对于同一研究主题的文献,它们的参考文献趋同性较高,尤其是同一作者或者是相同团队的发表文献,呈现出很高的耦合率。(3)不同时间段的代表作者和主要研究内容有所不同,覆盖了医学、计算机和管理学等多个学科,同时研究内容具有一定连续性,例如3个时间段关于电子处方的研究:医嘱录入系统设计——医嘱录入系统的电子处方功能——临床决策支持系统的药物处方设计,说明了电子系统药物处方的开发设计是最近热点研究方向。
本文通过运用可视化工具Sci2软件,对近年来医学信息学数据进行文献引文耦合分析,绘制出本领域的知识图谱并对施引文献进行聚类,可以很好地呈现不同时间段的代表作者和代表文献及其研究的主要方向和潜在研究趋势,揭示国外医学信息学文献引文耦合图谱的特点和发展态势,同时为国内
医学信息研究者提供借鉴和参考。
1 陈先来. 加强临床医学生医学信息学教育的思考[J]. 西北医学教育,2011,19(1):14-16.
2 崔雷,陈东滨. 国外医学信息学科研热点的文献计量学分析[J]. 医学信息学杂志,2007,28(2):97-102.
3 许丹,侯跃芳. 国外医学信息学研究领域可视化引文分析[J]. 医学信息学杂志,2011,32(10):12-19.
4 邱小花,李国俊,肖明. Sci2——一款新的知识图谱分析软件介绍与评价[J]. 图书馆杂志,2013,32(9):79-87.
5 宋艳辉,武夷山. 基于作者文献耦合分析的情报学知识结构研究[J]. 图书情报工作,2014,58(1):117-123.
6 邱均平,赵月华,赵蓉英. 国外图书情报领域可视化研究之分析[J]. 情报理论与实践,2013,36(1):124-128.
7 曹霞,杨华. 基于SCI-E的中国大陆妇产科学领域论文产出分析[J]. 医学信息学杂志,2012,33(10):58-62.
8 黄卓泳,贺莲. 基于知识图谱的卫生技术评估发展现状及热点分析[J]. 医学信息学杂志,2013,34(6):55-59.
9 李国俊,刘恩涛,邱小花,等. 国外图书馆学情报学知识图谱研究——基于Sci2的文献引文耦合分析[J]. 情报杂志,2014,33(1):78-90.
10 栗文靖,许培扬. 近年来国际上有关医学信息学学科发展的一些探讨[J]. 医学信息学志,2011,32(10):7-12.
Literature Bibliographic Coupling Analysis of Foreign Medical Informatics Based on Sci2CAOXia,
CHENYun-xiang,
LibraryofShengjingHospitalofChinaMedicalUniversity,Shenyang110004,China;CUILei,DepartmentofInformationManagementandInformationSystem(Medicine),ChinaMedicalUniversity,Shenyang110013,China
The paper takes 25 kinds of medical informatics journals from JCR as the data samples and uses the information visualization tool Sci2to make literature bibliographic coupling analysis, draws the knowledge map of medical informatics domain. By clustering the citing literatures, the representative authors, literatures, their research directions and focuses in different periods are analyzed, the characteristics of literature bibliographic coupling map and the development tendency of medical informatics are revealed.
Medical informatics; Mapping knowledge domain; Sci2; Paper bibliographic coupling analysis
2014-10-30
曹霞,助理馆员,发表论文9篇;通讯作者:崔雷,副主任,博士生导师,发表论文100余篇。
R-058
A 〔DOI〕10.3969/j.issn.1673-6036.2015.02.011