医学文献计量分析的研究现状探讨
2014-06-04赵俊玲
姜 涛,赵俊玲
(1.河北大学,河北 保定 071000 2.河北大学管理学院,河北 保定 071000)
文献计量学是以文献本身及其所表现出来的题名、著者、参考文献及文献内容等一切与文献有关的文献计量特征为研究对象,通过数学、统计学等的计量方法,研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门科学[1]。我国文献计量学的研究随着情报学学科的建立和发展,在理论研究与实际应用方面均取得了长足的发展,目前已经在许多学科中广泛的应用,是情报学中最活跃、发展最迅速的专业领域之一。知识爆炸的时代,医学相关信息海量激增,医务工作者由于时间缺乏,检索能力差等原因,很难从大量医学信息中查找相关知识,文献计量分析为医务工作者提供了一种方便快捷可靠度高的医学情报情报信息获取途径。随着现代信息技术的飞速发展,文献计量分析在医学中的应用也越来越广泛,本文探讨医学文献计量分析的研究现状,现报道如下。
1 资料与方法
1.1 一般资料:本文的文献数据来源范围限定在《中国学术期刊全文数据库(CJFD)》“医药卫生科技”专辑,以“文献计量”为主题进行精确检索,检索出977条符合条件的论文,导入Excel中以方便统计。借助Excel剔除会议通知等非论文文献,并通过查检剔除非相关文献,最终得到的有效记录为740条。
1.2 方法:词频分析法是常用的文献计量学方法之一,是利用某一研究领域文献中的关键词频次高低来确定该研究领域的研究热点和研究现状。关键词是论文的文献检索标识,是表达文献主题概念的自然语言词汇,能够简单、直接、较为全面地概括论文的核心研究内容[2]。
共词分析法是利用某一研究领域文献中关键词共同出现的情况,来确定该研究领域中各关键词之间的关系[3]。一对关键词在文献中出现的频次越高,它们之间的关系越紧密。因此,构建出医学文献计量分析期刊论文的高频关键词共现网络,其节点之间的关系就可以反映出该领域主题内容的亲疏关系,通过分析该共现网络就能够得到医学文献计量分析的研究现状。
本文将在对医学文献计量分析相关的期刊论文进行频次分析和共词分析的基础之上,结合相关文献的具体内容,总结该领域的研究现状。
1.3 应用软件:应用Bibexcel和Netdraw软件对数据进行处理。
2 结果
2.1 高频关键词:利用Bibexcel对医学文献计量分析相关论文的关键词进行统计,得到1673个关键词,将其频次降序排列,其中频次不小于十次的高频关键词见表1。
表1 高频关键词及词频
2.2 高频关键词共词网络:使用Netdraw软件绘制医学文献分析的共词网络,选取共现3次以上的关键词予以显示,如图1所示。节点大小反映与其它节点的连接次数的多少,节点之间连线的粗细反映节点之间共同出现的频次,频次越高表示节点之间关系越密切。
3 讨论
通过词频分析和共词分析的结果,结合医学文献计量分析论文进行内容分析,对医学文献计量分析的目的,对象,数据来源和分析方法进行讨论。
3.1 医学文献计量分析的目的:①期刊评价:利用医学文献计量分析对某一种或一类期刊进行评价,确定该刊的发展现状以及在同类期刊中的地位和作用。②个人或机构评价:利用文献计量学方法确定某一领域的核心期刊,高产作者,高产机构等。③研究热点预测:利用医学文献计量分析得到某一研究领域的研究热点和研究现状。
3.2 医学文献计量分析的对象:①以某一种或某一类医学期刊为对象进行文献计量分析。②以某一研究领域的文献为对象进行医学文献计量分析,例如药物不良反应、艾滋病、中医药、医院管理或生物材料等。
3.3 医学文献计量分析的数据来源:①SCI(科学引文索引)数据库:SCI(Science Citation Index)是1961年由美国科学信息研究所(ISI)创建的引文数据库,是世界三大科技文献检索系统之一,是世界公认的科学统计与评价的重要数据来源。②PubMed数据库:PubMed是由美国国立医学图书馆开发的Entrez检索系统的一部分,是世界公认的最权威的免费的大型医学文献数据库,现有1950年以来的2200多万篇文献的记录,涉及40多个语种,每年增加60余万条文献记录。其中最重要的MEDLINE数据库收录1966以来的70余个国家5000余种生物医学期刊的题录与文摘。③CBMdisc(中国生物医学文献)数据库:CBMdisc是中国医学科学院医学信息研究所创建的综合性医学文献数据库,收录了1978以来的近1800余种中国期刊,以及汇编、会议论文的文献题录700余万篇,全部题录均进行主题标引和分类标引等规范化加工处理,年增文献40余万篇[4]。
3.4 医学文献计量分析方法:①载文分析:载文分析一般应用在期刊评价中,是对某一种或一类期刊的载文情况进行分析,主要分析内容包括载文量,载文质量,参考文献量,篇均引文率,基金支持情况等等。②著者分析:著者分析的主要分析内容包括高产作者,合著情况。高产作者,是指某一研究领域中论文发表数量相对很多的少数几个著者,这些著者在该领域中非常活跃,可以认定为该领域的核心领军人物。随着科技的飞速发展,医学研究的广度、深度不断增加,专业化程度越来越高,分工越来越精细,一些大型的复杂的科研实验往往需要不同学科学者的合作,科研合作日趋频繁。合著情况在一定程度上能够反映科研合作趋势,某一研究领域著者合作度越高,表明该领域信息共享和科研合作交往较多,有利于该领域发展。③引文分析:引文分析是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[5]。引文分析是文献计量学中的应用最为广泛的方法之一,主要分析内容包括引文时间分布,引文量,引文类型,引文语种,被引期刊等等。④统计分析、聚类分析:统计学方法是文献计量学的最基本的方法之一,聚类分析是统计分析中最常用的降低维数技术的多元统计方法之一。统计分析法是利用统计、概率的原理对关系中各属性进行统计分析,从而找出它们之间关系和规律的一种方法。常用的统计分析法有聚类分析、因子分析、相关分析、多元回归分析、多维标度分析等。
综上所述,大型的医学权威数据库如PubMed、CBMdisc等的建设,深度全面的文献归类,规范化的主题词表的标引,使得医学文献计量分析的结果更加具有权威性、可靠性。随着大数据时代的到来,文献计量分析方法越来越多样化,作为一门交叉科学越来越受到各领域专家学者的重视。近年来可视化分析法和社会网络分析方法在情报学中应用广泛,但在医学文献计量分析中应用还相对比较少,可以预见这些新的方法将为医学文献计量分析开辟更广阔的发展空间。
[1]邱均平,文献计量学,科学技术文献出版社,1988.12-13.
[2]尹相旭,张更平,李晓菲.基于关键词统计的情报学研究现状分析[J].情报杂志,2009,28(11):38-41.
[3]李长玲,支岭,纪雪梅,王效岳.我国情报学研究进展——基于期刊论文关键词的统计分析[J].图书情报工作,2010(24):35-40.
[4]中国生物医学服务文献系统.http://sinomed.imicams.ac.cn/,2013-11-24.
[5]邱均平,信息计量学[M],武汉大学出版社,2007.23.