图书馆学高频被引论文共被引分析
2012-04-29孙海生
孙海生
〔摘 要〕以《中国引文数据库》为统计源,采用共被引方法对我国图书馆学高频被引论文进行统计分析,透视我国图书馆学研究的主流领域。聚类分析的结果表明,我国图书馆学研究的热点主题包括:(1)数字图书馆;(2)网络信息资源研究;(3)用户服务;(4)知识管理;(5)图书馆2.0;(6)学科馆员;(7)复合图书馆;(8)信息素质教育。
〔关键词〕图书馆学;高频被引论文;共被引分析;聚类分析
DOI:10.3969/j.issn.1008-0821.2012.01.025
〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)01-0107-06
Co—citation Analysis of Highly Cited Papers of Library Science in ChinaSun Haisheng
(Library,Liaocheng University,Liaocheng 252059,China)
〔Abstract〕Utilizing co-citation analysis methods,this paper made statistical and analysis on highly cited papers of Library science based on China Citation Database.So as to get the research hotspots and deveIopment in Library science.The cluster includes digital library,network nformation resources,user services,knowledge management,library 2.0,subject librarians,hybrid library,information literacy education.
〔Key words〕library science;highly cited papers;co-citation analysis;clustering analysis
科学文献的引用与被引用说明了科学知识和情报内容的继承和利用,文献的相互引用是由科学本身的发展规律和研究活动规律所决定的,任何一项科学研究都必须在前人的基础之上吸取他人的经验来进行 ,科学文献之间的引证关系形成了引文分析的基础。20世纪20年代第一篇使用引文分析方法的论文的发表,标志着引文分析的诞生,60年代《科学引文索引》(sci)的问世极大地促进了引文分析的发展,计算机的广泛应用使对大规模科学引文网络的研究成为可能,也促进了引文分析理论的不断成熟,特别是近年来,数据挖掘和信息可视化技术在引文分析中发挥了重要作用,使可视化成为引文分析新的研究热点。目前,引文分析已经受到越来越多的科技哲学、情报学研究者和管理、决策机构的重视,成为信息计量学、科学学的重要研究领域之一。广泛用于研究文献情报流的规律;揭示科学结构以及学科间的相互交叉、相互渗透关系;进行文献检索;学术交流研究和科研绩效评价以及科技决策和政策指定。
共被引是引文分析的重要方法之一,最早由美国情报学家斯莫尔和前苏联情报学家马沙科娃分别提出。文献共被引是指两篇(或多篇)论文同时被后来的文献所引用,则这两篇(或多篇)就有“共被引”关系,利用同时引用它们的论文的篇数作为共被引强度来测度其共被引程度[1]。以粒子物理学为例,斯莫尔对该领域高被引论文进行了共被引分析,并且绘制了高被引论文的共被引网络。这也成为人们利用共被引分析定量地揭示科学的结构、亲缘关系和演化规律的先例。随着共被引概念的深化,共被引分析已经延伸为论文共被引、著者共被引、学科或专业共被引和期刊共被引。
在引文分析中文献的被引用次数是最基本的度量指标,文献被引用是该文献的质量、重要性以及影响力的体现,论文的被引次数是衡量论文受同行关注程度和学术影响力的重要指标,尽管施引(citing)文献的作者在引用某一文献时的引用动机具有复杂性和无法量化衡量的特点,高被引并不等同于高质量,但是不管是正面引用还是批判性地引用,都属于科学探索范围[2],多次被引用足以说明这些论文涉及的主题或内容受到更多的关注,能够反映出学科领域普遍关注的热点问题。普赖斯认为在科学论文之间形成的引文网络结构中,只有极少数论文被新发表的论文较多引用,被引频次高的这小部分论文可视为学科的新的生长点,成为热门的科学前沿,为利用引文分析探测科学前沿的可行性奠定了理论基础[3]。考虑到引文分析存在滞后性的缺点,我们认为对高频被引论文进行共被引分析可以纵览某一时间段内学科的主要研究主题,结合时间序列分析,能够预测各研究主题的未来发展趋势。
我国研究人员在共被引分析时多采用作者共被引分析(ACA)和期刊共被引分析(JCA)。马费成对我国情报界的核心作者进行了ACA分析,研究我国情报学学科的结构和研究状况[4];邱均平对我国图情界核心作者进行ACA分析,研究我国图书情报学的学科结构[5];赵勇利用SSCI数据库,对24种情报学核心期刊引文进行了作者共引分析,并绘制了情报学研究的知识图谱[6];另外,对组织行为学、国内网络信息计量学研究均有研究人员进行了作者共被引分析[7-8]。秦长江对农史学科、图书情报学期刊的期刊共被引分析,构建中国农史学科与相邻学科关系知识图谱,分析农业史学科与相邻学科的关系[9];赵勇对24种图书情报学核心期刊引文进行了期刊共引分析,并绘制了图书情报科学研究的知识图谱,分析了国际图书情报学的主流学科领域[10];邱均平对CNKI数据库中21种编辑出版类期刊进行共被引,确定这一学科的核心期刊[11]。然而,对学术论文的共被引分析却相对较少,特别是,对学科领域具有影响力的高被引论文,当前的研究多集中在高被引论文的年代分布、期刊分布、主题分布、作者分布、机构分布、地区分布等传统文献计量指标进行统计分析[12-13],本文以我国图书馆学高被引论文为研究对象,采用论文共被引分析方法,对这些论文进行分析。理论基础在于论文共被引是由于它们在研究主题、理论或方法等方面的相关性,被共引的次数越多说明它们之间的关系越密切,对共引数据进行系统聚类分析,把共被引关系简化为一定数目的聚类,以可视化的形式直观地表达出来,进而揭示近年来我国图书馆学研究的主要领域。
1 数据来源和结果
1.1 数据来源
中国学术期刊全文数据库(CNKI)是目前全世界最大的中文期刊文献全文数据库,内容丰富,涵盖自然科学、工程技术、人文社科等各个学科领域。本文中的数据来自CNKI《中国引文数据库》,CNKI数据库实现了期刊、图书、论文、报纸类文献的引用文献和被引文献的链接,并且各类引用文献和被引文献的链接动态增长。引文数据库根据论文的被引频次,提供了涵盖各学科的高被引论文的列表,从中提取图书馆学研究领域70篇被引频次超过110次的论文作为本文的分析对象,检索日期为2011年4月21日。表1为按照被引频次由高到低排序的高被引论文统计表。
1.2 分析结果
在CNKI中国知网提供的论文链接文献网络图示中,选择“引证文献”,统计每一篇高被引论文的施引文献,统计数据涵盖了中文期刊全文数据库、中国博士论文数据库、中国优秀硕士论文数据库与全国重要会议论文数据库这4个数据库。这些施引文献是被引论文研究工作的继续、应用、发展或者评价,是相关研究的后续发展,反映了科学知识和情报内容的继承和利用。下载这些引证文献的题录信息,保存在Excel文件中,然后利用基于VBA编写的程序,统计高频被引文献两两之间的同被引次数,得到高被引论文的原始共被引矩阵,共引矩阵中对角线数据为对应论文的总被引次数,其它数据В锚i,j为相对应的论文i和论文j共被引的次数。删去矩阵中每行(列)非零项过少的行(列)所对应的论文,最后剩余56篇论文,构成56×56的共被引矩阵,原始共被引矩阵的部分如表1所示。为了消除各论文在被引频次上的绝对差异造成的影响,利用Ochiia系数把原始共被引矩阵进行归一化处理。归一化矩阵的元素В岐i,j=ci,jci,icj,j其中,В岐i,j是归一化矩阵中数据,В悛i,j是原始共被引矩阵中的元素,В悛i,iАⅹВ悛j,jХ直鹗锹畚莫i和论文j各自被引用的总频次。把归一化的共被引矩阵,利用SPSS16.0软件,选取平方欧式距离(Squared Euclidean distance)作为相似度测度,利用组间平均链锁(Between-groups linkage)进行系统聚类。聚类结果见图2。
1.2.1 数字图书馆
数字技术的迅速发展促使传统图书馆向数字图书馆演变,从20世纪90年代美国国家信息基础设施计划实施至今,数字图书馆的理论和技术一直受到国内外学者的广泛关注。我国的数字图书馆研究从1999年开始升温,此后一直是图书馆学研究中的重中之重,研究内容主要涉及:数字图书馆信息资源建设、信息资源共享、数字资源的整合与存储、知识产权、网络服务等方面。随着研究的深入,数据挖掘和元数据开发在数字图书馆中的应用方面,个性化信息服务研究,数字图书馆建设和服务量化评价指标体系成为热点问题。
1.2.2 网络信息资源研究
网络信息资源已经成为信息资源中重要的组成部分,对网络信息资源的研究成为跨学科领域的研究热点,图书馆学情报学关注的的重点在于:网络信息资源的组织、开发整合、图书馆网络信息资源建设;网络信息资源评价;网络信息资源检索;网络信息资源保存;尤其是网络信息计量学得到迅速发展。
1.2.3 用户服务
用户服务是图书馆社会功能作用于社会的具体形式,是图书馆社会职能和社会价值的社会表达和社会实现过程,也是图书馆一切工作和图书馆学全部理论的最终归宿。用户服务研究始终是图书馆学研究的重点,以图书馆现代化建设的实践为基础,图书馆服务方式、服务内容的拓展和延伸是关注的重要问题,网络环境下的信息服务以及如何从信息服务走向知识服务成为研究的热点。
1.2.4 知识管理
知识管理的概念产生于20世纪90年代,目前,已经成为许多领域关注的热门主题之一。我国图书馆知识管理研究,主要是结合图书馆学、情报学的教育背景和从业经验,围绕知识管理是对信息资源的管理展开。关注的问题主要集中于:运用知识管理对图书馆知识进行整合管理;包括对显性知识的序化和对隐性知识的发掘。知识管理的最终目的是用知识管理的理念指导图书馆服务,从各种显性和隐性信息资源中,提炼出人们需求的知识并提供服务,从而实现面向用户的知识服务。
1.2.5 图书馆2.0
图书馆2.0强调以用户为中心,服务创新和用户参与,参与、合作、创新、共享是图书馆2.0的核心理念。对图书馆2.0的研究集中于:图书馆2.0的概念、理念和原则的介绍以及Web2.0相关技术在图书馆服务中的一些具体应用。
1.2.6 学科馆员制度
从1998年起,我国高校图书馆开始实行学科馆员制度,经过十几年的发展,已经在很多高校图书馆得到实践。随着实践活动的逐步展开与深化,学科馆员服务模式、演进及发展方向成为研究的重点。在制度建设方面,对学科馆员服务质量评价、服务评价指标体系的构建成为研究的重点。
1.2.7 复合图书馆
Rusbridge认为复合图书馆是传统图书馆与数字图书馆之间的过渡形态,是二者的有机结合,我国对复合图书馆的研究主要集中在:复合图书馆资源建设及评价研究、信息资源整合、发展模式、复合图书馆个性化信息服务以及发展策略。图2 系统聚类树状图
1.2.8 信息素质教育
信息素质是指判断何时需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。进行信息素质教育是图书馆的教育职能的体现,图书馆界对信息素质教育研究的主题包括:信息素质教育与图书馆的关系、信息素质教育的内容与方法、信息素质教育存在的问题、信息素质教育的创新和信息素质评价研究。
2 结 论
通过高频被引论文的聚类分析,得出了10年来我国图书馆学关注的8个主要领域:数字图书馆、网络信息资源研究、用户服务、知识管理、图书馆2.0、学科馆员、复合图书馆、信息素质教育。分析结果与我国图书馆学研究的实际状况比较符合。本研究的不足之处在于:(1)由于聚类分析的局限性,有些类团不能有效生成[14],表现在聚类结果中就比较孤立,比如开放存取、文献资源共享、图书馆管理等;(2)由于引用的动机复杂、引用深度不同,目前,还没有办法对引用动机和引用深度进行量化分析,该研究假设被引用是基于科学研究的正面引用;(3)已发表论文的被引频次随发表时间的延长而增加,所以本研究中的高频被引论文的发表时间主要集中在2001-2006年度,这也是引文分析滞后性的体现,基于高被引论文的共被引分析对于纵览一段时间内学科主要研究领域是有效的。而在揭示当前的研究热点方面,对最近发表的高频被引论文进行分析或者利用共词分析方法对论文关键词聚类分析无疑更有意义。
参考文献
[1]邱均平.信息计量学[M].武汉:武汉大学出版社,2007.
[2]刘俊婉.杰出科学家论文影响力的社会年龄分析[J].情报学报,2010,29(1):121-127.
[3]刘则渊,等.科学知识图谱:方法与应用[M].北京:人民出版社,2008.
[4]马费成,等.我国情报学研究分析:以ACA为方法[J].情报学报,2006,25(3):259-268.
[5]邱均平,等.网络环境下ACA方法的应用研究[J].图书情报工作,2008,(2):85-87.
[6]赵勇,沙勇忠.当代情报学研究的知识图谱:基于ACA的分析[J].图书馆论坛,2008,28(6):63-69.
[7]路红,等.基于著者同引分析的组织行为学研究知识地图绘制[J].科技进步与对策,2010(1):140-144.
[8]邓中华,等.国内网络信息计量学研究的作者共被引分析[J].中国科技资源导刊,2008,40(4):40-44.
[9]秦长江.基于期刊共引分析法的学科关系知识图谱的实证研究[J].现代情报,2010,30(5):9-11.
[10]赵勇.期刊共引分析及可视化实证研究——以图书情报学研究为例[J].图书与情报,2009,(3):89-94.
[11]邱均平,等.期刊同被引的实证计量研究[J].情报科学,2008.
[12]徐剑,中国新闻传播学高被引论文分析——基于CSSCI、CNKI两个主流引文数据库的研究[J].上海交通大学学报:哲学社会科学版,2009,17(1):63-70.
[13]孔春苗.基于高被引论文的中国档案学研究现状分析[J].档案管理,2010,(3):540-56.
[14] 李佳.共词聚类分析法中的主要问题与对策[J].情报学报,2010,29(4):614-617.