信息开放获取研究的知识基础与研究热点探析
2011-11-17周金侠
〔摘要〕文章利用当前最著名的可视化分析软件Citespace II对从SCI与SSCI中下载的1988-2010年间信息开放获取研究的全部文献做了详细的量化可视分析,绘制了信息开放获取研究文献的共引网络图谱,分析了关键节点文献,探讨了信息开放获取研究的知识基础,揭示了其研究热点的变化情况以及信息开放获取运动在有关国家与研究机构的开展情况。
〔关键词〕信息;开放获取;Citespace II;共引网络图谱
收稿日期:2011-03-11
作者简介:周金侠(1965-),女,馆员,研究方向:图书馆学,文献计量学,发表论文数篇。
DOI:10.3969/j.issn.1008-0821.2011.06.030
〔中图分类号〕G255.76 〔文献标识码〕A 〔文章编号〕1008-0821(2011)06-0118-05
Study on the Epistemological Foundation and Hot Spots of
Researches Acquired through Publically Accessed Information
Zhou Jinxia
(Library,Hebei Normal University of Science and Technology,Changli 066600,China)
〔Abstract〕The article,using the most notable visualizing software Citespace II,made a quantitative and visualized analysis of the academic literature from SCI and SSCI published between 1988 and 2010 and downloaded from publically accessed resources.Based on the analyses,it described a web atlas of co-references,analyzed the literature on the key nodes and explored the epistemological foundation of researches based on the publically accessed information.The author depicted the pattern of change in hot spots of research and the status quo of public acquisition of information in some countries and research institutions.
〔Key words〕information;public acquisition;Citespace II;web atlas of co-references
开放获取(Open Access,简称OA)是指在网络范围内任何人都可以免费的、及时的、永久的、全文的联机获取数字科技与学术资料。开放获取意味着任何用户在任何地方,都可以利用因特网链接、阅读、下载、存储、打印、使用和数据挖掘这篇文章的数字内容。开放获取的文章通常具有有限的版权和许可限制[1]。开放获取思想迎合了网络时代信息交流的特点,开创了一种新的、高效的交流模式[2],也是国际科技界、学术界、出版界、图书馆界为打破商业出版者对科学研究信息的垄断和暴利经营而采取的推动科研成果通过Internet免费、自由地利用的运动[3]。为了全面了解信息开放获取研究的学科基础与研究热点,本文拟用文献量化可视分析的方法,对信息开放获取研究的文献进行研究,以期有益于我国信息开放获取运动的发展。
1 数据来源与分析工具
1.1 数据来源
本文以美国Thomson.ISI最著名的引文索引数据库SCI网络版——Web of Science中的科学引文索引扩展版(Science Citation Index Expanded)和SSCI(Social Science Citation Index)数据库为文献来源。检索方法选定为高级检索,检索式为:“TS=information open access”。检索年限设定为“所有年份”,其中文献类型设定为“Article”,共计1 124条记录符合条件。数据下载的方式设定为“作者、标题、来源出版物、摘要以及所引用的参考文献”,数据下载格式为“TXT”,结束的时间为2010年7月14日。
1.2 分析工具
本文使用的分析工具是基于JAVA平台的CiteSpace II,版本号为2.2.R7。CiteSpace II是由美国费城德雷克塞尔大学(Drexe1)信息科学与技术学院的陈超美博士开发。Citespace II可用于探测和分析学科研究前沿的变化趋势以及研究前沿与其知识基础之间、不同研究前沿之间的相互关系。通过对文献信息的可视化,能够较为直观地识别学科前沿的演进路径及学科领域的经典基础文献。同时,选择机构共现分析,可以得到基于研究机构共现的机构合作网络图谱,实现对某技术研究领域中研究机构合作情况的可视化分析[4]。
2 分析研究
将下载的文献记录数据全部导入Citespace II软件中,然后进行相关选项的设定。首先设置时间,本文检索年限为1988-2010年共计22年,设定时间跨度为5年,这样就形成5个时间段。其次设定c、cc、ccv(其中c为文献被引频次;cc为2篇文献的共引频次;ccv为文献的共引系数)的阈值为3、3、20,选定路径搜索(pathfinder)算法。最后依据分析研究的需要,选定相应的网络节点。
2.1 信息开放获取研究的知识基础
将网络节点设定为分类(category),主题词来源设定为文献标题、文摘、描述符(descriptor)3种,主题词设定为名词短语(noun phrase),然后运行Citespace II,不仅可以看到输出网络所涵盖的节点与连接线数,同时也可得到信息开放获取研究文献的共引知识学科网络图谱,见图1。
图1 信息开放获取研究文献的共引知识学科网络图谱
从图1可以看出,信息开放获取的知识基础非常广泛,其研究领域也是众多学科的交叉点。通过对全部数据进行量化统计分析发现,全部文献记录来源近百个学科,其主要学科来源见表1。
表1 信息开放获取研究文献的主要知识基础分布表
续表1
从表1可以看出,信息开放获取研究文献主要来源于信息科学与图书馆学,占全部文献的16.18%;其次是计算机科学与信息系统、工程与电气电子科学,二者占全部文献的20.70%。计算机应用、公共环境科学、生物化学与分子生物学、电信、医药科学、生物技术与应用微生物学、保健科学与服务、软件工程、计算机理论与方法、管理科学、人工智能等近百个学科的文献占63.12%。因此,从信息计量学角度看,信息开放获取研究领域有着非常显著的学科交叉属性,信息科学与图书馆学、计算机科学与信息系统、工程与电气电子构成了信息开放获取研究的学科知识基础的核心。
2.2 研究热点的分析
随着时间的推移,科学文献的内容会逐渐变得陈旧过时。而研究内容的陈旧过时,具体体现在代表该研究内容的词汇或短语出现的次数的变化[5]。由于CiteSpaceⅡ软件所调用的主题词(Terms)全部来源于SCI—E与SSCI数据记录中的题名(Titles)、摘要(Abstracts)、标识符(identifier)和描述符(descriptor),其完全可以用于表征该文献的内容。因此,笔者将网络节点设定为关键词(keyword),结合软件自带的涌现检测算法(burst detection algorithm),然后运行Citespace II,绘制出1988-2010年各年度的研究主题变化的时区可视图谱,见图2。
图2 信息开放获取研究文献主题变化的时区分布图
在此基础上,使用CiteSpaceⅡ自带的聚类软件对全部主题词进行Expectation Maximization简称(EM)聚类,最后得到了全部主题词的年度变化分布表,限于篇幅,这里只给出比较重要的部分,在表2中详细列出了1988-2010年各年度重要主题词变化的详细信息,如主题词、词频与中心度等关键指标的数值。
表2 各年度研究主题变化表
续表2
导出的全部主题词分布表列出了1988-2010年各年度主题词的中心度与词频及其详细的变化情况。从表中可以看出1988-1997年间没有出现热点主题词,此阶段为信息开放获取运动的萌芽期。1998年热点主题词主要是信息与教育;1999年是万维网;2000年为信息检索;2001年主要是互联网(词频52,中心度0.65)与数据库;2002-2003年没有突现的主题词;2004-2005年热点主题词主要是局域网、信息技术、信息共享等。此阶段(1998-2005年)是信息开放获取运动的成长期。从2006年起,开放获取(open access)开始成为热点主题(词频30,中心度0.22)并持续至今,伴之出现的热点主题还有数字图书馆、开源计算机软件、信息系统、电子期刊、开放访问数据库、多媒体检索等等,这表明开放获取运动得到了越来越多的行业和人们的支持,众多的科学研究资助机构、科学家及其组织、图书馆、期刊编辑出版机构与国际合作组织都已成为开放获取运动的中坚力量[3],此阶段(2006-)为开放获取运动的蓬勃发展期。研究文献的主题词变化比较准确地反映了信息开放获取研究运动中研究热点的演进情况,而开放获取文献研究主题的演进轨迹,与开放获取发展史大事记[6]高度吻合。
归根到底,开放存取运动的蓬勃兴起缘于学术成果交流的需要。对学术作者而言,需要获得更多的潜在读者;对读者而言,需要免费在线取得研究文献,无须面对合理使用的争议或可能侵权的担忧;对科学家或学者而言,借助开放存取则能加速科学研究。
2.3 信息开放获取研究文献的国家分布
在利用CiteSpaceⅡ进行数据分析时,将网络节点分别设置成“Country”和“Institution”,然后加以运行即可得到有关国家与研究机构在信息开放获取研究与发展中的实力分布情况,见表3。
表3 国家与研究机构实力分布情况
从表3中可以清晰地看出在信息开放获取研究与实践领域中,美国具有绝对的优势,被引频度高达121次,远远超过其它国家,独占首位。在排位前十五的研究机构中,有美国哈佛大学、威斯康星大学、加州大学等8所大学出现;英国虽然远逊于美国,但明显超出其它国家很多,被引频度为49次,位居第二。有南安普顿大学(在研究机构中排名第一)、伦敦大学帝国理工学院与谢菲尔德大学进入研究机构前十五名;德国、加拿大相差无几,排在英国之后,并列第三。加拿大有两所大学入围研究机构前十五名,德国则没有。后面依次为法国、意大利、澳大利亚、日本、瑞士、苏格兰、中国、南非、芬兰、以色列和墨西哥。由此可见信息开放获取研究文献的国家与研究机构分布状况,在一定程度上反映了开放获取运动在各个国家推广程度[7]。
3 讨 论
(1)信息开放获取运动正在创造着新的学术交流机制、新的科学研究态势和新的社会知识传播模式,已经对图书馆、科技机构、科学交流和社会知识传播的责任内涵、发展机制和运作政策带来重要影响。同时,开放获取的内涵也在不断扩展,从最初只关注期刊论文,到后来将科学数据纳入开放获取的对象,强调借助互联网对学术信息的免费获取和合理使用。而现在开放获取又把开放教育资源、开放教育系统和开放教育过程纳入其中。这样的扩展不仅是由于越来越多的资源类型能够通过网络被开放利用,而且反映了“开放”本身对教育过程和知识创造、信息交流模式的影响,反映了人们对知识传播过程的理解与深化。信息资源(论文或者数据)的开放获取仅仅是第一步[8](尽管是很重要的一步),更为广泛的信息资源与科研过程的开放,将为科学技术进步的带来强大的助推力。
(2)开放获取的正式提出,始于2002年的《布达佩斯开放获取计划》,该计划提出了推动科技文献的开放获取。2003年10月召开的柏林会议,在继承《布达佩斯开放获取计划》的基础上通过了《关于自然科学与人文科学知识的开放获取的柏林宣言》。《柏林宣言》扩大了开放获取资源的范围,将经科学界认可的人类知识和文化遗产的综合性信息资源,包括原始的科研论文、数据和元数据、参考资料、照片和图表、学术类多媒体资源等统统纳入开放获取的范畴,也得到了全球科技界的积极拥护。2004年5月,中国科学院院长路甬祥和国家自然科学基金委主任陈宜瑜分别代表中国科学院和国家自然科学基金委签署了《柏林宣言》[9]。截止2008年9月,已经有包括德国马普学会、印度科学院、瑞士科学院、捷克科学院、荷兰科学研究局、瑞士科学基金会、奥地利科学基金会、捷克科学基金会、欧洲地球科学协会、WikeMedia基金会等250多家机构签署了柏林宣言。由于世界各国的图书情报机构、科技资助机构、科学家团体和科研教育机构等不断建立支持开放获取的政策机制,积极推出支持开放获取的各种工具,使得开放获取成为科学研究与文献信息服务的重要组成部分。
(3)信息开放获取运动的研究与实践工作在我国起步较晚,虽然近几年发展比较迅速,但仍然明显落后于英、美等发达国家,而且从研究机构排名情况来看,还没有一个国内研究机构能够凭借自己研究团队的实力而进入世界前列。国外开放获取运动的发展经验表明,政府引导作用的发挥对开放获取运动的发展壮大起着决定性推动作用。反过来,开放获取运动的发展又可成为一个国家经济持续发展的永久推动力,美国开放获取运动发展历程即佐证了这一点。政府引导作用的缺失是我国开放获取运动无法向深层次、实践性阶段推进的主要原因[10]。我国是发展中国家,国力有限,国内外学术出版物价格的上涨严重影响了有价值信息的获取成本,进而阻碍了国内学者科研水平的提高。
参考文献
[1]黄凯文,刘芳,曾强.科学信息“开放获取”资源的开发与利用[J].情报杂志,2006,(8):114-116.
[2]东方.“开放获取”:信息交流新模式[J].中国信息导报,2006,(1):48-50.
[3]肖冬梅.开放存取运动蓬勃兴起的原因何在[J].图书情报工作,2006,50(5):128-131.
[4]Chen chaomei,CiteSpace II:Detecting and Visualizing Eme~ing Trends and TrarLsient Patterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology,2005,57(3):359-377.
[5]高继平,丁.专利研究文献的可视化分析[J].情报杂志,2009,28(7):12-16.
[6]Alma Swan.开放获取发展史大事记[J].刘兰编,译.图书情报工作动态,2007,(10):1-5.
[7]张小莉.论开放获取及其社会影响[D].南京理工大学,2008.
[8]http://www.berlin8.org/cn-default.aspx?view=content/article&id;=16&miid;=22[EB].2010-07-25.
[9]http://www.cas.cn/jzd/jgjjl/gjjlzt/zgkxy/xwbd/200405/t20040524z1714458.shtml[EB].2010-07-25.
[10]喻丽.我国开放获取研究现状分析[J].图书馆,2008,(6):47-49.