基于CiteSpaceⅡ的国际图情领域信息共享研究可视化分析❋
2013-08-21谢阳群
李 阳 谢 笑 谢阳群
(1.安徽大学管理学院 安徽合肥 230601;2.武汉大学信息管理学院 湖北武汉 430072;3.淮北师范大学 安徽淮北 235000)
信息行为包涵信息需求、信息搜集、信息传递、信息评价等,组织氛围下的信息行为会促进组织内部信息共享行为的产生,信息共享是指不同层次不同部门之间的信息交流,即在一定条件下将资源与他人共同分享以达到信息资源的合理分配与利用。尽管信息共享的重要性已经被大多数人所接受,但在实际操作过程中经常不受组织内部重视,Constant等在1994年提出信息共享理论,并发现组织因素与个人因素共同影响个人信息共享态度。〔1〕Kolekofski从理性行为理论(Theory of Reasoned Action,TRA)出发,认为信息共享受组织内部个体信任、态度等因素的影响并最终会反馈到个人自身信息行为上。〔2〕组织内部的信息共享程度与组织绩效关系密切,通过大量文献调研我们发现目前国内对信息共享的研究大多是基于供应链管理条件,且研究大多数是在应用层次,而对信息共享其他领域内的研究相对较少。信息共享属于群体信息管理(GIM,Group Information Management)领域的内容,是个人信息管理(PIM,Personal Information Management)的重要分支,个人信息如何在公共领域达到共享是图情领域信息共享需要解决的问题。〔3〕近些年来国内对个人信息管理的研究已经逐渐成熟,但对如差错信息、差错报告等信息共享领域尚未提及,而国内对信息共享的研究更多的是转移到对知识共享的研究上,导致信息共享没有形成系统的研究,国内学者姜永常曾对信息服务与知识服务的区别和联系做了理论上的分析,并认为国内对知识服务与信息服务的关系有一些模糊的认识,〔4〕本文在对国际图情领域信息共享研究文献统计分析的基础上,通过运用CiteSpaceⅡ软件从信息共享的研究前沿、知识基础等方面对国际图情领域信息共享作可视化分析,希望对信息服务在未来的发展有一定借鉴意义。
1 数据来源与研究方法
1.1 数据来源
本文以ISI(美国科学信息研究所)出版的Web of science数据库为来源,WOS数据库收集了世界范围内最具影响力的8000多种期刊,这为我们更加科学准确性地得出研究结果提供了极大便利,以“information sharing”为主题词进行检索,为了更加系统对信息共享研究做可视化分析,我们选取近20年来的研究文献作为分析数据来源,检索时间为2012年11月26日,时间跨度为1992-2012 年,引文数据库包括SCI-EXPANDED,SSCI,CPCI-S以及CPCI-SSH,检索出文献一共33206篇,进一步筛选设置学科类别为“Information science library science”,限定文献类型为期刊论文(article),会议论文(proceedings paper)和综述(review)三种,语言为英语,精炼后的有效文献数据为1818篇(见表1),再对1818篇的文献数据进行输出,输出记录设定为全记录,并包括摘要和引用的参考文献,最后以文本文档形式保存在拟用研究的文件夹里。
表1 数据来源
1.2 研究方法
近些年来国内掀起了科学知识图谱研究学科领域研究前沿和热点的浪潮,〔5〕本文沿用这一方法,运用美国知名学者陈超美教授开发的CiteSpaceⅡ信息可视化软件,〔6〕该软件可以直观地反映学科领域科学前沿热点以及知识基础,研究前沿在CiteSpaceⅡ软件中以突变词检测方法来确定,是指临时形成的学科领域研究的概念组合,代表着一个领域内的研究现状;而知识基础是由共引聚类来确定,通过共引网络来反映出研究前沿的知识基础,包括经典文献、过度文献等。〔7〕本文运用网络版CiteSpace3.1.R3版本,在对相关参数进行适当调整的基础上,采用关键词聚类、膨胀词探测等方法对国际图情领域信息共享研究的研究前沿和知识基础做了可视化分析,通过国家(地区)及机构分布合作分析来了解国际图情领域信息共享研究的基本合作情况;通过关键词共现分析来确定国际图情领域信息共享研究的研究热点;通过文献共引分析来确定国际图情领域信息共享研究的知识基础;通过突变词算法来分析国际图情领域信息共享研究的前沿趋势;以此几个方面来分析揭示该领域的发展状况。
2 研究现状
本文对国际图情领域信息共享文献进行信息计量统计,以便了解该领域研究的基本情况。文献信息量统计是科学基础理论研究的一个重要环节,一定程度上反映出该学科领域的研究热度,通过表2和图1我们可以看出1992-2012年国际图情领域关于信息共享的研究文献总体呈增长趋势,并且到2004年之后达到一个高峰期(2012年数据不完整,暂不做详细分析)。
表2 文献信息量统计情况
图1 国际图情领域信息共享研究文献增长趋势
从引文情况来看,1818篇论文被引频次总计8454次,去除自引的被引频次总计7893次,施引文献为6664个,去除自引的施引文献为6357个,每项平均引用次数为4.65,其中h-index值为41,即有41篇论文至少被引用41次。每年的引文数情况如表3图2所示,我们可以看出关于信息共享的研究文献呈增长趋势,并在2004年之后达到高峰期,这与上述的年文献总量有密切关系。
表3 引文情况统计表
图2 国际图情领域信息共享研究文献年引文数增长趋势
3 知识图谱可视化分析
3.1 国家(地区)及机构分析
表4 主要参数设置
CiteSpaceⅡ可通过“年轮”的厚度和颜色深浅来区分国家(地区)及机构分布情况,〔8〕在可视化分析前,我们需要对一些参数进行设置,具体如表4所示,将整个20年的数据分为20片,并将阀值设置为Top30,即出现频次最高的30个字,最后将网络节点类型(Node Types)设置为国家(Country)和机构(Institution),即可得出图3的分布合作图。
从输出结果来看,总共有410个网络节点(Nodes),302条连线(Links),节点越大表示出现的频次越多,连线越多表示彼此之间的合作越密切,图3可以看出,国际图情领域信息共享研究合作总体比较分散,很多都是孤立的点,没有形成一个良好的合作系统。研读图3的知识图谱相关数据,我们可以得出以下结论:
从国家发文量来看,美国以619篇排在首位,中心度达0.45,遥遥领先于其他国家,说明美国在图情领域信息共享研究上处于领军地位,英国以133篇位居第二,中国排在第三位,总共发表相关论文113篇,还有一些国家(或地区)如加拿大86篇,台湾地区56篇,澳大利亚50篇等,这些地区是该领域内的主要研究阵地,论文产出占总数的近60%;从机构发文量来看,印第安纳大学(美)、北卡罗来纳大学(美)、南洋理工大学(新加坡)皆以23篇位居前列,其他还有一些机构也较突出,如宾州州立大学(美)21篇、华盛顿大学(美)19篇、密歇根大学(美)18篇。可以看出,高校是图情领域信息共享研究的主要机构,而这些机构主要集中在美国,其他国家只有个别机构做过该领域的研究。
从国家(地区)的合作来看,总体合作状况较差,内部合作相比外部合作要多,一定程度上符合马太效应特点,即只有少部分国家(地区)研究文献较多并且展开内部合作研究(其中美国表现尤为明显),其他较少国家(地区)文献较少且缺乏合作。从图3可以看出,美国、英国、中国、新加坡、加拿大、荷兰、德国、韩国这几个国家之间合作相对较多,这与发文量有一定关系;从机构合作来看密歇根大学、加利福利亚大学在网络节点上最为突出,与其他机构的协作关系相对较高。
3.2 研究热点分析
图3 国家(地区)及机构分布合作图
图4 关键词知识图谱
对文献题录中的关键词进行分析可以确定一个领域内的研究热点,将网络节点类型(Node Types)设置为关键词(Keyword),其他参数同上,运行CiteSpaceⅡ并以Cluster View标准方式显示可以得出图4的结果,共有423个节点,480条连线,图中“年轮”的颜色和厚度分别表示关键词出现的时间和数量,每个节点分别表示一个关键词,节点的大小表示关键词出现的频次,节点之间的连线越粗表示关键词之间的共现越高,另外,关键词的中心度在图中主要通过紫色圈圈表示出来。〔9〕研读图4我们可以得出排名前十的高频关键词和高中心度关键词,如表5和表6所示。从图4、表5和表6我们可以看出,所有研究文献中出现频次最高的关键词是知识管理(knowledge management),频次为
表5 高频关键词
表6 高中心度关键词
151次,其次是信息(information)、管理(management)、知识共享(knowledge sharing)。信息共享属于管理学科并以信息为原材料,所以“信息”与“管理”出现频次偏高毋庸置疑,知识管理与知识共享这些高频词主要是在知识管理方向研究文献中出现,由于知识不会凭空产生,在研究知识发展规律时必定会对信息进行深入探讨,信息与知识的内在联系决定了他们彼此互相依托互相促进。系统(systems)、技术(technology)、性能(performance)、模型(model)、网络(internet)、信息技术(information technology)这些高频词主要基于计算机技术来探讨信息共享问题,它们是信息共享在网络应用上的研究集群。中心度是社会网络分析理论中的词汇,一定程度上能够反映出某节点与其它节点之间的联系在整个网络中的地位与作用,从高中心度关键词来看,数字图书馆(digital libraries)、高校图书馆(university libraries)、文献(documentation)这三个关键词是前十位高频关键词中没有出现过的,这些关键词的研究文献主要是对信息共享在图书馆文献信息网络系统的应用上做了相关研究,这也是信息共享领域的一个研究热点。从图中我们还可以看出,信息共享的研究在其他领域也有所进展,如健康管理(health care)、信息行为(behavior)、信息架构(framework)等,它们都是信息共享理论在其他领域内的应用。
3.3 知识基础分析
知识基础可以反映出研究前沿术语词汇的文献引文在科学文献中的利用情况,一定程度上可以反映学科领域前沿的本质,在CiteSpaceⅡ中主要通过同被引聚类分析来完成,将网络节点类型设置为参考文献(Cited Reference),运行CiteSpaceⅡ调整相关系数并以Cluster View标准方式显示可以得出图5的结果,共有467个节点,1763条连线,研读图5并综合考虑文献被引频次以及中心度我们可以得出信息共享领域内的7个经典文献,如表7所示。
图5 文献共被引知识图谱
表7 高被引作者及其经典文献
从表7我们可以看出,日本学者Nonaka等所著的《知识创造企业:日本企业如何动态创新》被引频次最高。该书主要探讨了日本企业发展成功的部分经验,指出知识在企业发展中的重要作用,作者从认识论角度分析了个人层次以及组织层次的信息共享问题,认为这种信息共享可以通过知识创造和交流的方式实现,组织学习是组织发展的重要环节,Nonaka在解释知识创造的过程中还指出显性知识和隐性知识的产生方式以及影响效度不同,并为个体向组织共享显性以及隐性知识的流程提供了案例参考。〔10〕Alavi等在《知识管理与知识管理系统:基本概念以及研究问题探讨》中系统地介绍了知识管理以及知识管理系统的相关内容以及架构模式,分别从理论研究以及应用工具两个方面阐述了组织知识管理流程,并认为信息技术影响组织内部信息交流以及组织知识管理战略的制定。〔11〕Devenport等所著的《工作知识:组织如何管理他们所拥有的知识》中通过案例研究了目前组织知识管理的一些突出问题,并认为知识是组织在竞争中处于优势地位的保证,组织建立信任的关键在于提供一个良好的组织氛围以鼓励员工积极参与组织知识改造与创新。〔12〕Fornell等在《用不可测变量和测量误差来评估结构方程模型》一文中通过建立结构模型、测量模型等提供了一种新的样本评价方法,并认为统计结果解释必须符合研究目的,这种方法在后来的信息计量类论文中被广泛应用。〔13〕Wasko等在其文章《我为什么要分享?探索电子网络实践环境下的社会资本和知识贡献》中研究了网络环境中个体与其他陌生对象交流的障碍问题,通过实证说明社会资本对电子网络环境知识贡献的影响,而在这种社会资本变量中加入了个体行为因素,该方法被广泛应用于研究电子商务以及电子政务的公共服务问题。〔14〕Grant在《对于一个企业的知识基础型理论》中指出组织最重要的角色不是知识创造而应该是知识应用,企业应当在生产服务过程中更加重视对知识的应用。〔15〕Nahapiet在《社会资本、智力资本与组织优势》中认为企业社会资本是通过关系网络来获得的,它具有信息、凝聚以及节约交易费用几大功能,作者认为社会资本可以为组织决策提供关键性信息,通过一定渠道可以促进组织内部信息沟通,加强内部信息共享程度。〔16〕上述七篇经典文献主要涉及了知识共享、信息沟通、社会资本、电子网络服务、社会关系等多个领域,我们可以看出知识方向的文献最多,说明知识要素在信息共享研究中占据着重要地位,这些文献都给信息共享的研究提供了重要的理论支持。
3.4 发展趋势分析
CiteSpaceⅡ具有的突变检测功能可以用来探测一个领域的研究前沿,通过考察频率变化较高的词的变动趋势来确定一个领域的发展趋势。〔17〕本文通过对信息共享领域文献关键词的突变情况来确定其研究前沿,在CiteSpaceⅡ将网络节点类型设置为关键词(Keyword),并将“Term Type”选定为“Burst Terms”,调整相关参数并以时区视图(Timezone)的方式显示可以得出图6所示的知识图谱。
图6 信息共享领域发展趋势时区视图
研读图6并对所有的关键突变词进行分析,我们发现国际图情领域信息共享研究前沿可以归纳为五个方面,主要包括对计算机网络技术信息共享应用方向的研究、对图书馆领域信息共享方向的研究、对健康信息共享方向的研究、对信息行为影响信息共享意愿方向的研究、对信息公开共享方向的研究。
对计算机网络技术信息共享应用方向的研究主要是针对计算机网络技术的发展对信息交换、资源共享以及协同工作的影响,相关突变词主要包括网络资源(web resources)、基于可扩展标记语言(xml based)、可扩展标记语言模式(xml schema)、信息系统(information system)、信息技术(information technology)、Web 2.0 等。
对图书馆领域信息共享方向的研究主要对图书馆文献信息资源管理的研究,这给图书馆信息共享空间能够更好地开发利用提供了方向,相关突变词主要包括高校图书馆(university libraries)、联合目录(union catalogue)、数字图书馆(digital library)、文献配送(document supply)、灰色文献(gray literature)等。
对健康信息管理方向的研究主要包括建立健康信息共享档案,针对医疗差错信息报告处理问题制定标准等方面,相关突变词主要包括临床信息(clinical information)、医疗信息(medical information)、初级保健(primary care)等。
对信息行为影响信息共享意愿方向的研究主要是从心理学角度解释人类信息行为对信息传递等因素的影响,相关突变词主要包括第二人生(second life)、行为研究(action reasearch)、信息需求(information needs)、共同交流理解(shared understanding)、语境因素(contextual factors)等。
对信息公开共享方向的研究主要揭示了政府以及企业内外部信息共享的必要性,相关突变词主要包括公开获取(public access)、信息透明度(information transparency)、数据共享(data sharing)、信息专家(information professionals)、社会交换(social exchange)等。
以上五个方面构成了信息共享领域的研究前沿,是信息共享研究在各学科领域内的应用,为信息共享研究更全面更深入奠定了良好的基础。
4 总结
本文运用最新的可视化软件CiteSpaceⅡ对Web of science数据库中信息共享研究文献做了文献计量和可视化分析,通过绘制知识图谱分析了国际图情领域信息共享研究的相关知识基础、研究热点以及其发展趋势,可以得出以下结论:
第一,1992-2012年间国际图情领域信息共享研究文献发文量总体呈增长趋势,引文量也逐年增长,说明该领域逐渐被国内外学者所肯定,相关的学术研究也逐渐增多。
第二,借助CiteSpaceⅡ绘制的国家(地区)及机构合作分布知识图谱,我们发现该领域的研究主要以美国、英国、中国等大国为主,美国实力最强,其他国家亦有突出贡献,机构上密歇根大学、加利福尼亚大学等总共发文量较高,影响力较大,从合作角度来看,该领域总体合作不明显,主要以内部合作为主,存在马太效应。
第三,借助CiteSpaceⅡ绘制的关键词知识图谱,我们发现国际图情领域信息共享研究的研究热点主要包括知识管理、信息、知识共享、数字图书馆、模型等,还有一些如健康管理、信息行为、信息架构等也是新兴的研究热点。
第四,借助CiteSpaceⅡ绘制的文献共被引知识图谱,我们分析了国际图情领域信息共享研究的知识基础,并发现该领域的经典文献主要以研究知识要素为主。
第五,借助CiteSpaceⅡ绘制的发展趋势时区视图,我们发现该领域的研究前沿主要包括五个方面,它们是计算机网络技术信息共享应用研究、图书馆领域信息共享的研究、健康信息管理的研究、基于信息行为的信息共享意愿研究、信息公开共享的研究。
通过以上相关研究我们对国际图情领域信息共享研究有了初步了解,我们发现虽然选定的领域具有局限性,但信息共享方向的研究文献仍然呈现出高跨学科性,这说明该学科的拓展研究已取得一定成效,同时这也给未来信息服务方向提供了参考。
1.Constant D,Kiesler S,Sproull L.What's mine is ours,or is it?A study of attitudes about information sharing.Information Systems Research,1994(5):400-421
2.Kolekofski K E Jr,Heminger A R.Beliefs and attitudes affecting intentions to share information in an organizational setting.Information&Management,2003,40(6):521-532
3.谢笑,李晶,谢阳群.基于知识图谱的个人信息管理研究热点与前沿分析.情报杂志,2012,31(7):102-109
4.姜永常.论知识服务与信息服务.情报学报,2001,20(5):572-578
5.陈悦,刘则渊.悄然兴起的科学知识图谱.科学学研究,2005,23(2):149-154
6.Chen C.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature.Journal of the American Society for Information Science andTechnology,2006,57(3):359-377
7.陈超美,陈悦,侯剑华,梁永霞译.CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化.情报学报,2009,28(3):401-421
8.刘则渊等.科学知识图谱:方法与应用.北京:人民出版社,2008:31-38
9.刘军.社会网络分析导论.北京:社会科学文献出版社,2004:122
10.Ikujiro Nonaka,Takeuchi Hirotaka.The knowledge-creating company:how Japanese companies create the dynamics of innovation.New York:Oxford University Press,1995
11.Maryam Alavi,Dorothy E.Leidner.Knowledge management and knowledge management systems:conceptual foundations and research issues.MIS Quarterly,2001,25(1):107-136
12.Davenport T H,Prusak L.Working knowledge:how organizations manage what they know.Boston:Harvard Bussiness School Press,1998
13.Fornell C,David F L.Evaluating structural equation models with unobservable variables and measurement error.Journal of Marketing Research,1981,18(1):39-50
14.Wasko M M,Faraj S.Why should I share?Examining social capital and knowledge contribution in electronic networks of practice.MIS Quarterly,2005,29(1):35-57
15.Grant R M.Toward a knowledge-based theory of the firm.Strategic Management Journal,1996(17):109-122
16.Nahapiet J,Ghoshal S.Social capital,intellectual capital,and the organizational advantage.Academy of Management Review,1998,23(2):242-266
17.栾春娟,侯海燕,王贤文.国际科技政策研究热点与前沿的可视化分析.科学学研究,2009,127(2):240-243
猜你喜欢
——写在《图书与情报》“图情档青年学者专辑”出版之前