我国图书情报学视角下Web2.0研究热点演进趋势分析
2015-09-08朱春艳华薇娜
朱春艳 华薇娜
[摘要]十年积淀,大浪淘沙。从图书情报视角来看,Web2.0十年间经过怎样的发展和演进?为我国图书情报领域留下了什么?对图书情报学科的发展产生了哪些影响?文章采用因子分析、聚类分析及多维尺度分析等多元统计分析方法,挖掘了国内图书情报学视角下Web2.0研究现状,并以高频关键词的共词矩阵为基础,初步绘制了十年来Web2.0研究热点演进趋势的知识图谱,得出其主要研究领域是图书馆领域、信息服务领域、信息交流与社会网络、知识管理和用户行为等。
[关键词]Web2.0;因子分析;多维尺度分析;图书情报学;研究热点
DOI:10.8969/j.issn.1008-0821.2015.01.011
[中图分类号]G250 [文献标识码]A [文章编号]1008-0821(2015)01-0054-07
Web2.0到底是什么?自2004年O'Reilly媒体公司总裁兼CEO TimOReilly首次提出“Web2.0”概念以来,至今仍然没人能给出科学统一的界定。然而,不论是商业领域的概念炒作,还是互联网界的产业升级,亦或者是计算机领域的技术创新,事实上,Web2.0已在无声无息中给社会生活、互联网、科研活动等带来了强烈的冲击和巨大的变革,而以计算机科技为支撑的图书情报领域更是首当其冲。
早在Web2.0提出之前,我国图书情报界就有学者对此进行探索。2002年刘柏嵩在《新一代基于P2P的图书馆信息系统》中介绍了P2P网络的现状和特点,并给出将其应用在图书馆信息系统中的几种形式;随后,王敬稳等人于2003年撰文《“博客”现象及其对图书馆的启示》对博客的定义、类型、思想理念、运作模式和社会影响力做了详尽阐述,并总结了博客给图书馆的启示。随着“Web2.0”概念被明确提出,相关研究逐步兴起,经过数十年的发展,成果丰硕。十年积淀,大浪淘沙。从图书情报学视角来看,Web2.0经过了怎样的发展和演进?它为我国图书情报领域留下了什么?它对图书情报学科的发展产生了哪些影响或者在将来会继续产生什么影响?这将是本文所要探讨的。
1.数据来源与方法
1.1数据来源
以中国学术期刊网络出版总库(CNKI)为数据源,以篇名为检索项,以WFB2.0、BLOG、WIKI、RSS、SNS、P2P、IM、TAG、Folksonomy等及对应的中文翻译为检索词,将来源期刊限定在“图书情报与数字图书馆”学科,时间范围为2004-2013年,共检索文章2039篇;为保证数据的完整性和权威性,本文选定万方学术期刊全文数据库收录的《情报学报》作为补充数据源,检索策略与前所述一致,检索文章54篇。对所得结果进行内容分析,去除无关数据结果,如博客选萃、会议通知、电子标签方面论文等,最后得到有效文献2036篇(检索日期2014年2月13日)。
1.2研究方法
知识图谱是一种以科学知识为计量研究对象,将复杂的科学知识领域通过数据挖掘、信息处理、知识计量和图形绘制,以可视化技术描述科学知识的发展进程与结构,揭示知识及其活动规律,展现知识结构关系与演进规律。本文将综合运用知识图谱涉及的共词分析、聚类分析、多维尺度分析等方法,描绘我国图书情报学视角下Web2.0研究热点演进趋势。其中,共词分析是对一组关键词在同一篇文献出现的频次进行统计分析,进而揭示其所代表的研究方向和主题的结构关系,本文选取能揭示文献核心主题的高频关键词来分析该领域研究热点;聚类分析是采用聚类的计算方法,对共现的关键词词对的关联性进行运算,将关系密切的词聚集归类,以达到挖掘隐含信息的目的;多维尺度分析通过低维空间(通常是二维空间)以展示主题间的联系,并利用平面距离来反应主题间的相似度,高度相似性的主题聚集在一起,从而形成学科研究热点。
2.Web2.0研究热点演进趋势分析
2.1关键词共词矩阵的构建
统计2036篇有效文献,得到关键词7512个;合并同义不同形的词、集中相同研究主题的词、舍弃表述宽泛无实意的词,最后得到2013个关键词。进一步排除无实际意义的关键词后,选择词频不少于10次75个关键词作为分析的基础,详见表1。由表1可知,我国图书情报学视角下的Web2.0研究热点主要集中在图书馆、高校图书馆、数字图书馆等领域,对博客、微博、RSS、WIKI、TAG等技术的应用关注较多。根据遴选的75个高频词,本文借助TDA(Thomson Data Analyzer)软件构建75×75的共词矩阵,其中对角线上的数据表示关键词的出现频次,其他数据表示两个关键词在同一篇文章中共现的频次。
2.2因子分析
本文将2004-2013年共划分为5个时间段,每两年一个时间段,研究不同时间段里我国图书情报视角下Web2.0的研究热点以及十年间的演进趋势。
首先,对十年的数据进行因子分析。将75×75的关键词共词矩阵导人SPSS21.0中,转化为Spearman相关矩阵,选取主成分、相关性矩阵、最大方差法进行因子分析;75个高频关键词中有13个公共因子被提取,能够解释图书情报视角下Web2.0领域总信息的89.685%。根据数据挖掘理论,所提取的因子包括总信息的60%以上即可接受,因此提取4个及4个以上的公共因子都是合理的。依据以上分析,对十年间不同时段的高频关键词做因子分析,将因子的绝对值超过0.6的视为被接受,每个时间段各提出3-4个主成份,并将其界定为每个时间段中图书情报学界Web2.0的热点研究领域,详见表2。从总体上看,服务、RSS、博客等是Web2.0十年来研究热点,但我们也注意到从2010年开始,微博凭借发布便捷、管理方便、辐射面广等诸多优势逐步取代博客的地位,成为新的热点研究领域。
2.3关键词共现图谱
为了进行多维尺度分析,须将关键词共现矩阵转化为相异矩阵。本文选用Ochiia系数将共词矩阵转换成相似矩阵,具体算法为A、B两词的Ochiia系数=(A、B两词共现的频次)÷(A词出现的频次×B词出现的频次),得到相似矩阵;然后,将相似矩阵转化为相异矩阵,再导入SPSS21.0,利用多维尺度分析绘制Web2.0领域的知识图谱,然后通过聚类分析划分出不同的学术领域。按照2.1中划分的5个时间段,绘制每个时间段Web2.0研究热点知识图谱,再结合表2数据,从中探寻十年间Web2.0研究热点的演进趋势。endprint
(1)2004~2005年(图1),图书情报学界初涉Weh2.0,小试牛刀。Web2.0以用户参与为本质,以其开放性、真实性、自组织性、聚合性等特性与图书馆开放、参与、分享、创造的精神不谋而合,在数字图书馆建设的基础上,图书情报界引入RSS、博客、WIKI、即时通讯等技术,丰富了信息资源,提升了服务功能。
此阶段研究焦点在于引入技术、服务图书馆,具体来看有三大领域:a.图书馆基础服务研究,包括信息检索和数字图书馆功能等内容;b.信息服务模式和方法研究,介绍了RSS、信息推送、WIKI、QQ等特点、功能及其在图书馆中的应用;c.图书馆与用户交流方式研究,重点讨论在Web2.0环境下博客变革了传统参考咨询服务模式、改善了文献信息加工和信息导航、提升数字图书馆信息服务能力,基于此,博客在图书馆的应用是可行的;同时,博客精神激发用户的求知欲和表现欲,是有效的知识管理工具,有助于提高图书馆服务质量和管理效率;在图书馆不断运用博客服务读者的实践中,学者们也得到不少启示:博客更新的及时性、个性化、亲和力等是发挥其在图书馆与读者沟通交流作用的重要基础。
(2)2006-2007年(图2),Web2.0领域的研究内容得到进一步扩充和细分,主要体现在两个方面:第一,除了对P2P、RSS、WIKI以及博客等技术的深入研究外,还引入了TAG、Folksonomy、元数据等内容;第二,首次提出了Lib2.0概念,欲意将Web2.0与library进行深层次融合,以提升图书馆服务与管理水平。其中“图书馆2.0五定律”影响较为深远——图书馆2.0是以用户为中心的虚拟社区、图书馆没有障碍、图书馆无处不在、无缝的用户体验、永远的Beta版。此后,相关学者对图书馆2.0的理论研究、平台建设、规划与实施等开展了诸多讨论,强调在大力开展图书馆2.0建设的同时,不能忽视图书馆员自身素质的提高,逐步从图书馆员1.0过渡到图书馆员2.0。
在这一阶段,对Web2.0的研究分为三大领域:a.以图书馆为核心的研究,包括图书馆应用、高校图书馆、图书馆服务、图书馆网站、数字图书馆等,这是在第一阶段的基础上的延伸与扩展;b.信息服务模式仍然是研究热点,但研究内容在RSS、信息推送、WIKI基础上扩充了TAG、Folksonomy、xml、知识博客等。具有里程碑意义的是在2006年5月召开了第一届“Web2.0与信息服务”研讨会,会议以“创新=信息*交流2.0”为主题,旨在促进Web2.0技术应用于图书馆信息服务;c.信息交流与社会网络是这个时期新兴发展的领域。随着Web2.0技术的广泛推广,信息交流变得越来越便捷,信息传播、人际社会网络中的现象与规律也逐步引起图书情报学界的关注。
(3)2008-2009年(图3),Web2.0进入发展壮大时期,主要表现为发文量大幅增加,达到524篇,是上一阶段的两倍;其次,研究领域进一步分化,Web2.0与图书情报的结合不再局限于讨论博客、WIKI、TAG等技术在图书馆的应用,而是更为深入探讨各种技术在教学、管理、服务中的新运用,包括文献检索课、图书采访、网站设计、网络资源、图书馆管理、图书馆竞争情报服务、用户服务、信息共享空间等方面。研究者在理论探讨的基础上对日渐复杂的信息交流、学术交流和知识交流中更深的社会网络关系进行了大量的实证研究,将传统的引文分析法用于网络环境下的链接分析,分析博客之间信息交流行为和社会网络关系。
同时,知识管理也是学界关注的热点。从Web2.0的主体角度来看,知识管理主要集中研究个人知识管理和组织知识管理,后者包括企业、政府机构和事业单位等;从研究内容看,Web2.0环境下主体获取知识的模式、整理和存储知识的方式以及知识共享的途径等也引起研究者的重视n引。此外,知识管理系统和平台一直是关注的重点。值得一提的是王伟军教授团队较为系统研究了基于Web2.0环境下知识管理系统的构建、模型、框架等,该团队应用Web2.0的思想和技术,引入SOA技术构架,提出知识管理系统的知识表现层、服务层、逻辑层和存储层四层模型。
(4)2010-2011年(图4)是图书情报界研究Web2.0的稳步发展期,研究者在讨论各项技术应用与实践的同时,开始对已有的研究成果和实践应用进行梳理和分析,逐步注重对理论基础、发展机制、特征规律等的研究。
此阶段研究特点主要体现在两个方面:a.图书馆应用Web2.0技术提升服务仍然是研究主流,与以往不同的是研究者在借鉴国外经验的基础上,不断总结、反思国内现状,以求不断探索和完善。如杜玉玲等人通过对16个学科馆员博客进行实证调研,思考了推广学科馆员博客时应注意统一博客名称和挂靠点、及时更新、增设“博客推荐”栏目、链接学科师生博客等方面;王伟军等人以SSCI、CNKI收录的图书情报学领域期刊所载Web2.0相关论文以及2006-2010年度与Web2.0相关的基金项目为对象进行统计分析,总结Weh2.0关注热点领域有信息内容生成、信息组织与检索、信息交流与共享、信息服务、知识管理、网络伦理等方面,并指出应从研究视角、研究主题和应用领域3个方面对“Web2.0信息资源管理”进行深入探讨。b.信息服务进入新的发展阶段,强调服务创新、用户参与、个性化服务、学科服务、知识服务,并新引入微博、Twitter、本体等平台或技术,尤其是微博以门槛低、裂变式传播方式、即时通讯、信息交互性强、平民化等特点很快在图书情报界得到广泛应用。很多图书情报机构将微博用于信息推送、参考咨询、建立读者兴趣圈、个性化学科服务、内部学术园地;其中,新浪微博应用最为广泛,它的@功能与微博短信为参考咨询提供新的服务模式,微直播&微话题&微链接是宣传特色活动的完美组合,微媒体与微盘共存让在线读者培训成为现实,微群成为同好读者、同行交流的平台,微访谈为读者提供话语权,微应用让图书馆服务一切皆有可能。
(5)从Euclidean距离模型图来看,有关Web2.0的研究在2012-2013年(图5)间已逐步趋于融合,Web2.0的各项技术与理念已融入图书情报各领域。除了图书馆、信息服务、知识管理、信息交流与社会网络外,本阶段还分化出新的研究热点,即用户行为研究。
Web2.0环境下,用户的行为、需求和态度等都发生巨大变化;而对于信息服务机构而言,调研用户行为特征,对提高用户个性化服务质量、最大限度地满足用户的信息需求具有重要意义。基于此,研究者探讨了基于Web2.0的用户行为。用户信息行为主要包括信息检索行为、信息利用行为和信息发布行为。考虑到信息检索行为存在个体性差异,有研究者对不同群体如大学生、教师、医学生、青少年等的信息检索行为进行研究,分析影响用户检索行为的各种因素,进而优化检索系统;同时,协同信息检索行为也受到高度关注,韩毅教授的团队做了系统研究,他们沿用传统信息行为研究的社会方法学,通过实证方法验证和发现了“信息交流”与“语境”在合作查询与检索中的独特作用。用户产生内容(UGC)已成为一种重要的信息来源,基于此,信息发布行为将会成为Web2.0环境下研究用户行为的主要趋势之一。作为Web2.0环境下知识组织的一种新形式,有关百科词条用户贡献行为的研究开始受到关注,研究者以百度百科为例,分析词条创建者和词条编辑者的行为,发现用户在共现过程中呈集中与分散趋势、共现无偏好性。
3.结论
2004-2013年间,国内图书情报视角的Web2.0研究总体上形成了五大研究领域:(1)基于Web2.0的图书馆领域的研究;(2)基于Web2.0的信息服务研究;(3)基于Web2.0的信息交流与社会网络研究;(4)基于Web2.0的知识管理研究;(5)基于Web2.0的用户行为研究。其间各个领域不断地交叉、融合、分化、更新。从总体上看,十年来研究热点当属图书馆领域,博客、RSS、TAG、Wire、P2P、IM、Folksonomy、微博等技术在图书馆的广泛应用,为图书馆的服务及其发展提供新的方向。十年来,Web2.0以其独特的优势已经逐步融入图书情报学界的发展,在信息服务、信息交流、用户参与、知识研究等方面为图书情报学界的发展做出了不可磨灭的贡献。endprint