图书馆可视化技术研究的文献计量分析
2013-09-11沈小尉李小涛
沈小尉,李小涛
迄今为止,可视化技术的研究已经历了科学计算可视化、信息可视化和知识可视化3个阶段[1]。将可视化技术引入到数字图书馆领域,不仅可以解决信息需求与服务的个性化、信息提供的个性化等问题,还可能有助于解决数字图书馆发展中遇到的其他问题。在用户需求与科技发展的推动下,图书馆可视化研究近年持续升温,已形成图书情报领域的一大研究热点。
1 资料与方法
1.1 资料来源 以中国知网的中国学术期刊网络出版总库为数据源,以主题为检索途径,以“可视化and图书馆”为检索词,不限年份,共检出文献184篇,最后检索时间为2012-06-05。将所有文献题录下载存贮其详细格式为“.txt”文件,并将该数据库提供的文献被引频次进行记录和保存。
1.2 研究方法 对文献题录进行去空格和段落标记的格式调整,然后切分字段并导入到Excel表中。通过Excel的排序、筛选、分类汇总功能,并结合使用武汉大学ROST统计软件,对文献的时间分布、单位分布、作者分布、基金资助情况、高频关键词、被引频次等指标进行统计分析。
2 结果与分析
2.1 时间分布 检索到的最早相关文献为1996年《中国信息导报》刊载的“情报科学技术与虚拟图书馆”一文,提出了虚拟现实技术和数据可视化技术在图书馆的广阔应用前景。在随后的时间里,有关图书馆可视化技术研究的文献不断增多,尤其是近几年,文献量和基金论文数出现了成倍增长。1996~1999年是图书馆可视化技术的起步阶段,文献量很少。除1997年有5篇文献(包括1篇基金论文)发表外,其它年份均只有1篇文献。2000~2003年这方面的研究有了进一步的发展,文献量和基金论文数都略有增加。2004~2007年图书馆可视化研究逐渐吸引了更多研究者的关注,文献量和基金论文数明显增加;2008年至今,图书馆可视化研究的文献量急剧增加,逐渐成为一个新兴研究热点,仅2011年1年的文献量就达到了40篇,其中包括基金论文15篇。各年的论文数量和基金论文数见表1,各阶段文献量的增长趋势见图1。基金资助论文基金资助论文是指由国家各级政府部门、各类基金组织和企事业单位提供科研经费而产生的研究论文,可以反映本专业领域内理论与实践研究的热点问题和最新的研究成果,具有较高的学术价值[2]。近年基金资助论文率的增高可以在一定程度上说明图书馆可视化的研究水平上升,正日益成为学界同仁关注的热点,受到政府及相关行业的重视。
2.2 机构分布 高校各院系发表论文最多,共95篇,其次是高校图书馆,发文67篇。91.23%的基金资助论文来自于高校各院系和高校图书馆,其他类型单位的基金论文相对较少。可见高校各院系和图书馆对于图书馆可视化的研究水平较高,课题来源较多,见表2。第一作者所在机构进行统计,发文量最多的8家机构见表3。南京大学发文10篇,位居第一,其次是中国科学院,共发文9篇。其他6家机构发文3~7篇。对高被引论文的作者单位进行统计,高被引论文数最多的10家机构见表4。武汉大学有7篇,位居第一;其次是南京大学,共有6篇。其它8家机构的高被引论文篇数为2~4篇。可认为这些机构是目前国内图书馆可视化研究的的主要力量。
表 1 1996~2012年的文献量与基金论文数
图 1 1996~2012年的文献量与基金论文增长趋势
表 2 各类机构的发文量
表 3 发文量最多的8家机构
表 4 被引论文最多的10家机构
2.3 作者分布 第一作者发文量最多的是刘丽和高飞,均为4篇,其他作者发文量均为1~2篇,此领域尚未出现较为突出的高产作者,见表5。共有90篇论文已被引用,对被引论文的第一作者进行统计,总被引频次最多的10位作者见表6。第三军医大学基础部的张绍祥已有2篇论文被引,总被引频次为51次,其次是北京大学的吴慰慈,被引34次。这些作者的研究成果受到了国内同行的较多的关注,见表6。
表 5 发文量最多的11位作者
2.4 研究热点分析 对184篇文献的关键词进行统计,共有389个关键词,总频次为672次。将关键词按词频降序排列,词频≥3次的39个关键词如表7所示。若某一关键词在其所处领域的文献中反复出现,则说明该关键词所表征的研究主题是该领域的研究热点[3],根据这39个高频关键词并结合实际情况可以归纳出图书馆可视化研究的四个主要的研究方向:信息组织可视化、信息检索可视化、信息分析可视化、信息服务可视化。
表 6 总被引频次最多的10位作者
表 7 关键词词频统计
2.4.1 信息组织可视化 本体和语义网是新兴的信息组织方式 ,引入可视化技术表现本体,能加深人们对信息的理解和认识[1]。表征这一研究方向的高频关键词有:本体(6)、知识组织(3)、中国图书馆分类法(3)。此研究方向被引频次较多的论文作者有靖培栋、欧阳宁、曹树金等人。
《中国图书馆分类法》(简称《中图法》)是我国图书馆和情报单位普遍使用的一部综合性的分类法,在分类编目、组织文献等方面有广泛应用。2005年,靖培栋等[4]使用Java技术,实现了基于双曲几何的《中图法》分类体系的可视化。随后,欧阳宁等[5]利用本体构建工具Protégé,进行了《中图法》部分类目的可视化实践,证明用Protégé实现《中图法》可视化是可行的。曹树金[6]认为分类法的可视化更加有利于直观呈现类目之间的关系和结构,《中图法》的发展应借鉴杜威十进分类法和国际十进分类法网络化发展的经脸,向网络化和可视化方向发展,增强用户交互性。
2.4.2 信息检索可视化 信息检索可视化就是将馆藏资源和馆藏资源之间的语义关系以一种可视化的方式展示出来,实现检索过程的可视化和检索结果的可视化。信息检索系统引入可视化技术可以优化读者体验,为用户提供更好的服务。表征这一研究方向的高频关键词有:信息检索(4)、数据库(3)、检索结果(3)、检索过程(3)。 此研究方向被引频次较多的论文作者有吉雍慧、黄田青等人。
1997年,王宁等[7]以图书馆为例,结合信息检索及Internet相关技术,说明了可视化信息检索系统的总体结构及主要实现技术。2008年,吉雍慧[8]探讨了在数字图书馆的文献检索平台中,集成实现检索结果聚类、相关文献的关联推荐的方法,并运用信息可视化技术来展示最后的检索结果,使得用户获得比较直观和满意的体验。同年,黄田青等[9]论述了信息可视化的基本概念和方法,通过对Aquabrowser Library信息可视化应用案例的分析,阐述了信息可视化与图书馆OPAC结合的意义,并指出了信息可视化技术存在的一些不足。2012年,王庆娟[10]结合图书馆资源的现状,运用网络搜索引擎、可视化搜索引擎、音频搜索引擎等各类搜索引擎,将数字图书馆的资源整合在OPAC系统的检索功能里,为使用馆藏资源提供了的更加简便、直观的途径。
2.4.3 信息分析可视化 数据挖掘是一种信息分析常用的技术,但其算法较为复杂,一般的用户难以理解和接受。把可视化技术引入到数据挖掘中,实现信息分析的可视化,可以为用户提供了一种易于理解的信息分析工具,帮助人们更好地理解、利用信息。表征这一研究方向的高频关键词有:知识图谱(21)、地理信息系统(10)、研究热点(8)、图书馆学(6)、数据挖掘(5)、共词分析(5)、共现分析(5)、文献计量(4)、词频统计(4)、情报学(3)、共被引分析(3)、图书情报学(3)。此研究方向被引频次较多的论文作者有郝小花、宗乾进等人。
2005年,张永梅等[11]讨论了数字图书馆系统中可视化数据挖掘的理论、方法与实现,采用Visual Basic和Matlab进行数据挖掘,并利用Visual Basic中的可视化功能将结果以图表方式动态展示,以实际案例说明了可视化数据挖掘的科学性与可行性。2008年郝小花等[12]提出,对于用户社区的分析有利于分析不同用户的信息相关性,采用二维的距离模型来建立用户社区模型,在传统数据描述的基础上引入了相关可视化建模技术,直观地描述用户与知识间的关系,进而将数字图书馆用户分为了四个类型:求学群体、教学群体、科研群体、管理与服务群体,并计算了上述群落的彼此相关性系数,为图书馆的个性化服务提供了依据。2011年,宗乾进等[13]利用自编程序与陈超美博士开发的 Citespace II对2009年的中国图书馆学文献进行了分析,以可视化知识图谱的方式展示了国内图书馆学的研究热点。研究结果显示,我国图书馆学研究热点主要有数字图书馆、机构知识库、信息共享空间、服务模式、知识管理、图书馆联盟、学术评价等。
2.4.4 信息服务可视化 信息服务可视化是指充分发挥可视化技术在数字图书馆中的作用,将现有馆藏资源最大限度地开发利用,解决信息需求、信息提供与服务的个性化等问题。表征这一研究方向的高频关键词有:信息资源(6)、虚拟现实(5)、面向对象(4)、人机交互(4)、图书馆管理(3)、信息服务(3)、知识服务(3)、虚拟图书馆(3)、信息管理(3)、触摸屏(3)、图书馆服务(3)、可视化信息系统(3)、个性化服务(3)。此研究方向被引频次较多的论文作者有周静怡、杨达等人。
盛小平[14]介绍了数字图书馆用户界面的三种模式,即自适应可视化界面、统一用户界面、拖放多媒体界面,提出了数字图书馆用户界面评价指标和优化数字图书馆用户界面的措施。周静怡等[15]介绍了信息可视化在数字图书馆中的初步应用,包括信息检索过程可视化、信息检索结果可视化和知识领域可视化等方面。信息检索结果可视化成果最为突出,她着重介绍了Xerox PARC关于数字图书馆研究的代表性研究成果。杨达[16]讨论了数字图书馆环境下信息可视化的基本含义与特点,并建立了信息可视化的主要研究框架。他认为数字图书馆可视化研究的热点研究领域包括:可视化变量研究,可视化模型的研究,符号系统研究,心理学与认知科学研究,非空间数据可视化处理研究,知识管理研究,仿真和虚拟技术研究。随后,刘钟美[17]针对当前个性化信息推荐服务的不足,提出了把知识地图应用到图书馆的个性化信息推荐服务中的建议:为用户提供一个可视化环境,及时把有关信息自动推送给相应的用户,提高服务效率。
3 讨论
以上研究结果表明,我国图书馆可视化研究正在兴起,论文数量持续增多,基金资助率不断上升,出现了以武汉大学、南京大学等为代表的高水平研究机构,产生了以刘丽、高飞为代表的作者群体,形成了信息组织可视化、信息检索可视化、信息分析可视化和信息服务可视化等主要研究方向,研究水平逐渐提高。
但同时也要看到,图书馆可视化研究的发展中也存在着一些问题。从研究机构来看,高等各院系和高校图书馆是研究主力,基金论文也多来自这两类单位。公共图书馆、科研院所对这方面的研究尚处于起步阶段,无论是研究水平还是重视程度均远远不够。为更好地满足用户需求,提高图书馆的服务质量与核心竞争力,各类图书馆对可视化技术的研究和应用还有待加强。
从研究方向来看,关于图书馆信息分析可视化和信息服务可视化的论文较多,但多停留在理论研究阶段,缺少实证研究;关于信息组织可视化和信息检索可视化的研究论文较少,而且多为对国外图书馆可视化情况的介绍,自身的技术应用与创新亟待突破。本体和语义网等新兴的信息组织方式为突破信息组织可视化的技术瓶颈提供了工具,这方面的研究与应用必将极大地推动图书馆服务的可视化进程。
另外,虽然近年来我国的图书馆可视化研究在之前的基础上有了明显的进步,但不可避免地也存在一定的局限性。一方面,可视化是一门交叉学科,相关技术知识需要涉猎多学科背景知识才能掌握,而图书馆工作人员大多不是专业的技术工作者,研究和推广可视化技术较为困难;另一方面,由于馆藏资源的广泛性与复杂性,凭借现有的技术和工具来对馆藏进行可视化的组织和检索还比较困难,图书馆服务完全实现可视化还有待较长时间的探索和实践。
[1]刘 波,马红妹,徐学文.20年可视化发展历程对情报学的影响[J].情报理论与实践,2008,31(1):15-17.
[2]高 凡,王惠翔.我国图书馆学情报学基金论文产出力调查研究与定量分析[J].图书情报工作,2004(10):12-16.
[3]李小涛,刘 岩,刘亚民,等.我国两大医学信息学期刊不同时期研究热点的比较分析[J].中华医学图书情报杂志,2011,20(1):10-14.
[4]靖培栋,郭宇峰.基于双曲几何的《中图法》分类体系的可视化[J].现代图书情报技术,2005(1):40-42.
[5]欧阳宁,包 平.基于本体《中国图书馆分类法》的可视化实现[J].图书馆杂志,2008,27(1):28-32.
[6]曹树金.DDC,UDC网络化对《中图法》发展的启示[J].国家图书馆学刊,2008(2):36-39,70.
[7]王 宁,葛家翔,胡运发.可视化信息检索系统的设计与实现[J].计算机工程,1997,23(12):179-182.
[8]吉雍慧.数字图书馆中的检索结果聚类和关联推荐研究[J].情报分析与研究,2008(2):69-75.
[9]黄田青,曹 艳,陈清文.信息可视化在图书馆OPAC中的应用———以AquabrowserLibrary为例[J].情报资料工作,2008(2):64-68.
[10]王庆娟.基于OPAC系统检索功能的图书馆资源整合研究[J].图书馆学研究,2012,2012(7):15-17.
[11]张永梅,韩 焱,薛海丽.数据挖掘技术及其在数字图书馆中的应用[J].计算机与现代化,2005(10):33-38.
[12]郝小花,邓小昭.基于数据挖掘的可视化数字图书馆用户社区聚类与特征分析[J].情报科学,2008,26(3):396-399.
[13]宗乾进,沈洪洲.2009年我国图书馆学研究热点和知识来源谱系———南京大学知识图谱研究组系列论文之一[J].图书馆杂志,2011,30(6):13-19.
[14]盛小平.数字图书馆用户界面研究[J].图书馆杂志,2003(2):12-16.
[15]周静怡,孙 坦.信息可视化在数字图书馆中应用浅析[J].现代图书情报技术,2005(1):5-8.
[16]杨 达.数字图书馆信息可视化的研究框架[J].沈阳教育学院学报,2005,7(3):127-130.
[17]刘钟美.知识地图在图书馆个性裕信息推荐服务中的应用研究[J].图书情报工作,2006,50(10):97-103.