WorldCat标注系统的优化方案
2012-04-29黄如花刘鎏
黄如花 刘鎏
摘 要:WorldCat标注系统是分众分类法在书目信息管理方面的代表,适应了社会化网络下信息组织的发展趋势。但是,因其自身在标签、管理机制、检索机制等方面存在的不足,一定程度上影响了信息组织的精准度,不利于用户的实际操作使用。基于这些分析,文章构建了一个整体优化方案,通过明确标签含义层次、增加用户编辑功能、完善用户社区聚合功能等具体措施对WorldCat标注系统进行优化。
关键词:WorldCat 标注系统 优化方案
中图分类号: G250.73文献标识码: A 文章编号: 1003-6938(2012)05-0016-05
WorldCat标注系统同一般的标注系统一样,都是由用户、资源和标签三个集合构成,具有平面化的组织结构、多维度揭示信息资源、自由随意性、共享性、社会性和动态自适应性[1]。同时WorldCat标注系统进行标引的资源对象都是已经经过预先规范加工处理过的规范化书目数据,本身就因为主题、著者等因素关联在一起,是有序存在的。另外,WorldCat标注系统的用户由成员馆用户和一般用户组成,前者提供基本书目信息以构成WorldCat全球书目信息数据库,具有专业的信息资源组织管理能力;后者跟一般标注系统的用户群体类似,根据自身对资源的理解进行标注,具有差异性和主动性。本文通过对WorldCat标注系统的标签、管理机制、检索机制等方面的分析,结合常规标注系统的特点,制订了优化方案,方案包括前期准备工作、具体实施内容和后期调整完善三个部分。
1 WorldCat标注系统优化的前期准备工作
为了确保针对WorldCat标注系统的优化方案能够最贴合其实际情况和用户的实际需求,也为了避免优化方案在实施过程中过多地影响到WorldCat自身的正常运行提供书目信息服务,方案实施之前的准备工作是必须进行的,并可以从四个方面展开。
1.1 全面了解WorldCat标注系统
主要是针对现在标注系统中的用户、资源和标签的数量、质量、关联等方面进行了解,掌握最新的、最为全面的数据统计信息,为后面的数据分析制定详细的优化方案和实施步骤提供参考。
1.2 详细调查WorldCat标注系统用户
主要是针对用户对现在标注系统的使用满意度和修改意见的收集、统计和分析。从而确定需要进行优化改进的地方,并且在优化方案中体现用户的使用需求,力图让优化后的标注系统更加吸引用户的长期和高频率使用。
1.3 调查了解其它标注系统
主要是针对那些跟WorldCat标注系统有相类似特征的标注系统,比如专门针对书目信息的LibraryThing和亚马逊标注系统进行调查,了解它们的各个集合和服务模块的设置和结构,尤其是那些WorldCat标注系统所不具有的功能,应当重点关注,考察是否可以借鉴。
1.4 制订优化实施方案
基于以上的调查数据,制定一个有具体时间进度、可操作性强的实施方案。需要特别注意的是,该实施方案应当留有可以在实施过程进行调整的余地,同时要注意不会对WorldCat的其它功能造成长时间、高程度的影响。
2 WorldCat标注系统优化的具体内容
2.1 明确标签的实际含义,构建标签的层次体系结构
标注系统中的标签都是以平面形式存在的,缺乏上下级之间的类别管理[2],标签之间的关联性弱,加上标签来自于自然语言本身就存在着同义和异义等容易造成的歧义,使得信息资源按照标签的聚合会出现差错,导致检全率和检准率得不到较好的保证[3]。WorldCat的标注系统也不例外,以其首页上的热门标签云中的标签为例。标签“nonfiction”和“non-fiction”实际上指的都是非小说类文学作品,两个词是可以通用的。但是在标注系统中,两个不同的标签意味着将本来具有相同特征的信息资源划分到不同的类别之中,割断了这些资源之间本来的关联性。再如,标签“fiction”和“historical fiction”,前者指的是小说,后者指的是国家年度最佳的小说名单,后者应当从属于前者,是前者的下位类。但是由于标注系统中标签的平面无等级性,使得这两个标签之间不存在任何类别关联,也就使得它们分别代表的资源之间没有建立任何的关联性。
因此,可以在后台构建一个对标签进行后控的词汇库,其内容包括基本的同义词词表和多义词词表,并且这些语词之间都是相联系的。考虑到WorldCat的多语种性,每个语种应当选定一个最为权威的成员馆来进行关于该语种的语词库建设。然后由技术人员进行不同语种之间常用标签词汇的关联赋予工作。同时该词汇库开放部分的权限给普通的用户,用以添加新出现的词汇和语义以确保该语词库能够与实际的自然语言使用情况保持动态一致。
WorldCat标注系统的特征之一就是其资源对象是已经经过处理的书目信息,本身就是按照传统的信息组织方法进行规范组织的,具有基本的层次系,按照著者、时间、年份、语种、主题等进行了简单的归类组织。基于此,可以将赋予给同一个资源对象的标签跟随该资源归入到同一个大类之中。标签根据不同的分面规则划归到不同的类别之中,标签与标签之间就不再是一个平面结构,而是有了比较明晰的等级层次关系。
2.2 增加针对标签本身的浏览和检索界面,优化用户对标签修改编辑的功能
WorldCat标注系统中对于标签并没有比较清晰的管理机制存在。一方面,标注系统中用户使用过的标签并没有按照某种顺序排列全部显示出来也没有用来查找某个标签的检索机制,用户没有办法通过浏览或检索的方式进行标签的查找;另一方面,用户在对自己已经使用过的标签进行编辑或者删除等管理操作时,相对应的信息资源的被标注情况并没有得到改变。例如,先给“Decision-making in the absence of certainty:a study in the context of technology and the construction of 21st century academic libraries”一书添加了“图书馆”这样一个标签。然后在“我的标签”界面中对使用过的“图书馆”标签进行修改,改成“图书”。理论上,原来被赋予给资源对象的标签也应该从“图书馆”相应地变成“图书”。事实上,返回到资源对象的界面,发现笔者对该资源的标注行为变成了两次,分别赋予了“图书馆”和“图书”两个标签(见图1)。
WorldCat标注系统需要增加对标签的管理机制。该管理机制不仅包括前面提到的对标签语义和层次关系的后控制,还包括提供浏览、检索机制来方便用户查找某个具体的标签和对标签进行编辑修改。
因此,WorldCat标注系统可以将热门标签云中的标签和所有用户标注使用的标签都根据字顺等规则进行排列,保持实时动态性,保证用户新添加的标签也能够快速地出现在标签列表中。标签的检索设置只需要提供简单的语词检索即可,由于标签之间通过后控实现层级化和关联化,可以在用户获取检索结构的同时显示与该标签相关的其它标签选择,实际上扩展了用户的检索范围。同时,需要在WorldCat首页的热门标签云设置可以方便链接到标签浏览和检索界面的按钮,确保用户在热门标签云中寻找不到所需要的标签后能够快速找到如何进行标签查找的途径。此外,WorldCat标注系统需要保证用户对标签再编辑的同步性,当用户对标签进行修改时,系统应当将这样的修改同步保存到标签数据库中和反映在用户之前使用该标签进行标注的信息资源的标签显示中。
2.3 构建专门通过标签进行信息资源检索的途径
用户通过自由标注来组织信息资源,被赋予了相同标签的信息资源被聚合在一起。这样的聚合让用户可以通过标签对信息资源进行检索。标注系统是WorldCat为了适应社会化网络环境和信息组织管理新趋势而添加进来的。标注系统本身就包含了一定的检索功能,主要是通过检索某个标签来查找它所相关联的信息资源。在目前的WorldCat检索功能中,无论是简单检索(见图2)还是高级检索(见图3)都没有设置提供给用户进行标签检索的途径。在检索框中输入任何检索词,即便是该检索词在标注系统中已经是某个信息资源的标签,WorldCat的检索系统会自动将其默认为按照传统题名、关键词等方式进行检索。
在WorldCat中唯一能够进行标签检索的方式就是找到这个标签,通过点击该标签进行检索。但是WorldCat首页中用来显示用户标签的标签云中,只是显示了很少一部分使用频率较高的标签,而且WorldCat没有标签浏览页面,使得用户无法找到想要检索的标签,也就不能通过标签的检索查找到所需要的资源。从这个意义上来看,标注系统利用标签聚合信息资源以便于用户快速查找的功能完全没有发挥出来。
需要注意的是,虽然WorldCat上原有的检索方式可以对检索结果分别按照“相关性”、“著者字顺”、“题名字顺”和“出版时间”等顺序进行排序,但是通过标签进行检索的时候,检索结果并没有按照一定的规则进行排序,这样不利于用户在众多的检索结果中获取自己所需要的信息资源。
为了实现标注系统的检索功能,可以在WorldCat的简单检索界面和高级检索界面添加“标签”检索的途径,也可以在首页设置专门的按钮链接到通过标签进行资源检索的界面。
WorldCat通用检索的检索结果是可以按照相关度、著者等因素进行排列的,这样有利于用户在众多的检索结果中进行进一步筛选。所以WorldCat标注系统通过标签对资源对象的检索,其结果也可以模仿诸如“著者”、“出版时间”等这样的条件进行排序。除此之外,还可以在页面右侧设置类似的进一步筛选框让用户进一步筛选。从而缩短用户通过标签检索并获取信息资源的所需要的时间(见图4)。
2.4 构建WorldCat用户的社群,实现用户之间的交流和资源共享
标注系统的社区聚合功能能够很好地将用户与用户、用户与资源用标签联系起来,构成了一定规模的社会网络,并且利用标注系统的运作原理不断强化和扩展已经形成的社会网络。对同一资源对象进行标注或保存的用户和使用相同或相似标签的用户被聚集在一起,形成具有相同兴趣点和关注点的用户群体。在群体中,用户之间交流、共享信息资源,并且运用群体的智慧管理和创造
信息资源,体现了社会化网络环境下网络用户之间信息资源的共享和交流。标注系统用户所具有的交互性从根本上说受到社会化网络这个大环境的影响,同时,用户的交互性也推动着标注系统的社会化发展[4]。但是在World
Cat的标注系统中,用户是松散的。标签仅仅是将被赋予有同样标签的信息资源聚集在一起,而没有对用户之间的关系做出关联,使得用户没有办法形成群体社区。这样不利于WorldCat标注系统的交互体验,也不利于其在社会化网络环境下的进一步发展。
在WorldCat上,用户与用户之间唯一的关联是用户可以关注另一个用户自己构建的书目列表,不存在用户之间真正的信息资源共享和交互活动。可以借鉴Flickr上社群(Groups)的构建,构建用户之间的社群建设规则。这样用户既可以参与到其它社群中的活动也可以自己创建新的社群开放给一定的用户参与进来,并且这些社群可以通过用户权限的设置实现隐私和资源的完全公开、半公开和完全保密。
WorldCat标注系统增加用户之间的交互可以在一定程度上弥补作为社会化网络环境下的网站对用户社会性的关注不足。同时基于WorldCat系统用户是由成员馆和普通用户构成的这一特色,增强用户之间的交流可以帮助书目信息组织管理的专业人员与普通用户进行互动,有利于WorldCat的发展和服务质量的提升。
2.5 提供WorldCat标注系统检索API接口,实现与其它标注系统的互操作
WorldCat中的书目信息来自于其各个成员馆,尤其是2003年OCLC开始实施的“开放的WorldCat”(Open WorldCat)计划允许各成员馆和普通用户以Wjkl的方式对书目信息的评论和标签进行添加之后,其开放和共享性一直就是WorldCat不断发展壮大的重要因素之一。但是WorldCat标注系统的开放和共享性较差,既没有跟其成员馆所使用的图书馆标注系统进行对接,也没有与LibraryThing和亚马逊这类专门提供书目信息的标注系统关联[5],不利于WorldCat标注系统中标签资源的共享。
虽然通过常规的搜索引擎,如谷歌、必应或者百度,仍然能够检索到标注网站中的信息内容,但是由于搜索引擎针对的是整个网络信息资源,覆盖范围过于广泛,会降低查找和检索的检全率和检准率。所以WorldCat标注系统可以借鉴元搜索引擎的架构,构建一个跨标注网站的搜索引擎。每个标注网站自身都设计有通过检索标签来查找相对应的信息资源的简单搜索引擎,跨标注网站的搜索引擎可以以此为基础进行设计(基本结构见图5)。
针对标注的跨网站搜索引擎的结构类似于双层C/S结构:用户向搜索引擎提交检索请求,搜索引擎根据这个检索请求向相连接的多个标注网站自带的搜索引擎发出实际的检索请求,然后多个搜索引擎会将获得的检索结果返回到跨标注网站搜索引擎,经过去重、合并、排列后反馈给用户。
最后,借鉴“一键分享”的模式实现标签和资源的跨系统分享。共享无疑是社会化网络环境最为突出的特征,为了让标注网站能够体现并且促进信息的共享,可以借鉴一些视频和新闻网站的做法,在资源旁边设置一些可以将该资源快速分享到社会化服务网站平台,比如微博、人人网的按钮。
只需要用户拥有分享目标系统的登录权限,点击相应的按钮,资源便可以即时分享,省去了用户操作上的麻烦,提高了信息资源分享的效率。标注网站可以效仿这样的做法,在资源旁边设置同样的用来分享该信息资源到其他标注网站的按钮,通过后台的插件链接,方便用户将需要的资源、标签与其他标注网站的用户共享。
事实上,目前WorldCat的检索API(Application Programming Interface,应用程序编程接口)已经免费提供给所有需要的用户[6]。将这个API放到其它应用程序之中,就可以通过它来检索访问WorldCat上的书目信息。因此,WorldCat标注系统的检索功能可以借鉴这个API的开发方式进行,然后将标注系统的API放置到首页,提供给需要的用户。除此之外,WorldCat还可以将标注系统的API主动提供给那些已经将其它标注系统用到OPAC中的图书馆,让两个标注系统进行链接,实现跨标注系统的检索。如宾夕法尼亚州立大学(University of Pennsylvania)图书馆自行开发使用的PennTag系统,就是一个比较完善的标注系统,该校图书馆同时也是WorldCat成员馆之一。WorldCat可以将标注系统的API提供给宾夕法尼亚州立大学图书馆,将WorldCat标注系统与PennTag系统相关联。用户可以通过任何一个标注系统的检索同时获取两个系统的信息资源,从而实现标注系统资源的共建共享。
3 WorldCat标注系统优化的后期完善
当所有具体的优化内容都稳妥实施完成之后,还需要对WorldCat标注系统的运行情况、用户使用情况进行调查分析,对优化方案的成效进行评估,并且对优化后的WorldCat标注系统进行微调。
3.1 了解优化后的WorldCat标注系统
参照准备工作中对WorldCat标注系统进行调查分析的内容,对经过优化的系统重新进行一次全面的了解。然后把获得的关于标注系统中的用户、资源和标签的数量、质量、关联等方面的情况与优化前的情况一一对比分析。
3.2 调查用户对新标注系统的使用情况
对用户包括系统管理人员使用优化后的WorldCat标注系统的情况进行调查。调查的内容主要包括使用者对整个标注系统,尤其是经过优化处理的模块的使用体验、满意度等。将使用体验与未进行优化时的使用体验进行比较,为下一步对优化方案成效的评估提供数据参考。
3.3 评估WorldCat标注系统的优化成效
以WorldCat标注系统本身优化前后的情况对比和用户使用情况优化前后的对比为主要依据,综合考虑在实施优化的过程中各种人力物力的投入情况,对WorldCat标注系统优化方案的成效进行客观评估。评估的结果一方面可以作为对优化后WorldCat标注系统进行微调的依据,另一方面可以作为对WorldCat标注系统优化方案进行调整完善的依据。
3.4 完善WorldCat标注系统的优化方案
根据对WorldCat标注系统自身情况和对用户使用情况的调查,参考其他同类标注系统,制定针对WorldCat标注系统的优化方案。优化方案实施后,根据成效对方案进行评估,再根据评估结果对WorldCat标注系统优化方案进行调整。对于会将WorldCat标注系统性能和客户体验显著提升的优化措施保留并加强,反之则考虑弱化或剔除。
4 结语
WorldCat标注系统作为标注系统的一种,有助于用户在自己理解的基础上对书目信息进行组织管理,提高书目信息的使用率。针对WorldCat标注系统的不足,制订有效的优化方案并实施,能够充分发挥标注系统的共享功能和社区聚合功能,更好地体现标注系统的平等性、自由性、开放性和交互性。随着对用户标注行为和语义网的研究与应用的深化与发展,WorldCat标注系统能够将其应用到后续的优化之中,充分发挥分众分类法的优势,引导和促进用户对WorldCat中书目信息的使用。
参考文献:
[1]王英.Folksonomy与传统分类法的比较分析及其完善研究[J]. 图书馆学研究,2010,(2): 45-47,74.
[2]Thmas Marliesel, Caudle Dana,Schmitz Cecilia. To tag or not to tag[J]. Library Hi Tech,2009,27(3):411-434.
[3]黄建年,侯汉清.关于TAG分类及相关理论问题的研究[J]. 图书馆杂志, 2008, 27(7): 49-52.
[4]易明等.基于社会网络分析的社会化标签网络分析与个性化信息服务研究[J].中国图书馆学报,2010,36(3):107-114.
[5]姚晓锋.用户标签和图书馆主题分类的比较研究——以Librarything为例[J].图书馆学研究,2010,(4): 63-66.
[6]WorldCat Search API(Web service)[EB/OL].[2012-7-16].http://www.worldcat.org/affiliate/tools?atype=wcapi.
作者简介:黄如花(1968—),女,武汉大学信息资源研究中心教授、博士生导师;刘鎏(1986—),女,武汉大学图书馆学硕士研究生,上海浦东图书馆馆员。