Folksonomy在学科信息导航服务中的应用
2011-04-03傅秀兰曾湘琼
傅秀兰,曾湘琼
(湘潭大学图书馆,湖南 湘潭 411105)
自从美国互联网专家Thomas Vander Wal提出“Folksonomy”这一概念以来,国内外许多学者对其内涵进行了探讨。Thomas Vander Wal认为:“Folksonomy是个人用户为满足自身检索的需要,对信息或对象自由添加标签的结果,用户添加标签的行为是在一个社会化的环境中进行,即这个环境是开放的、共享的”[1]。 Clay Shirky 认为 Folksonomy是由大众创建的、具有扁平特点的命名空间[2]。我国学者黄国彬则认为Folksonomy是网络资源的利用者为了便于自己或他人获取和利用由自己或其他人创建的某一数字资源,而对该资源赋予标签的过程或结果。所赋予的标签可以是网址或符号,也可以是具有实质含义的词汇、短语或句子[3]。目前,国外学者已开始倾向将Folksonomy置于具体应用领域中进行研究。如Terrell Russell指出,通过上下文权威标注方法,利用用户在标签社区中使用标签的声誉,可以发现和定义认知权威性,查找出某一领域的权威专家最经常涉足的领域知识。在国内,将Folksonomy应用于信息服务的研究还刚刚起步。学科信息导航作为对网上某学科、主题领域信息资源进行深入揭示和提供利用的信息组织模式,是图书馆虚拟馆藏建设的重要内容。图书馆将Folksonomy应用于学科导航的信息组织和服务工作中,可构建“以用户为中心”的信息服务模式。
1 Folksonomy与Tag
Folksonomy的基本理念是鼓励用户根据自己的想法为信息选择关键词,用户之间是分享、协作、互助的关系。标签(Tag)是用户赋予特定资源的标识,用于描述资源的主题、类型、功能等多种特征,其代表用户对资源的理解,是实现资源组织和共享的基础,是Folksonomy的具体表现形式。Adam Mathes指出,标签是一种由用户产生的元数据,区别于以往由专家或网站作者产生的元数据,它能直接、迅速反映用户的词汇和需求及其变化[4]。Folksonomy、Tag和资源的关系如图1所示。
图1 Folksonomy、Tag和资源的关系结构模型
从图1可以看出,标签的出现,使资源和用户两者紧密地联系起来。相同的标签被赋予不同的资源,表明用户使用的资源具有某种共性。标签能实现这些资源的聚合,从而使没有关联的资源建立了联系。使用相同标签的用户对相似资源使用相同标签,表明知识体系的某种重合。标签能帮助用户发现“共同语言”的群体。相反,相互独立的标签也可以通过用户和资源产生联系[5]。
Folksonomy的特点是以词为类,类目由网络用户自定义生成。Folksonomy的类目既体现网络用户的个性化特点,同时又代表所有网络信息用户的共性;Folksonomy的类目是非等级的,用户不必从根目录开始经过几级类目找到所需要的信息。这种显示类目的优点是使重要的信息都能直接显示在页面上,而且描述最热门、点击率最高的信息的Tag在页面上被突出显示。Tag可以是文章中的关键词,也可以是代表文章主题的其他词汇。因此,用Tag不但包含了文章的显性知识,而且也包含了文章的隐性知识,更能代表文章的主题。分众分类的过程是用户采用Tag对网络信息资源进行标识和分类,这一过程完全由用户控制,信息分类组织的结果也必然更符合一般用户的习惯。
2 学科信息导航服务现状
开展学科导航服务是当今图书馆的热点工作和热点话题。中国高等教育文献保障体系(CALIS)组织立项,由“211工程”高校图书馆参与建设的“重点学科导航库”,是以教育部正式颁布的学科分类系统作为学科分类基础,为高校师生提供了重要学术网站的导航和免费学术资源的导航。另外,还有近百家高校图书馆根据本校的学科特点及服务用户需求也开展了自建学科导航库工作。但是,笔者在调查中发现这些学科导航服务存在以下问题。
2.1 学科资源开发深度不够,资源更新慢
较多机构所建的学科导航只是一个简单的网络导航系统,而非一个集成化的资源导航和信息服务平台。学科导航服务目的是比搜索引擎提供更准确、更深入的检索结果,但当前学科导航库对信息揭示的深度不够,没有将导航的揭示对象定位为具体的学科内容,对包含重要专业信息的隐蔽网络的揭示更少,用户通过导航不能获取最终的、最有价值的信息。学科导航建设速度慢,许多学科导航库更新周期长,资源数量不足,而且有些还是死链接,用户往往在检索学科信息时还是采用搜索引擎[6]。
2.2 缺乏统一的软件系统以及相同检索平台
据调查,目前已提供学科导航服务的100多所高校所使用的系统软件和检索系统不尽相同,导致导航库的质量和服务水平存在明显差异。即便是同一所图书馆的不同学科导航库,也不一定使用同一系统软件和同一检索平台。资源分布在不同结构的平台中,资源整合的各环节以及检索方式会因不同的检索平台而出现差异,不同检索式的输入也会给不熟悉资源和系统的读者造成信息查询和信息检索的困难。另外,系统数据如果在不同系统软件间转换容易造成数据的丢失和字段对应错位,也会影响到学科导航库的管理,给管理人员带来不便[7]。
2.3 用户参与度低
专业研究人员、专家学者既是学科导航库的利用者,又是学科资源的生成者之一。他们通过会议、资料、同行交流等各种方式,掌握大量的学科信息线索,可为学科导航推荐资源。虽然有的学科导航库界面也有“资源推荐”栏目,但因为缺乏反馈信息,用户仍然不清楚自己推荐资源的采用情况,网站也没有对推荐资源用户给予鼓励或肯定。系统与用户间缺乏互动,从而导致用户的体验性差,无法发挥用户的创造性。据刘秀文对CALIS重点学科网络资源导航门户的资源利用调查显示,在近18万条资源中,点击率最高的仅为180次,点击率10次及以上的仅占0.19%,资源被点击1~9次的占26.3%,还有73.51%的资源从未被点击过。这种低利用率的根本原因是导航系统设计与工作中心主要以信息资源的加工处理为核心,没有更多体现以用户的需求思维习惯组织优化资源及提供服务[8]。
2.4 缺乏对资源的有效评价
当面对大量缺少控制的信息时,用户要花费大量精力进行甄别。大多数的学科导航缺乏对学科信息的同行评价和质量评价。面对数量不少的学科信息导航站点,用户在客观参考信息方面缺乏选择,如果用户对网上学术资源的质量很难作出评价,他们会根据网站在同事和熟人中的声望、他们的成见以及即时反应进行选择。如果有了信息资源公正有效的评价,会降低用户选择信息的成本。
3 Folksonomy在学科信息导航服务中的应用
3.1 改变信息组织模式
Folksonomy应用于学科信息导航服务的本质是突出用户的主体地位。虽然现有的资源分类法都是以信息资源的内在相关性和有序性为核心,揭示了资源的本质类属关系,但不能反映普通用户的现实需求、习惯和用户组织资源的特征。Folksonomy的核心是强调“以用户为中心”的资源管理。用户根据自身使用网络信息的习惯、偏好、需求,甚至价值观进行信息资源的组织和传递。这是一种建立在自我体验基础之上的自我需求制定。学科信息导航服务借鉴Folksonomy的信息组织方式,使组织模式从他组织模式向自组织模式转变,可以发挥用户在学科信息服务中的作用。“以用户为中心”的学科信息导航系统构架如图2所示。从图2可以看出,基于Folksonomy的资源管理注重用户间的协作,用户利用学科导航信息管理系统的功能,完成对网络信息资源的采集、组织、存储和检索操作;用户之间可以通过学科信息导航管理系统提供的协作机制,实现网络信息资源的共享。用户由学科资源的消费者变为学科资源的发现者和组织管理者。
图2 “以用户为中心”的学科信息导航管理系统构架图
3.2 建立用户反馈信息的互动平台
学科信息导航服务的根本目的是为了使网络学科信息资源得到充分利用。用户作为学科信息资源利用者,通过学科导航系统检索需要的资源;作为学科信息资源的管理者,利用Folksonomy对学科信息资源进行序化组织。用户与系统之间的交流主要包括用户可以保存信息资源,以自己的方式标注信息资源,对信息资源进行评价等。用户之间的交流包括用户之间的资源推荐,对某种资源的讨论等。在学科信息导航服务中,用户通过Tag将用户关心的同类信息自动聚合在一起,使学科导航成为研究人员发现研究热点、交流研究体会的学术讨论区[9]。从用户的讨论中,导航员可以把握学科发展的动向等信息,从而对资源进行更科学合理的评价和推荐[10]。Intute、INFOMINE 等学科信息门户就设有 “suggest a resource”之类的栏目,欢迎用户推荐相关领域的研究资源。
3.3 提供个性化服务功能
现有系统没有给用户提供个性化的自主服务空间,用户无法进行自主的收藏、标引、编辑、推荐、发布等活动,这不利于提高用户的参与意愿。系统管理者可根据用户特征提供更具针对性的服务[11]。如开展信息定制(含界面定制、服务功能定制、资源内容定制等)和信息推送、信息发布等。引入Tag后,系统只需根据用户的定制信息及用户自我空间的检索词统计,并通过Web Trends Log Analyzer统计学科导航系统中资源的访问量,统计不同数字资源被访问的频率、逗留的时间及是否被下载等[12],就能及时把握用户的兴趣点,从而开展信息推荐等个性化服务,并可将用户共同需要和感兴趣的信息分类进行发布,如将新闻信息、会议信息、科研报告及成果信息等在网页上动态发布,让用户查找事件列表等。
3.4 聚集用户智慧与力量
Folksonomy采用由资源使用者为资源提供关键词,根据这些关键词聚类资源的方式。这种资源组织方法方便了用户。另外,它利用集体智慧组织资源,形成的分类结果更贴近用户的使用习惯,帮助用户更快、更准地找到需要的信息[13]。用户采用分众分类模式添加主题分类标签,可满足用户按主题检索与浏览相关资源。用户通过自定义关键字的方式给出的Tag标签,能反映整个社群的群体意识倾向和知识背景,对自发标引通过聚类方法能选出满足大多数人需要的分类标签。在参与资源维护时,可以报告失效资源、分类及描述有错资源、留言建议。当资源数量巨大,专业人员无法完成对资源的组织时,这种由用户自己分类的方式更有效。
3.5 采用协同过滤机制
通过对大量标签的聚类和内容分析,可以划分用户群体、资源群体,从而实现协同过滤。由于网络的开放性和无组织性,网络信息增长迅速,良莠不齐。在学科信息导航服务中,用户挑选自己喜爱的网站,用标签标注后组合在一起,无形中成了网络资源的过滤者。用户通过Folksonomy中的某一标签进行搜索,可以看到其他用户在这一标签下的资源列表。这些用户有的是某一特定主题领域的专家或该领域的关注者,他们拥有很好的资源鉴别能力。
3.6 充分挖掘隐性知识
由于学科导航收录资源范围十分有限,无法发现和收集隐性知识。目前,用户无法通过搜索引擎获取内容更丰富、专业性更强、更具有学术价值的网络隐蔽性资源。要想使学科信息资源收集全面且质量高,信息开发者要相信用户的智慧,鼓励用户参与学科信息资源管理,利用多种渠道收集资源。用户采用Folksonomy分类方法组织资源可丰富学科信息导航的信息内容,挖掘隐蔽网络资源,为学科导航库建设提供大量的信息资源线索,从而提高信息服务质量。分众分类法的产生就是为了使用户能够更好地组织和检索信息。用户交互组织信息资源,具有相当的稳定性,因而它可以作为信息检索的一个新的途径。
4 结束语
Folksonomy也有其缺点,如由用户用自然语言标注的标签缺乏同义词控制,词汇之间缺乏层次性,不利于用户系统浏览。另外,在一些使用频率特别高的tag标签中,会出现一些毫无关系的垃圾资源条目。但Folksonomy的兴起,为图书馆开展学科信息导航服务提供了一个新的模式,即可通过互联网和相关的技术把大批的学科信息资源建设者与用户以自愿的方式聚集在一起合作建设资源库。尽管这种方式还处于形成和发展过程中,目前还不能完全认识与预测其最终的展开结果。但我们相信,这种新的学科信息资源建设与服务模式蕴涵着全新的价值和巨大的能量,将对传统信息建设与服务产生深远影响[14]。
[1] WAL T V.Folksonomy Explanations[EB/OL].[2009-02-12].http://www.vanderwal.net/random/entrysel.php?blog =1622.
[2] SHIRKY C.Ontology isoverrated:Categories,links,Andtags[EB/OL].[2009-02-12].http://shirky.com/writings/ontology_overrated.html.
[3] 黄国彬.大众标注研究进展[J].图书情报工作,2008(1):13-15,55.
[4] MATHES A.Folksonomies-Cooperative Classification and Communication through Shared Metadata[EB/OL].[2009-02-12].http://www.adammathes.com/academic/computermediatedcommuni-cation/folksonomies.html.
[5] 孙红莺,次仁拉珍,叶鹰.基于标签的数字图书馆个性化信息检索[J].杭州师范大学学报(自然科学版),2008(5):387-391.
[6] 张燕萍.用分众分类模式优化学科导航库建设[J].情报理论与实践,2007(4):552-557.
[7] 陈源.学科导航库的建设与发展[J].图书馆论坛,2008(3):97-100.
[8] 刘秀文.学科导航系统建设的“用户中心模式”[J].图书馆杂志,2009(2):49-52.
[9] 任瑞娟.WEB2.0环境下的网络信息资源建设新模式探析[EB/OL].[2009-02-12].http://www.paper.edu.cn/downloadpaper.php?serial_number=200812-893&type=1.
[10] 陈希.浅谈重点学科导航库的可持续发展[J].图书馆论坛,2007(5):104-106.
[11] 王晓光,丁韧,胡超.基于Web2.0的学科信息门户设计与实现[J].图书情报知识,2007(1):83-86.
[12] 马玉妍,韩志.数字图书馆用户使用信息挖掘与应用[J].图书馆理论与实践,2007(2):27-29.
[13] 常唯.论网络环境下用户标注的价值与应用[J].图书情报工作,2008(1):9-12.
[14] 刘高勇.基于Wiki与Folksonomy的专业信息服务研究[J].图书情报工作,2008(10)122-124,128.