APP下载

资源共享在澳大利亚:Trove的检索及获取——让获取更美好

2012-07-14王艳翠聊城大学图书馆山东聊城252059

图书馆理论与实践 2012年12期
关键词:馆藏条目检索

●王艳翠(聊城大学 图书馆,山东 聊城 252059)

1 概述

Trove是澳大利亚2009年底由澳大利亚国家图书馆推出的为澳大利亚国家及人民提供的一项检索服务。Trove从1000多家澳大利亚图书馆及其它文化机构和组织中收割元数据,允许公众免费获取超过100万的条目。Trove的原则是“检索并获取”。目前Trove已很好地实现了“检索”:一次单一的检索,用户可以从许多资源中获取大量丰富的信息及文本类型,且相关度排序及检索结果分区使得“检索”方便快捷。从2010年下半年开始,Trove团队把重点转向了提高“获取”方面。本文对迄今为止Trove是如何改善“获取”、目前正在进行的工作以及对于未来的设想进行了概述。

2 “获取”的重要性

研究表明,大多数人只使用一个检索工具来寻找信息目标,因为他们最终希望获取自己所需要的信息。卡尔霍恩在2009年OCLC上作的《联机检索:用户及图书馆需要什么?》报告一文中验证了这个观点:“终端用户有针对性地使用目录及目录数据。终端用户通常希望找到并获得所需信息”、“终端用户传输所需条目的经历与他们检索经历是同等重要的”、“对许多终端用户来说,如果他们所需要的条目没有了传输,检索就只是在浪费时间,调查结果证实了传输作为多数检索目标的重要性”。多数用户期望自己能够在同一地方“获取”或订阅他们“找到”的元数据信息。因此,“获取”选项需要无缝嵌入到一项检索服务中。这就意味着参考书目的传输及馆际互借服务背后的思想观念变化早已存在于初步检索服务或初步书目服务之外。“由于终端用户来自于有大量在线信息的信息世界,他们很自然的希望能获取到内容,而不仅仅是发现、选择并被指点如何获取到内容(图书馆目录的惯用做法)”。2003年OCLC的环境扫描发现:用户想要的是无缝服务,这也是Google如此受欢迎的一个主要原因。信息搜索者明确希望能实现:自助服务、搜索到满意的结果及获得的信息准确无误。对于信息搜索者来说,信息的易于使用、便利、易于获取与信息的质量及可信度同等重要。随着越来越多的全数字化内容的提供,用户也希望通过URL链接直接访问获取信息。卡尔霍恩在2009年的报告中指出,随着对谷歌使用体验的增强,用户的这种期望只会增多:“我们生活在一个‘即买即得’的即时访问获取电子资料的世界里,现实是终端用户希望图书馆为他们提供描述联机内容的元数据与内容本身之间的链接。”“终端用户希望立刻链接到图书的数字化内容,或者至少是内容片断,甚至是希望获得更多。终端用户希望链接到超文本内容,他们还表达了希望链接到音像及视频的愿望。”Trove团队意识到,Trove不仅仅只是一个“检索”工具,“获取”必须简单、无缝、快捷。Trove的首要目标就是减少“检索死胡同”。当用户找到一个条目后,既没有把握如何去获取它,也无法得到它时,就会出现“检索死胡同”。Trove2/3的内容并不是图书,而是音乐、地图、档案、手稿、报纸等内容以及保存在档案馆、博物馆或其它机构中的条目。为此,Trove团队进行了一项“获取”分析,以识别并尽可能地减少“死胡同”。

尽管Trove团队通过改善界面的可用性能够提高一些获取率,但是很大的责任仍然落在了能够促进Trove与本地目录、联机定制形式及数字化要求之间深层次合作的组织机构身上。2010年OCLC的Katie Brich对馆际互借与文献传递的发展趋势作了相关性论述,其中论及了用户所关注的问题,如:①你有我想要的资料吗?②如果没有,你能为我获取吗?③当我需要某些资料时,你能及时为我获取吗?④我不介意你何时能获取到我所需的资料?⑤我需要为我所需的资料付费吗?⑥我能自己便宜的获取到吗?她提醒图书馆“如果我们不为用户提供简单易行的获取,他们只需选择其它更便宜并更容易获取的地方。重要的是图书馆仍然符合需要并仍然在逻辑上是一个首要的信息获取地点,因为毕竟这是图书馆存在的主要原因”。“在过去只有图书馆存在,而今天事实并非如此”。[1]

3 2010-2011年Trove“获取”的改进及进一步的发展

3.1 浓缩数据

卡尔霍恩在2009年的报告中指出:封面、摘要、目录、综述、等级、评论等元数据帮助用户决定要“获取”哪些条目。这种“浓缩数据”非常有助于从“检索”到“获取”的转化过渡。Trove的浓缩数据资料来源于亚马逊、尼尔森书目数据、维基百科及他们自己的用户,用户根据自己的能力向数据库中添加标签、评论、等级等。尽管目前用户还不能像在图书馆事务中那样添加自己的封面,但这对于绝版书和特有的条目来说却是非常有用的。

3.2 明确识别数字化条目

许多用户只关心他们可以立即获取的条目。根据目录或其它元数据记录中所提供的信息,Trove可从网上获得大多数的明确标识的条目。目前正在开发的第四次“样本”,可以识别三种“在线”目录。这些目录的各个方面是可视的并可在简短的结果显示中突显出来,从而有利于直接获取。用户还可以把检索限制在在线目录上,尽管目录并不是百分之百的准确无误,但是Trove根据用户的反馈可以对规则进行修改。目前Trove数字化目录有下列特点:(1)可免费获取,任何人都可以在线浏览或下载,有版权限制的资料也可以申请浏览。(2)目录获取的条件,大多数的条目均可在线浏览或下载,但下列情况需要提出申请:①需要一次性付款的,② 由于条目是由某一特定大学或图书馆读者订阅而受到限制的,③ 条目有文化敏感性或是有版权要求的。(3)条目联机获取的可能性未知。链接可能是全文资源,也可能仅仅是目录表、摘要或例子。(4)目前正在开发中的“样本”,在线获取不到完整的条目但是其数字化样本可能存在,如音乐作品、视频剪辑、一本书的前几页等。

3.3 “获取”界面设计

“获取”最大的障碍之一就是用户界面不好,其结果会导致用户不能确定检索位置、浏览的内容及如何“获得”条目。Trove自发布以来,就建立了一个持续反馈程序,鼓励用户提交困难报告。大多数的用户发现检索界面和结果界面相当直观,但是当检索到“条目/著作/版本”界面时就会被弄糊涂。Trove采用了结构实用检测来解决“获取”问题。用户反馈的获取界面主要存在以下问题:

(1)“获取”的多样性选择。许多用户最初并没有意识到在著作及版本甄选“有效”框架内有许多不同的标签,可以从不同的标签中“获取”各种各样的选择。主要的“获取”选项标签有:图书馆馆藏、在线链接以及购买。许多用户只看到了开放的标签选项,而没有注意到别的标签选项。为了准确反映各个选项,Trove团队几经修改并对标签重新予以命名。根据成本要素,有网络资源存在的时候,系统会优先显示“在线”标签;只有印刷型资源的时候,系统则会根据成本要素显示“图书馆”标签;上述两种资源都无法获取的情况下,系统会显示“购买”标签,清楚地区分了不同的在线类型。

(2) 用户对参考书目的功能需求(FRBR) 不能充分理解,从而无法正确理解“获取”界面。Trove最初使用了一种与参考书目相类似的“文集”概念,由版本/版次信息组成,把所有格式的各种条目加以归类显示(而不是像旧版目录那样只显示1条记录/1个条目)。多数用户无法理解在“获取”选择界面既有文集部分,又有版本部分。整个2010年中,用户提交的报告都是试图“检索”并“获取”基于语言或年代的书的版本问题。实用检测表明:多数用户,对这方面的功能缺乏了解。后来,Trove对文集和版本界面在措词、字体、信息的位置等方面做了重大变动,折叠/显示更多的信息方面也稍有变动。但是用户在很大程度上对于参考书目功能需求(FRBR)的核心概念模型及其多方面运用仍不能够充分了解。2010年底Trove团队向Trove加入了更先进的检索程序,与以前的功能相比,提供了一种完全不同的方式来深入挖掘条目数据。Trove专家组在2011年对“获取”界面及参考书目功能要求(FRBR)的有效性作全面审查。

3.4 显示馆藏名字以及其中对公众开放的馆

卡尔霍恩在2009年的报告中指出:“终端用户和图书馆重点想知道的是条目的馆藏位置及如何快速获取”。在澳大利亚,有超过1000家的图书馆通过澳大利亚国家书目数据库为Trove提供数据。由于馆藏位置影响用户的“获取”决定,因此用户需要非常明了地知道馆藏副本的所在位置。在检索结果界面上,多数馆的名字过长,因此Trove使用了澳大利亚图书馆网关(ALG)为用户提供馆藏。网关中的条目由各图书馆自己进行更新。Trove团队向ALG中加入了“简短图书馆名”使得Trove可以显示检索名称。此举得到了用户的积极反馈。然而实用检测表明:用户希望能够从Trove上显示的任意馆借到所需资料,但许多馆有查阅或借阅限制。Trove因而使用了颜色编码对是否可公开访问的馆进行显示区分。用户可从ALG上获得这种信息,成员馆也能够自己更新信息。

3.5 把图书馆/组织添加为优先使用的资源

在获取界面上有一个选项为用户识别他们最想显示在“我的图书馆”标签中的Trove成员馆,这有助于用户从已知的机构中或与该机构有关联的成员馆中快速获取条目。目前,Trove可获得馆仅用关键词进行检索,用户必须知道实际的馆名(尽管可以从图书馆分布表中找到相应的馆名),但实用检测表明,多数用户希望能添加一个地理名称搜索。如:检索“堪培拉”,不管标题中是否有“堪培拉”,都会看到其所有的城市/州图书馆,从而用户在浏览了获取条件后能够选择参数设置。重建后的ALG将在2011年支持该项功能。

3.6 注意即将推出的报纸论文

Trove包含了数百万页的数字化报纸。该区域的文章正在等待最终质量控制审查,因而在检索结果中会显示为“即将推出”,但用户无法即时获取报纸文章。系统会提示用户留下相关的邮箱,当文章通过了最终的质量审查时,系统会向用户邮箱发送所需文章。报纸检索网页上仅显示引文及部分语言片断。遗憾的是,许多文章未能通过最终的质量审查而不得不重新加工,这就意味着报纸文章不能被很快引用。由于该区域的使用率非常高,加上每周大约出版5万篇新论文,因而当“即将推出”的论文可获取时,系统需要提醒大量的用户。Trove在2010年推出了对用户进行提醒的RSS反馈服务,但这种反馈不适用于那些没有通过质量审查的文章。这个简单的改进对用户的“获取”体验产生了较大的积极影响。

3.7 资料的购买

在既不能借到资料又不能浏览的情况下,一些用户就会选择购买资料。Trove的设计非常合理。和Trove有联系的任何一个澳大利亚书店以及有网页存在的书店都被添加到Trove中。目前Trove中已有78家书店零售商。Trove使用ISBN检索书商的在线目录并把“购买”标签直接链接到该条目上。私人用户也可通过点击“购买”标签询问有关资料(尤其是学术资料、当地历史资料)的购买事宜。目前Trove通过“评论”字段显示这些信息。

3.8 购买数字化的或物理的复制资料

澳大利亚国家图书馆为Trove提供了一种远程复制服务。该服务大量应用于用户免费获取书的某些章节、档案、手稿、图片等的数字化拷贝或复印本,同时还为用户免费提供在线条目的高分辨率版本。如果澳大利亚国家图书馆拥有某一条目的副本,Trove“购买”标签下就会出现“直接复制”项。澳大利亚国家与州图书馆联盟(NSLA) 在2011年开始了Re-imaging图书馆项目,鼓励每个州及地方图书馆在未来两年内实施远程复制服务。

3.9 关联用户获取认证资源

从2010年10月到2011年6月,Trove团队致力于强化允许用户在Trove中在线获取认证内容,这也是通过NSLA作为Reimaging图书馆项目中开放范围的一部分。澳大利亚的多数图书馆都订购了电子期刊及数据库。Trove与他的供应商合作向该项内容中添加元数据,并允许其用户从Trove中无缝获取所需数据资料。

4 Trove未来提高“获取”的设想

4.1 关联馆馆藏的深层链接

当用户点击某一条目外部馆的链接时,他们希望在图书馆的目录中看到该条目的位置及该条目是否可用。这种在本地目录中的精确链接(即“深层次”链接)依靠的是Trove与图书馆之间的合作。在那些未能实现深层链接的馆,用户使用Trove链接是不能在图书馆主页上获得目录检索页的,为此,不得不重新检索。目前仅有20%的关联馆可以实现深层链接,这就导致了Trove用户有既不稳定又消极的“获取”体验。在2010年底进行的可用性实验中发现这是一个重要的问题。为解决这个问题,Trove鼓励众多的图书馆实现深层次链接,并在工作界面上更清楚地识别可以实现深层链接的馆。同时,各馆在澳大利亚国家网站上可以获取到启动深层次链接的简单操作指南。

4.2 馆藏的物理空间分布

用户希望在Trove网页上看到他们当地分馆的馆藏。在ALG中有些公共馆由于各种原因未能列出其分馆,结果导致用户无法看到或选择他们当地的分馆。Trove的关联馆已认识到这样会对用户的获取体验产生负面影响。

4.3 过期的馆藏

如果图书馆不能定期更新国家书目数据库中的馆藏,Trove中的信息将是不正确的,这对于“获取”就会有负面影响。尽管澳大利亚图书馆中也会有类似的错误信息,但由于Trove的广泛使用而导致影响颇大。Trove针对未从国家书目数据库中删除的过期馆藏采取了系列积极措施。有人建议,用户可以对那些不可靠信息或他们以前访问过而现在却无法访问的记录进行标记后反馈给Trove。

4.4 没有“获取”选项的条目

对于用户来说,在Trove中没有“获取”选项就是一个检索的“死胡同”。很难识别那些没有“获取”选项的条目,也无从考察这类问题的严重程度。这类条目通常是没有馆藏,原因有二:一是该条目还未出版,但在ANBD中有最初的“预出版”记录;二是条目已绝版,有馆藏复本的馆删除了该条目。Trove正在尝试用下列方法解决这类问题:① 找到一种可以识别没有“获取”选项条目的方法;② 在Trove或ANBD中删除或限制那些没有“获取”选项的条目;③ 呼吁用户为这类条目找到一个可“获取”的选项;④ 把这类条目作为“征求”条目上传到Trove论坛、二手书店、音像店等网上空间进行公开征集;⑤ 如果该条目尚未出版,则显示其订购信息,或添加“即将推出”信息提醒用户。

4.5 中断的链接

链接数字资源时没有使用持久标识符。持久标识符与其它的网址相比更加稳定可靠。中断的链接通常会导致Trove用户陷入检索死胡同。统计发现,Trove中有3%-5%的链接会中断。Trove欲从以下几点加以改进:① 允许组织使用持久标识符代替网址;② 定期进行Trove链接检查,查找中断的链接;③ 改变ANBD的工作流程,向其中添加一个链接检查的工作流程,从而制止向其中添加任何中断的链接。

4.6 地区性报纸的数字化计划

在Trove中,利用率最高的是数字化报纸。每天Trove团队接受到读者大量的数字化报纸需求。国家图书馆联盟的建立使得诸多的数字化报纸需求的获取成为可能,并为用户提供了终端到终端的数字化服务。同时组织对图片及手稿等也做出了数字化计划,这对于用户来说是最好的获取选择。

5 结论

提高获取率需要一个多元化的方法,利用多种不同的技术和方案更好地满足用户的需求。Trove团队一直致力于提高获取率及发掘更多的获取选择,但未来仍任重而道远。提高获取率并不仅仅是国家图书馆联盟的责任,更多的责任在那些资源拥有者(图书馆、档案馆、博物馆)身上。Trove的成员需要在数字化方案准备、深层次链接支持、在线订单、更新颗粒记录等方面进行全方位的合作。

很明显,用户希望从“检索”到“获取”实现无缝过渡,而Trove恰好能实现用户的这种愿望。对用户来说,首先是实现了条目的全面数字化,且可以免费下载并查看所有条目;其次是有望建立一个快速、可靠并且价格便宜的国家级系统使用户只需简单点击鼠标就可实现排序、追踪并接收一个物理条目。Trove已经表明,实施澳大利亚发现服务满足用户需求是可能而且是非常可行的,从而成为无缝“获取”服务的典范。

[1] Rose Holley.Resource SHaring in Australia:Find and Get in Trove-Marking“Getting”Better[EB/OL].[2011-03-16].http://dlib.org/dlib/march11/holley/03 holley.html.

猜你喜欢

馆藏条目检索
馆藏几件残损《佚目》书画琐记
博物馆的生存之道:馆藏能否变卖?
瑞典专利数据库的检索技巧
《词诠》互见条目述略
知还印馆藏印选——古印篇
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
专利检索中“语义”的表现
介绍两件馆藏青铜器
对县级二轮修志采用结构体式的思考
国际标准检索