APP下载

CALIS导航库:现状、困境与发展

2009-06-01张惠君曾丽军张西亚肖小勃

大学图书馆学报 2009年3期
关键词:编目搜索引擎网络资源

张惠君 曾丽军 张西亚 肖小勃

摘要阐述了CALIS导航库存在的价值和意义,对其目前面临的困境进行了分析,并提出了CALIS导航库可持续发展的构想。

关键词学科导航导航库可持续发展CALIS

1991年HTML及Web的创建者Tim Bemers-Lee在位于日内瓦的欧洲粒子物理研究所建立了一个关于互联网网站/网页的目录系统(WWW VirtualLibrary),是迄今为止历史最“悠久”的网络资源导航。在随后的20多年间,为应对网络资源的爆炸式增长带来的信息查找和获取的不便,世界各地的许多机构或志愿者(尤其是图书馆和图书馆人)都建立了网络资源门户或导航系统。2000年4月,中国高等教育文献保障系统(CALIS)在其一期建设中首次设立了“重点学科网络资源导航库”(以下简称“导航库”)子项目,在之后的二期建设中,导航库仍是重点建设的子项目之一,CALIS为此投入了相应的财力及人力。一路走来,在获得了宝贵的建设经验、取得成绩的同时,作为导航库子项目的承建单位,我们一直在思考着这样几个问题:导航库究竟有没有存在的必要?导航库的存在与发展面临的致命缺陷是什么?CALIS导航库该如何健壮地发展?

1、CALIS导航库的存在价值

自2000年CALIS首次为导航库立项至今,来自业内的质疑之声就从未间断过:有了goodle之类的搜索引擎,读者还需要导航库吗?网络资源导航这样的数据库会有人用吗?究竟有没有必要建立导航库?总之,导航库存在的必要性一直是一个话题,值得我们加以讨论。

1.1黑格尔说:存在即合理

“存在即合理”出自黑格尔的《小逻辑》,其准确翻译是:凡是合乎理性的东西都是现实的,凡是现实的东西都是合乎理性的。在黑格尔哲学里,现实一定是合乎理性的,理性也只有通过现实才能实现自己,非现实的理性是空。世界上一切事物都是合乎理性的。由此,导航库的存在也是合乎理性的。

2006年,CALIS二期导航库项目管理组对当时因特网上的学科导航系统进行了全面摸查,截止2006年12月,网上可正常访问且更新维护正常的学术性学科门户有151个,主要分布在英国和美国,占80%左右,以英国的Intrnte最为突出。目前,我国还没有建立起像Intrnte这样的可以系统、全面地为本国高等教育服务的学科导航系统,CALIS为导航库立项具有重要的现实意义。

学科导航系统的存在,是在纷繁的网络世界为读者提供一个资源检索和推荐工具。和另一种网络资源检索工具——搜索引擎相比,二者具有显著的不同。

1.2学科导航与搜索引擎:异曲不同工的网络资源检索工具

搜索引擎和网络资源导航系统均可为用户提供符合特定需求的某一主题或领域的信息资源,具有对网络资源的检索和过滤功能,但是它们之间又存在着显著的差异:

首先,目标不同,搜索引擎以“全”为目的,学科导航以“佳”为目标。搜索引擎追求的是尽可能“完全”地抓取网页,学科导航努力将网络中最好的学科资源奉献给用户。

目标不同自然结果不同。搜索引擎会根据用户的检索要求将符合条件的网络资源“和盘托出”,而导航库中的资源是质量受控的。

其次,导航库中的每条记录都有一个“描述”字段,它是编目人员的原创信息,用户可以据此判定是否有必要访问某一网站或网页,而搜索引擎无此功能,它只是从所收录的网站(网页)中“照搬”一些信息。

从某种意义上说,学科导航具有搜索引擎涵盖不了的优势和长处,它提供的不是包罗万象的信息检索,而是用户在查找学科学术资源时值得信赖的便捷工具。

1.3它山之石:长尾理论的启示

长尾理论是网络时代兴起的一种新理论,由美国人克里斯·安德森提出。长尾理论认为,由于成本和效益的因素,过去人们只能关注重要的事物,如果用正态分布曲线来描绘,人们只能关注曲线的头部;而在网络时代,由于关注的成本大大降低,人们有可能以很低的成本关注正态分布曲线的尾部,关注尾部产生的总体效益甚至会超过头部。长理论提出后,引发了图书馆界对其的热烈讨论。

一直以来,图书馆都将数字资源建设的重点放在两个方面,一是购置数据库商生产的主流产品,二是将各自的特色馆藏数字化,从而忽视了网络免费资源的收集、整理和揭示。孰不知,身处网络之中的我们正被一个丰饶的长尾所环绕,这条长尾中蕴藏着丰富的信息资源,它涵盖所有知识领域,涉及种类繁多的资源类型,可谓应有尽有。虽然很多网络资源并非主流媒体或权威人士生产,但其中的绝大多数都是业内人士的智慧结晶,只要在网络上发布、传播,就会有同行需要,会对其他人的学习和研究有所帮助。从另一个角度考虑,由于网络资源在内容和形式方面有别于商业数据库,或许可以发挥主流数据库不可比拟的作用。

2、CALIS导航库面临的困境

2.1收藏质量:品质不佳必遭用户弃用

既然我们的建设目标是将网络中优秀的学术资源聚合起来为用户提供服务,那么数据质量就是导航库赖以生存的基础,一个在收藏内容上“名不副实”的学科导航系统终将被读者弃用,失去存在的价值和意义。虽然在导航库二期建设中制订了“追求质量、强调应用、兼顾数量”的建设原则,但是在建设过程中并未得到充分贯彻,目前导航库大约有20%的学科在数据质量方面尚未达到规定的发布要求。如果数据质量不能保持在一个较高的水准,导航库将逐渐失去用户。

2.2维护和更新:停滞意味着走向死亡

70多年前,阮冈纳赞出版了著名的《图书馆学五定律》,其中的第五定律为“图书馆是一个生长着的有机体”,认为“生长着的有机体能独自生存,停止生长的有机体将会僵化,直至死亡”。在网络资源日新月异的今天,“生长着的有机体”这一理念用在以收录优秀网络资源为目标的导航库上似乎更加合适。网络资源的动态性特征决定了它是CALIS子项目中最需要及时更新维护的,因为过时的资源著录信息对任何人都没有意义,甚至可能误导用户,损害用户利益,从而“败坏”导航库声誉。

从一期、二期导航库建设的情形看,验收后的更新维护不及时甚至停滞已经成为其可持续发展的羁绊。以二期导航库为例,在项目处于学科验收和学科评优前夕,平均每天收割的数据量为几千条,一旦验收结束,极少有数据更新,有时一周都没有一条记录更新,如果不及时解决这个问题,CALIS导航库真的是难以在因特网上健壮地生存下去。

2.3项目组织管理:监管不力制约目标实现

项目组织管理是CAMS导航库面临的另一问题,这个问题最直接地表现在项目管理单位与参建馆的信息沟通方面。在项目建设过程中,很多工作需要参建馆的反馈,然而,总有少数参建馆对此置之不理,可是当牵涉到利益问题时(如下拨经费),所有的参建馆都反应迅速,可见信息反馈的渠道是畅

通的,只是参建馆一方因为种种原因不愿配合而已。沟通不畅从一个侧面说明监管方面存在着问题。

监管不力不仅影响项目进展,还关系到数据库的建设质量。如果导航库想在今后谋求健康发展,就必须改变现有管理模式,从根本上解决由此产生的诸多问题。

3、CALIS导航库可持续发展构想

针对导航库二期建设存在的问题,项目承建单位西安交通大学图书馆进行了深刻的总结和思考。要保证CALIS导航库项目的可持续发展,必须从以下几个方面人手。

3.1改革管理模式:解决项目管理问题的根本

我们考虑在三期建设时采用更为开放的管理模式,充分集结各方力量,调动广大有志者的积极性,共同建设CALIS导航库。三期可能采纳的管理方式包括:

(1)调动项目管理组成员馆的积极性,由他们共同分担管理工作。

(2)可考虑吸收商业机构加入导航库的资源建设。

(3)为确保资源建设责任到人,拟采用以个人名义申报的方式来选择学科导航资源建设者,这将是CALIS项目申报的一次变革和尝试。

(4)以更加开放的方式吸纳建设者,不考虑申报者所在学校的大小,不限制参建者覆盖学校的数量,充分体现CALIS“共建、共知、共享”的精神。

(5)一个学科可以由来自不同学校的多个馆员参与建设。

(6)为每一位热心的志愿者提供更加友好的推荐资源的窗口。

我们期望能够通过上述管理模式的改变带动导航库项目建设的良性发展。

3.2系统升级:提升效率和服务

通过二期建设,我们构建了CALIS学科导航数据库资源建设与发布平台,建立了由中心系统和本地系统组成的两级分布式建设和服务体系。整个系统采用分布式数据收集和编目、集中服务的模式。近几年的建设实践告诉我们,当前导航库系统主要应从工作模式以及学科导航门户网站这两个方面加以完善和改进。

现有工作模式主要有两方面不足:本地系统安装和维护问题、本地系统和中心系统数据更新同步问题。针对这两个问题,导航库项目管理组正在考虑改变资源建设工作模式,即:将现有的使用本地系统进行资源搜集和元数据编目的方式改为远程访问操作,不再使用本地系统。改变后的工作模式具有人员分布式、编目集中式的特点。

导航库门户网站是下一步系统升级的重点。目前的网站具备了一个门户网站应有的大部分功能,但在易用性和界面友好性方面还需优化,包括检索、浏览、页面设计、帮助信息的改进以及智能化等。

3.3完善标准规范:高水平数据质量的保障

CALIS二期导航库项目管理组专门组织人力制订了《资源选择标准》、《元数据规范》、《著录规则》、《资源类型表》等四个相关标准与规范。从使用情况看,前三者基本可以满足资源选择以及资源描述的需求,问题主要集中在资源类型表的设置。

CALIS导航库在进行资源类型的设定时,遵循学术性、准确性、可操作性、通用性的原则,设计了一个二级体系。根据网络资源呈现的不同属性将其归纳为8个一级类目;每个一级类目下包含若干个二级类目,均为具体的资源类型,共29个。当时我们认为这是一个数量适中的、可操作性较强的资源类型表。

但在对资源描述质量进行评价的过程中我们发现,资源类型标引不准确、归类不一致等现象超出预期,出现这些问题,既表明编目人员的使用经验欠缺,同时反映了现行的资源类型表存在着某些不完善之处,造成使用过程中的困惑。资源类型表的设置和使用可以从多个方面加以完善和改进。

(1)扩充资源类型,建立完整的资源类型表。

网络资源类型庞杂,远非29个资源类型可以涵盖,致使编目时很多资源无合适的类型可归,如临床医学的病历,造成资源标引工作的不便和标引结果的混乱。解决这一问题的最直接、有效的方法是:保持一级类目不变,扩充二级类目,尽可能完全地罗列现有网络资源类型,以避免编目人员在标引时去“挂靠”或者往“其他”里面塞,用户在查询时也不用去猜测、揣摩。

(2)制定规则,灵活使用资源类型表。

设计一个完全的资源类型表,并不表示每个学科都要用到那么多资源类型,各学科应根据本学科网络资源的特点来确定需要使用的资源类型种类。事实上,其他权威的学科导航系统也是这么做的,例如英国著名的Intrnte,它的资源类型为72种,但在实际使用时,每个学科为10-20种不等。

(3)适应发展,允许资源类型扩充。

网络世界日新月异,今天还不被多数人关注的小众资源类型,明天也许就会成为传播学术思想的有力工具,因此应该在使用规则上允许编目人员根据实际需要扩充资源类型,同时还应改进编目系统,使之从功能上得以实现。

(4)加强指导,正确使用相关规则。

就像学科分类会遇到交叉学科一样,对网络资源归类也会碰到类似情况,某些资源可能具有多个类型属性,例如一个教学资源,它同时又是多媒体资源,这时该如何处理呢?在导航库《著录规则》中这样规定:“若该资源类型符合多种资源类型,描述其多个资源类型词组之间用‘;隔开,或以多字段的形式进行反复著录”,只有将其所呈现的属性全部进行揭示,才可以保证用户查询结果的完整性。但是,在实际中绝大多数记录都只进行了单一资源类型标识,可见各参建馆对著录规则的内容还不够熟悉,理解还不够透彻,项目管理组应加强这方面工作,提高资源标引水平。

4、结论

CAuS导航库是不同于搜索引擎的优秀网络资源的集合,它的存在对于高校的教学和科研有着不可替代的作用。目前,导航库已经初具规模,具备了为用户提供服务的基本条件,数据库更新维护已成为下一阶段的工作重点。为保证导航库的可持续发展,必须在今后的建设中理顺管理模式、提高工作效率,改进系统、完善标准规范,只有这样,才能提供更好的服务,将CALIS导航库打造成文献资源共建、共享的优良品牌。

猜你喜欢

编目搜索引擎网络资源
国家图书馆藏四种古籍编目志疑
粤剧编目整理之回顾与展望
网络资源在高中班级管理中的运用
CALIS联机合作编目中的授权影印书规范著录
谈网络资源在大学计算机教学中的应用
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
网络资源在语文综合性学习中的运用