我国特色数据库建设问题与对策
2010-03-22陈全平
●陈全平
(1.南开大学 信息资源管理系,天津 300071;2.东莞松山湖图书馆,广东 东莞 523808)
1 前言
特色数据库是依托馆藏或可获得信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将本馆或可获得的特色资源数字化,以满足用户个性化需求的信息资源库。[1]随着专业细化、学科交叉、知识爆炸的信息社会的快速发展,特色数据库有助于及时、准确、高效地获取专业信息。
我国特色数据库建设始于20世纪90年代,特色数据库的建设经历了萌芽起步阶段(1995年前)、稳步发展阶段(1996—2000年)、快速发展阶段(2000年后)三个阶段。[2]特色数据库的名称源于自建数据库这个概念。在萌芽起步阶段,各级别的专业及综合性情报机构初期依托馆藏,着眼于自建数据库建设,诞生了一批书目型和文摘型专业文献数据库;在稳步发展阶段,“中国高等教育文献保障系统”和全国文化共享工程项目的启动,又诞生一批各具特色的书目型、文摘型数据库和少量全文型数据库;快速发展阶段,在以上基础上增加图文等多媒体型数据库,一些软件公司专门针对图书馆自建特色数据库的工作,提供一些数据库的发布工具,如清华同方TPI、易宝北信TRS、国图数字DIPS、北大方正DESi等,这些软件工具为图书馆自己建设数据库带来了很大的便利。截至目前,全国建设了一大批各具特色的数据库,从规模上看,比较大的数据库群有中国高等教育文献保障系统(CALIS)“十五”全国高校专题特色数据库,公共图书馆依托全国文化共享工程项目和通过自建等建设的特色数据库,[3]区域合作建设如天津高等教育文献信息中心建设的包括“动植物病害智能诊断专家系统”等14个特色数据库[4]的数据库群。从内容上看,比较有代表性的是反映高校特色[5](学科、专业等)、民族特色[6]、地方特色[7]、企业特色[8]、需求特色[9]等的数据库,涉及范围广,覆盖的主题众多。然而,在特色数据库的建设中还存在一些问题,如建设意识、开发水平、地区分布不平衡等,因此,无论是从原则的制订和把握上,还是从实际的采集、加工、发布和利用上,都有值得进一步研究和探讨的必要,特别是针对存在的问题找到相应的对策是具有重要意义的。本文拟从国内特色数据建设中存在的问题出发,探讨研究相应的对策,以期与同行交流。
2 特色数据库建设存在的问题
2.1 建设意识薄弱
主要表现为:①从规模上看,一是特色数据库建设主体单位的数量和比例偏小,二是各建设主体单位间的数量比例不均衡,高校图书馆表现积极,所占比例较大。[3,5]②从建设主体上看,特色数据库建设由谁承担和由谁组织缺乏统一的权威机构来统筹规划解决。③从认识上看,特色数据库建设主体单位或建设者们对特色这个概念在一开始就缺乏一个清晰或者基本统一的认识和理解,存在许多误区,导致特色数据库建设沿不同方向进行,常常存在找不准方向、找不到重点、找不到特色等现象,有时即使已经开发建设了特色数据库,但常常存在对特色资源的挖掘不深,满足于表面内容或华丽的外表。④由于特色数据库的特殊性(使用范围、使用对象和采用的技术等),对于特色数据库的评价缺少或没有比较一致认可的指标体系和方案,从而影响了特色数据库建设的热情和动力,常常出现建设期间热情高涨,维护期间偃旗息鼓甚至惨遭废弃或淘汰。
2.2 开发层次偏低
主要表现为:①从数据量上看,数据库规模小,专业面窄,数据量不足,文献收藏覆盖面(时间范围、内容范围)不全,以本单位收藏为主,以网上资源为辅,馆藏联合数据所占比例较小。②从文献类型上看,文献类型单一,书目、题录类型信息多,全文、图片、音频、视频等类型较少。③从数据标引上看,原始信息不全,特殊文献标引的规范性和准确性不够(原因一是根据规范标引时,本身难度大,二是有时无规范可用时,需要自定义),缺乏数据质量控制(即使使用统一标准和规范,但在相关度和深度上因人或单位而异,数据内容缺乏评价标准),标引中也存在人为原因导致的错误。④从资源组织上看,由于缺少现成的、标准的分类体系和主题词表,要形成科学、合理、符合用户习惯的分类组织体系及方便的主题浏览检索体系比较困难,从而使严密的知识组织体系的形成或构建变得更为艰难。⑤从信息服务功能上看,文献揭示深度不足,资源加工整合力度欠缺,缺乏信息增值服务,检索功能(检索途径或检索式构造、检索结果处理)不强,一站式检索功能不足。⑥从整体开发水平上看,有处于初级或雏形阶段的,有处于发展和成熟阶段的,层次不齐,并且技术选型上也存在一定差异,数据库接口不规范、互操作性不强是常见的问题。
2.3 选题主题偏窄
主要表现为:①从选题主题来看,公共图书馆的选题反映地方经济、政治、参考决策等内容的数据库偏少,高校图书馆的选题反映地区特色或地区某一领域特点的偏少,科学院(所)图书馆和专业及综合情报服务机构反映新型产业和行业发展的数据库偏少。②从选题分布来看,存在重复建设、缺乏协作和区域发展不平衡等问题;③科学院(所)图书馆和专业及综合情报服务机构(包括商业数据公司)大多依托本单位的和可获得的资源建设面向各行业的特色数据库,但由于盈利和非盈利之差异,使得特色数据库的质量和服务存在较大差异,在一定程度上也影响使用范围和使用效果。
2.4 标准化和规范化程度偏低
主要表现为:①软件平台层次不齐,有自主开发的,有合作开发的,也有购买成熟商业软件的,但有时缺少统一如标引系统、检索系统、操作系统、功能指标等方面的标准和共同遵守的如标引、分类、检索点选择等方面的规范,其中对重复数据(同一个数据库的数据重复、不同数据数据库的数据重复)处理、文档格式(包括文献数字化后的文档格式和文献加工后的文档格式)处理缺乏相应的控制机制。②即使制订了一些标准和规范,但在执行中或多或少存在一些差异,而且这些标准和规范不能覆盖所有特色文献,需要自行制订相应的操作规范,由此带来更多差异。
2.5 知识产权问题突出
主要表现为:特色数据库的数据来源大部分涉及到知识产权问题,文献数字化复制性质导致的数字化文献的著作权等问题,网络资源的加工利用带来的版权问题,现有法律条例无法适应文献信息资源网络化发展的要求问题,由此而导致的文献资源作者、建设者、利用者合法权益的合理合法解决问题等,都是特色数据库建设、使用中不能回避的问题。②特色数据库的自主权或知识产权,如数据库软件、数据库数据等保护是一个容易被忽视的问题,需要从法律、运营、技术三方面考虑和解决,使特色数据库成果得到合理合法地使用和保护。
2.6 宣传利用效果不够
主要表现为:特色数据库建设初期宣传力度大,有一定使用效果和社会效益,但建设中后期缺少宣传和培训,加上使用中或多或少的限制,其利用率不高,影响力小,造成“养在深闺人未识”的窘境,形成资源有特色而利用效果不好的局面。因此,适时引入有效机制甚至是市场营销的各种策略和手段,对特色数据库推而广之,树立品牌,使更多的用户了解与利用,达到社会效益最大化。
2.7 合作建设协调不足
主要表现为:①有合作协议,因协议的可操作性不强,在实际运转过程中存在很多困难。② 有合作愿望,因合作单位间存在人员、技术和基础条件的差异,对合作缺乏信心或缺乏合作积极性。③有利益双赢意愿,因分工不明确和不公,利益存在冲突或难以协调,合而不作或者享而不建是合作中常出现的问题。④合作的统一管理机构缺失,或者即使有,常缺乏权威或有效的行政权利和手段来组织合作建设。
3 特色数据库建设的对策
3.1 投入是关键,意识是灵魂,人才是根本,技术是支撑
(1)财力、物力、人力的投入是软硬基础设施的保障。特色数据库不论规模大小、技术难易程度、建设周期长短、开发主体和使用对象各异,均需要一定的量的投入,包括设备、场地、人员、管理及各类型文献信息资源等方面,而且进行特色数据库的后续维护、数据更新等又需要持续不断地投入。如CALIS管理中心设有专项资金资助,但各承建单位也提供了配套资金或人力物力进行建设,特别是后期投入是特色数据保持其生命力长久的重要因素。投入是特色数据库建设任何阶段必要的“动力”,因此,多途径争取投入是特色数据库建设的首要任务。
(2)特色数据库资源建设意识是特色数据库建设获得支持的保障。意识有多高,重视程度就有多强,意识源于数据库事业发展的需要和市场需求。各级公共图书馆主管部门领导和图书馆领导、高校图书馆主管领导和图书馆领导的高度重视及图书馆的广大工作人员的热情和努力促进了特色数据库的建设。如在全国文化共享工程和CALIS工程的项目推动下,出现了一批高质量的特色数据库;高校图书馆根据馆藏情况和用户需求建设了一批各具特色的数据库。强烈的事业意识、责任意识、服务意识是特色数据库建设获得支持的强有力保障,因此,需要以项目为载体、以成效回报政府或用户,逐步将这些意识渗透到文化部门各级领导、特色数据库建设主体单位领导和建设人员。
(3)一群具有高素质的建设人才是高质量完成特色数据库的保障。特色数据库的建设表明,要完成高质量的特色数据库建设,除需要与普通数据库建设需求的专业型高素质人才外,还需要具有对特色数据库所涉及的文献有一定研究和造诣的专业技术人员、专家和具备一定管理和协调能力的优秀管理人员。因此,需要提供优质工作环境和出台人才吸引政策,从而招到合适人才、培养有用人才和有效管理人才,以期满足特色数据库高质量建设的要求。
(4)先进的技术平台是特色数据库发挥有效作用的保障。特色数据库的开发要采用先进、实用、合乎数据库特点的技术标准、技术规范、技术平台,以确保开发出来的特色数据库具有较强的可扩展性、可移植性、易用性、易维护性等。因此,采用的先进技术平台提供的相应功能要能够满足使用对象的需求,能充分挖掘特色数据库的信息资源,特别是其中的关键技术的采用和应用要合理科学,如超大规模内容数据的管理技术、多媒体技术、人工智能技术、XML技术等。
3.2 选题是关键,特色是灵魂,服务是根本,建设是支撑。
(1)选题是特色数据库开发方向正确的关键。好的选题一方面要体现特色,另一方面要有明确的使用对象。好的选题是在充分调查、研究、分析、比较的基础上确定的,好的选题是数据库开发成功的一半。特色数据库选题应遵循需求第一、特色为重、优势互补、先易后难、不重复建设的总原则。
(2)独特性是特色数据库的灵魂所在。特色数据库的特色一方面要体现内容独到、精辟和有风格,别具一格;另一方面要体现内容的价值和生命力,以形成具有权威性的高价值的特色数据库。独特性是特色数据库区别于其他数据库的标志。
(3)服务是特色数据库开发的根本。一方面要通过宣传、培训推广特色数据库,让更多的用户知道、了解并且学会使用特色数据库,为特色数据库找到最佳用户;另一方面要能为有需求的用户提供最佳的产品和服务,提供满足需求的服务是特色数据库建设目的所在,是其生存延续和可持续发展所在。注重特色数据库的附加值,提供信息增值服务是特色数据库发展创新的方向之一;对于涉及信息增值服务和链接获取原文需要付费的还要提供配套的、便利的费用计算和收取服务。
(4)建设是特色数据库服务的重要支撑。特色数据库建设带来了提供特色服务的机会,然而其建设是一个长期的、系统的复杂工程,后续维护和更新是特色数据库保持旺盛生命力的关键。因此,特色数据库建设要想可持续发展,就必须要走联合、协作、共建共享之路。
3.3 共建是关键,共享是灵魂,协作是根本,发展是支撑
(1)共建是特色数据库大规模和高质量的关键。特色数据库建设有多种方式,共建带来了合作,可以带动更多的单位参与建库工作,获得共同发展的机会,共建可以使特色数据库建设得更为完善、全面,为使特色数据库做大做强和更具特色提供机会。因此,在资源和技术等全球化、用户需求多元化背景之下,不论单个共建单位之间,还是区域内的共建单位联盟都要将共建理念、共建规划、共建制度、共建框架、共建实施、共建控制、共建评价等方面落到实处,要有切实可行的操作方案。
(2)共享是特色数据库建设充分发挥功能和价值的灵魂。共享是共建的目的之一,共建为共享提供了可能。共享是当今网络信息时代文献信息资源发展和用户市场需求发展的必然要求;共享节约了特色数据库开发、维护、使用成本;共享能让更多的用户参与到数据库的建设中来,如通过用户反馈信息,改进特色数据库建设,促进提高特色数据库质量。因此,要合理、合法、有效地扩大特色数据库使用范围,巧妙规避相关政策和规定及与知识产权相关的条款限定,使更多的用户享受特色数据库建设成果。
(3)协作是特色数据库有效建设和高质量的根本。统一的规划和宏观管理,统一的组织结构和规章制度是有效开展共建特色数据库的前提,而协调管理也是至关重要的,良好的协作能产生协同效应。因此要做到:建立合作组织结构和规章制度,遵守合作协议和规定;建立权威性协作协调机构,安排专职协调人员管理;建立交流和沟通机制,保证合作中信息交流通畅。促使特色数据库的建设高效、完善。
(4)发展是特色数据库生命力和活力的重要支撑,其特点是体现一个“特”字,强调一个“专”字,重在一个“用”字,求在一个“新”字。不论特色数据库是处于筹建期、建设中,还是处于使用中和维护期,特色数据库的开发技术应以实用为原则,选择最新最适宜的技术;数据库类型应从文本型、书目型、文摘型等常见的类型逐步过渡到图文并茂、声像俱全的多媒体类型;数据库内容应保持一定的更新频率,提供更方便的利用形式。任何数据库都存在一个生命周期,即包括构思、规划、开发、应用发展、消亡等阶段,特色数据库也不例外。总之,特色数据库只有处于不断发展中才具有较强的生命力和活力,才能更好地为用户提供独到的优质服务,否则就可能遭到被淘汰从而消亡的命运。
[1]范亚芳,郭太敏.特色数据库建设若干问题研究[J].情报理论与实践,2008(4):550-553.
[2]王小琼.我国图书情报系统自建特色数据库研究概述 [J].现代情报,2007(12):28-30.
[3]覃凤兰.公共图书馆特色数据库建设调查分析及对策研究[J].图书情报工作,2009(8):83-87.
[4]李凌杰.天津市高校图书馆特色数据库建设现状与分析 [J].图书馆工作与研究,2008(9):71-74.
[5]肖乃菲.西南地区高校图书馆特色数据库建设的现状与分析[J].图书馆工作与研究,2009(1):45-48.
[6]苏萍.构建维吾尔语言文学专业特色数据库[J].图书情报工作,2006(S2):97,100-101.
[7]马莎,等.攀枝花苏铁特色数据库建设[J].图书馆,2007(5):107,110.
[8]勾学海,等.吉林省企业竞争情报系统特色数据库建设研究 [J].情报科学,2005(5):730-737.
[9]高建林,等.基于Internet的“廉政文化研究”特色数据库模型架构的设计与开发[J].图书馆学研究,2009(11):20-24.