长江流域水利文献信息资源共享研究
2011-11-20黄艳艳
黄艳艳
(长江水利委员会网络与信息中心,湖北 武汉 430015)
随着社会信息化进程的不断加快,信息资源占有量的增加是信息化发展的必然趋势和时代要求。计算机网络的日益普及,数字化技术的日趋成熟,可以最大限度地突破时空限制,为人们提供方便快捷丰富的信息资源。不同组织和机构拥有海量信息资源得到有效共享是社会信息化的重要课题。在水利信息化建设中,水利系统各个部门和机构也逐步把文献信息资源共享建设放在重要位置。2001年4月,在全国水利信息化工作会议上,“水利数字图书馆工程”被列为水利部《金水工程“十五”计划及到 2010年规划纲要》中的任务之一[1]。长江水利委员会(以下简称长江委)作为水利系统最大的流域管理机构,涉及的部门多、专业广,急需先进的文献信息资源服务。2009年,长江委数字图书馆开始建设,这既是长江委信息资源开发、利用和共享的需要,也是与全国水利信息资源共享与整合的必然要求。
1 长江委数字图书馆总体设计
长江委数字图书馆建设计划用3a时间(2009~2011年),依托长江委已有的信息网络,通过对文献业务需求和功能的系统梳理,采用基于统一的标准、技术架构,开发可以覆盖全长江委的重要单位的数字图书馆,配备必要的硬件网络环境,建成具有国内先进水平的开放式水利文献信息资源共享平台(数字图书馆应用平台),整合不同类型的文献信息资源,向长江委的管理、科研、技术人员等用户提供免费的文献信息服务[2]。
长江委数字图书馆平台主要包含信息资源、应用软件系统2个相对独立的建设内容[3]。
长江委数字图书馆平台的总体框架是由标准规范层、基础设施层、系统软件层、应用软件平台层、数据库资源层、用户服务层等6层自下而上组成的,其中标准规范层主要是定义所有的技术标准、资源加工规则、文献信息著录规则等方面标准规范,是数字图书馆统一规划与建设的前提;基础设施层是系统运行的硬件环境;应用软件平台层是水利文献信息资源共享平台工作平台。总体结构如图1所示。
2 长江委数字图书馆应用系统建设
应用系统平台建设是长江委数字图书馆建设的基础,数字图书馆应用系统建设需要实现对内外部各种异构信息资源的高度集成整合,实现对于信息资源内容的采、编、发加工处理,实现信息资源的快速统一搜索,实现信息资源的个性化信息服务等。
图1 基础信息管理系统网络结构图
2.1 数据资源整合
数据资源整合是通过各种手段和工具将已有的信息资源集成起来,并按照一定的逻辑关系进行组织,实现信息资源的有效共享,为用户提供规范化的信息服务,为后续信息的管理与使用提供规范。长江委数字图书馆采用了元数据整合方式,系统通过将各种类型的数据进行清洗、转换、加载的方式合并入1个大的数据仓库中,数据资源整合示意图如图2所示。
图2 数据资源整合示意图
2.2 信息资源采编发
信息资源采、编、发主要完成对系统信息资源的维护与管理,包括信息采集、加工处理、分析和发布等后台维护管理功能。
2.2.1 信息采集
信息采集子系统通过信息采集转换工具完成各种格式数据文件或光盘数据的数据转换、批量加载和维护、处理功能。信息采集的主要信息源包括互联网信息源、文档信息源、自身数字化加工的各种资源和关系数据库信息源等。
互联网信息采集实现对于各种外部互联网网站信息的监测和采集,用户完全能够根据自己对网页信息源的需求,实现网页信息的抽取与加载入库。
文档信息源采集实现各种格式文档的按目录分类标引,自动扫描,特征标引,全文抽取,原始链接生成,自动入库等功能。
资源数字化加工主要完成各种纸质档案、电子图书和期刊、产品技术资料等纸介质的快速扫描和识别,并能够抽取相应的文本数据用于全文检索,同时能够将扫描图片组织成可原样显示的电子文档或图书全文。
关系数据库信息源采集主要解决已有数据库信息的整合和数据加载,支持 Oracle,Sybase,DB2,SQL Server 等各种主流异构关系数据库的数据导入和整合[2]。
2.2.2 信息加工处理
信息加工处理子系统主要包括内容采、编、发和信息统计分析。内容采编发用来支持流程可定制的信息编辑、分类标引,信息审核和签发;信息统计分析提供信息采集、加工处理的日志浏览,信息采集、加工处理的日常统计分析,信息生产的考核管理功能。
2.2.3 信息发布
信息发布子系统主要完成发布信息门户的定制管理,以及根据定制配置实现信息门户站点的生成。
2.3 信息服务
数字图书馆平台的信息资源非常丰富,基本能涵盖各类用户的需求,然而这些资源情况比较复杂,如何让用户从海量的数据资源中突破各种客观因素造成的障碍而获得目标信息是平台功能建设的关键。这就需要我们为用户提供多种模式的服务。长江委数字图书馆向用户提供统一检索、原文传递、定题服务、参考咨询等多元化的服务。
2.3.1 统一检索
用户通过统一的资源搜索入口,可以快速搜索所有整合资源,如各种本地数据库、采购镜像系统数据库、各种网络电子资源,可以对资源进行全文、字段、高级组合、二次、跨库等检索,也可以进行资源浏览,查看资源详细信息,获取和下载资源原文,统一检索示意图如图3所示。
图3 统一检索示意图
为了提升统一检索能力,统一检索平台提供多种检索方式,如支持模糊检索,文中的任意字、词、短语、句和片段检索。用户通过统一的检索方式、输出格式,对于网格中的任意资源进行检索、调用、全文获取和访问。
2.3.2 原文传递
原文传递主要满足以下2方面的需求:1)平台用户查询到的平台资源提供原文下载,只能通过原文传递的方式返回给用户;2)平台数据资源少,用户委托平台管理人员代为检索,并将检索结果通过原文传递的方式返回给用户。
用户在提交原文传递申请时,填写联系方式及需要的文档的介质类型。平台将检索到的结果通过传真、信函、电子邮箱等多种途径将纸质或电子文档传递给用户。
2.3.3 定题服务
后台管理人员利用专题管理模块定制各种各样的专题,结合订阅推送将相关专题内容推送到用户注册邮箱里,供用户离线浏览。
2.3.4 委托检索
图书馆工作人员根据委托人提供的检索命题及准确的检索词,在平台丰富的电子资源、网络检索系统和其他联机资源范围内,代为检索题录、文摘或全文资料,将检索结果以索引、摘要或全文等形式通过拷盘复制、E-mail 发送或打印输出等手段提供给委托人。
2.3.5 参考咨询
在参考咨询单中,读者填入问题标题和描述,提交咨询问题表单,由对应咨询人员进行咨询问题回复,并将回复结果在用户个性化的参考咨询中予以展现。
3 长江委数字图书馆文献信息资源建设
文献信息资源建设是长江委数字图书馆建设的重点,通过采用“自建+引进”的建设方式,逐步建立长江水利数字文献资源体系,长江委数字图书馆规划建立以下3大类信息资源库:
1)水利特色专题文献数据库。围绕水利创新和技术进步的战略需求,广泛收集水利特色文献资源,按照专业内容,建设多个专题数据库,包括防洪减灾、生态环境保护、水资源开发与保护、水土保持、流域管理、湖泊治理和库区移民等专题文献数据库等。
2)常用科技文献专题数据库。针对广大职工工作和学习的需要,建立或引进论文、标准规范、法律法规和电子图书等全文数据库资源。长江委数字图书馆拟建的数据库包括长江委馆藏中文图书和期刊、法律法规、标准规范、科技文献信息、会议论文、外文文献、数字图书和中文期刊全文等数据库。
3)网络资源数据库。根据工作和生活的需要,图书馆专业工作人员从互联网抓取有价值的信息,建立网络信息资源数据库,主要包括热点追踪、生活百科数据库,以及视频、音频、图片和电子书等多媒体数据库[2]。
4 结语
长江委数字图书馆作为长江水利文献信息资源共享的应用平台,为实现水利文献信息资源共享提供基础,为水利信息化和管理决策提供重要数据支撑。在社会信息化快速发展的今天,长江委数字图书馆也需要明确自己的发展方向。在应用平台建设上,数字图书馆一方面要以满足用户信息需求为导向,以用户方便快捷获取文献资源为目标,不断修改完善已有的系统平台;另一方面要根据 “数字长江”规划任务,逐步向“长江委数据中心”提供基础数据作为发展方向。在文献信息资源建设方面,应该在长江委系统内部进行水利文献信息资源共建共享模式的探索,让更多的单位参与到信息资源共享共建中来,避免资源重复建设,使有限的财力和人力资源得到合理配置,保证水利文献信息资源建设的顺利延续。
长江委数字图书馆的共建成员可以包括水利部、各流域管理机构及长江委委属二级单位,使得长江委所有的宝贵信息资源得到充分利用,也使整个水利系统的资源为长江委所用,真正实现水利信息资源的有效共享。
[1] 李晶,姜斌,刘倩,等.水利数字图书馆[M].北京:知识产权出版社,2006: 155.
[2] 黄艳艳.长江委水利电子文献信息资源系统建设实施方案[R].武汉:长江水利委员会网信中心(长江档案馆),2009: 5.
[3] 吴昌春,庄宇,张红建.浅谈水利信息资源共享体系的构建模式[J].水利发展研究,2006(9): 43.