谈图书馆地方文献特色数据库的构建——以衢州市为例
2010-05-12胡建峰
胡建峰
(衢州市图书馆,浙江 衢州 324000)
〔作者信息〕胡建峰,男,信息技术部副主任,馆员。
地方文献数据库是图书馆为科研、生产活动提供信息服务的重要情报源,它汇集了特定地方的政治经济、文化教育、历史地理等各方面的文献资料,向读者提供地方文献的全文信息或检索线索。近年来,各地方图书馆都在积极开展地方文献数据库的建设工作,衢州市有关部门和图书界的同仁们都十分重视,市图书馆、各县图书馆等都在这方面做了不少的工作。但是,由于各个单位在文献收集和管理上各自为政,缺乏宏观调控,造成衢州地方文献在建设上还缺乏整体性和规划性,在利用上不能实现资源共享,在文献的管理和揭示上更是缺乏规范性和系统性。为此,建立以网络为基础条件的地方文献数据库,为挖掘和利用地方文献资源提供一个共建共享的大平台,对于推动衢州经济文化建设和对外开放都具有积极的意义,也是衢州图书信息服务科研工作中的一项基础工程。
1 地方文献建设的现状与问题
几年来,衢州市图书馆充分利用报纸、广播、电视等媒体,广泛宣传图书馆地方文献工作的重要意义和地方文献呈缴本制度。注意发挥地缘优势,广泛向全国各地衢州籍专家学者寄发征集函。与此同时,又注意加强与各级党史办、方志办、地名办、政协文史委、统计局、社科联、文联、科协等有关部门的沟通交流,努力构建文献征集网络。
据统计,市馆地方文献藏有 8613种,14326册。其中,各种地方志、专业志 115种 232册,地方年鉴 37种 72册,地方党史、组织史 95种 219册,地方史料 197种、451册,府、县古地图 30幅。通过重点征集与长期挂钩征集相结合,收集各种报刊 76种 823册;通过服务征集与追踪征集结合,从《四库全书》中查找复制宋代程俱的《北山小集》40卷、《麟台故事》5卷;元代吾丘衍的《周秦刻石释音》、《学古编》、《闲居录》各 1卷,以及《竹素山房诗集》3卷;衢州历代名人中,衢籍作者的传世佳作录入《四库全书》的有 43人,61种 594卷。通过剪报辑录的《三衢儿女》专题人物 225位,为衢州名人专题数据库的建立奠定了基础。
通过抽样调查的方式对部分文献收藏单位进行地方文献收藏情况调研,基本情况归纳为以下几个方面:
1.1 收集和管理缺乏统一规划,缺少主动合作
衢州地方文献的蕴藏量非常丰富,但收集工作呈分散性和多样性。如开化县图书馆历来非常重视地方文献工作,但是只针对开化境内的文献收藏,而衢州市图书馆主要负责对全市文献的收藏,部门之间的重复工作造成了资源浪费;另外,图书馆、档案馆、地方志办公室等多家之间缺少主动合作和有效的管理机制,出现有些文献缺藏的状况,使得整个地区的文献建设缺乏完整性和系统性。
1.2 缺少学术研究性的地方文献
一方面是因为对地方文献的收集范围在概念上缺乏统一的认识,另一方面各收藏部门受自身人力、物力和技术条件的限制,对一部分学术研究型的文献的收集,衢州地区几乎处于空白状态。如发表在学术期刊上的学术论文、专业性学术会议论文和一些特种文献。而这些文献能在很大程度上反映出本地区的经济、科技和文化的发展,对地方建设有很重要的指导意义。
1.3 地方文献开发形式单一,技术手段落后
首先,地方文献的各个收藏部门基本上采用手工为主的低层次的加工处理方法,作为信息产品只能在局部范围内利用;其次,对文献开发的随意性较普遍,而且,文献著录不规范、标准不统一,难以适应数字化和网络化发展的需求,使得地方文献无法实现网络化的共享;再者,整个衢州地区地方文献收藏单位因功能和职责不同,给利用带来很大的不便。如文保部门主要是以保存为目的,一般不作为信息提供需求者使用,同时从文物保护的角度考虑还要尽量降低使用频率。尽管如此,这部分文献会因保存时间过长而逐渐毁坏。
2 构建衢州地方文献数据库的基本思路
2.1 建设要求
数据库建设是运用高速发展的计算机、网络、影像描述技术,把存放在库房里的各种地方文献变为便于存放及查看的电子文献,并存入大型数据库,建立网络图像管理系统。目的是提供丰富的信息资源实现资源共享,尤其是在网络环境下必须要求拥有完善的、结构合理的检索功能体系。根据地方文献数据库建设的要求,信息存储一般需要具有以下特点:
①系统能完全兼容CDS/ISIS、ISTIC/ISIS、QuickIMS的数据及其功能;
②界面标准化,和其它数据库产品在界面上保持风格一致,提供数据库桌面管理工具的全部数据维护管理功能;
③用户可在本地建立自己的 R M S数据库,包括数据库的定义、数据维护(可定制数据维护格式)、索引维护、检索、排序、分类和统计报表等;支持用户自定义报表、统计分析、分类检索、逻辑子库等功能;
④可完成MARC、ISO-2709、XML等格式的数据交换功能, 可将任意格式的关系数据库导入本系统;
⑤支持基于字典的标准数据维护和记录间的数据复制和拷贝,在系统数据维护方面,支持数据字段的缺省值维护,支持表格式维护和用户自定义格式维护,简单易用;
⑥全面支持子字段、重复字段和外部文件、多媒体等对象数据处理;支持基于词表的自动标引,支持大小写敏感标引和检索;支持字段检索、自然语言搜索等全文内容的搜索和结果排序输出;
⑦可同时管理本地的远程授权资源库;系统支持数据库的基于日志的数据备份与恢复功能。
2.2 建设方式
2.2.1 信息资源目录体系的建设
为了便于信息资源的采集、处理和利用,必须对浩瀚的信息进行合理的分类,目录体系是在合理的信息分级、分类基础上,将所有业务工作所需的信息资源编制一个统一的目录。通过目录服务使信息资源的使用者、维护者方便地按照目录和索引的导航进行工作。信息资源目录体系是全面整合信息资源的先决条件,也为未来的统一信息服务平台的建设奠定基础。
2.2.2 建设信息资源数据库平台
全面整合信息资源采集渠道、信息内容,建设图书馆信息资源特色数据库平台。将现有的地方特色文献进行数字化加工,形成可以直接利用的电子文献,并借助平台的便捷性为读者提供资源的查询利用。
2.2.3 建设统一信息服务平台
整合各种信息资源和业务模块,建设具有先进水平的集信息采集、存储和服务于一体的多功能平台,能够全天候及时地为读者提供信息服务。
2.2.4 安全保障体系建设
建立信息安全保障体系框架,逐步完善信息安全管理体制;加强对信息采集、整合、加工、分析工作的监督和审计,保证信息资源的真实、完整、有效;建设信息安全分级体系,满足不同类型工作人员的不同信息需求;采用身份认证、访问控制、防火墙、数据备份等安全防护技术措施,确保信息资源和系统安全。
2.3 建设框架
特色数据库系统应用平台框架分为五层,自下而上分别是:基础设施层、系统软件层、应用软件层、数据库资源层、用户服务层。
基础设施层:主要由计算机、网络、存储系统等组成,是系统运行的硬件环境。
系统软件层:主要由操作系统、数据库管理系统等系统软件组成。
应用软件层:是管理特色数据库系统工作平台,主要包括资源加工、资源管理、资源利用、信息检索、用户服务等子系统。
数据库资源层:按信息来源包含 3类数据库:互联网数据库、业务信息库、工作资料库。
用户服务层:主要包含导航检索、跨库检索、数据挖掘、信息发布等内容。
2.4 建设流程
对于开展图书馆文献资料数字化研究,拟出一条适合的技术流程,为全面实现文献资料管理
扫描子系统的主要流程如图 1所示:的信息化奠定基础,能有效地整合图书馆各部门的信息资源,使之成为有序的、管理简便并且完善的资料库。
数字加工处理系统可划分为扫描子系统和标引子系统。具体加工流程如下:①把所有纸质文献资料通过扫描形成电子图像文件,保存一套原始的数字图像文件;②对古籍的电子图像文件进行全文 O C R识别,形成全文文本数据,并和图像文件一起生成双层 pdf格式文件;③对期刊的图像进行标引取得各自的元数据,转换成 X M L文件;④将图像文件、元数据及全文文本数据整合形成电子文献资源库。
图 1 扫描子系统的流程图
标引子系统的主要流程如图 2所示:
图 2 标引子系统的流程图
〔1〕周文.地方文献数据库的建设的实践与思考[J].内蒙古科技与经济,2009(5):152-153
〔2〕尤维玲.我国图书馆的地方文献工作研究[J].黑龙江科技信息,2008(22):116
〔3〕江涛.浅谈我馆地方文献资源建设[J].贵图学刊,2008(2):71-72
〔4〕周欣娟.构建萍乡地区地方文献数据库的思考[J].萍乡高等专科学校学报,2003(3)
〔5〕董志珍.关于衢州图书馆地方文献工作的思考.图书馆研究与工作,2008(2):69-72