地方特色数据库建设探究
——以武汉城市文化文献数据库为例
2019-05-22刘海燕
□刘海燕
一、引言
大数据时代依托互联网的云计算服务,对海量分散的数字化信息进行深入检索,通过物联网技术实现将涉及到工作学习当中的信息实现智能化操作[1]。面向数字环境,人类社会开始步入以数字化为核心、以互联网为基础、以智能化为目标的大数据时代。伴随着现代信息技术迅猛发展及其在图书馆的广泛引用,信息交互越发便利地给图书馆数据库的建立带来巨大的变化。随着图书馆信息服务体系建设的深入,图书馆已进入全面数字化转型时期,资源建设从纸质资源为主转向以数字资源为主[2]。读者对图书馆纸质资源和数字资源的单一服务已不再满足,对深层次的数字资源服务的需求越来越明显。图书馆不断推进的数字资源建设,对图书馆利用现代信息技术去挖掘和建设具有地域特色性的馆藏数字资源的要求也不断提高。为满足读者多样化的知识需求和共享的需要,对资源进行智能化、专业化的管理和建设,以推动图书馆不断向前发展。本文基于大数据环境背景下,以武汉城市文化文献数据库建设为例,对基于地方文化的特色数据库的建设意义、原则、构思以及相关思考进行探讨。
二、建设地方特色文献数据库的意义及必要性
特色数据库的建设是为了满足读者对资源的个性化需求,按照一定的标准和规范依托馆藏资源进行资源数字化,对特定主题的信息进行有序的收集、整理、分析、评价、存储等,形成特定主题的特色资源库[3]。伴随着社会经济的高速发展,在城市化进程过程中,有关城市文化建设的研究逐渐升温。文化是城市的灵魂与精神支柱,也是一个民族源远流长的血脉。文化具有天然的可数字化性和易传播性,它见证了城市和国家的历史荣耀和沧桑,是人类社会的共有财富。运用“互联网+”的思维与传统进行深入融合,也使得对传统资源进行数字化升级改造显得越发迫切。城市文化是社会成员在城市发展进程中创造出来的具有鲜明特点的物质财富和精神财富,其标志性的内在价值既可以体现在建筑物造型上,又可以体现在传统文化上,更可以体现在各种设施和所形成的久远文化的综合沉淀上。文化不仅是城市的魅力,还是城市长盛不衰的“软实力”[4]。城市文化贯穿于城市发展始终,能够对体现城市精神和特质的思维方式、建筑形态、经济环境和特质资源等文化特征进行反映,具有超越时代的内容和精神[5]。
武汉作为历史文化名城,有着丰富的文化底蕴。在大数据环境背景下,建立武汉城市文化文献资源库,通过互联网思维和手段对城市文化进行提炼,是实现城市文化数字长期保存和互联网推广的一项重要措施。通过构建武汉城市文化文献数据库实现文献资源收集和索引,实现城市文化数字化展示,提升城市文化认同感,方便城市历史文化研究工作者调研考察,增强城市核心竞争力[6]。高校图书馆在引领城市文化建设中既是满足城市发展内在需求,也是高校图书馆职责所在。主要体现在:第一,高校图书馆担负着传播科学文化、传承人类文明的重任,具备多年积聚的资源,使其在城市文化建设中具有得天独厚的优势。高校图书馆在履行高校“人才培养、科学研究、服务社会”承担着重要作用,将这种优势延伸到城市文化建设中,对收集本地文化知识、保存城市文化、记忆城市历史、传播地域文化等方面仍可以发挥积极而重要的作用。第二,高校图书馆在推动城市文化建设有着不可推卸的责任和使命,其拥有丰富的馆藏资源和城市文化建设相关的人才储备,能够为城市文化建设提供有力保障。第三,高校图书馆推动城市文化建设也是其拓展服务空间的新机遇,通过与城市文化建设相融合,在增进城市人文内涵、提升城市“软实力”的同时,还能直观地体现高校图书馆的价值和作为,推动图书馆综合服务能力的提升,为自身发展争取良好的机会。
三、武汉城市文化文献数据库的设计思路
武汉城市文化文献资源库建设依托省内各兄弟院校图书馆、公共图书馆、相关职能部门及研究机构收藏和建设本地文献资源的优势,立足于江汉大学图书馆,收录各类相关文献信息资源,全面系统地揭示武汉的城市文化。由于信息资源具有分散性,运用技术手段将与武汉城市文化相关的分布于不同机构和载体的文献资源进行系统收集,经筛选、加工后进行有效组织。为武汉城市文化的不同类型资源实现有序存储,方便用户查询、利用和充实资源,在处理好知识产权和数据安全等问题的前提下,武汉城市文化文献资源库的建立充分考虑到开放管理和互动交流等功能。力争将此数据库建设成为具有武汉特色的数据库,为相关研究单位及武汉市政府提供比较丰富的文献信息资源。
(一)总体架构。武汉城市文化文献数据库主要包括武汉名人、论学杂述、方志史料及历史文献四个子库。其中武汉名人库是收集武汉市各个领域的著名人士;论学杂述库是收集关于武汉市城市文化方面的期刊及网络文献;方志史料库是收集关于武汉市的地方志文献;历史文献库是收集武汉市城市文化方面从古至今的图书(武汉城市文化文献数据库的总体架构如图1所示)。
图1 武汉城市文化文献数据库的总体架构
数据库的分类架构在遵循《中图法》分类体系的基础上,借鉴了搜索引擎的分类方法,四个子库下面又划分不同的一级类目,分别建立资源导航库、武汉名人库、论学杂述库和历史文献库,并提供浏览、检索、下载等各种服务形式。
在总体架构下,逐步实施各级各类专题数据库及子库的建设。尽管各子库之间形式上保持独立,但逻辑上底层数据不可避免地存在关联关系,例如武汉名人库中关于某位名人的研究可能关联于论学杂述库中的文献。在权限管理模块上优化数据逻辑,使各子库之间高内聚但又保持必要关联关系,达到业务层面相互独立,减少数据冗余,提高系统可靠性和稳定性的目的。
图2 数据库整体结构图
武汉城市文化文献资源库的建设涉及期刊、图书、图片、音频、视频、网络资源等多种载体。具体的子库中,数据存在形式多样化的特点(例如:在论学杂述子库中,可能存在学术论文、图书、报纸、互联网等多种形式的文献)。在底层数据存储以及上层接口描述上采用CALIS公布的文献描述规范进行标准化描述。将单一兼容性字段模板扩展为论文模板、图书模板、报纸模板、互联网模板以及兼容模板。同时,为保障数据录入质量,细化数据审核的管理流程。强化审核员职能,审核范围明确化并对审核意见进行存档化。通过对资源进行有效处理和关联分析,实现以内容主题为单元,最终将武汉城市文化文献数据库建成一个纵横交错的资源网。
(二)资源的收集与整理。武汉的文化历史悠久,戏曲、文学、美术、杂技、文博、民间工艺等各种文化艺术门类比较齐全,内容丰富,地域特色鲜明。经过历代文化人士的不懈努力,文化建设不断推陈出新,在全国具有重要地位。武汉城市文化文献资源库的建立在资源搜集上,一方面可以对现有馆藏资源进行数字化,另一方面可以对互联网上各类型学术资源进行搜集。对搜集到的资源进行梳理和分类,建立对数据质量进行审核的机制,通过标准化和规范化的流程对资源进行整理并纳入数据库。对体现武汉城市文化的相关文献资源的馆藏情况进行梳理,在充分展开文献调查的同时也需注重建立对资源拓展的征集渠道。考虑到资源存在分散性,在充分利用互联网搜集文献资源的同时,还可以与各高校图书馆、公共图书馆、博物馆及相关机构进行征集。具体可以包括以下方面。
1.馆藏数字化加工。按照文献的分类架构,从图书馆现有馆藏中关于武汉城市文化的图书文献从各个阅览室抽调集中,主要涉及的类别有地方志K269.631、地方风俗习惯K892.463、地方剧I236.63、地方文学作品I218.63、地方文学史I209.963、武汉城市文化与文化事业G127.63以及区域地理、名胜古迹、市县史志等,共计图书1,839种,2,834册,形成专门的武汉城市文化文献阅览室。同时,对抽调出的专题图书进行数字化搜集,对没有电子版的专题图书进行数字化加工。还可以充分利用图书馆的馆际互借、文献传递等功能,多途径、多渠道对各类资源进行复制、扫描、拍照、摘抄、剪辑、转录等,经筛选审核后一并纳入数据库中。
2.数据库资源收集。资源是图书馆的立足之本,是图书馆展开各类型服务的保证。充分利用图书馆购买的学术数据库中收录的相关学术资源包括地方志、文史资料、电子期刊、电子图书等,按照分类架构,从各种已购买的电子资源中下载相关方面的文献资料,按照字段进行录入并分别进行标引。
3.互联网资源搜集。网络也是获取具有地方特色文献资料的一个重要渠道。可以充分利用搜索引擎,查找相关的权威网站,收集具有地方特色的专题数字化资源。除了获取各类型的学术资源,也不能忽视学术资源以外的网络资源,充分利用网络展开搜集下载,或借助Spider、Robot等专用软件进行自助搜索抓取,并对下载的资源明确标注下载出处。由于网络资源各种信息和数据的真实性和价值性参差不齐,为保证数据及资料的有效性、准确性以及权威性,需要对文献材料进行鉴定和选择。并从各种不同类型的文献资料中挖掘和提炼具有武汉特色的文献材料。
4.资源公开征集。加强多部门合作机制,通过与各图书馆、博物馆、档案馆以及地方史志办等部门建立相关联系,征集需要的图片、文档、音视频等资源,包括一些非正式出版的内部资料、各种文献汇编等灰色文献。还可通过自媒体发布征集函的形式面向社会大众征集武汉城市文化相关资料。
5.用户自主上传。增加用户自主上传的通道,在武汉城市文化文献数据库发布后,用户可以自行注册,对其在访问过程中发现数据库为收录的资源可以自行上传,经后台管理人员审核通过后进行规范化描述和分类并作为数据库资源发布。
四、大数据环境下地方文献数据库建设的思考
大数据时代的数据具有更新快速、种类多样、数量庞大以及处理复杂的特点。如果有效利用大数据,则可以为决策及个人生活带来很大的便利,不仅可以减少投入,而且还可以根据数据信息作出有效的决策。
(一)拓展数字资源范畴。图书馆长期以来都非常重视资源建设,但基本局限于对图书、期刊、报纸、学位论文、会议论文、专利、标准、科技报告等文献型资源上。武汉城市文化文献数据库的建立,不应局限于处理利用数据库和本馆资源数字化,更应该以大胆创新、勇于探索精神,结合大数据环境下的思维,对政府信息以及专题报道等信息进行搜集,对用户使用数据资源以及网络搜索的行为信息进行信息采集。
(二)提升数字资源广度。数据杂乱多样是大数据的一大特点,图书馆单纯以文献信息服务难以满足用户深层次的需求,在服务上,采用以文献服务为主的资源整合转向以综合信息服务为主的资源整合也是必然的趋势。将图书馆的数字资源与社会资源进行有机关联,把文献信息、政府信息、网络信息和用户信息等进行整合,进一步满足用户需求。
(三)明确建设的目标和方向。本着“人无我有,人有我精”的原则,从本地实际出发,深度挖掘城市文化的特点和内容,突出鲜明的地方特色和区域特性。高度重视和培育特色资源的建设方向,提供长效机制和中远期规划。
(四)加强区域合作交流。大数据时代,信息资源分散而杂乱,特色资源数据库的建设单靠一方的力量是远远不够的,更需要发动社会的力量,共同参与制作。加强与公共图书馆、高校图书馆、博物馆及相关机构的交流合作,充分实现区域内资源的共建共享,保证资源的完整性和特色性,方能进一步推动地方特色数据库的持续发展。
五、结语
高校图书馆是一个城市文化体系重要组成部分,能够充分发挥、利用本地特色的文献信息资源的作用,为城市文化建设提供多样性的文化与信息服务。武汉城市文化文献数据库有助于丰富高校图书馆的特色馆藏建设,有助于深入展开武汉城市文化研究,更有助于宣传和传承武汉城市文化,提升城市文化“软实力”。武汉城市文化特色文献数据库作为一个特色专题数据库,建设过程有其复杂性和系统性。高校图书馆充分发挥人才和技术优势,建立协调机制,多方联系各种社会资源,大胆尝试、勇于创新,在城市文化建设中发挥积极的作用。