辽宁省图书馆家谱数字化建设概述
2010-09-26郭广
郭广
(辽宁省图书馆,辽宁 沈阳 110015)
1 家谱数字化的意义和价值
1.1 选题意义
家谱是一种记录家族迁徙、发展的事迹和家族人物世系、传记的书籍,是以特殊形式组织、编写的家族生活史。它是传统文化的折射和侧影,既可以弥补正史、地方文献之不足,也可以为人们提供寻祖认亲的重要信息。中国家谱经过几百年的发展,成为一种种类繁多、内容丰富、记事详备的独特史料,对我们今天弘扬民族文化,增强民族凝聚力,以及进行社会学、人口学、民族学、历史学等学科的研究,都具有很大的作用。
1.2 选题价值
家谱属于珍贵资料,具有很高的保存价值。在大量的古籍数字化开发实践过程中,家谱数字化有利于解决古籍的“保护”与“利用”这对矛盾,是实现家谱再生性保护的有效途径,有利于改善古文献资源的服务工作,推动珍稀古籍的资源共享与学术研究。
2 辽宁省图书馆家谱文献收藏状况
2.1 地区特点
从地区即从家谱的籍贯来说,馆藏家谱文献覆盖面广,涵盖全国19个省,两个直辖市(北京和上海),其中以江苏、浙江家谱居多,超过了总数的30%,其次是湖南、安徽和山东家谱,北方的家谱较少收藏。如表1统计。
表1
2.2 姓氏特点
从姓氏上来说,所藏家谱文献姓氏众多,共有106个姓氏。如表2统计。2.3 时代特点
表2
从时代上来说,所藏家谱文献大部分纂修于清末至民国年间以及20世纪初。明代纂修的家谱只有两种,清代纂修的家谱有146种,民国年间纂修的家谱有11种,20世纪初至今纂修的家谱有212种。其中清代纂修的家谱统计如表3所示。
表3 清代纂修的家谱统计表
2.4 版本类型特点
从版本上来说,所藏家谱文献的版本类型多种多样,统计如表4。
表4
清代纂修的家谱以刻本和活字本为主。
3 辽宁省图书馆的家谱数字化
随着网络化、自动化、数字化等计算机技术的高速进步,传统的图书馆也面临着新的挑战,人们已不再满足于二次文献的获取,而是更迫切需要一种不受时间、地域限制的文献阅读方式,即从网上直接获取一次文献,于是进入了一个由传统文献信息资源转向传统与数字化信息资源相结合的新阶段。3.1 馆藏家谱数字化项目总体概况
辽宁省图书馆对其馆藏清代家谱进行数字化处理,最终实现了网上多途径检索并通过电子书方式提供全文浏览功能。累计采集家谱图片28万3千多页,打包电子版家谱图书1700多册,收录并分类整理了家谱、宗谱、支谱、家乘、世系表等,共371种,著录项目主要包含书名、卷数、始祖、始迁祖、名人、索书号等18个检索字段,涉及姓氏106个,涵盖全国19个省、两个直辖市,对家谱姓氏源流进行完整著录,真实地反映原始文献的内容与特征,数据库总容量441G。数据库采用清华同方TPI数据库加工发布系统,利用此系统的电子书加工、元数据加工、内容加工与发布子系统,实现了家谱数据库完善的检索功能,可进行全文浏览,全面揭示辽宁省图书馆馆藏家谱的文献全貌。3.2 馆藏家谱数字化方法
根据前期的整理和调研工作及家谱图书的特点,该项目在实施的过程中采用多种技术手段对家谱进行数字化处理,如对于不超过扫描仪扫描范围的家谱,采用无边距扫描对纸质家谱实行全文数字化,尽量减少对家谱原件的损伤。对于超过扫描仪范围的大本家谱采用了专业数码照相设备进行采集。在电子图书的制作方面采用了清华同方TPI系统的电子书加工系统,此系统可以支持多种方式的扫描,并可以对书页图像进行批处理,然后自动生成目录树,进行背景处理,还可以高度压缩,最后支持CAJ格式的电子书导出。后期将打包的电子书与元数据进行链接,只要在发布界面通过点击书名即可进入电子书,进行全文浏览。
3.2.1 扫描的数字化要求
根据家谱图书的特点,将家谱扫描的技术指标定为能灵活应用的TIFF格式。每册书的每一页作为一个图片文件,图片色彩模式采用灰度模式,精度为300dpi,对图片进行无压缩扫描。为了保证图像能够真实地反映原始文献的内容与特征,对于家谱中涉及到多页记录的图谱、家族地图等,运用软件Adobe Photoshop7.0拼接,以达到完整显示。
3.2.2 照相的数字化要求
照相图片的格式采用JPG格式,质量能够很好地满足数据库的要求,符合打印标准。照相后,运用软件光影魔术手或I See对扫描后的图像进行手动加工,如锐化、去噪、纠偏、裁剪等优化处理。3.3 设置导航栏
为了便于数据的管理使用,我们对所采集的家谱数据进行了分类。通过多次论证和考察,将家谱数据库的数据按照姓氏第一个字的首字母为分类标准,分类到二级类目。体现在发布界面是给读者提供了一个导航栏,导航栏显示从A~Z的26个英文字母,下设以姓氏为分类的二级类目。如:【浙江海宁市】海宁渤海陈氏宗谱,分类在C>陈>【浙江海宁市】海宁渤海陈氏宗谱。
3.4 内容著录详尽
该库每条记录均详细著录家谱的书名、卷数、编目员补充的附加题名、责任者、版本说明、书名与责任说明附注、册数、外形尺寸、插图、载体形态附注、始祖、始迁祖、名人、装订、备注、收藏者、索书号、以及编目员等信息,对家谱文献的外在特征和内部特点进行了充分揭示。数据采用集中式管理,同一种家谱在库中只存在一条书目数据,不同家族撰修的家谱以及同一家族在不同年代每一次的续修本各自著录一条书目数据。
4 家谱数据库的设计、发布
馆藏家谱数据库采用清华同方TPI数据库加工发布系统,这对于我们来说是一个全新的尝试,利用此系统的电子书加工、元数据加工、内容加工与发布系统,实现了家谱库以姓氏、地区、单册电子图书的形式进行检索、浏览全文的功能,而且与馆藏其他电子数据库统一在一个平台上,方便了数据库的管理。
4.1 TPI系统简介
TPI系统即清华同方专业数据库制作管理系统,是清华同方光盘股份有限公司为大中小型信息服务机构开发的一个以内容管理为核心的数字图书馆解决方案。TPI是基于非结构化文档管理而开发的大型智能内容管理系统。
图1为利用TPI系统构建的家谱数据库流程示意图。
图1
4.2 家谱数据库的发布
我们利用TPI自带的发布模板,通过动态页面技术的采用,实现了数据库的自动发布,界面友好。读者可以根据个人爱好、检索策略等选择不同的检索手段,方便检索。数据库检索系统采用Web界面,提供书名、卷数、编目员补充的附加题名、责任者等18个检索字段,并且支持这些检索字段的全部索引,即按打开的顺序进行检索。检索信息快、准、全,既能成批简单显示,便于比较和取舍,又能单独显示详细数据,能够满足读者高查准率和高查全率的需求。同时能够对这些字段进行合并检索,即基本检索、高级检索和二次检索,并具有全文图片浏览功能,方便读者了解所需家谱的详细信息,全面揭示了辽宁省图书馆所藏家谱的文献全貌。
5 分析与总结
5.1 图书馆员通过对古籍资源的收集、筛选、分类、组织和发布,可以使读者直接获取查询主题,大大节约了信息获取成本。
5.2 家谱数字化采用了馆藏资源和虚拟馆藏一体化建库模式,用户通过统一界面的检索平台就能最大限度地获得信息。这是图书馆在网络环境下一种比较可行的方法,也是评价一所图书馆在网络环境下信息服务水平和能力的重要标志。
5.3 家谱数据库文献内容全面系统,图文并茂,多角度地反映了馆藏家谱的原貌。
5.4 古籍数据库建设不能仅注意技术方面,还要注意用户环境。不仅要围绕建设数字化馆藏和服务两方面,更要从数字资源的结构上满足用户需求,家谱数据库很好地做到了这一点。
[1] 洪其庚.家谱史话.钟山风雨,2009(5).
[2] 管飒爽.家谱档案的数字化生存.兰台世界,2008(21).
[3] 毛建军.中国家谱数字化资源的开发与建设.档案与建设,2007(1).