上海图书馆:开卷寻根,推动家谱数字化建设
2020-05-11周德明
周德明
寻宗觅根,了解自己的祖先繁衍、家族发展脉络等,是全球各民族所共有的情结。解开此结的工具与方法颇多,而查阅家谱是常见的一种。
所谓家谱,又称族谱、宗谱、家乘、房谱等,是记载同宗共祖血缘集团世系、人物和事迹等信息的历史图籍。家谱与方志、正史一起构成了中华民族历史大厦的三大支柱,是我国珍贵文化遗产的一部分。
无论何种编谱方式,构成家谱最重要的内容当属世系图表,用以记载始祖至撰修该谱时本家族各世代成员姓名、生卒年月、科第、妻室、子女等信息。以此为家谱之根本,然后或设有谱序,阐述修谱背景、姓氏渊源、家族迁徙;或设有族规家戒,即自行制定的用来约束、教化族人的宗族法规,包括忠君、孝亲、祭祖、禁赌。
当然,不少家谱还内含阐明修谱原则和体例的凡例;刊载祖先及本族重要人物的遗像;登载皇帝对家族成员敕书、赐匾的恩荣录;记录本族祠堂建筑图案,修建过程、规模、地理位置,祠堂内祖先牌位次序的祠堂信息;记载家族集体财产、分家约定以及买卖田地等文据的族产契约;收录族人著述、诗词、奏疏等的艺文;表明本族世系人名排行的字辈等等。
总之,家谱记载范围的宗族性,体例的多样性,内容的广泛性,记叙的细致性,为后人了解、把握先祖人物及事迹等提供了一幅百科全书式的家族图景,是弥足珍贵的第一手史料。并且,家谱所载信息可反映或折射出社会变迁、经济状况、宗教习俗、生活水平、文化教育之情形。也因此家谱具备了寻宗问祖、科研史料、教化惩戒等功能,为专家学者和社会大众所重视。
宋代以降,系私修家谱的年代。正如章学诚所言,家谱是“人自为书,家自为说”。(章学诚《校雠学通义》)虽说历史上曾多有修谱兴盛之时,但毕竟因年代久远、兵燹变故、思想禁锢、自然毁损以及原本印制数量不多等因素,故存世量甚少。《中国家谱总目》(上海古籍出版社,2008年)揭示海内外藏中国家谱七万多部,计52000余种,除部分入总目的新谱外,民国前旧谱仅稍过四万种。国内外收藏新旧家谱(以1949年为界)数量最多的公藏机构上海图书馆因其有30000种300000多万册而享誉全球,引各地读者纷至沓来。但是,如何使更多的读者能够方便查阅家谱,甚至足不出户即可实现呢?
1996年底,上海图书馆开设全国首家家谱阅览室,并宣告对馆藏家谱进行整理研究。其中,整理工作主要由原件修复和目录编撰构成。由于特殊年代对家谱的误读导致图书馆只能长年累月地将家谱捆扎、堆于书库一角,故而损伤严重。欲解冻家谱、服务读者,必先施以修复。其次,组织馆员编撰家谱书目,其目的是按著录规则将馆藏家谱置于一种科学的检索体系之中,便于查寻。经过几年的努力,于2000年5月出版了《上海图书馆馆藏家谱提要》,使11000余种20000余册家谱公之于众。并且,2001年起,在当时文化部及各家谱收藏单位等的支持下,上海图书馆组织编制、出版《中国家谱总目》,这是一部迄今为止收录中国家谱最多、著录内容最为丰富的专题性联合目录,较完整地揭示了海内外近600个收藏单位家谱的基本状况。
与此同时,在数字图书馆建设热潮的推动下,自1998年起,上海图书馆开始进行家谱数字化作业,其主要工作就是通过对馆藏家谱全文扫描以及标引检索点等,建成家谱全文数据库。2003年,该数据库登堂入室,读者可以通过谱名、纂修者、姓氏、谱籍地、堂号等入手查检自己所求家谱,凡上海图书馆收藏的,还能阅览原谱全文。此举大大方便了寻根问宗者的查阅,促进了家谱的利用,使相关服务提升到一个新的境界。
特别值得一提的是,1998年下半年起,上海图书馆每年拨出经费、派出专员走街串巷访寻、采购旧谱,建立较为稳定的进谱渠道,并持续保证5000多册的年采量。如此,边采购、边修复、边整理、边研究、边建库、边服务的模式成为延续至今的工作常态。
2015年,正值數字人文技术兴起,上海图书馆随即尝试将其植入于家谱整理、研究与服务之中。即以前期数字图书馆建设中累积的书目数据和全文家谱为基础,通过语义技术实现数据关联,利用家谱的MARC(机读目录)或DC(都柏林核心元数据)对家谱的文献特征和有关内容特征做标引,从而提供基于题名、著者、谱籍地、先祖名、堂号等关键词匹配检索功能。换言之,数字人文技术把有关家谱的知识单元细致化,令知识组织语义化,使知识呈现可视化,以便达到从元数据记录和数字化全文中提取知识的目的。
以胡适家族的“上川明经胡氏”迁徙为例,依据家谱数据即同一始祖多种家谱中的先祖以迁徙事件为链接点,将人物、时间、地点要素关联,用可视化工具,便可完整展示胡氏始祖胡昌翼在唐末自长安迁往婺源考川,其后代又从考川迁至绩溪等不同居住地的路线图。
数字人文不仅有助于读者直观获知隐藏于不同家谱中的信息、知识点,还有助于发现问题、解决问题。如上川明经胡氏始祖胡昌翼为何要做长途迁徙?查家谱数据库的某个元数据字段不难发现其中奥秘。“始祖昌翼,谱称本唐昭宗幼子,母何后,天佑元年生,避祸来婺源考川,遂冒义父胡三公姓。”至此,读者或许发现“胡李不通婚”之说的原委。那么,可否运用数字技术对此再做一番统计呢?答案是肯定的。从家谱数据库中的上川明经胡氏家谱世系表中析出入谱男性8915名,配偶4733名,对配偶姓氏统计后发现,虽“李”为大姓,但所有该族胡氏配偶中无人姓李。自然,“胡李不通婚”说最终应由历史学者定论,但基于数字人文技术的家谱数据库所提供的事实和数据至少能为这种研究提供一种佐证。
我们所做的家谱整理和研究,其目的是为了更好地服务读者。2015年5月,上海图书馆率先将家谱全文搬至网上,真正实现了全球读者足不出户便可查阅家谱的愿望,至2018年底,已提供8000多种家谱。它们在地域分布上既涵盖了江苏、浙江、安徽、湖南、湖北、江西、福建、上海等收藏家谱数量较多的省份,亦有云南、四川、重庆、贵州、山东、甘肃、河南等收藏家谱数量较少的省份;在姓氏分布上,不仅有百家姓中的常见姓氏,也有稀见姓氏,如荆、荀、昌、茹、吾、迮、钭、相、郎、贵、元、支、戈、蒯、廉、后、慎、经、闾、环、阚、翦、阙、印、束、忻、嵇、戟、鹿等;还有不少名人家谱。
随着家谱修复、整理、数字化以及版权协商的进程,我们还会继续将更多的家谱传上网。难能可贵的是,这些家谱均先后融入2016年1月底上网的数字人文家谱数据库——中国家谱知识服务平台(http:// jiapu.library.sh.cn)之中。如此,上海图书馆在家谱服务中,实现了既提供家谱全文,又提供检索路径,也提供知识平台,还提供技术工具等的全方位服务系统。
20多年的家谱工作,我们有三点体会。其一,理念更新。珍品特藏不能置于书库、秘不示人,而应当加快整理、投入服务。而且,在网络、大数据时代,必须考虑提供网络服务,便利于读者。其二,与时俱进。日新月异的技术,为整理、开发家谱提供了源源不断的工具,我们理应及时利用,以朝更有力度地加工家谱、有深度地揭示家谱、有广度地服务读者的方向行进。其三,加强研究。馆员有研究实力,读者服务才会有品质。这些年来,上海图书馆在家谱目录编制、少数民族家谱总目编制,家谱资料选编,家谱通论、祠堂研究,家谱丛刊编制,家谱数字人文技术研究等诸方面均取得了一系列成绩,获奖连连,使家谱及其服务成为品牌。我们正不断努力,争取使上海图书馆早日成为全球华人家谱的资料中心、研究中心和服务中心。