我国传统家谱的数字化发展概述
2020-04-22王琳珠
王琳珠
摘要:随着数字技术和网络技术的发展,学者对家谱数字化的研究积极拓展,中国传统家谱的丰厚内容和内在价值不断被挖掘。依托于网络、信息技术构建的家谱平台可以大量存储、分析数据、人性化互动、趣味性呈现。本文从近年来我国传统家谱数字化的发展进程为出发点,对现阶段家谱数字化的实践成果进行分析,指出发展过程中的问题,并提出相应的对策。
关键词:传统家谱;数字化;发展进程
家谱又称为宗谱、族谱,以一种表谱的形式记载着一个家族的世系繁衍及重要人物事迹的特殊文献形态,可以集合文、表、图、画等元素为一体,展现基于同一血缘关系的家族发展脉络及大事记。“家谱数字化就是采用计算机技术,将常见的文字或图形符号转化为能被计算机识别的数字符号,从而制成家谱书目数据库和家谱全文数据库,用以揭示家谱中所蕴涵的极其丰富的信息资源,从而达到保护和利用家谱的目的”。结合目前学界的研究成果,家谱数字化的实践成果主要表现在家谱书目数据库、家谱全文数据库、家谱网站以及家谱软件的建立和开发。
一、传统家谱数字化的实践成果研究
(一)家谱数据库的建立
根据不同的内容主体,家谱数据库的建立主要分为家谱书目数据库和家谱全文数据库。从20世纪90年代,国内的各大图书馆开始作为主导机构建立家谱书目数据库,随着技术的发展和前期家谱书目数据库的基础,家谱全文影像数据库以家谱全文作为揭示对象,形成了可储存、可检索、可量化的家谱信息资源。
家谱书目数据库初建,上海图书馆建立的“家谱书目查询”数据库是当时数据量最大的家谱书目数据库,数据量高达17041条。上海图书馆在家谱数字化道路上的探索并不仅局限于某一地区的书目数据库的建立,其当时的目标是我国的家谱联合目录、人名信息数据库以及全文数据库。中国国家图书馆建立的“地方志家谱书目”数据库收录的信息数量仅次于上海图书馆,其建立目标是集全文文本、影像、书目等资源浏览、检索功能为一身的地方志家谱数据库。
与家谱书目数据库相比,家谱全文数据库收录的则是家谱全文内容,也是在家谱书目数据库基础上的进一步探索,如中国国家图书馆家谱库、中国国家图书馆徽州善本家谱、上图家谱等。由于家谱全文数据量过大且繁杂,收录难度较大,其发展速度一直没有家谱书目数据库快。
在现代技术的支撑下,2018年6月,中国农村数据库的一个子数据库“中国家谱族谱数据库”正式与公众见面,成为全球目前电子化家谱族谱资料收录最多的数据库,可达8.44TB,共17723册,120893卷。与20世纪建成的家谱数据库相比,该数据库具有收录家谱信息多样化、时间跨度大、姓氏涵盖全、地域覆盖广的特点,网络访问者可通过关键字词、标签化处理,直接在搜索框输入相关信息,一键获取相关家谱资料,实现对资料的精确查询,也可通过设定具体地区、年份、姓氏等不同筛选条件的限制,找出自己所需要的系列家谱,并且得出相应的数量统计。
(二)家谱网站及软件的开发
家谱数字化的应用开发主要表现为家谱网站的建立,随着后来移动互联的到来,家谱移动软件的开发应用也逐渐火热。在当下应用较广的有“家谱先生”“天下家谱”“族脉家谱”等。这些软件可以满足人们新修、续修、改修家谱,强化了传统家谱的内容管理、修缮效率、传播效果等。就家谱网站而言,对家谱信息做改动的权利仍然没有开放,目前还只是通过后台编辑人员进行具体操作。家谱移动软件相对而言,增强了个人在家谱信息完善方面的主体性,主要的运作思维还是通过应用软件的社交性来得以实现,由于受家谱信息私密性较强的特殊属性,其传播广度仍然不是很大。此外,家谱应用软件的受众使用率还不是很高,触及用户有效率较低,一般都是出于好奇、有趣等心理,下载了解一下,更不用提及这些家谱应用软件的用户粘度。
二、传统家谱数字化的技术支撑概述
(一)关联数据技术
关联数据技术在家谱数字化的运用中,能够打破数据库资源中的间隔,实现各个数据库之间、各个数据之间的有机连接,从而提高用户在访问家谱网站主页时的检索效率和信息获取量。这一技术的应用也适应了家谱内容繁杂、数量庞大的特点。
(二)GIS技术
GIS是一种特定的空间信息系统。其技术原理是通过对空间中的相关地理分布数据进行采集、存储、处理、分析、描述和显示。GIS在不断发展的计算机硬件、软件技术的支持下,被应用到各种专业化领域中,其逐渐社会化应用的发展,为推动家谱数字化进程提供了充足的技术支撑。如家谱内容中人们的活动和变动都发生在一定的空间环境中,实现一个姓氏的空间分布展示、捕捉家族生活轨迹,进而分析和深入挖掘一个家族的起源和发展概况,GIS技术可以提供准确且高效的技术基础。
(三)文本挖掘技术
文本挖掘技术是从非结构化文本中抽取目标信息,从而将还没有使用过的文本中获取未知、有价值的知识,其涉及信息抽取、信息检索、数据挖掘、文本分析等多种技术。将文本挖掘技术应用在家谱数字化的探索中,提取传统家譜中的人物关系、家族关系、大事记等,将家谱档案中的姓名、地点、时间等元素加以结构化,从而实现家谱信息的有机连接,提高用户检索信息的效率,深化家谱内容的挖掘深度。
(四)信息检索技术
检索是获得信息的捷径。信息检索技术在图书馆数据库建设、资源查询中应用广泛,以一定的组织形式将大量的无规律的文本内容按照一定的规律或规范组织起来,也是一种过滤机制,在大量的数据中准确快速地获取用户的目标数据,它就像是对图书馆中每本书籍上进行统一规范地编码,按照一定书序进行排列后,读者在同一编码类型的书架上可以找到相应的书籍。家谱数字化的实现,信息检索是用户获得家谱信息的一个人口,输入关键字、关键词可以在数据库收录的信息中找到自己想要获得的内容。
家谱数字化建设中除了以上的技术支持以外,还可以通过现有的技术软件进行家谱信息的呈现,如方正德赛DESI系统软件、思维导图软件Freeplane以及Excel工作表。另外,由于家谱本身蕴含的资源丰富,其挖掘出的数据类型与多学科都有联系,如医学、伦理学、生物学、情报学、政治学、史学,本文只是关注现有的传统家谱数据中的文本可以数字化呈现,并没有针对某一研究领域对家谱数字化的实现技术作详细阐述。
三、传统家谱数字化发展进程中的问题探析
(一)家谱内容的挖掘深度不够
家谱本身包含的内容庞杂,如一个家族的人物关系,各个家族的连系,著名人物事迹以及其中包含的姓名、年代、地点等元素。基于文本挖掘技术的家谱信息数据采集具有较大的难度。因此,就目前已有的家谱数字化的实践成果而言,还存在对家谱内容的挖掘深度不够,如家谱档案馆重点建设的骨干网站“家谱数据库”作为国内最早建设的为公众提供家谱查询的网站,界面上设置了“首页”“读者来信”“家谱知识”等6个栏目,收录的数据数量也较少,6个栏目中只有读者来信更新着一条信息,其他下设栏目中都为空。对家谱相关资源的挖掘深度不够是当下数字化家谱网站、软件的共性问题。
(二)家谱数字化建设资金链薄弱
家谱数字化的实现需要持续且大量的技术支撑、资金支持,但是有些地区的政府在家谱数字化建设方面的经费比较紧缺,出现财力投入不足的问题,从而减缓了家谱数字化的进程。
(三)家谱网站、软件设计单一,缺乏运营意识
目前已有的家谱网站也比较多,各个省市主办的、个人资源建立的都有,但是普遍存在收录信息不完整,仍然停留在对姓氏地域分布、姓氏来源等方面的普及性知识,没有进行针对用户的个性化查询设计。另外,家谱网站、软件的界面设计较为简单,缺乏设计美感,对家谱的可视化呈现程度仍然较低。在家谱网站、软件的运营方面,做不到及时的数据更新,家谱网站提供的信息服务,家谱軟件的功能升级处于较为低级的层面。
四、传统家谱数字化的发展前景分析
(一)家谱数字化的建设需求升级
家谱可视化趋势不可逆转,我国相关机构应在家谱数字化的推进中一定会投入更多支持。笔者认为主要有以下两个方面的原因:
出于对中华民族优秀文化资源的保护与传承。家谱作为中国特有的一种文化资源,其中蕴藏着深厚的文底蕴,是中华民族优秀传统文化的传播载体。习近平总书记多次强调对家庭、家教与家风建设的重要性。我国的传统家谱中正是蕴含着各个时代对于“家风”不同层次、不同深度的记载内容,充分挖掘家谱内容,运用现代人们喜闻乐见的方式加以呈现,对于现代家庭道德建设具有重大意义。
出于对其他学科领域的科研实用价值的开发。前文笔者已经提到家谱涉及的学科多样,史学、地理学、医学、生物学等领域均有家谱的科研参考价值,对家谱的保护,加强对家谱资源的开发利用,就是对其他学科领域发展提供珍贵的理论依据和现实依据。
(二)以政府主导的家谱数字化工作机制亟待确立
目前来看,家谱数字化工作的推进并没有明确的工作机制,有的省市由政府主导,有些省市以公共图书馆机构作为支撑,还有一些省市是由个人承担主要的工作内容,甚至还有对家谱的保护力度不够的现象,因此,建立一套由政府主导的家谱数字化工作机制是目前亟待解决的,政府主导下,无论是家谱数字化的任务下达,还是在建设资金的投入,后期建设成果的维护和保障方面都是必要的。
(三)强化社会各界对家谱数字化的认识深度
公众对于家谱数字化建设的认知度仍然不够,家谱作为家族传承、中华民族优秀传统文化的传播等都有重要的作用。强化社会各界对家谱数字化的认知,为后续的家谱数字化建设进程的推动,是必要而且重要的。如家谱数字化的建设投入资金、技术支撑,都可以通过公众的力量进行筹备。