APP下载

文化遗产数字存储库资源建设实践研究与启示*
——以爱尔兰数字存储库为例

2022-08-11王运彬

档案与建设 2022年7期
关键词:爱尔兰备份检索

吴 倩 邓 莉 王运彬

(1.闽江学院人事处,福建福州,350108;2.福建师范大学社会历史学院,福建福州,350117;3.湘潭大学公共管理学院,湖南湘潭,411105)

引 言

文化遗产是我国宝贵的精神财富与历史根基,唯有从“养在深闺人未识”走入到寻常百姓中,才能使其真正“活起来”。2021年4月,文化和旅游部印发《“十四五”文化和旅游发展规划》,明确提出要坚持把保护文化遗产放在首位,建设国家文物资源大数据库[1],文化遗产数字存储库建设与完善应提上议程。

目前,学界针对文化遗产存储库开展的研究与实践主要包括:其一,现状研究,如公共图书馆文化遗产存储库建设现状研究[2]、地区文化遗产存储库建设现状研究[3]等;其二,构建研究,如资源数字化[4]、框架设计[5]、技术应用[6]及文化遗产数字化建档[7]等,为我国文化遗产存储库的建设提供了理论依据;其三,特色存储库建设研究,如岩画遗产[8]与满族文化遗产[9]等;其四,国外文化遗产存储库项目研究,包括威尼斯时光机[10]、美日地区的代表性文化遗产档案数据库[11]等。当前,我国文化遗产存储库建设的研究主要停留在对项目本身或现状的研究上,其理论研究深度与实践发展需要存在一定的错位。

爱尔兰数字存储库(Digital Repository of Ireland,以下简称DRI)是保存爱尔兰历史文化遗产和科学研究成果的国家数字资源库[12],从2012年开始定期开展项目研究。当前,DRI已广泛纳入都柏林城市图书馆和档案馆、爱尔兰图书馆、爱尔兰国家档案馆等38个学术机构会员,与之共同推动文化遗产资源的建设与发展。在信息化时代背景下,DRI作为爱尔兰乃至欧洲范围内关于数字归档、存储基础设施、数据管理的最佳实践研究中心,在文化遗产资源的数字化保存与服务方面都值得我国学习与借鉴。

1 爱尔兰数字存储库的数据存储流程

DRI为用户提供了自主存储数据资源平台。该平台为文化遗产资源的永久保存创建了完整的资源存储流程,涵盖“收藏评估、数据准备、理解管理角色、摄取数字对象、资源保存利用”的数据生命周期全过程(详见图1),为用户存储文化遗产资源提供指导。用户可通过该平台创建属于自己的收藏,并上传所需永久保存的文化遗产资源,从而提升用户文化遗产永久保存与传承的参与度与责任感。

图1 DRI基于全生命周期的数据存储流程图

2 DRI文化遗产资源建设的实践亮点

作为收集与保存爱尔兰乃至欧洲文化遗产资源的存储机构,DRI在技术框架、协同合作、多元服务与安全体系等方面具有较为成熟的建设经验。

2.1 技术框架:综合性的技术设施形成体系框架

作为一个交互式、可信的由爱尔兰机构持有的社会和文化数字存储库[13],DRI具有人文社会科学领域服务与文化遗产资源保存开发的双重职责,必然离不开综合性技术的全面支持,这主要体现在文化遗产的元数据接收、资源保存与3D文化遗产存储方面。

首先,DRI支持一系列的元数据格式标准,如EAD、MARC、XML等,且具有容纳各种载体形式元数据的特性。多元化的元数据支持为DRI接收各种载体形式的文化遗产提供了技术保障。其次,DRI为实现存储库的高度信任与保存,建立了一个安全的存储基础设施,其中包括存储集群、物理虚拟机(VM)服务器和虚拟环境等,以承载交付存储库功能所需的各种服务。Ceph和Bareos是该存储架构必备技术。Ceph是一种分布式文件系统,具备自己的内置校验和,能够在维护数据兼容性的同时加入复制和容错功能,定期检查和自动修复在数据中发现的任何错误[14],为DRI提供类似云的存储服务,用于虚拟机(VM)图像和存储库数据的实时存储。Bareos是一种备份/恢复系统,保存着校验和,即在数据处理和通信领域中用以检验的一组数据项之和,能够有效地保证通信过程中数据的完整性与准确性,在备份数字对象的同时也将其运行检查,以查看是否在磁盘或磁带上发生任何错误。[15]此外,DRI一直致力于收集和保存博物馆艺术品、考古挖掘和历史建筑等3D文化遗产数据,并广泛应用于开放科学、教育等领域。DRI使用open3D和云比较等技术重建了场景的3D副本,再用Bender和Meshlab等技术去除不必要的噪声。[16]同时,DRI还不断探索各种开放格式与标准,如IFC、Collada、glTF等,以提高3D内容的互操作性。

2.2 协同合作:广泛化的协同合作保障机构运行

DRI多主体参与的团队建设、多渠道的资金来源及特色项目开发建设方面的协同合作机制建设推动整个存储库的可持续运行。

2.2.1 多主体参与的团队建设。DRI的成员来自各个领域,包括软件工程师、设计师、数字档案管理员、数字成像专家等。除了广泛引入各领域的优秀人才外,DRI也得到了学术、文化、社会合作伙伴的支持,如爱尔兰的国家图书馆、爱尔兰广播电视台等,他们为DRI的运转提供了多领域的智慧型人才保障。

2.2.2 多渠道的资金来源。DRI最初从高等教育管理局获得了2011—2015年第五周期的520万欧元[17],同时还获得了爱尔兰企业、爱尔兰科学基金会、欧盟委员会第七框架计划(FP7)和爱尔兰基金的资助。从2016年起,DRI通过高等教育管理局和爱尔兰研究理事会获得核心资金。

2.2.3 特色合作项目驱动服务机制。DRI在立足自身项目建设发展的同时,也在不断地开展与其他机构合作的特色项目,共同驱动服务机制的运行,详见表1。

表1 爱尔兰数字存储库特色合作项目表

2.3 多元服务:便捷式的多元服务满足用户需求

为满足用户的需求、提高利用效率与优化用户的体验感,DRI向用户提供了更为便捷的多元化服务,主要体现在其多元化的检索方式和鼓励用户参与资源建设。

2.3.1 多元检索方式推动资源利用。为挖掘馆藏资源价值,使其得到高效利用,DRI为用户提供多层次的检索方式。首先,用户通过DRI网站所提供的一站式检索窗口,输入所需资源的关键词便可得到相关的数据资源。其次,用户还可根据检索结果的编成日期、发布日期、许可、学科、主题等优化检索结果。此外,DRI还提供相关性、创建日期、标题(A-Z)、检索结果等排序条件,以实现对检索结果的二次优化。DRI多层次的检索途径极大提高了资源的查全率与查准率,同时也提高了馆藏资源的利用率。

2.3.2 用户参与推进资源建设。DRI很好发挥了用户在资源建设方面的作用,使其实现从“利用者”到“建设者”的角色转变。2020年10月,DRI与爱尔兰国家档案馆共同主办“档案行为主义:以社区为中心的档案方法”在线合作网络研讨会[18],为DRI社区档案计划项目做出进一步规划。该项目通过建立可自由访问的在线收藏等方式记录、组织与共享社区用户的档案故事,永久保存“社区档案工作者”的记忆。此外,DRI还定期举办社区档案计划评选,调动用户参与资源建设的积极性。由于有了用户的参与,DRI的社区档案计划项目不仅提升了公民的档案资源挖掘能力,也促进了DRI与用户共同参与推动资源建设模式的发展。

2.4 安全体系:分布式的独立站点保障数据安全

DRI提供了交互式数据共享与异地备份,为应对故障转移与灾难恢复等危机提供安全保障。

2.4.1 交互式的数据共享模式。DRI将爱尔兰各机构所掌握的数据资源连接到一起,并提供一个中央互联网接入点和交互式多媒体工具,构建交互式可信数字存储库,实现资源交互式数据共享。[19]这一数据共享管理模式,在基于数据资源安全性保障前提下,实现了各机构数据的共建共用。

2.4.2 数据资源异地备份。DRI的存储集群为数字对象、虚拟机图像以及元数据资源提供存储与永久保存,该存储集群分布于多个独立站点上,当系统发生故障时,整个基础设施与数据资源都会被复制到一个二级站点中,该站点为整个存储集群提供安全的虚拟存储环境与基础设施,包括多元化的技术与高包容性的数据接纳系统,以规避整个DRI系统故障带来的影响,并实现灾后迅速恢复数据。

3 对我国文化遗产存储库建设的启示

纵观我国文化遗产存储库的建设现状,虽已具备一定的实践经验,但仍存在实践、合作、开发与技术等方面的不足。为此,可借鉴DRI的成功实践经验,通过下列方式弥补我国数字文化遗产存储库建设上的短板。

3.1 加强顶层设计,构建“1+N”分布式资源库体系

我国文化遗产存储库建设已然取得一定的研究成果与实践经验,但由于各地只专注于自身馆藏资源建设,文化遗产资源相对分散,暂无法实现各存储库之间的协同合作与资源共享,而文化遗产只有置于大数据时代背景下时,才能真正发挥出其蕴含的价值。因此,我国文化遗产存储库应当加强顶层设计,强化政策支持,明确建设主体,构建“1+N”分布式资源存储库的结构体系。所谓“1+N”分布式资源存储结构体系,即构建一个中央核心存储库接入点,利用交互式多媒体工具连接N个存储库机构,实现交互式数据资源共享,详见图2。用户通过本地文化遗产存储库进行一站式检索,当检索内容存于本地存储库时,用户只需通过本地存储库便可便捷获取资源及其相应的服务;当检索内容存于其他存储库时,可通过本地存储库向中央核心存储库发出资源请求,再由中央核心存储库向数据所在的存储库转发该请求,并利用交互式多媒体工具获得所需资源,提供给用户,以满足用户的需求。“1+N”分布式资源库体系打通了各存储库之间的界限,实现了资源互通。

图2 “1+N”分布式资源库运行图

3.2 强化技术管理,形成覆盖全周期的保护框架

我国文化遗产资源主要是通过网站或建设特色存储库进行宣传与推广,开发力度远远不够,在一定程度上影响了文化遗产资源潜在价值的挖掘与利用,同时也无法带动文化遗产数据管理与“活”态服务。因此,我国文化遗产存储库建设可引进DRI的综合性技术体系,形成覆盖文化遗产数据形成、资源存储、数据传输、永久保存及价值挖掘等一系列的周期性技术保护框架,在保证文化遗产永久保存的基础上实现价值的挖掘与流程再造。

在数据存储前期,存储系统采用具包容性的技术,如Ceph和Bareos等,以确保系统可识别与存储各种载体类型的文化遗产资源,并为其提供相应的存储环境。在数据传输阶段,构建综合性交互型技术框架,以保证数据资源在各存储库间实现共建共享,并为数据传输过程提供安全保障。而文化遗产的资源利用与价值挖掘处于流程末端,需系统运用相应的技术来充分保障资源的真实性与完整性。存储库可利用区块链结合智能合约、数字签名等技术保证数据交换安全,防止资源信息内容被篡改或泄露。

3.3 拓展协同合作,凝聚各方力量推动发展

要使文化遗产资源得以全面采集与永久保存,应借鉴DRI在人才团队、资金合作以及特色项目开发建设等方面协同合作的实践经验。基于此,我国文化遗产存储库可建构多元的协同合作运行机制,以凝聚社会各方力量共同推动存储库可持续发展。

一方面,要吸纳第三方力量,打造稳定的智慧人才队伍。应采取“自造”与“吸收”双重人才培养机制。除与高校、科学院等教育机构联合培养相关专业技术人才外,还应积极与政府、企业等社会机构协同合作,形成人才资源协同发展态势。

另一方面,转变民众角色,共同推进资源建设。用户的创新想法是无穷无尽的,唯有实现用户从利用者向资源创建者的角色转变,才能真正发掘用户的价值与需求。我国文化遗产存储库建设可通过开设文化遗产文创比赛、搭建众包平台等渠道,不断提高用户文化遗产保护意识及档案创新能力,将其发展成文化遗产存储库建设的主力军之一。

3.4 树立危机意识,创建异地备份组织架构

数字文化遗产资源的不稳定性要求在建设数字文化遗产资源库的过程中,必须树立危机意识,在做好安全技术保护的基础上,搭建系统异地备份组织架构,以便当系统被侵犯或受自然灾害破坏时可及时恢复数据或重建系统。

可借鉴DRI交互式数据共享与异地备份资源安全体系建设,在基于全国“1+N”交互式分布的资源存储系统上,打造全国文化遗产资源异地备份基地,增强存储库的容灾功能。异地备份存储基地类似DRI系统的故障转移功能,在异地备份前期,依托新型技术手段,为资源的收集传输、永久保存与利用等营造安全的存储环境,形成前瞻性的保护框架。在异地备份中期,备份存储基地必须具备匹配多元化资源格式的识别技术,以保障电子文化遗产资源元数据与存储环境数据的收集。此外还需与各存储库之间建立起资源实时相互映射机制,以确保资源的实时性与同步性,并定期检查资源的完整性与安全性,为资源的永久保存提供保障。在异地备份后期,要运用数字签名、可信时间戳等电子文件防篡改技术对电子资源进行验证[20],以确保输出资源的真实性,为文化遗产资源恢复提供技术保障。以辽宁省电子档案备份中心为例,其现为国家第一历史档案馆、广西、宁夏等地的电子档案异地保管机构,所存储的数据涵盖国家、省、市、县区四个行政级别的档案资源[21],起着重要的数据容灾备份功能,这种数据备份模式目前在全国范围内得到了一定的推广,具有较强的可操作性。

猜你喜欢

爱尔兰备份检索
“备份”25年:邓清明圆梦
VSAT卫星通信备份技术研究
一个统一的爱尔兰:爱尔兰统一的可能性正在增大
创建vSphere 备份任务
爱尔兰睡眠学会
爱尔兰笔记,西岸骑旅
旧瓶装新酒天宫二号从备份变实验室
专利检索中“语义”的表现
爱尔兰:小岛屿,大乐趣
国际标准检索