电子档案的长期保存:从诺克斯地堡谈起
2018-03-23郭薇薇
郭薇薇
现代化的数据中心:诺克斯地堡
诺克斯地堡,是瑞士军方于20世纪40年代在冰天雪地的阿尔卑斯山区伯尔尼高地建造的一个军事建筑设施,2006年6月,欧盟的科学家在此创建了一个名为PLANETS(Preservation and Long-term Access through networked services)的项目。该项目旨在通过网络服务进行长期数据保存和获取。科学家们利用诺克斯地堡建立了两个独立的地下数据中心,通过最尖端的IT技术和安全机制相连接,数据中心不仅防火、防震,而且防核爆、防辐射。2010年他们将一个密封舱放置进了诺克斯地堡的核心部位,密封舱里保存有穿孔卡片、微缩胶片、软盘、磁带、CD、DVD、USB 和蓝光媒介等载体,其中存储着来自欧洲多个国家的国家图书馆、档案馆及大学、技术公司等合作伙伴提供的大量科学研究成果和数字文化宝藏,随这些电子文件储存的还有相应的文件转换工具、阅读器及各种详细描述和说明。通过这个项目,科学家们想给未来的研究人员永久保存一些可以用来重建和拯救我们历史的有用资料,以延续人类文明的火种。该项目的一个负责人解释道:“爱因斯坦的纸质笔记今天我们仍然可以看到,然而史蒂芬霍金的数字笔记在70年后可能就会消失”[1]。
电子档案长期保存存在的问题
为什么科学家们会大费周章建设 “诺克斯地堡”?从3000多年前两河流域的泥板档案到古罗马的羊皮纸,再到近代的纸质文件,传统的档案管理都是建立在具体的实物基础上的,直到20世纪计算机的发明,数字信息及其承载媒介迅猛发展,开始动摇纸质媒介的统治地位[2],摆脱了实物而采用虚拟化方式存储的电子文件成为一种新的档案记录方式。电子文件在使用和修改上的便利性使得许多人更愿意采用电子化的输入方式而不是传统的手写来记录信息,如今打字逐渐取代写字,很多新派作家在写作的时候直接使用电脑打字,而不再使用手稿,新闻记者的采访稿件、会议记录等也都直接采用电脑记录,同时数字阅读也逐渐成为大众化趋势。伴随而来的是越来越多信息资料采用数字档案的形式进行储存和传播,和刻在龟甲上的甲骨文或记录在羊皮纸上的罗马文不同的是,电子档案所承载的数字信息不是轻易能永久保存的,如果在有限的保存周期内我们没能找出长期保存这些数据的方法,那么未来我们可能要花费更大的代价来弥补,甚至要面临部分数字资料永久丢失的风险。
电子档案的长期保存面临着严峻挑战,其最主要的威胁来自以下几个方面:
1.技术的快速更新升级
由于数字信息存储对机器的依赖性,电子档案必须依赖特定的计算机硬件和软件才能阅读和处理,而信息技术的发展速度已经远远超过了数据存入的速度,新型的存储设备和存储方式往往没过几年就被新的技术产品更新取代了。从穿孔纸带、磁带、软盘、光盘、机械磁盘到现在的固态硬盘、磁盘阵列等存储设备,硬件存储介质不断推陈出新,操作系统也不断升级,过去DOS时代的很多文档在今天的操作系统下已经无法识别和读取了。所以诺克斯地堡除了保存大量的电子文件之外还需要针对每类文件准备专门的阅读器、说明文档和文件转换工具用于解读。
2.存储介质的脆弱性
从1900多年前“蔡侯纸”的发明开始,纸张就被广泛用于书写,成为信息承载媒介被沿用至今。纸质档案的保护有着悠久的历史,到今天已经形成了一套完整、稳定和成熟的体系,然而电子档案中数字信息的保存则是一个较新的课题。无论是光盘还是硬盘,这些存储介质即使在无外力破坏的情况下,由于本身材料的不稳定性和不适宜的保管条件也会使其物理性能快速退化,普通刻录光盘的寿命短则只有几年。数据信息老化和衰退的现象每时每刻都在发生,从某种意义上说,我们现在是一边存入资料,一边丢失资料。
3.网络资源的时效性影响
网络数据资源本身变动很大,更新速度很快,资源容易过时。不少网络资料在经历一段时间后,其链接就可能因为网络文件丢失、网站关闭、网关错误及域名解析问题等原因导致无法指向被引用的网络资源,如果无法获取原始资料,这些资料就无异于“不存在”了[3]。另外,对于采用云存储方式储存的数据资源也有可能因为云服务供应商的自身安全机制缺失或网络安全威胁而面临信息丢失的风险。
4.数字信息容易被未经授权的操作更改或删除
纸质文件时代,文书体式日趋规范,文书归档及档案文件保管方面有非常成熟和完善的制度体系来保障,这套体系具有权威性和证据性,通过它纸质档案能够被确信为原始记录,经书面记录和归档的档案极难更改。电子档案不同于内容、形式和载体固化为一体的纸质档案,它采用的是数字化的存储方式,由于目前在技术手段和法律法规方面对数字信息证据性的支持尚不成熟,如何识别和发现对电子档案的非法人为变更还没有十分有效的解决方案和法律保障体系[2]。
就在欧盟科学家们建设 “诺克斯地堡”的时候,武汉大学刘家真教授组织的课题组对我国国内57个机构的数字资源保存状况进行了一次调查。调查主要针对国内多个图书馆、档案馆的数字资源及其保存、保护状况进行研究,根据结果来看,我国的数字资源保护情况不容乐观。调查发现,上述这些机构的数据存储介质物理损伤十分严重,71.40%的图书馆、32.10%的档案馆和25%的信息中心存在介质物理损伤情况,47.6%的图书馆和14.30%的档案馆存在数据无法读取的情况,被调查机构的总体数据备份环节都较弱[4]。
电子档案长期保存的对策
对于我国国内电子档案的长期保存问题,笔者认为可以从以下几个方面入手:
1.完善电子档案长期保存相关法律基础
电子档案涉及的数字信息保存牵涉到证据性、真实性与版权等诸多法律问题,欧美许多国家在这些方面都有相关立法,我国在《著作权法》及《信息网络传播权保护条例》中对电子文件的版权、存取、利用及隐私等方面的适用及影响作了相应规定,但是仍然不够细化和明确。只有进一步完善法律法规,通过立法保障进行规范、约束和控制,才能确保电子文件作为档案材料的适用性。
2.建立电子档案长期保存的标准
电子档案在保存中,需要采取标准化的技术和手段来提高电子文件长期保存的效率和质量。目前电子文件管理的标准有ISO、IEC/ITU等国际标准,也有BSI、ANSI、AFNOR等国家标准,我国也出台过档案行业的DA/T46-2009《文书类电子文件元数据方案》。该方案对于我国各类机构和行业制订自己的电子文件保存方案提供了指引和参考,但各具体行业和领域还缺乏细化的标准,在信息安全、信息资源发现、地理空间数据、图像视频资料等诸多具体技术层面的标准和规范还需要进一步完善,以便在具体使用时,对诸多相关标准综合选择和实施。
3.制定完备的电子档案管理策略
在管理策略方面,既需要落实国家层面的电子档案管理战略,又需要落实各类组织机构对电子档案的长期保存政策和策略。欧美许多发达国家于21世纪初期就已经从国家战略高度落实本国的数字信息和电子文件管理国家战略,另外在档案馆、图书馆等数字信息保存机构领域也出台了具体的数字信息保存政策。相对而言,我国电子文件管理战略起步较晚,缺乏顶层设计和总体规划,相互间重复开发、资源浪费及信息孤岛现象较为普遍,只有建立起完善的数字信息国家管理战略,完善国家机关、企事业单位的电子档案保存策略、管理意识和管理水平,才能更好地保存国家记忆和社会记忆。
4.选择适当的电子档案保存技术策略
作为具体的实施方案,电子档案保存的技术策略是影响着电子档案长期保存的关键因素,为了保障电子档案的长期可用,需要适时的采取更新、复制、迁移、转换、仿真及云存储等技术保护策略来解决存储介质老化和技术过时造成的介质物理性能退化的问题。但是每一种技术方案都有其特定的功能,没有一种技术是万能的,实施时应根据保存和访问的具体需求、数字对象的技术特点、保存环境等因素选择最佳的保存策略。同时所有的技术方案都要基于法律规范下符合相应标准和管理策略的方式来实施,只有这样才能真正实现电子档案资源的可持续使用。
结语
数字资料不是永恒的,它也有保质期,这就是为什么人类要花重金打造“诺克斯地堡”的原因,与刻在石头上的象形文字或羊皮纸上的墨水不同,数字信息的保存期限可能只是几年而不是几千年,如果现在不执行适当的保护措施,将来我们可能需要付出更大的代价来弥补,甚至有些资料可能永远也无法再找回来了。2010年Planets项目完成后,项目的成果由来自英国的非盈利公司OPF(Open Preservation Foundation)继承下来,继续致力于数字文化遗产的长期保存工作。也许我国并不需要仿建一个自己的“诺克斯地堡”,但是完善电子文件和档案的长期保存和管理,确保数字信息的真实性、完整性、可靠性和长期可用性的工作仍然迫在眉睫、任重而道远。
[1]VanHemert Kyle.The Blueprint To All Our Data Is Hidden Inside This Mountain Fortress[EB/OL].Gizmodo.2010
[2]赵屹.数字时代的文件与档案管理[M].上海:上海世界图书出版公司,2013:2
[3]张瑞.网络信息老化研究.情报杂志[J].2008,27(8):38-40
[4]肖秋会.电子文件长期保存:理论与实践[M].北京:社会科学文献出版社,2014