APP下载

电子文件长期保存技术与实践研究

2020-10-20郑悦萍

西部论丛 2020年7期
关键词:载体

郑悦萍

摘 要:分析电子文件资源本身、存储格式、存储载体、存储技术对电子文件长期保存的影响,探讨长期保存技术策略,介绍国内外长期保存研究和实践成果。

关键词:长期保存;格式;载体

电子文件长期保存是全世界图书情报档案学科研究和探索实践的必要且重要的课题,采取合适的技术手段和管理措施,使电子文件、电子档案独立于特定软硬件环境,在所需的时间段里能被持续访问或利用,且内容真实、有效、可靠、完整是电子文件长期保存的核心任务。

一、电子文件长期保存难点分析

在电子文件长期或永久保存过程中,影响真实性、完整性、可用性最大风险来自于时间、空间转换引起的系统性问题。电子文件长期保存难点涉及三方面:一是资源本身能否长期保持其真实性、完整性、可靠性、可用性;二是资源存储所依赖的载体或系统是否处于持续稳定的运行状态;三是资源长期保存过程安全可靠,是否所有的长期保存行为活动都被完整记录并可追踪。具体表现为:

1.1 存储格式多样

电子文件、电子档案以标准格式存储到数据库之前,其原始存储的形态多种多样。尤其是非文本的音视频文件,具有存储格式多样,数据占据空间大的特点。数字档案室建设到一定阶段,所有电子文件、电子档案都应以数字化的形态存储到数字档案室系统中。对于档案资源构成年代跨度大、单位历史悠久的单位而言,面对的档案资源格式问题更为突出。

1.2 载体或系统不确定性

一方面,电子文件存储所依赖的载体多样,例如光盘、软盘、硬盘等,若没有定期开展载体及内容鉴定、维护,载体损坏及数据丢失情况很难被发现。另一方面,随着电子文件处理、传递、存储、读取所用软硬件技术不断更新换代,管理利用依赖特定软硬件条件产生的信息将具有不确定性,可能要使用不同于其形成环境的软硬件条件来进行。[1]

1.3 缺乏电子文件管理基础

电子文件的凭证和查考价值来自其形成阶段,依赖于文件现行阶段的控制和归档后的维护管理。产生阶与现行阶段对元数据管理不善,后期将无法修补,真实性、完整性、可靠性、可用性就无从保障。完整的电子文件长期保管链条,始于立档单位的电子文件管理。文件的形成应与业务活动相关联,在缺乏管理要求或规则的情况下,文件产生的方式很大程度上由产生者个人或业务部门决定,不利于文件的长期保存。中国人民大学谢丽教授研究回顾了自1999年启动的“电子文件真实性永久保障国际合作项目”(InterPARES),提出了“现行文件管理是数字保存不可或缺的基础”观点。她通过调查分析美、加、澳、英等国家政府机构文件管理现状,发现现行电子文件管理基础的薄弱会影响这些机构无法即时启动数字保存机制,这些国家的档案馆因现行电子文件管理不善而难以接收适当的保存对象。强调了立档单位电子文件管理对于数字保存的极端重要性。[2]

二、电子文件长期保存策略

2.1 存储格式

(1)格式规范

在接收电子文件时,因考虑文件格式的长久保存能力,对繁多的文件格式进行筛选,降低因专有格式造成的数据失效风险,尽量选取源代码公开、国际通用、标准化、可扩展、系统依赖度低、支持格式转换与迁移的、有利于长期保存的数据格式。

以静态图像格式为例,若保存重要图像,适合使用无损压缩格式TIFF,能最大限度保存图像的原始信息。若是对图像信息要素要求不,可以使用国际静态图像压缩标准格式JPEG。而PDF格式因其具有兼容性强、可跨平台操作等特长, 查阅方便且节省存储空间的特点,被广泛使用。[3]

(2)格式转换

广义的数据格式转换包含数据格式转换、字段代码转换、媒体格式转换、操作系统及硬件系统等技术层面的转换等。市场共享率低的专用格式、依赖于特定硬件和操作系统的格式、已经淘汰的老版本格式等, 都需要进行格式转换。

数据格式转换的方法有多种,这里介绍二种:一是,在电子文件移交归档时,将文件转换成国际通用标准的文本文件格式保存,减少因格式不兼容带来的数据保存长期风险。第二,保存或开发格式转换软件,为了保证电子文件能够永久可处理,及时关注电子文件信息技术变化,当文件产生时所用技术与读取保存的数字信息所需技术不一致时,对所保存的数字信息进行相应的转换,使其保持与新技术的兼容。[4]

在格式转换前要做好数据备份及格式转换策划,避免因转换技术不成熟带来的风险。因格式转换前后的数据元素和结构次序可能不完全一致,若不做好数据备份,策划好来源格式结构要素与转换格式结构要素的匹配关系,盲目的进行格式转换,极有可能发生元数据、文件信息要素丢失等问题,影响文件真实性,造成文件不能读取或信息不完整、不准确。

2.2 存储介质

电子档案是一种海量信息资源,其存储介质必须满足容量大、寿命长、稳定可靠等要求。目前,数字档案的存储载体包括硬盘、光盘、磁盘阵列等。

硬盘在使用中,应保持供电稳定,避免随意关机和频繁启动,每天关停机的次数不宜过多。做好避震、防磁、防冻,注意温湿度调节。

光盘是能以标记的形式接受并保留信息在其记录层上的盘片,这些信息能用激光读出。正确使用和存放光盘,应注意避免频繁使用造成的标记面机械损伤,防尘、防空气污染、注意温湿度调节,禁止在标记面书写或贴标签。

磁盘阵列是当前在档案系统中有相当广泛的应用也比较成熟的一种存储设备。由多块独立磁盘组合成容量巨大的磁盘组,利用数组方式来做磁盘组可降低硬盘故障造成的读取风险,具有数据存取速度快、容错率、便于管理等特点。

2.3 数据安全存储技术

(1)数据拷贝更新

数据信息拷贝,复制存储。这种方法被广泛应用于磁带、磁盘、光盘的保存上。

(2)数据迁移

迁移是在保证文件数据真实性、完整性、可靠性、有效性、可读性的原则下, 运用一定的迁移工具,将文件、数据或是功能从一个系统转移到另一个系统的行动。数据迁移保证了数字信息在不断变化的环境中总能够被识别和读取,使数字资源独立于特定的软硬件环境而長期保存。

2.4 電子文件管理

统筹建设电子文件管理和电子档案管理系统,借助平台推进电子文件前端控制。通过统一的系统开发、标准宣贯等工作,逐步推进电子文件管理系统应用,指导办公自动化系统电子文件的产生与管理,统筹设计电子文件在线管理和归档功能设计,实施电子文件前端管理,将档案要求融入电子文件产生业务中。[5]

统筹设计规划电子文件管理和电子档案管理系统,各业子系统之间相互协调。重过程也重结果,不断提升档案部门在自动化、信息化建设,尤其是电子档案管理系统规划设计、功能需求、文件格式要求等反面的话语权。

三、探索与实践

针对数字档案资源长期保存,很多国家都展开了积极探索,投入尖端人力物力和科学技术,在保存策略、标准、技术、方法、设施上开展理论和实践探索。

1990年,应国际标准化组织(ISO)的要求,美国国家航空和宇宙航行局(NASA)的空间数据系统咨询委员会(CCSDS)承担起了制订长期保存数字信息标准的任务。1995年, CCSDS开始开发框架模型。1999年5月,开放档案信息系统(OAIS)参考模型雏形公布,OAIS 旨在对数字信息的长期保存和维护的档案系统提供一个概念性的框架。2001年7月,OAIS正式发布,2002年OAIS蓝皮书发布,2003年OAIS参考模型作为ISO的标准颁发,成为档案馆、图书馆及其它信息系统普遍遵守的数字信息长期保存国际标准。

电子文件永久真实性保障国际研究项目(InterPARES)经历了“保存电子文件的完整性”的第一阶段,“对迅速发展的信息技术及其对个人和机构文件生成者活动的普遍性作出应对”的第二阶段,“档案管理理论阐述:在数字系统和中、小型档案机构中应用保障文件真实性的理论”的第三阶段,第四阶段“InterPARES信任”,系多国、多学科合作的国际项目,主要探讨了日益网络化环境中数字文件和数据的相关问题。[6]

2017年8月,美国国家档案与文件管理署(NARA)发布《数字档案资源长期保存战略》,该《战略》包括数字档案资源长期保存制度建设、对象识别、可信保存与组织管理等方面的宏观基本战略,还同时制定了以实现长期保持数字档案资源的数据完整,数据格式与存储数据载体稳定、可持续,数字信息安全等目标的中观策略。[7]

2010年,欧盟科学项目PLANETS(Preservation and Long-term Access through networked sercices )将承载着欧洲多个国家图书馆、档案馆及大学、技术公司等合作伙伴的科研成果和数字文化宝藏以及相关的电子文件阅读器和各种详细描述和说明的信息密封舱放入了位于瑞士阿尔卑斯山的诺克斯地堡。

2000年4月,深圳市数字档案馆在国家档案局正式立项,项目总体目标包含“保证电子档案保存、利用的长期性”,是我国开启电子文件长期保存实践探索的标志性项目。2019年,中国国家图书馆“互联网信息战略保存项目”立项,将建设覆盖全国的分级分布式中文互联网信息资源采集与保存体系。[8]

相信在不断的实践探索中,国内研究也将不断完善,以应对数字档案资源长期保存和利用可能出现的新需求。

参考文献

[1] [5] 刘越男,刘语叶,李雪君,吴云鹏,电子文件的长期保存:多维互动的领域——第四届中国电子文件管理论坛综述[J]. 档案学研究,2014,(4).

[2] [6] 谢丽,王健,马林青, InterPARES项目:成果回顾与未来方向[J]. 档案学研究,2017,(S1).

[3] 张美芳,马丹宁,声像档案数字化抢救中存储与长期保存策略的研究[J].数字与缩微影像,2007,(1).

[4] 于嘉,数字信息长期保存的策略探讨[J]. 河南图书馆学刊,2005,(3).

[7] 祁天娇,美国数字档案资源长期保存战略的分析与启示[J]. 档案学研究,2019,(01):110-115.

[8] 冯惠玲,学科探路时代——从未知中探索未来[J].信息资源管理学报,2020,10(3):4-10.

猜你喜欢

载体
以多媒体信息为载体,展数学课堂魅力
以几何画板为载体,探究等腰三角形的存在性问题
以志愿服务为载体的大专院校思政课实践教学路径研究
以工作室为载体打造班主任专业成长共同体的实践探索
倾斜一下
以学习故事为载体 提升教师察析幼儿学习行为的能力
以数学类绘本为载体的幼儿园教学活动探究
以名校长工作室为载体建构教育联盟发展共同体
JGJ/T 135—2018载体桩技术标准
2016年高考试题中的重要载体