APP下载

电子文件长期保存研究综述*

2020-12-05宋奕宁向禹

山西档案 2020年5期

宋奕宁 向禹,2

(1.中南大学生物医学信息系 长沙 410083;2.中南大学档案技术研究所 长沙410083)

引言

电子文件作为国家信息资源和社会的记忆资产,理应得到长期保存。21世纪信息产业高速发展,电子文件数量的激增提升了文件长期保存难度,同时电子文件长期保存及有效管理对相关技术、专业人员以及管理层面也提出了更高的要求。由于电子文件产生于社会的各方各面,作为社会记忆资产,它记录着中国乃至全世界的行为轨迹。从某种程度而言,电子文件长期保存与管理关乎人类文明的传承与社会的繁荣,故而我们要攻克电子文件长期保存路径上的困境为社会可持续发展积蓄力量。文章在对国内外相关文献进行归纳总结的基础上,从六个部分对电子文件长期保存进行阐述,并对电子文件长期保存过程中可能存在的问题提出有针对性的解决办法。

1 文献调研

本文检索数据来源于中国知网中期刊、硕博士论文、会议论文三个子数据库和万方数据库平台,检索数据是通过关键词直接匹配,没有经过数据清洗。检索文献的时间为2019年12月21日。检索项、匹配条件、检索结果如下表1所示。

表1 数据库调研情况

图1 发文量趋势图

图2 主题分布图

2 国内外电子文件长期保存的研究现状

实现电子文件真实、完整、可靠、有效和安全的长期保存是社会关注的重难点。然而如何解决电子文件长期保存过程中的问题更是研究的关键。文章从相关认知、相关主体、相关格式、技术内容、标准制定、相关策略这六个方面的内容进行阐述。

2.1 相关认知

电子文件呈几何态势增长,但是社会电子文件容量有限,电子文件长期保存需求日益迫切。笔者结合文献进行分析,发现研究者主要从电子文件长期保存内涵特性、需求分析及必要性等方面对电子文件长期保存的相关认知进行深入研究。

电子文件[1]是指国家机构、社会组织或者个人在履行其职责或处理事务时,通过计算机等电子设备形成、办理、传输和存储的各种信息记录。长期保存是运用某种科学可靠的方式来保护电子文件真实、完整、可靠、有效和安全的行为[2],是电子文件进入档案管理阶段后的主要目的,保存时间由法定和业务需要决定[3]。它不仅要求电子文件内容真实、完整和可靠还需要在形成、流转、保管的过程中规范完整,在电子文件提供凭证价值的同时上升到信息和文化价值。

钱毅[4]提到“数字档案馆可信数字资源长久保存需求规范”是为了确定电子文件在长期保存需要具备的各种需求, 以此来保障电子文件的可信度。方昀、杨安荣、宗琳[5]从技术层面对电子文件的长期保存提出了需求,构建框架主要从储存载体、文件格式、技术路线、元数据管理和软件功能这5部分进行拓展。

聂云霞、肖坤、何金梅[6]认为电子文件长期保存是有必要的,因为电子文件的广泛应用需要提升电子文件长期保存能力,且电子文件长期保存也是国家记忆构建的内在要求。屠跃明、张梦霞[7]提出电子文件长期保存与电子文件生命周期的各个阶段都有一定的关联。文章提出长期保存风险防范的思路、路径与方法,是一个由局部推及整体的研究过程,它符合事物发展规律。肖秋会、高婷[8]提出中国在数字档案信息长期保存研究上存在一些亟待解决的问题与困惑,在国际上也缺乏代表作。在借鉴欧美等国具有价值的经验和成果的同时提出:有必要对电子文件长期保存体系进行自我创新,构建和完善更加符合我国的电子文件长期保存体系。

2.2 相关主体

相关主体是通过将分散且独立的信息资源进行整合统一来进行电子文件长期保存的主体,笔者结合研读文献进行分析,发现研究者主要从长期保存相关主体、主体职责、长期保存各主体间合作必要性与模式等方面进行探讨。

翟慧杰[9]提出“信息长期保存的责任主体由档案馆、博物馆、图书馆、大学、出版商、学术团体、基金会及个人组成”,并对每个主体进行了责任的讨论和定位。屠跃明、张梦霞[10]提出电子文件保管工作分为产生、流转和保管,一项工作的完成需要不同的责任主体进行协调合作、责任分担。肖秋会[11]提出构建电子文件长期保存合作机制,其中电子文件产生机构、保管机构、政府机构以及除了产生、保管机构外的提供技术、资金和管理等方面帮助的第三方机构、组织或个人这5个合作主体构成了合作机制的一部分重要内容。从理论上讲,信息生命链条上的任何主体都是参与者,这些主体在承担责任的同时需要进行明确的分工和责任。一部分机构起带头和领导作用。其余机构配合主要部门进行辅助工作。各个机构各司其职让行业有条不紊、井然有序的运行。

2.3 相关格式

格式是为了存储数字信息而使用的特殊编码方式,是对数字对象的信息内容进行交换和表示的一种重要标准,电子文件长期保存必须考虑格式问题,笔者结合国内外研读的文献,发现研究者主要从电子文件长期保存格式需求、重要的格式以及相关格式规范等方面进行介绍。

1) 冬笋收入。在合作社成立之前,农户基本上不培育经营冬笋,竹林下草、灌木丛生;而在合作社成立之后,对所有基地竹林进行劈山抚育,2017年合作社又围绕冬笋做文章,注册“孝海竹珍”冬笋品牌,2017年11月至2018年2月,合作社生产冬笋13 882.5 kg,销售额30.34万元,除去挖笋成本15.40万元,冬笋收入14.94万元。

黄玉明[12]学者提出了对电子文件长期保存的格式需求,概括为“格式开放、不绑定软硬件、文件自包含、格式自描述、显示一致性、持续可解释、稳健、可转换、利于存储、支持技术认证机制、易于利用。”毛义春[13]学者分析了电子文件长期保存的格式需求,认为适合的格式有PDF/A格式、TIFF格式、FLAC格式、JPEG2000格式以及MPEG格式。文章总结到:(1)针对文本型电子文件的归档格式应是公开的并且保持文件生成时的排版格式,这样便于数据的传输与交换,在电子文件的各个生命周期确保不被窃取和篡改。(2)针对数字资源保存图像格式应公开化、标准化并且对储存介质无依赖性。(3)针对数码录音的格式应支持验证技术、易于储存、信息安全等要求。

2017年世界标准日,国家标准委员会正式发布了《电子文件存储与交换格式板式文档》,制定了国家板式文档格式规范(OFD)。该标准涵盖了电子文件长期保存的格式需求并且制定了相关格式标准。相比于PDF格式而言,OFD格式长期可读性更占优势,指南中在保留PDF格式的同时规定电子公文的正本、定稿、公文处理应以OFD、PDF、PDF/A等板式格式归档保存。

2.4 技术内容

电子文件长久有效保存依然是一个需要攻破的难题,以此对电子文件长期保存的技术提出了更高的要求。笔者结合研读的国内外文献,发现目前国内学者主要是针对长期保存包含的技术和系统构建以及长期保存技术体系进行研究。

杨小云[14]提出电子档案长期保存的技术策略可以涵盖数据更新、仿真和数据迁移。李育岭[15]认为对电子文件数据的备份与迁移,可以利用数据库归档技术,把有限的资源释放出来以驱动系统的稳定运行。蒋术、吴明霞[16]提出云存储技术可以解决海量数据的存储难题,在减轻存储压力的同时也节约了成本。钱毅、刘立超[17]从数据库自身特性出发通过对ODBC集中归档、采用SIARD等格式进行XML封装、OAIS模型长期保存特性、DVT等可视化工具等技术路径,来对电子档案长期保存工作进行阐述。基于区块链技术,结合电子文件长期保存的目标要求,聂云霞、肖坤、何金梅[18]认为区块链 技术是保障数据安全的技术手段,对于保护社会的记忆资产具有非常重要的意义。王平、李沐妍、姬荣伟[19]认为运用区块链技术的特殊优势进行电子文件可信保护的同时可以维护电子文件长期保存的真实性、完整性和可靠性。

OAIS模型为电子档案长期保存提供了参考模型和基本框架。张智雄[20]等学者在参考了OAIS模型的基础上,提出了长期保存技术体系,可以整理为保存管理、摄入、仓储、存储管理和访问的5个功能板块。董晓莉[21]在对电子文件资源长期保存传统存储缺陷和软件优势进行探讨和分析的基础上,为数字资源长期保存存储系统的建设提供了一种全新的选择。

2.5 标准制定

标准是丈量一切的准绳,ISO、各个国家和相关机构都制定了长期保存相关标准,长期保存相关标准规范备受关注。一方面国家出台一系列标准规范是对电子档案长期保存的重要支撑。另一方面国内学者结合国内外制定的相关标准,提出标准建设思路、操作流程以及标准体系。

国家档案局2014年启动了“档案长期保存系统建设试点项目”,为了实现电子档案长期保存的目标,通过保持电子档案在生命周期内的真实有效性,建立相关的管理体系和技术标准来实现。肖秋会、高婷[22]从主体、类型、格式、国际采标等不同的角度思路提出了我国电子文件长期保存标准的建设思路。孙瑾、杨晓玲[23]参照OAIS模型的理念,从功能需求出发构建了长期保存系统,进一步规范了操作流程。蔡盈芳[24]在梳理归纳了相关法律法规以及在规范化实行的过程中所面临的问题,基于档案管理的需求对电子文件政策和标准体系提出更加完善的建议。李海涛、朱婉云、王月琴[25]在对比了国内外制定的相关标准,分析整理出我国电子档案长期保存面临的问题,结合管理标准的构建,提出了更加完善的对策。

2.6 相关策略

电子文件长期保存的策略是国家对长期保存工作的基本态度、总体规划以及统筹安排,有利于“低成本高效率”的去解决电子文件长期保存过程中遇到的问题。笔者结合国内外研读文献,将电子文件长期保存策略分为国内战略思想和国外经验借鉴。

姜晓曦学者[26]通过对三大类具有代表性图书馆的战略规划进行对比分析,对图书馆战略资源的具体内容进行了精准的阐述。刘家真[27]对1997年美国档案10年间的管理战略进行了整理。例如NARA为了实现数字档案长期保存的目的利用档案馆的馆藏来达到监督政府工作的目的。黄如花、李英子[28]认为数字档案长期保存涉及经济、法律、管理、策略层面的问题,并且归纳了日本国会数字档案长期保存的六大特征。聂云霞、晏秦[29]在进行一系列国内外数字档案长期保存的科学调研与研究的基础上,从文化的角度,提出了适合我国应用的政策、管理、技术策略。

美国国家文件管理署(NARA)2017年发布了第一个对电子档案长期保存进行的战略部署,对中国的其后战略规划产生了深远的影响。华东杰[30]介绍了英国近十年的数字档案保存策略规划。为我国的研究起到了抛砖引玉的作用。张梦霞、屠跃明[31]通过国内外对数字档案长期保存进行的策略部署归纳整理的基础上,分别从目标、实施路径和支撑要素三方面展开了讨论与设想。祁天娇[32]通过分析美国在档案长期保存的战略,对相关文献和问题进行了深入的学习,在了解战略背景的基础下,从路线规划、宏观、中观策略等方面进行战略方面的阐述。

3 研究述评

电子文件的大规模出现,从文件到档案的基本属性并没有实质性的改变,但电子文件的载体格式需求、管理流程、保存方法等都发生了根本性的变化。查尔斯 · 凯斯凯姆蒂博士[33]称这次变革为“20世纪档案革命”。另一位学者戴维 · 比尔曼[34]称这次变革为“重新创造档案”。针对这种情况我们可以运用理论和实践知识相结合,在建立具有中国自己的电子文件长期保存体系的同时预测电子文件长期保存的发展趋势。

结合综上和研读文献以及电子文件形成、流转、保管过程,笔者认为电子文件长期保存存在的问题主要有4个方面:(1)缺少相关技术和资金支持,多领域交叉学科的研究远远不够。(2)电子文件长期保存系统不够完善。各部门缺乏有效的沟通,衔接不到位,导致需求不够明确,造成系统功能无法满足电子文件长期保存的需求。(3)工作人员业务能力不够,相关责任者意识不强。目前我国从事电子文件管理的工作人员大多是没有专业背景的,难免有时候会对业务不熟悉把握不精准。(4)相关部门执行力度不强,部门指导缺位造成形成的电子文件不规范。

针对上述情况我们可以从以下5个方面进行改善:(1)结合实际情况,在提供资金支持、技术输出、岗位培训的同时建立多领域合作,从更广阔的视角去解决电子文件长期保存迫切需求的问题。除档案部门外,鼓励社会各界团体的积极参与,在减轻档案部门部分负担的同时促进相关领域的发展。(2)创造有利于实现电子文件长期保存的环境。包括电子文件长期保存系统的建立、相关开发工具的更新与完善等。(3)各部门一起设计电子文件管理系统,在进行充分的前期需求调研后,与信息技术部门进行密切有效的沟通,明确长期保存的要求通过完善设计来实现电子文件长期保存功能。(4)进行岗前、岗中培训,培养工作人员的专业素养和责任意识。(5)在明确电子文件管理主体的同时提升质量。档案部门要明确责任,规范流程。

结合国内外电子档案长期保存研读文献的分析,笔者认为促进多领域交叉研究、加强国际间的合作互动、注重人才培养、颁布更多符合我国实施的宏观战略等会成为未来电子文件长期保存的发展之势。