从生命周期视角探寻电子文件长期保存的影响因素与对策
2016-12-16屠跃明张梦霞
屠跃明 张梦霞
(中国科学院档案馆,北京,100190)
从生命周期视角探寻电子文件长期保存的影响因素与对策
屠跃明 张梦霞
(中国科学院档案馆,北京,100190)
电子文件长期保存已成为新时期档案工作的重点工作内容之一。电子文件长期保存不是孤立的,它与电子文件生命周期的各个阶段都具有直接或间接的联系。文章从电子文件生命周期的视角,通过问卷调查方式,具体分析了电子文件生命周期不同阶段影响电子文件长期保存的主要因素;最后以这些主要影响因素为突破口,提出进行长期保存风险防范的思路、路径和方法等建议。
电子文件 长期保存 生命周期
电子文件作为社会记忆和国家重要信息资产,理应得到长期保存,但由于载体损坏、技术淘汰、格式变换、系统升级以及当前电子文件管理方面存在的缺陷等原因,一些电子信息正以一种不可逆的方式流逝,如何长期保存电子文件使其在未来依然能真实、可靠和完整地被读取和理解,已成为档案界关注的重点和难点。本文在对电子文件管理现状进行调研分析的基础上,把电子文件长期保存引入到电子文件生命周期的宏观视角,通过分析电子文件生命周期不同阶段影响电子文件长期保存的关键因素,进而提出针对电子文件长期保存的相应对策建议。
1 电子文件长期保存已成为新时期档案工作的重要内容之一
1.1 长期保存工作体现出新时期档案工作的变化
笔者从事档案工作三十多年,在档案专业学习和长期的档案工作期间,通常都用“收、管、用”三个字来概括传统的档案工作内容。随着计算机的普及应用和电子文件的出现,档案部门越来越多地开始运用“收、管、存、用”四个字来概括档案管理工作的相关内容。
电子文件出现并没有改变从文件到档案的基本属性,但电子文件使得档案的载体形式、管理流程、保存方法和利用手段方式等方面都发生了根本性的变化。原国际档案理事会秘书长查尔斯·凯斯凯姆蒂把这种以适应大规模的文件生成和进入电子文件时代为特征的变革称为“20世纪的档案革命”[1],美国档案学家戴维·比尔曼把电子文件出现而造成的变化称之为“重新创造档案”[2]。从国际档案大师的评价中足以体现出电子文件对传统档案工作带来的巨大冲击。
由于档案工作对象的变化,人眼无法直观认读电子文件相关信息,必须借助计算机等相关设备实现对电子文件的认读与管理,因而档案部门最关心电子文件可用性,即现在(特别是将来)能不能读取电子文件的相关信息。而维系当前电子文件在将来可用性的电子文件长期保存工作是档案部门的重点工作内容(见表1)。
从表中涉及工作部门看,唯有电子文件长期保存工作是由档案部门进行主导的。由此可见,新时期的档案工作用“收、管、存、用”四个字来替代“收、管、用”三个字是有道理的,这一字之差说明了在传统档案工作的基础上,其对象和管理模式都发生了变化;说明了档案界对履行档案工作职责的担心;说明了要对电子文件风险进行有针对地防范;说明了电子文件长期保存已成为新时期档案工作的重要工作内容。
1.2 档案界对电子文件长期保存的认识过程
档案界对电子文件长期保存的认识和研究方兴未艾,经历了一个从关注存储介质——关注存储技术——关注存储系统工程的三阶段认识和研究过程,这个过程是一个从局部到整体,从微观到宏观的认识和研究过程,符合事物认识和研究的发展规律。
(1)关注存储介质
以往档案界认为长期保存的关键在于电子文件载体、媒体或介质的长期保存,并就载体的使用寿命、性能、容量、成本等方面开展了相关研究[3,4]。
(2)关注存储技术
由于信息技术迅速发展,技术淘汰、格式变换和系统升级等速度远大于载体的损坏速度,导致电子文件长期保存的研究热点开始转向技术方面,先后出现如仿真、拷贝、迁移、再生性保护、更新、加密、电子签名、“可信时间戳”认证、封装、开放描述等一系列以技术为主的解决方案[5,6]。
(3)关注存储系统工程
随着研究的不断深入和电子文件长期保存实践的开展,档案界意识到某些单一技术只是细节问题,电子文件长期保存是由政策、标准、策略、管理、技术、人才等要素构成的系统工程,需要从电子文件生命周期的宏观视角进行系统分析和研究[7]。
2 电子文件生命周期与长期保存的相互关系
电子文件进行长期保存的基本条件是电子文件要符合质量要求,但电子文件质量受其生命周期不同阶段各个环节的综合影响,不论哪个环节出现问题,电子文件质量便无法保障,因此,从电子文件生命周期全过程进行电子文件质量控制显得尤为重要。国际档案理事会1997年发布的《电子文件管理指南》将电子文件生命周期划分为三个阶段,即概念(设计)阶段、形成阶段和维护阶段[8]。概念(设计)阶段是电子文件生存环境的搭建时期,形成阶段是机构业务活动记录被形成并赋予其文件价值的时期,维护阶段是电子档案的真实完整性得到长期安全维护,确保社会记忆延续的时期。为此,通过分析电子文件生命周期每一阶段对应的工作目标和工作对象,进而阐述电子文件生命周期与长期保存的相互关系(见表2)。
通过表2可以看出,电子文件生命周期不同阶段的工作对象和工作目标各不相同,通过采用倒推的方法来理解电子文件生命周期与长期保存之间的相互关系。首先,作为社会记忆的电子档案需要进行长期保存。维护阶段的对象是需要长期保存的电子档案,其作为人类社会活动的记忆,需要被真实、完整、安全有效地长久保存下来。其次,由于电子文件是电子档案的前身,长期保存的电子档案质量取决于形成阶段电子文件的质量,因此,形成阶段电子文件质量的好坏对维护阶段长期保存效果具有重要影响。最后,电子文件的存在依赖于管理系统环境。电子文件在其系统平台内产生、流转、保管和使用,所以,概念(设计)阶段开发的系统平台作为电子文件的生存环境,对电子文件的形成质量具有直接影响,而具备电子文件管理和保存功能需求的平台,是形成符合质量要求的电子文件的条件和保证。
表1 档案部门关注电子文件的重点工作内容
表2 电子文件生命周期各阶段的工作对象和目标
电子文件生命周期不同阶段与电子文件长期保存具有直接或间接联系,长期保存的对象是具有保存价值、符合质量要求的电子文件,而电子文件又依赖其系统环境。因此,长期保存的工作环节应该延伸到电子文件及其生存环境的研制上,长期保存工作的影响因素自然也贯穿于电子文件完整的生命周期[9]。
3 通过数据分析电子文件管理中的问题
为客观反映电子文件生命周期不同阶段影响电子文件长期保存的主要因素,笔者2016年初对中国科学院系统的院属单位以问卷调查的方式了解电子文件管理及保存现状,并从电子文件生命周期视角,对其影响因素进行了分析,共发放问卷116份,回收67份,回收率为57%。为确保问卷设置的问题能反映调查意图,笔者借助SPSS对回收的问卷进行信度分析,其α系数为0.893,表明问卷具有一定的可信度和进一步分析的价值。此文采用了部分调研数据对电子文件管理中存在的相关问题进行分析。
3.1 电子文件管理的数量受局限
根据调查结果显示,目前院属单位已有50%—90%的文件以电子形式产生,但产生的电子文件能被档案室接收、管理和保存的却不到50%(见图1)。
3.2 电子文件管理的种类受局限
基层单位能够接收管理和保存的电子文件主要以数码照片、音视频文件、数字化文件、电子档案等类型为主,而一些数据库文件、网页文件、电子邮件等系统外产生的电子文件被归档管理的很少(见图2)。
3.3 电子文件管理和保存方式缺乏专业性
档案室受传统纸质文件管理理念和方式的影响,缺少针对电子文件的有效管理方式,突出表现在难以正确划分电子文件的保管期限。60%的院属单位选择参照纸质文件的保管期限执行,34%的单位根本没有划分电子文件保管期限,而只有5%的单位制定了适用于电子文件的保管期限表(见图3)。
3.4 电子文件管理系统的元数据管理功能薄弱
元数据缺失的电子文件很难确定其真实性,也不能为长期保存的电子文件真实性提供保障,因此,元数据管理功能是电子文件管理系统的主要功能之一,承担着完整捕获电子文件内容、结构和背景信息,保证长期保存的电子文件质量的重要任务。但调查数据显示,电子文件管理系统的元数据管理功能相对较弱(见图4)。
图1 被管理电子文件数量与产生数量情况
图2 被管理的电子文件类型占所产生类型的对比
3.5 电子文件归档不力
由文件形成者职能活动产生、具有保存价值的电子文件使用后都应归档、移交到档案室进行统一管理和保存,电子文件形成者是电子文件产生的责任主体,是保证电子文件质量和避免长期保存的电子文件资源流失的重要防线。但调查结果显示,部分单位未开展电子文件归档管理的原因是多方面的,其中文件形成者不愿意归档是主要原因之一。形成者认为由自己保管使用更为方便,导致出现了电子文件的未归档现象(见图5)。
3.6 档案部门的电子文件业务指导职能被弱化
档案管理部门为确保电子文件的质量,应当在电子文件形成阶段提供业务指导与监督检查,但这一职能在实际工作中发挥不理想,有44%的档案部门没有参与电子文件形成阶段进行业务监督指导(见图6)。
4 电子文件生命周期不同阶段对长期保存的主要影响因素与对策
电子文件长期保存应在电子文件生命周期的各个阶段得到持续关注,而分析每一阶段影响电子文件长期保存的主要因素,为实现长期保存寻找工作突破口具有重要意义。笔者通过调查发现了电子文件在管理和长期保存过程中存在的一些影响和制约电子文件长期保存工作的关键因素(见图7),面对这些影响因素,本文提出具有针对性的对策建议。
4.1 概念阶段
(1)影响因素——电子文件管理系统功能无法满足电子文件管理和长期保存的要求
图3 电子文件保管期限的依据情况
图4 电子文件元数据管理情况
图5 未开展电子文件归档管理的原因
图6 档案部门参与电子文件形成的业务指导情况
电子文件生命周期的概念(设计)阶段是搭建电子文件生存及运行环境的阶段,其目标是研制符合电子文件管理要求的系统平台,首先需要明确系统功能需求,而多数单位的系统设计缺乏档案部门的参与,责任主体以信息技术部门为主,但信息技术人员不了解电子文件管理需求,缺乏与文件形成者、档案管理者之间的有效沟通,其设计的系统主要以实现业务需求为主,容易忽略相应的电子文件管理与长期保存的相关功能。从长期保存视角看,如果系统无法及时完整捕获电子文件及其元数据等,不能具备满足档案管理要求的相关功能,则无法保障电子文件的真实性和安全性,无法满足电子文件长期保存的基本要求。因此,电子文件管理系统功能设计对确保长期保存电子文件真实性的重要程度不言而喻,也是设计阶段影响电子文件长期保存的主要因素。
图7 电子文件生命周期不同阶段影响长期保存的主要因素示意图
(2)对策——档案部门介入电子文件管理系统设计,确保系统功能符合档案管理要求
档案部门必须在系统设计阶段先期介入,争取系统功能设计需求的话语权,与信息技术部门密切沟通,认真做好前期需求调研,充分了解电子文件管理和长期保存的具体要求,完善系统功能方案设计,确保系统功能符合档案管理要求并注重系统各项功能的实现,为电子文件的产生、流转、保管、利用提供一个安全可靠的生存、运行和长期保存环境。
4.2 形成阶段
(1)影响因素——无法有效控制电子文件质量和归档
形成阶段是机构业务活动过程中根据需要在搭建好的系统环境中形成电子文件的阶段,电子文件在这一阶段随着业务流的推进过程而流转,责任主体是文件形成部门。造成电子文件质量不佳的原因包括文件形成者业务能力不强、文档部门业务指导缺位等方面,文件形成者如果不使用或不能熟练使用电子文件系统,不按照业务流程形成符合档案管理要求的电子文件,必然造成形成的电子文件不规范,缺少元数据等先天质量问题。归档难是由于相关制度执行不力和文件形成者对电子文件管理与保存意识不足,重视电子文件利用的便捷性而忽略了有价值电子文件的归档保存要求。这些是形成阶段影响电子文件长期保存的主要因素。
(2)对策——有效控制电子文件质量并明确文件形成者的归档责任
档案管理部门应当履行电子文件的业务指导责任,监督文件形成者在可靠系统内生成电子文件及其元数据,并遵从规范流程,通过系统功能实现电子文件的质量控制,尤其要重视不同业务系统中产生的电子文件归档,需要通过规范接口实现各类异构电子文件数据平稳转移到电子文件管理系统,由该系统提供唯一标识符,并实现归档电子文件的安全存储和集中管理。同时要在制度中明确电子文件形成者的归档责任,按时将具有保存价值的电子文件移交档案管理部门,从而保证长期保存的电子文件来源渠道顺畅且质量符合要求。
图8 数字档案馆、室分布式保存平台示意图
4.3 维护阶段
(1)影响因素——档案管理部门的电子文件长期保存的能力不足
维护阶段是对那些办理完毕并进行归档的电子文件进行有效管理、提供利用和长期保存的时期,责任主体是档案管理部门(档案室和档案馆),长期保存能力不足主要体现在档案室自身能力有限,档案室、档案馆和部门工作之间衔接等方面。档案室保存的电子文件是社会记忆的基础,其电子文件质量决定了档案馆的电子档案质量和长期保存效果,但由于档案室保存规模小,管理和技术能力不足等现实困难,难以承担电子文件长期保存的重任。一些档案馆由于对长期保存工作的重要性和认识不到位,缺乏系统的顶层设计,持续的整体条件支持不足。长期保存涉及电子文件生命周期各个阶段,相关部门工作之间衔接不畅,未形成合力所造成的效率降低等也是维护阶段影响电子文件长期保存的因素。
(2)对策——从宏观到微观全面提升电子文件长期保存的能力
档案馆作为档案信息的永久保管基地和服务中心,需要全面提升电子文件长期保存的能力。一方面要以对历史负责的态度高度重视电子文件长期保存工作,采用适合本单位电子文件特点的技术路线,做好顶层设计、优化技术方案、确保经费到位、匹配专业队伍,保障有序开展长期保存工作。另一方面要认真思考档案室和档案馆等部门之间的工作对接,构建数字档案馆、数字档案室的电子文件分布式保存平台[10](见图8)。平台中的数字档案馆的作用是实现对电子文件进行数据管理和长期存储,维护电子文件的长期真实完整有效性,并面向用户提供档案信息利用服务;而数字档案室的主要作用是“中转站”,及时对电子文件形成部门(在OA及业务系统)的质量符合要求的电子文件进行收集、管理和利用,并按规定向数字档案馆输送需要长期保存的电子文件。
[1]张奕.档案新观察——凯斯凯姆蒂教授人大座谈纪实[J].档案学通讯,2000(1): 55-56.
[2]屠跃明.电子文件的生命周期与质量控制[J].档案与建设,2008(11):8-10.[3]陈垦.光盘文件存档系统[J].应用激光,1987(S1):33-40.
[4]连秉然.光盘备份—电子文件(档案)长期安全保存的有效方法[J].中国档案, 2011(7):61-63.
[5]徐义全.电子文件的特性与长期保存[J].档案学研究,2000(1):53-57.
[6]屠跃明,张庆东.保障电子数据真实有效的国家时间印记[J].中国档案,2012(7): 41.
[7]钱毅.我国可信电子文件长期保存规范研究[J].档案学通讯,2014(3):75-79.
[8]冯惠玲.电子文件管理教程[M].中国人民大学出版社,2001.
[9]屠跃明,张梦霞.电子文件(档案)长期保存责任体系构建研究[J].档案学研究,2016(1):101-106.
[10]蔺胜楠.数字档案室研究述评[J].办公自动化:学术版,2014(1):39-40.
屠跃明,中国科学院档案馆研究馆员,研究生导师,主要研究方向为档案信息资源管理。
张梦霞,中国科学院档案馆硕士研究生,主要研究方向为是档案信息资源管理。
The Influences and Strategies Deal with the Long-term Preservation of Electronic Records from the View of Life Cycle
Tu Yueming,Zhang Mengxia
(Archives of Chinese Academy of Science,Beijing,100190)
Long-term preservation of electronic records has become the focus content of the new period archives.Long-term preservation of electronic records is not isolated,and it has direct or indirect with other stages the life cycle of electronic records.The paper make an investigation methods to detailed analysis of the main factor that effect on the long-term preservation of electronic records at different stages.Finally,with these factors for the breakthrough the paper propose to risk prevention ideas,methods and recommendations path for long-term preservation of electronic records.
Electronic Records;Long-term Preservation;Life Cycle
G270.7