电子档案“四性”检测要求及其实现方法
2017-03-30
1 引言
电子档案[1]是指具有凭证、查考和保存价值并归档保存的电子文件。随着信息技术的快速发展,国家信息化建设的不断推进,档案管理工作进入了电子化、网络化发展的新阶段。电子档案以其操作方便、传递快捷、存储空间小、信息容量大等特征[2],逐渐成为档案的主体形式。但电子档案具有易逝性、易变性、对元数据的依赖性、信息与特定载体的可分离性等特性[3],随着电子档案的大量产生,档案部门的接收和长期保存工作面临巨大挑战,如何管理好电子档案是新时期档案工作需要直面的重要问题,而利用技术手段对电子档案的真实性、完整性、可用性和安全性进行检测是有效措施之一。
2“四性”的定义与意义
电子档案的“四性”是指真实性、完整性、可用性和安全性,根据《文书类电子档案检测一般要求(征求意见稿)》中的定义,真实性指电子档案的内容、逻辑结构和背景与形成时的原始状况相一致的性质;完整性指电子档案的内容、结构和背景信息齐全且没有破坏、变异或丢失的性质;可用性指电子档案可以被检索、呈现和理解的性质;安全性指电子档案的管理过程可控、数据存储可靠,未被破坏、未被非法访问的性质。
真实性不仅能反映社会各项活动的历史原貌,而且是构成电子档案价值属性的前提,是确保电子档案具有行政有效性和法律凭证性的重要基础;完整性是确保电子档案凭证价值的重要保障;可用性是电子档案存在和具有保存价值的基础,如果电子档案不能便捷使用,再有价值的档案资料也会失去存在的实际意义;安全性是真实性、完整性和可用性的基础,是维护电子档案凭证价值、法律效力的保障[4]。
保证电子文件、电子档案的“四性”是电子文件能够成为电子档案的前提,也是电子档案能够长期保存的关键要素。2009年发布的《电子文件管理暂行办法》(两办厅字〔2009〕39号)首次提出了“四性”的概念,并且明确指出“电子文件归档时,应当进行真实、完整、可用和安全方面的鉴定、检测”;2012年国家档案局发布的《电子档案移交与接收办法》(档发〔2012〕7号)指出在电子档案移交和接收过程中要对电子档案的“四性”进行检测。为了规范电子档案的“四性”检测工作,国家档案局正着手制定电子档案“四性”检测方面的标准规范,目前已发布了《文书类电子档案检测一般要求(征求意见稿)》。
图1:归档环节的“四性”检测内容
图2:移交接收环节的“四性”检测内容
图3:长期保存环节的“四性”检测内容
由此可见,电子档案“四性”检测在电子档案生命周期管理过程中具有举足轻重的作用,是保证电子档案真实性、完整性、可用性、安全性的重要手段,也是确保电子档案凭证价值、查考价值和保存价值的重要措施。
3“四性”检测研究内容
“四性”检测研究应以电子档案的全生命周期管理过程为基础,并从检测环节、检测对象和检测内容等方面入手。
3.1 检测环节
根据文件生命周期理论[5],电子文件从其形成到最终销毁或永久保存,主要经过电子文件创建、电子文件办理、电子文件归档和电子档案管理、移交进馆(电子档案接收与长期保存)四个阶段,其中与档案部门密切相关的就是电子文件归档、电子档案移交接收和电子档案长期保存三大环节。
一是电子文件归档环节。由于电子文件在归档过程中存在业务部门和档案部门之间的权属交接以及从电子文件到电子档案的转变,因此在此环节中需通过“四性”检测手段对归档电子文件质量进行严格把关,将符合归档要求的电子文件归档并统一管理,把不符合要求的电子文件退回业务部门重新进行整理。
二是电子档案移交接收环节。立档单位按照档案馆要求,将需要移交进馆的电子档案移交至档案馆进行长期保存。由于电子档案从立档单位档案室移交至档案馆的过程中存在档案权属的转移,且电子档案在移交过程中必须符合档案馆接收的相关规定与要求。因此在电子档案移交接收过程中,档案室移交人员应对移交的电子档案进行“四性”检测,检测通过后方可正式移交;同样,档案馆接收人员需对接收的电子档案进行“四性”检测,检测通过后才能正式接收。
三是电子档案长期保存环节。在电子档案进入长期保存库之前,需要对其“四性”进行全面检测,严防不合要求的电子档案进入长期保存库。在电子档案长期保存的过程中,由于技术更新换代或存储介质损坏等原因,可能导致电子档案损毁或无法读取,因此需要设置检测策略,对长期保存的电子档案进行定期或者不定期的“四性”检测,确保电子档案长期可用。
综上所述,“四性”检测要与电子文件归档、电子档案移交接收和电子档案长期保存这三个环节密切结合,要与电子文件生命周期管理密切结合,确保电子文件和电子档案的真实、完整、可用和安全。
3.2 检测对象
图4:电子档案“四性”检测工具架构图
图5:四性检测工具检测界面
从对检测环节的分析研究可以看出,“四性”检测的对象主要是三个环节中的信息包[6],即电子文件归档环节的归档信息包(ASIP,Archiving Submission Information Package)、电子档案移交接收环节的移交信息包(TSIP,Transfer Submission Information Package)、电子档案长期保存环节的保存信息包(AIP,Archival Information Package)。根据《文书类电子档案检测一般要求(征求意见稿)》中的定义,归档信息包指电子文件归档时立档单位内部业务部门向档案部门提交的信息包,移交信息包指电子档案移交时立档单位向档案馆提交的信息包,保存信息包指按照长期保存要求形成的电子档案信息包。
另外,从技术实现手段上看,由于信息包的技术表现形式既可能是离线数据包也可能是在线逻辑包,因此在“四性”检测过程中,既要支持对离线数据包的检测,也要支持通过数据库或服务调用的方式对在线逻辑包的检测。
3.3 检测内容
要确定“四性”检测的具体检测内容,必须针对电子文件归档、电子档案移交接收、电子档案长期保存三个环节进行分析,制定真实性检测、完整性检测、可用性检测和安全性检测的具体检测指标项,实现对电子档案“四性”的全面检测。
电子文件归档环节,“四性”检测的具体内容如图1所示。真实性检测内容包括:(1)电子文件来源真实性检测:通过检测归档电子文件中的固化信息是否有效确认电子文件来源的真实性;(2)电子文件元数据真实性检测:检测归档电子文件元数据是否符合DA/T46-2009要求,包括数据类型、长度、格式、值域以及元数据项著录是否合理等;(3)电子文件内容真实性检测:检测电子文件内容数据中包含的电子属性信息与电子文件元数据中记录的信息是否一致;(4)元数据与内容关联真实性检测:检测电子文件元数据与内容数据是否关联,检测元数据中记录的文件存储位置与电子文件内容数据的实际存储位置是否一致;(5)归档信息包真实性检测:检测电子文件归档信息包的信息组织结构和内容是否符合国家有关规定,检测归档的信息包与业务部门发送的信息包是否一致。
完整性检测的内容包括:(1)电子文件数据总量检测:检测GB/T18894-2016表A.1《电子文件归档登记表》中登记的电子文件数量和字节数与实际归档的电子文件数量和字节数是否相符;(2)电子文件元数据完整性检测:对照DA/T46-2009检测元数据项是否齐全完整,具有连续编号的元数据项(比如归档号、件内顺序号等)是否有漏号现象,反映重要问题的归档电子文件是否包括主要修改过程和办理情况记录等;(3)电子文件内容完整性检测:检测归档电子文件是否有对应的内容数据,内容数据是否齐全完整;(4)归档信息包完整性检测:对照归档信息包的组织方式以及单位的归档范围,逐项检测信息包的内容数据和元数据是否齐全完整。
可用性检测内容包括:(1)电子文件元数据可用性检测:检测电子文件元数据是否可以被正常访问;(2)电子文件内容可用性检测:检测电子文件内容数据是否可以被正常打开和浏览,内容数据格式是否符合归档要求;(3)电子文件软硬件环境检测:检测电子属性元数据中记录的软硬件环境信息是否符合归档要求;(4)归档信息包可用性检测:检测归档信息包是否包含影响其可用性的因素,如使用非公开压缩算法、加密等。
安全性检测内容包括:(1)归档信息包病毒检测:检测归档信息包是否包含恶意代码;(2)归档载体安全性检测:检测载体内是否含有非归档文件,通过外观、读取情况等判定载体是否安全可靠,检测光盘是否符合DA/T38-2008的有关要求;(3)归档过程安全性检测:检测归档信息包在归档和保存过程中是否安全、可控。
电子档案移交接收环节,“四性”检测的具体内容如图2所示。电子档案移交接收环节的“四性”检测内容与电子文件归档环节基本一致,不同的是在对移交信息包完整性的检测过程中,需要对照《电子档案移交与接收办法》(档办发〔2012〕7号)的要求检测移交信息包中的内容数据和元数据是否齐全完整。
电子档案长期保存环节,“四性”检测的具体内容如图3所示。电子档案长期保存环节“四性”检测内容,相对于其他两个环节最大的不同在于设置了检测策略。在电子档案长期保存过程中,需制定检测策略进行定期和不定期的“四性”检测,包括设置电子档案的封装格式、元数据与内容数据的关联方式、存储路径、存储方式、备份策略、各项检测指标、检测周期、长期保存格式、访问授权策略和操作流程等。另外,对于采用EEP封装包[7]方式进行长期保存的电子档案,需要对EEP封装包进行“四性”检测;对于电子档案长期保存所涉及的各类备份数据、保存载体也要分别进行检测,以保证电子档案的长期可用。
4“四性”检测的实现方法
4.1 实现原理
基于对电子档案“四性”检测的研究成果,为切实提高电子档案“四性”检测的质量和效率,我们通过融合各种技术设计,开发出一款功能强大、操作便捷的电子档案“四性”检测工具,完全能够满足电子文件归档环节、电子档案移交接收环节、电子档案长期保存环节对电子档案“四性”检测的要求。
电子档案“四性”检测工具的总体架构如图4所示。“四性”检测工具总体上划分为检测工具和检测引擎两大模块。检测工具包括配置模块和检测模块两个子模块,文件检测引擎包括应用程序接口和检测策略的设置。“四性”检测工具能够以独立工具软件方式提供应用,其内核是检测引擎,实际上是在工具软件中嵌入“四性”检测的功能,实现对电子档案的“四性”检测。检测引擎基于Java虚拟机开发,具有跨平台运行的特性,便于集成到档案管理系统,实现在档案管理系统中进行“四性”检测的功能。
4.2 功能介绍
“四性”检测工具提供检测项的配置功能,可灵活地按照电子文件归档环节、电子档案移交接收环节、电子档案长期保存环节的检测要求进行检测项的配置。同时,“四性”检测工具也支持直接导入已经配置好的检测方案。在具体操作中,用户可根据检测主体和保管环境的变化,通过配置检测项,实现情境化、高效率的检测功能。“四性”检测工具的检测界面操作十分便捷,在配置方案设置完成后,支持通过一键操作的模式实现电子文件归档环节、电子档案移交接收环节、电子档案长期保存环节的“四性”检测。同时检测过程也非常直观清晰,发现问题能及时进行预警和提示,并能在检测完成后出具完整、详细的检测报告,如图5所示。
5 总结与展望
本文从检测环节、检测对象、检测内容等方面对电子档案“四性”检测进行了深入的分析研究,并设计开发出“四性”检测工具,为电子档案“四性”检测提供了技术保障。但目前国内档案界对于电子档案“四性”检测的研究才刚刚起步,《文书类电子档案检测一般要求》目前也还在修订完善中,本文提出的观点还存在很多不够完善、不够全面的地方。如,有关电子档案来源检测的指标可以作进一步深入研究,有关电子档案安全性的检测范围还需进一步界定,等等。在今后的研究中,希望更多的学者能够关注并参与进来,结合理论和实践经验,对电子文件和电子档案“四性”检测要求及实现方法进行总结和完善,提出更清晰的思路与更合理的方法。
注释与参考文献:
[1]DA/T 58- 2014,电子档案管理基本术语[S].北京:中国标准出版社,2014.
[2]杨爽.浅谈如何做好电子文件的归档管理[J].中外企业家,2012(08X):93-93.
[3]何嘉荪,金更达.基于元数据的电子文件集成管理与服务[J].档案学通讯,2005,5.
[4]李向前.论档案工作中电子文件归档的“四性”保障[J].兰台世界:上半月,2008 (5):28-29.
[5]Erlandsson A, International Council on Archives. Committee on Electronic Records.Electronic records management: a literature review[M]. Paris.: International Council on Archives, 1997.
[6]ISO 14721-2012空间数据和信息传输系统——开放档案信息系统(OAIS)——参考模型.
[7]DA/T 48-200基于XML的电子文件封装规范.