大数据时代电子文件档案化过程中需要注意的几个问题
2020-04-08孙康燕唐合文李薇
孙康燕 唐合文 李薇
摘 要:大数据时代的电子文件数量越来越巨大,其对社会经济各方面影响越来越大。为了更好地管理与利用电子文件,将其档案化为电子档案很要必要。该文从分析电子文件与电子档案特点出发,论述了电子文件档案化的必要性以及此过程中需要注意的问题。
关键词:电子文件 电子档案 档案化
中图分类号:G272 文献标识码:A 文章编号:1672-3791(2020)02(a)-0016-03
Abstract: In the age of big data, the number of electronic documents is icreasingly huge, and it has more and more influence on all aspects of society. In order to manage and utilize electronic archives efficiently, it is necessary to archiving electronic documents into electronic archives.Based on the analysis of the characteristics of electronic documents and electronic archives, this paper discusses the necessity of archiving electronic documents and the problems that should be paid attention to in this process.
Key Words: Electronic document; Electronic Archive; Archiving
全球知名咨询公司麦肯锡曾经说过:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”
在此大数据的背景下,档案界也必须会受到影响,甚至是冲击。关于大数据与档案的研究也越来越多。以中国知网(CNKI)作为数据资源库,用“大数据&档案”作为关键词对国内大数据与档案管理相关的研究资料进行篇名检索,检索结果为1566条,最早的文献发表于2012年,近2006—2008年间共发表1156篇,占总文献的75%。
进入大数据时代,电子文件数量激增。《全国档案事业发展“十五”计划》就强调“电子文件发展的趋势不可逆转”。在此背景下,该文主要讨论电子文件向电子档案的转化问题。
1 几个相关概念
1.1 档案
我国的档案行业标准“档案工作基本术语(DA T-2000)”将档案定义为“国家机构、社会组织或个人在社会活动中直接形成的有价值的各种形式的历史记录”[1]。
1.2 电子文件
国家标准《电子文件管理系统通用功能要求》(GB/T 29194-2012)将电子文件定义为“机关、团体、企事业单位和其他组织在处理公务过程中,通过计算机等电子设备形成、办理、传输和存储的文字、图表、图像、音频、视频等不同形式的信息记录”[3]。
我国的档案行业标准“电子档案管理基本术语”将电子文件定义为“国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。电子文件由内容、结构和背景组成”[3]。
此这两种定义的主体内容基本相同,但前者的范围更大,故该文采用此前者定义。
1.3 电子档案
我国的国家标准“电子文件归档与电子档案管理规范(GB/T 18894-2016)”将电子档案定义为“具有凭证、查考和保存价值并归档保存的电子文件”[4]。
1.4 电子文件档案化
根据前面2与3的定义可看出,电子文件与电子档案两个概念不是完全等同的。电子文件必须经过完善的归档过程处理后,符合相关档案标准才能称之为电子档案。
国家标准“电子文件归档与电子档案管理规范(GB/T 18894-2016)”将电子文件的归档定义为“指将具有凭证、查考和保存价值且办理完毕、经系统整理的电子文件及其元数据管理权限向档案部门移交的过程”[5]。
笔者把电子文件进行归档处理为档案的过程定义为电子文件档案化,也就是电子文件档案化管理。
2 电子文件档案化的必要性
虽然电子文件是经过了一定规范化的形成、发展、结果等流程和管理规定,具有真实性、完整性和有效性特点。此类电子文件的流转具有一定的法律特殊性和保密性。该节从电子文件与电子档案的主要特点入手来论述电子文件档案化的必要性。
2.1 电子文件的主要特点
2.1.1 文件格式多样
电子文件主要来源于办公自动化(OA)系统与电子政务“E-government”,当前各种系统产生的文件格式不统一,电子文件的制作和储存方式有许多种。我们常见的有Excel表格样式、Word文檔样式、PDF文档样式、JPEG图片样式等,其存储和记忆方式也不尽相同,常见的有CD盘刻录、硬盘(移动硬盘)储存、网络云盘等,这就使得电子文件的形式多样化[6]。
2.1.2 文件易变动
相对于纸质文件来说,电子文件改动非常容易且几乎不留痕迹。电子文件的改动可分为两类:一是正常改动,如工作学习经历发生变化必然导致个人简历的变化;二是非正常改动,如为了提前退休把年龄改大。
2.1.3 文件易被破坏
电子文件一般都要依赖于计算机进行读写,而计算机非常容易受到病毒感染或攻击。仅2018年9月,国家计算机病毒应急处理中心共发现病毒7474881个,比8月上升2.5%,新增病毒57926个, 比8月上升2.3%,感染计算机11 559万台[7]。
计算机受到病毒攻击,很容易导致电子文件丢失或失效(变成乱码文件导致不可读),也即电子文件被破坏。
2.2 电子档案的主要特点
2.2.1 原始记录性
原始记录性是档案的本质特性。档案管理活动中必须遵循其对以往历史事实的原始记录价值为轴心这一基本定律。电子档案也必须保持原始记录性。
2.2.2 相对稳定性
尽管电子档案相对于纸质档案来说,也容易被修改,但一般情况没有谁愿意冒着承担违法成本的风险来修改档案,因为“档案法”明确规定,涂改、伪造档案的要依法追究刑事责任。电子文件的修改就要随意得多,随意修改电子文件也不用承担法律后果,最多只是承担相关行业或企事业单位内部处罚。所以,相对于电子文件来说,电子档案具有相对稳定性。
2.2.3 法律證据性
张劲松等认为档案的本质是信息,档案的法律证据作用的本质是档案内容信息的原始性[8]。
而电子档案的原始凭证性与纸质档案一样,故电子档案也应具有法律证据价值,即具有法律证据性。
关于电子档案证明力认定相关的法规有40多部,对电子档案证明力认定有直接规定也有间接规定[9]。
根据以上特点分析可知,电子文件很有必要经过归档过程处理为档案,亦即电子文件档案化。
3 电子文件档案化过程中需要注意的几个问题
3.1 建立元数据
根据定义可知,电子文件主要是在工作中形成的不同形式的信息记录,它们都是在处理某一事务中形成的。如“总局文件20190410.pdf”这样的电子文件名如果直接归档,显然是不符合要求的。要将此文件有关的背景信息和元数据与其一起归档保存,这样才能很清楚地标明证明这份文件的下发时间、审批领导、办理单位及办理结果等。《电子文件归档与电子档案管理规范(GB/T 18894-2016)》把“元数据”明确定义为“描述电子文件和电子档案的内容、背景、结构及其管理过程的数据”。在建立元数据时要注意按照一定标准规范,这对电子档案的凭证作用也要重要价值。
3.2 保护电子档案的真实性
相对于纸质文件来说,电子文件很容易被修改,故其档案化过程中要特别注意在保证其真实性上下功夫,否则其很容易丧失保存价值。保护电子档案的真实性, 也是电子文件档案化中必须面对与解决的一大难题。
从技术上来说,可通过电子认证来保护电子档案的真实性,时间戳、数字签名、区块链等都是保证电子档案真实性的认证技术。我国于2005就颁布了“电子签名法”并于2015年修正。此法律确定规定了电子签名具有与手写签字或盖章同等的法律效力,电子文件与书面文书一样具有同等法律效力。数字签名在国外已有较好的应用先例。德国明确要求电子文件在进行归档时, 必须进行电子签名的更新, 加上新的有效的签名,才可以长期保存[10]。最高人民法院于2018年9月6日发布《最高人民法院关于互联网法院审理案件若干问题的规定》,第一次以司法解释形式对可信时间戳及区块链等固证存证手段进行法律确认,这意味着电子固证存证技术在司法层面的应用迎来重要突破[11]。
3.3 确保电子档案的管理安全
在电子文件档案化为电子档案后,需要与管理纸质档案一样,严格执行相关归档标准和管理制度。此外,还需要根据电子档案的特点来建立完善的管理系统,这可使得以后对电子档案进行内容补充、载体更换、档案拷贝和数据监测等操作时留下详细的记录,做到对电子档案全程进行监控针对电子档案管理人员,还需要加强职业素质及道德素质教育,增加守法意识,特别要加强对保密法与档案法的学习、遵守。在电子档案的使用过程中要对相关人员严格审核,利用过程中按相应的程序进行。
另外,还需要从技术上保证电子档案的安全,相应的技术有加密、数据封装、数字水印、访问控制、防火墙、文件备份和灾害恢复等技术。
电子档案的极小过失就可能造成非常严重的后果。例如,2007年英国皇家税务及海关总署在邮寄过程中丢失了两张重要的数据光盘,其中包括约2500万人的个人资料和银行信息,致使近一半的英国人面临受欺诈的危险,英国税务署长也因此辞职[12]。
4 结语
在大数据背景下,电子文件数量越来越巨大,对电子文件的管理也越来越重要。其中电子文件档案化为电子档案,对于规范管理与有效利用很有必要。在电子文件档案化过程中,要特别注意根据相关规范标准建立元数据,通过相关技术与法规、管理制度等来确保电子档案的真实性以及电子档案的安全。
参考文献
[1] DA T-2000,档案工作基本术语[S].
[2] GB/T29194-2012,电子文件管理系统通用功能要求[S].
[3] DA/T 58-2014,电子档案管理基本术语[S].
[4] GB/T 18894-2016,电子文件归档与电子档案管理规范[S].
[5] GB/T 18894-2016,电子文件归档与电子档案管理规范[S].
[6] 焦丹琼.浅谈电子文件对档案管理工作的利与弊[J].教育教学论坛,2018(48):17-18.
[7] 李冬,张宇晴.2018年9月计算机病毒疫情分析[J].信息网络安全,2018(11):89.
[8] 石家庄市钢铁有限公司电子档案课题组.电子文件归档及法律证据作用探索[J].档案学研究,2000(3):35-38.
[9] 陈柳青.电子档案证明力研究[D].福建师范大学,2015.
[10] 穆林.德国电子文件管理和归档标准——DOMEA[J].档案学研究,2007(3):57-60.
[11] 最高人民法院.最高人民法院关于互联网法院审理案件若干问题的规定[EB/OL].(2018-09-13)[2019-04-08].https://www.splcgk.court.gov.cn/gzfwww/sfjs/details?id=ff808081635e1e190165d117a4bb24ae.
[12] 黄念.英国:小光盘遗失大部长丢官[J].中国社会保障, 2008(1):34-37.