我国电子文件真实性研究综述
2022-03-05刘田宇
刘田宇, 向 禹,2,3
(1.中南大学 生物医学信息系,湖南 长沙 410083; 2.中南大学 档案技术研究所,湖南 长沙 410083; 3.中国人民大学 档案事业发展研究中心,北京 100872)
0 引言
电子文件是国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录[1]。国内对电子文件的法律地位早已通过一系列法律法规的制定和更新得以确立,如:《中华人民共和国电子签名法》、《中华人民共和国合同法》、《电子商务法》等。2020年6月20日修订的《中华人民共和国档案法》也再次明确电子档案与传统载体档案具有同等效力,可以以电子形式作为凭证使用。但在实际运用中,电子文件的法律有效性还是未被全面接受,大量企事业单位和个人在办事过程中还是要求或被要求提供相应的纸质文件,笔者认为,保障及检测电子文件真实性的困难是重要原因。在推进我国电子文件单套制的进程中,电子文件真实性问题值得进一步深入研究。
1 电子文件真实性文献统计
20世纪90年代开始,国内外相继开展电子文件真实性相关研究,如InterPARES项目(International Research on Permanent Authentic Records in Electronic Systems,1999—2012,电子系统中文件真实性永久保障国际合作项目)、1996年国家档案局承担的关于电子文件归档与管理的研究项目等。
以“关键词=电子文件”OR“关键词=电子公文”OR“关键词=电子档案”为检索式在CNKI中国知网和万方数据总库中检索,检索日期为2020年12月28日。将检索结果导入到NoteExpress,进行查重以及人工剔除不相关文献后,共获得文献14 225篇。对文章发表年度进行统计,20世纪80年代开始出现有关电子文件的文献,但在1997年以前年发文量都很少,从1997—2011年发文量迅速增多,2011年以后年发文量震荡下跌。
图1 有关电子文件研究发文量趋势
以“关键词:(电子文件) and关键词:(真实性) or关键词:(电子公文) and关键词:(真实性) or关键词:(电子档案) and 关键词:(真实性)”为检索词在万方数据和中国知网中检索,并将检索结果导入到NoteExpress中进行查重和筛选,共检索出608条中文文献。1998年开始有学者就电子文件真实性问题进行研究讨论,2013年发文量达到顶峰,随后发文量震荡下跌。
图2 有关电子文件真实性研究发文量趋势
利用Citespace对在中国知网中有关电子文件真实性的检索结果进行可视化分析,对关键词进行共现分析,图中节点表示关键词出现的频次,节点越大表示出现频次越多,连线越粗表示关键词之间共同在一篇文章中的频次越高,连线颜色越浅表示同时出现年份越晚。可以发现出现频次最高的关键词是“电子文件”、“真实性”;同时在这些文献中除了“真实性”以外,“原始性”、“可靠性”、“完整性”、“安全性”、“可读性”也在各种文献中频繁提及,表明国内学者围绕电子文件的属性进行了广泛的讨论;随着我国档案信息化进程的推进“电子档案”、“数字档案”、“电子数据”这类关键词出现频次也较多;“元数据”也是一个重要节点,其与“检索”、“多媒体”、“档案价值”、“凭证性”、“电子档案”、“项目管理”等关键词之间的连线可以说明元数据技术在档案信息化、保障电子文件真实性等方面发挥着重要作用;“电子文件”与“真实性”与“区块链”之间的连线,表明相关研究人员已经开始探讨如何利用区块链技术保障电子文件的真实性;“档案机构”、“保障措施”和“电子文件”之间的连线,表明我国档案机构也在积极探索如何保障电子文件的真实性、安全性等。
图3 有关电子文件真实性研究的关键词共现分析
另外,通过阅读相关文献,笔者发现对电子文件的最新的相关研究多集中在电子文件“单套制”、“双套制”的讨论上。“单套制”是大势所趋,但是在由“双套制”向“单套制”发展的过程中,如何有效保证电子文件的真实性是重中之重。我国对电子文件真实性的研究持续已久,取得了一定的成果,但也存在一些尚未找到解决办法的难题,随着时代变化和技术不断革新,对电子文件真实性的研究还需要继续寻求突破。
2 电子文件真实性概念分析
关于电子文件真实性的含义,目前档案界还没有形成一个统一的定义。《电子文件归档与电子档案规范管理》(GB/T 18894—2016)将电子文件的“真实性”定义为“电子文件的内容、逻辑结构和背景与形成时的原始状况相一致的性质”[2]。电子系统中文件真实性永久保障国际合作项目(InterPARES)二期研究成果将“真实性”定义为:“是文件之所以可被信任为文件的品质,即电子文件符合最初的制文目的,且文件未经篡改和损坏”[3]。以上两个定义从不同角度强调了与电子文件要与最初的形式、目的的一致性。
另外,许多学者对电子文件真实性也有各自的理解。张宁认为“电子文件的外在的要素特征的完整性和合规性以及管理活动的连续性和可控性是电子文件真实性的本质”[4]。冯惠玲、刘越男在其编写的《电子文件管理教程》第二版中指出,我国电子文件的真实性包含形成过程的真实和内容的真实,即电子文件在形成后的整个生命周期内的运行都保持不变,文件的内容与形成时的原本含义一致[5]。
电子文件的真实性对于电子文件的发展起着非常重要的作用。《信息与文献文件管理:通则》(GB/T26162.1—2010)将真实性列为文件的首要特点[6]。姜志伟认为关于真实性的定义中就提及了文件的内容、结构和背景三个方面,所以“真实性是对电子文件最为全面的描述”[7]。《电子文件管理教程》第二版指出,确保电子文件的真实性是无纸化业务顺利展开的先决条件,电子文件想要作为社会记忆长久保存也要先保证其真实性[5]。
3 电子文件真实性问题研究
笔者在学习和实践中了解到,大部分档案馆在对电子文件进行归档时也只是对电子文件进行简单的四性检测,并未对馆藏电子文件的真实性进行深入的研究,采取更多的保障措施。而在企事业单位中,对电子文件管理仍然处于摸索阶段,目前的技术手段无法完全保证电子文件的真实性,使得各单位仍旧倾向于使用纸质文件,或者只是对电子文件进行纸质备份。很显然,保障电子文件的真实性依然面临着很多问题,也限制了电子文件单套制的推进。
从电子文件的特点来看,电子文件对计算机软硬件系统的依赖性、信息与载体之间的易分离性、信息的易变性和可操作性等区别于纸质文件的特点,使得保障电子文件的真实性存在较多困难。姜志伟认为电子文件容易修改的特性,是真实性保障问题的症结所在,而且修改后的电子文件很难被人肉眼识别出来[7]。
在管理方面,我国2009年建立了国家电子文件管理部际联席会议制度,但是该制度并未高效发挥其作用。其次,不论是电子文件的前端控制还是全程管理,档案部门都存在职能缺失的问题,工作缺乏主动性。有学者指出,档案部门在新的时代背景下,没有积极主动参与到数字信息资源的采集中去,档案部门的管理功能实际上已被其他政府部门蚕食。我国仍有部分档案馆未认识到电子档案的重要性,并没有按照国家要求形成专门的电子档案业务流程[8]。2016年7月,国家档案局、国家发改委分批组织开展企业电子文件归档和电子档案管理试点工作,2020年3月已有两批企业通过验收,但从目前来看,政府部门大力推行电子政务促进了电子文件的发展,企业层面尤其是中小微企业还未形成大量运用,推进“无纸化办公”仍然任重道远。
在技术方面,目前还没有能完全保证电子文件真实性的具体措施,每个技术都有其局限性,现有的在实际运用的技术方案也还不成熟。袁嘉新、杨安荣等指出了目前电子文件防篡改技术在实际运用过程中存在着一系列问题,如:服务周期有限、容易损坏电子文件信息结构、管理成本较高、文件共享利用不方便等[9]。例如:电子签名存在伪造数字签名的风险,因为数字证书有时效性且用户可以随时选择注销,在数字证书失效后签名私钥及签名时间是可以被修改的。近几年被人熟知的区块链技术仍处于发展阶段,此技术在保障电子文件真实性方面暂时还未被广泛的利用,理论上来说运用区块链技术能有效防止电子文件被轻易修改,但也没有相关研究表明其能保证电子文件绝对不被篡改,而且目前区块链技术运用还缺乏统一的规范和标准,实际运用中存在很大的复杂性[10]。马仁杰、李梦云指出,区块链技术在信息存储和处理方面的运行速度较慢,高昂的技术成本和人力成本也阻碍了档案部门将区块链技术运用到实际工作中去[11]。
在法律法规方面,一系列法律规定以及国家标准的出台早已确立了电子文件的法律地位,但在实际的生产经营活动中,电子文件的有效性仍然备受质疑。如:2005年4月1日起正式施行《中华人民共和国电子签名法》,2019年再次修订,早已确认了可靠的电子签名与手写签名、盖章具有同等的法律效力,但电子签名、电子证照和电子档案的法律效力在全国范围内并未得到全面认可。目前在很多工作中众多要求签字的大小文件依旧要求采用手写签名或盖章的方式。更有甚者,相关电子文件(如销售报表)在传输给上级单位时,要求“将电子文件打印成纸质版,相关负责人手写签名或加盖公章再扫描成PDF文档邮件传送给有关部门”。可见,电子签名、电子印章并没有被广泛使用。
4 电子文件真实性保障对策
4.1 管理手段
2012 年国家档案局印发的《电子档案移交与接收办法》也明确规定:“应当对接收的电子档案数据进行准确性、完整性、可用性和安全性检验,合格后方可接收”。前文提到的InterPARES第二期项目成果提出了针对电子文件的事前控制、跟踪记录和事后审査等过程性措施[3]。他们都特别强调了针对电子文件的不同阶段采取相应的措施,如归档移交时要进行真实性检测,但都并未指明具体的检测办法,在相关主体对电子文件进行管理时只能作为参考,具体实施办法还要依具体情况而定。
我国档案界对于电子文件真实性保障的研究与实践思路,主要基于电子文件的全生命周期和体系化保障的思想这两个方面,从电子文件的产生到销毁整个生命周期中都要注重其真实性,同时要系统地对电子文件真实性问题进行管理。但也有学者认为不需要在电子文件的全生命周期都保障真实性,只需重点关注电子文件归档这个环节即可。
4.2 技术手段
张俊贤,汪丽,柳晶等认为利用可靠且有效的技术手段确认与保障电子文件的真实性,是电子文件管理工作的核心,也是确保电子文件法律效力的关键[12]。赵屹总结了电子文件防篡改技术(文件固化技术、哈希值校验技术、数字签名技术、可信时间戳技术、区块链技术)对档案管理的影响,并认为电子文件管理应尽快全面应用新技术,实现对电子文件全流程的监督[13]。
《电子文件归档与管理规范》中,为保障电子文件的真实性,提出了4条安全防护技术措施,全面涉及了电子文件的操作者、操作行为、电子文件本身以及电子印章、数字签署等加密技术。白云认为档案管理部门、信息用户可以与专业的第三方机构合作,建立信任机制,借助第三方机构的专业技术支持,由第三方机构进行电子文件的真实性检测和担保,以此来保证电子文件的真实性[14]。石进、薛四新、赵小柯提出了完整的基于区块链技术的电子文件真实性保障系统的总体架构,包括业务部门系统嵌入与功能部署、接入层、区块链网络、管理平台、认证中心5个部分,系统的详细设计包括系统网络架构、共识机制、区块结构和真实性验证流程[15]。
电子文件真实性保障的技术手段有电子签名法、加密、备份、身份认证、防火墙、元数据采集等等,目前实际运用较多的主要有:可信时间戳、PKI(Public Key Infrastructure,公钥基础设施)技术、元数据技术等,另外区块链技术也开始在电子文件真实性保障方面发挥作用。国内目前主要是通过采用软签名证书、加密设备来保证电子文件的真实性[16]。
PKI技术是指根据公钥理论和技术,建立一套提供安全服务的密钥管理平台,为网络通信和网络应用提供信息加密和数字签名,其核心是解决信息网络空间中的信任问题[17]。PKI 系统提供的核心服务有对用户进行身份认证、对数据进行保密操作、保证数据的完整性以及交易的不可抵赖性,能够为电子政务以及电子商务等提供安全基础平台的技术规范[17]。
电子签名是指数据信息中以电子形式存在的、用于识别签名人身份并表明签名人认可其签署的文件内容的数据[18-19]。电子印章是指基于可信密码技术而生成的身份标识,是以电子数据图形表现的印章。电子印章也是对电子签名技术的一种应用,只是把电子签名变成人们习惯的签名加盖章的方式。
区块链是一系列传统计算机技术如分布式数据存储、点对点传输、共识机制、加密算法等的新型应用模式[20-22],因为其所具有的链式数据结构、自动化智能合约、分布式存储、非对称加密等技术优势[23],成为了解决数据信任问题的有效工具,能够有效保障电子文件的真实性。如:分布式存储方式加大了电子文件篡改的成本与工作量,同时单向密码技术的转化机制使被篡改的电子文件更易被发现[24]。目前国内已经有部分企事业单位将区块链技术运用到实际工作中,如:中国石油化工集团在企业电子文件归档和电子档案管理试点工作中运用区块链技术实现了几个分公司之间数据的实时共享,沈阳市建设了基于区块链的民生档案跨馆出证平台,上海证券交易所的电子文件全生命周期真实性保障平台也是基于区块链技术建立的[9]。同时还有学者提出,档案部门还可以将区块链技术运用到检测鉴定电子文件的真实性中去,通过人工检测和系统检测并行的方式保证存档的电子文件的真实性[15]。
5 总结
国内对电子文件真实性的研究已开展多年也取得了相当多的成果,但是在实际工作中效果并不理想。在“大智云物移”的时代背景下,电子文件的真实性研究迎来了新的发展机遇,又面临着巨大的挑战。不断更新的各种信息技术为电子文件的真实性保障和检测提供了更强大的技术手段,信息高速发展的时代也使各类电子文件呈现“爆炸式”增长,如何快速甄别有用信息然后有效保存成为重要的问题。档案部门及每个档案工作者在专注当前工作的同时,要时刻关注有关领域技术的发展,不断地学习新技术、新方法,制定完善合理的管理制度,进一步推动档案工作向前发展。