区块链技术应用于档案数据管理的调查及优化研究★
2023-12-12尹鑫
尹 鑫
(中国人民大学信息资源管理学院 北京 100872)
0 引言
随着新兴信息环境进入大数据时代,以区块链技术为代表的信息技术成为新型生产范式,在档案界掀起了新的技术革命,不仅对现有档案业务和产业秩序发起挑战,逐渐更新了传统档案行业的业务规则和流程,也在一定程度上改变了用户对档案行业的认知和行为模式,并引致了档案业务和制度层面的变革。2018年12月15日,京东集团报告,已在文档管理系统全面布局区块链技术[1]。2019年1月10日,国家互联网信息办公室发布《区块链信息服务管理规定》[2],从区块链的信息安全风险角度规定了信息服务提供者的信息安全管理责任,标志着在大数据时代,区块链应用及其数据安全问题已经引起国家高度关注。
区块链是一种去中心化、无需信任、防篡改性强的分布式记账本技术,综合利用了密码学、概率论、共识机制和分布式网络等多种计算机技术,是互联网发展史上的一次伟大创新。区块链由许多个区块构成,每个区块由区块头和区块体构成,许多区块链接在一起形成区块链。档案数据就存储在区块体中,许多个档案区块链接在一起,形成档案区块链。区块链技术的特点是公开透明性、不可变性、非中介性、数据冗余性,被Alexander Savelyev(2018)誉为“新经济中最有前途的技术之一”,很好地体现了大数据时代跨界融合场景下的主导力量去中心化和服务对象去专业化的特征,区块链技术继大数据技术、物联网技术的兴起而逐渐进入公众视野,因其普适性、可信性而成为时下前沿学术概念。区块链基础架构模型由数据层、网络层、激励层、合约层以及应用层构成,研究区块链技术在档案数据管理中的应用,可以为大数据环境下的档案数据管理搭建底层技术框架和逐步实现系统架构。在传统档案管理情境下,档案具有唯一属性,即实体的唯一性、所含信息的唯一性、档案形成过程的唯一性和档案积累方式的唯一性。档案信息收集场所统一,档案信息处理加工程序统一,流转的信息内容真实独一等唯一性特征奠基了档案规范保密可信的基础。在数据态环境下,档案信息量呈现海量化特征,传统的管理方式已经不能有效解决档案信息管理中信息收集、档案利用等环节存在的制约矛盾。在数字档案管理的八大业务环节,受限于中心化的数据库技术,且档案依据内容区分为涉密级、重要非涉密级、无必要对外公布级、依申请公开级四个保密级别,因此,电子档案文件的安全性和真实性问题一直没有得到较好解决,仍然有档案伪造、窃取和篡改等恶性事件不断发生。目前,数字档案管理模式是“中心化数据库+分布式终端”为主,而区块链是分布式存储方式,“集中式+分布式”是区块链技术应用于档案管理的发展前景之一。在符合档案数据管理需求、保密性、内向性、封闭性基础上,逐步引进、吸收、借鉴、试点区块链技术,并建立和完善制度和技术层面的配套措施,是档案学界和实务界必须认真思考的时代课题。
1 相关研究回顾与述评
根据对国内外相关研究的回顾,发现国外的研究较之国内数量更多、与区块链涵摄的各核心概念结合更为密切,在技术设计上更为前沿、精细、具体,研究涉及的计算机科学专业概念更多更领先,且多发表于计算机科学类国际权威学术期刊和会议论文集上,体现了档案数据安全和区块链、大数据、物联网的融合式研究。
国外文献对于区块链技术对档案数据安全管理的作用主要围绕区块链与物联网[3]、区块链与RFID系统、区块链与用户隐私保护[4]、区块链与基因数据保护[5]、区块链与hadoop[6]、区块链与高精度数据归档[8]、区块链与大数据流安全机制[9]等方面展开。譬如,Lemieux V L(2016)认为区块链技术在采用适当的安全体系结构和基础设施管理控制的前提下可用于解决归档信息完整性问题。García-Barriocanal E,Sánchez-Alonso S,Sicilia M A(2017)认为,区块链已经成为一种部署分散数据库的方法,这种数据库不受篡改,开启了数字档案系统开发与运营的新方式。
国内文献对于区块链技术对档案数据安全管理的作用主要围绕区块链应用于档案数据安全的基本模式、区块链保障档案数据全生命周期安全管理模式、区块链保障档案数据全程可追溯管理模式、区块链保障电子档案安全模式、区块链的联盟链和私有链模式在单套制管理中应用等方面展开。譬如,刘越男、吴云鹏(2018)[9]以英国ARCHANGEL项目和InterPARES Trust欧洲团队信任链模型项目作为案例,通过分析区块链在数字档案长期保存方面的长处、不足和风险,得出区块链在数字档案保存中成功应用需要解决寻找到保证哈希值持续有效的方法等7大关键问题,未来需要在推动区块链档案应用的标准化、完善生态系统等方面继续发展。孙大东、杨晗(2018)[10]从区块链的公共链、联盟链和私有链三种安全应用模式出发探讨了区块链技术在档案信息安全、实体安全、载体安全管理中的作用;应用区块链时间戳技术可全面有效记录电子档案形成、流转、改动、保存、移交的生命周期管理过程和连续、完整、可证的档案保管链;应用区块链时间戳技术可使电子档案数据实现安全信任背书和来源可追溯;非对称加密技术可通过椭圆曲线加密、RSA、Elgamal等算法产生的一对非对称公开密钥和私有密钥满足电子档案身份验证和数据安全需求;区块链的联盟链和私有链的完全和部分去中心化功能适用于各种类型的不开放电子档案,譬如健康、人事、学籍档案的管理。王发明、朱美娟(2017)[11]从文献计量学角度,研究我国区块链研究的时间空间分布特征、热点主题、最新前沿。
国内外现有研究成果初步从区块链技术对档案数据安全管理可实现的全生命周期和全程可追溯管理、身份验证管理、不开放管理、单套制管理方面取得了一定进展,但是较为缺乏基于档案实践部门具体认知和应用情况的实证研究,故本文尝试推进这一研究领域。
2 研究设计
2.1 研究方法、对象与意义
本调研采用实地访谈方式,听取国内档案事业发展较为领先的不同类型实务部门负责人对于档案数据安全的已有业务布局和区块链技术应用于档案数据态管理的意见,可以有效克服仅使用单一问卷方式产生的随意性及样本缺乏代表性问题,提高调研的针对性与代表性。选择的调研对象有三类,一是党政机关,譬如青岛市公共档案局(馆)、深圳市公共档案局(馆);二是事业单位,譬如深圳市文档服务中心;三是大型档案服务企业,譬如深圳市万维博通有限公司。这些意见,有助于标准和规则制定部门深入了解实务部门的需求,有助于改进实务部门对于技术标准和规则制定的参与,使技术标准和规则在前期设计和全面形成过程中能更好听取、考虑、吸纳实务部门的意见,从而更具针对性、价值性和可接受性,提高技术标准和规则质量与效率,筑牢技术标准和规则制定的社会基础。
2.2 调研途径与数据来源
笔者分别对青岛市公共档案局(馆)信息技术处负责人进行实地访谈和跟踪访谈,对深圳市公共档案局(馆)监督指导处负责人以及信息技术处业务骨干、深圳市文档服务中心工作组进行实地访谈和跟踪访谈,对深圳市万维博通有限公司工程档案项目负责人进行实地访谈和跟踪访谈,对深圳市罗湖区公共档案局(馆)负责人进行实地访谈和跟踪访谈。访谈的主要方式为半结构式访谈。访谈主要围绕区块链技术认知、区块链技术应用、区块链技术与档案数据安全管理工作布局等三个方面展开,访谈提出的主要问题编码如表1,访谈所获数据来源于档案局(馆)和企业的工作实践,并根据跟踪访谈数据进行更新完善,数据全部可靠可信,具有准确性、科学性和信度效度。
3 实地访谈结果及分析
3.1 区块链技术认知
一是已经在档案数据管理工作中密切关注区块链技术。青岛市档案局(馆)认为区块链技术在档案数据管理中的作用主要为来源可靠、管理可信、长期可用,档案数据管理的全流程以及授权管理均无法篡改。深圳市公共档案局(馆)表示已密切关注区块链技术,认为在档案数据管理工作中可以尝试应用区块链技术。深圳市万维博通优先公司表示已在文档数字签名、文档数字加密技术中考虑尝试应用区块链技术。二是对区块链技术在档案数据中的应用持保守态度。青岛市档案局(馆)认为由于区块链技术属于新兴先进技术,档案馆不应用最先进的技术,而应用最成熟的技术,对于区块链技术是否可以应用于实现档案数据全程可追溯管理,要看是否会降低档案工作效率。深圳市档案局(馆)认为区块链技术应用,应考虑应用中档案数据安全保障的高、低、彻底性问题。深圳市罗湖区档案局(馆)是表示对区块链技术认知不多且目前文档管理系统尚未用到区块链技术。深圳市文档服务中心表示对区块链技术应用于档案数据管理存疑,因为区块链的分布式管理与档案的封闭式管理相反,与图书馆的开放式管理相近。深圳市文档服务中心表示就档案实务来看,区块链技术对大型企业较之公共档案馆更为适用,因为大型企业的档案信息量更大。深圳市万维博通有限公司表示对区块链技术认知不多,目前公司文档管理系统尚未用到区块链技术。
3.2 区块链技术应用
一是表示已试点应用区块链技术。青岛市档案局(馆)表示计划在青岛、黄岛、红岛馆先试点区块链技术,推进三城联动和组团发展。二是表示需等待国家政策法规的指导。深圳市公共档案局(馆)表示不会率先应用区块链技术,要看制度上和技术上,国家档案局(馆)是否认可该技术。提出从实务部门的角度看,区块链技术的可信功能不一定能够成功保障档案数据安全,即记录文件的每一步不可否认,不可更改,具体的实施要符合《数据安全法》的标准和要求。深圳市文档服务中心表示要等国家层面先行开展区块链技术应用后,文档中心才会跟随应用区块链技术。如果国家档案局提出推广区块链技术在档案数据管理系统的应用,深圳市文档服务中心愿意立即跟随应用。三是对档案数据管理中应用区块链技术的建议。深圳市文档服务中心提出可应用区块链技术架构档案进馆之前超过50个节点的集中共享平台。青岛市档案局(馆)建议健全区块链立法和因地制宜应用区块链技术,建议通过法律保障区块链技术在档案数据的全生命周期管理中的应用,建议在《档案法》中增加对档案数据采集、鉴定、整理、保管、检索、编研、统计、传播、利用过程中的泄密风险的规制内容,并提示技术应用应符合时当时当地的档案工作发展情况。
3.3 区块链技术与档案数据安全
一是表示档案部门可以为保障区块链技术应用布局良好的数据安全环境。青岛市档案局(馆)表示已开展信息划控工作,并已采用RFID技术,可以将全文、目录、照片、音像数据库按照用户需求进行一站管理,确保档案的真实完整性。青岛馆对开放的档案信息按照涉密级、重要非涉密级、无必要对外公布级、依申请公开级四个级别实行控制。对于涉密档案信息安排专人接触和保管。青岛馆按照其布局的档案数据安全管理方式,已成功实现对青岛珍贵历史记忆的保存。深圳市公共档案局(馆)建立了“三块制”档案数据安全保障机制,同时,通过采用物联网技术和RFID技术实现对特藏室档案信息资源的定位和移动报警功能,解决文书档案数据进出库的数据漏读问题。二是提示档案数据管理中应用区块链技术需要充分考虑相应的数据安全问题。青岛市档案局(馆)表示,由于档案管理已从传统的纸质管理拓展演化至网站管理、数据库管理、手机终端管理、微信等移动APP模式管理,档案管理的依托、核心、更新、维护模式均发生变化,对档案数据安全提出了更高要求。为确保档案利用整体流程运行顺畅,保障用户的隐私和安全,档案的“四性监测”工作必不可少。三是对档案数据安全工作的建议。深圳市公共档案局(馆)建议综合档案馆的档案数据安全工作重点应考虑提供利用中的国家秘密保护、隐私保护、著作权保护问题。如保护国家领导人涉密照片档案数据、保护具有珍贵历史文化价值的民俗档案数据、保护具有隐私声明和保密约定的个体档案数据等。同时,较之综合档案馆,企业档案数据安全工作更应充分考虑档案数据的知识产权保护问题。
4 调研结论及优化建议
4.1 区块链技术应用于档案数据管理的优势分析
区块链技术应用于档案数据管理的理论优势在于,一是区块链技术可以实现档案数据的全生命周期管理和全程可追溯管理;二是区块链技术的可信机制可以有效避免档案数据的篡改、窃取和泄密风险;三是区块链的联盟链和私有链模式可以推进封闭期电子档案数据管理。未来结合国家大力发展区块链技术的重大需求,可集中开展区块链技术的应用研究,提出区块链技术保障档案数据安全的初步路线和底层架构,推进电子档案数据单套制安全管理,具体研究方向主要有区块链技术对于档案数据全生命周期管理的作用研究,区块链技术对于档案数据全程可追溯管理的作用研究,区块链技术、人工智能技术、物联网技术在档案数据管理中应用的比较研究,区块链技术、人工智能技术、物联网技术在建设档案数据管理系统中应用的数学证明机制研究、互联网+时代移动APP对传统档案社交媒体的创新与冲击研究等。
4.2 区块链技术应用于档案数据管理的困境分析
区块链技术应用于档案数据管理的理论困境在于,区块链的分布式原理与档案的封闭式管理原理相反,与图书馆系统的开放式管理相近。区块链技术应用于档案数据管理的现实困境在于,一是实务部门对区块链技术了解甚少,未深入思考和运营数据态环境下档案数据安全管理,对档案数据安全管理仍相当程度上停留在传统纸质档案布局层面;二是对在档案数据管理系统应用区块链技术存疑,甚至对区块链技术在档案数据安全管理中的应用持观望态度;三是需要考虑区块链技术应用于档案数据管理的成本问题,以区块链技术应用于档案安全管理为例,采用类似于比特币的工作量证明机制,由于共识机制需要大量用户一起参与验证,极为耗费网络中各个节点的计算资源和经济资源,故应该考虑计算成本和经济成本问题;四是需要考虑档案的相对封闭期过后区块链技术过时问题,譬如,现行《档案法》第二十七条规定,县级以上各级档案馆的档案,应当自形成之日起满二十五年向社会开放。二十五年期间以共识算法为代表的区块链技术不断更新,软硬件环境不断变化,届时区块链技术是否还能适用于此类档案数据的管理需要慎重探讨。
4.3 区块链技术应用于档案数据管理的优化建议
宏观层面,一是可以进一步完善档案数据管理应用区块链技术的政策法规、技术标准,开展信息环境较优越地区的技术试点应用,借助示范效应推进全国技术应用工作的开展;二是可以研发降低区块链技术应用成本的补强技术。如在制度层面,可以完善区块链技术应用于档案数据管理的制度,构建制度与技术的双轨制保障,加强事前规制和事中把控,从而实现档案数据安全管理的高屋建瓴和无缝对接,其中,制度层面,可以根据国家网信办已发布的《区块链信息服务管理规定》,制定如何应用区块链技术记录、制作、存储、复制、传播、发布档案数据信息的配套制度,以及禁止或限制应用区块链技术记录、制作、存储、复制、传播、发布档案数据信息的范畴,或者在时机成熟时将相关规范的位阶提升为行政法规或法律;又如在技术层面,可在区块链技术应用于档案数据管理的可信任机制、防篡改机制、分布式存储机制的优化分析方面继续优化。微观层面,可以提升地方档案实务部门对区块链技术的认知和认可程度,促进档案部门适应和融入数字社会,推进区块链技术服务于档案数据的异地存储与异地备份,推进区块链技术服务于文档生命周期上链管理,进而服务数字中国建设总体进程。
一是区块链技术在档案数据可信任机制中应用的优化。譬如,早期信息系统安全技术中的防火墙技术,通过防止受信任服务器或客户机与不受信任的主机间建立直接联系,在内外网之间形成安全隔离屏障,同样,区块链技术可模拟防火墙技术可信任机制的核心功能,并加以拓展延伸,构建区块链可信任机制。再如,区块链技术可以提供档案数据管理环境条件下档案数据科学归档的技术基础,即任何发生在同一个区块链系统上的交易都会被既定的算法记录到该区块链上,具体来说,按照时间顺序保存、查阅、记录档案的技术基础在于区块链“账本”的各个区块包含交易记录,后区块均会记录前一区块的标识,形成链条状结构,当每笔区块链交易发起的时候,只需把相关的交易信息传播到区块网络中,“矿工”便会把该笔交易信息详情记载到新的“区块”并连到区块链上,该项交易至此就完成了。同时,可以设置私有链管理涉密级档案数据,设置联盟链管理重要非涉密级档案数据和无必要对外公布密级档案数据,设置公开链管理依申请公开密级档案数据。可信机制优化场景的实现,可在机构规范文档建构领域实现。具体而言,可在以机构为单元的信息检索、知识导航、科研评价等工作中构建区块链规范文档系统,应用区块链的可信机制实现对机构知识资源的规范控制。
二是区块链技术在档案数据防篡改机制中应用的优化。首先,区块链技术可以提供自动实现档案监管的技术基础,即可以实现具有极高安全性的“去中心化”的集约管理,有效减少甚至规避由档案行政管理人员人工监管的局限性,减少因人为失误、职务犯罪、疲惫等弊端,应用区块链技术的去中心化、自动监管功能介入档案数据系统建设过程,行使类似公共档案馆的监督指导功能。其次,可由国家档案局制定统一的规则,运用区块链技术提供“工作量证明”的机制,让系统中的每个节点均参与存档的审批,同时设置内部检查和平衡程序,确保系统中的每个节点被真实记录下来,所有的这些审查和监督完全由算法自动完成。现在出现的其他共识模型也都保留了任何客户端或者节点都可实现点对点管理系统的这一核心理念。防篡改机制的优化,可关注区块链电子存证领域。在互联网法院试点应用区块链存证中的防篡改技术保障电子证据的真实完整性。具体而言,可将区块链技术的防篡改机制应用到档案数据的全生命周期管理和全程可追溯管理中,结合刑事技术侦查手段,对证据档案的来源和生命周期各阶段的发展进行技术鉴定和印证推理,从而完善证据档案的鉴定工作。
三是区块链技术在档案数据分布式存储机制中应用的优化。首先,可以从新档案创建、网络广播新档案、共识机制、网络广播验证结果、记录区块链五个环节应用区块链生成档案。具体来说,在新档案创建环节,档案所有者用自己的私钥对新档案进行数字签名,然后将签名附加在新档案后;在网络广播新档案环节,档案所有者将签名后的档案广播到全网,每个节点将收到信息纳入新区块中;在共识机制环节,在区块的每个节点通过相当于解一道数学题的工作量证明机制,从而获得创建新区块的权力,并争取得到数字货币的奖励;在网络广播验证结果环节,当一个节点找到解时,就向全网广播盖有时间戳的区块,并由全网其他节点核对;在记录区块链环节,全网核对正确,就将该合法区块加入区块链。
其次,可以应用区块链的联盟链和私有链模式推进各相对封闭期内的档案数据安全管理。档案数据开放利用服务是数据态环境下档案数据管理的工具载体,必须回应和处理好档案数据的开放获取与与档案的内向性特征问题。价值扩展律认为文件价值形态通过机关、单位向档案馆移交档案实现由第一价值向第二价值过渡,我国这一过渡一般需经历10至20年时间,而且档案进馆后还要再过若干年,待其形成满25年后,方能向社会开放,而在数据态环境下,如何解决大数据开放环境和档案文件封闭期的矛盾,是档案数据开放利用服务必须思考的问题。鉴于档案数据管理具有传统档案管理固有的内向性与封闭性特点,应利用区块链技术的联盟链和私有链模式管理处于封闭期内的电子档案数据,以实现真正意义上的档案价值扩展。