基于区块链的档案信息共享平台设计
2022-07-11闵婕肖秋会
闵婕 肖秋会
摘要:该文分析了我国档案信息资源共享面临的主要困境及区块链技术用于档案信息共享的优势,提出了基于“双链”模式的档案信息共享平台,从信息共享主体及职责权限、“公有链+联盟链”双链模式、共享内容与层次、共享档案信息利用方式四个方面加以阐述,为区块链技术运用于区域性档案信息共享提供参考。
关键词:档案信息共享 区块链技术 双链结构
为了加强区域档案机构之间的沟通与合作,提高档案工作的效率和质量,更好地满足人们对档案使用的需求,档案信息资源的共享至关重要。《“十四五”全国档案事业发展规划》明确指出:“各省(自治区、直辖市)综合档案馆加强本区域档案信息资源共享平台建设,实现本区域各级综合档案馆互联互通,推动共享平台向机关等单位延伸,促进档案信息资源馆际、馆室共建互通,推进档案信息资源跨层级跨部门共享利用。”[1]区块链技术因其去中心化、安全加密、资源共享等特性,不仅为可信电子文件管理及归档保存提供了有利条件,而且为档案信息资源共享提供了技术可行性。本文分析了我国档案信息资源共享面临的主要困境,探讨了区块链技术用于档案信息资源共享的可行方案。
一、现阶段我国档案信息共享面临的主要困境
(一)共享数字档案资源规模较小,范围有限
我国的共享数字档案资源主要为政务档案资源,而且大多为档案目录级别的内部共享。例如,南京市现有的民生档案资源仅在几个部门之间达到了部分互联共享。民生档案和开放档案信息共享平台就是典型的系统内部的共享,参与单位只有市综合档案馆和各区综合档案馆。[2]此外,因我国现阶段开放档案资源数量有限,技术条件和法律制度环境不够完善,区域性的综合档案馆数字档案资源共享尚处于初步探索阶段。
(二)统筹协调不力,跨部门共享困难
虽然我国已经建立了以政府部门信息中心、公共图书馆、综合档案馆等为主体的政府信息资源利用体系,但由于资源的统筹协调不一致,档案信息资源的组织和整合,仍存在“各司其职”和“部门私有”的现象。面对公众需求,政府信息资源仍存在交叉、重叠、缺少关联、缺乏规范处理等问题,[3]安小米等人于2016年得出的调研结果表明,80个信息惠民建设试点城市中没有一个城市的民生档案信息体系被纳入信息惠民工程,使民生档案信息体系的建设工作脱离信息惠民建设工程而成为“信息孤岛”,这种“孤岛性”同时限制了民生档案建设与信息惠民建设工程的推进。[4]不同政府部门之间档案资源共享受到了行政管理体制、利益保护、权限归属、技术标准不统一等诸多因素的影响而不能全面落实。档案管理软硬件平台异构、数据格式和接口技术不统一等导致各部门档案信息共享无法深入开展,而且不同平台之间档案信息资源共享存在信息安全风险。
(一)去中心化存储,拓展共享档案资源类型和范围
引入区块链技术,将传统的集中式存储方案转变为多中心分布式存储,解决了技术层面和业务层面难以协调的问题。同时我们也可以通过有条件地增加文件资源共享的主体,不断扩大文件资源共享的类型和范围。[5]加入区块链的档案馆(室)构成了档案信息资源共享的各个节点,各个节点之间实现互联和互通,权利和义务对等。随着上链节点的增加,共享档案资源的类型和数量会随之拓展。
(二)采用联盟链加强协调,统一标准
区块链依据访问及管理权限可分为公有链、私有链、联盟链。其中,联盟区块链的部分去中心化特点与档案信息资源共享的契合度最高。[6]每一个联盟成员负责一个节点,主要负责管理和上传具有馆藏特色的档案信息,利用智能合约和非对称加密技术实现联盟内的档案信息共享。区块链技术可以规范不同组织的元数据描述系统,实现数据共享,使异构的档案管理系统标准统一化,保证档案馆与其他相关机构的相互可操作性。
(三)非对称加密,减少信息安全风险
传统的中心化系统容易受到外力的攻击,安全性较差。并且,信息共享系统的不确定性风险导致高度集中的系统信息安全能力较低。区块链采用非对称加密技术,通过算法保证身份和数据的一致性,从而形成信任,为档案等机构提供相对稳定可靠的运营平台。当公众需要利用社会基本信息时,他们可以直接通过基于区块链技术的档案信息共享平台,从区块链库中获取认证,省去相关权威机构提供信息佐证这一步骤。[7]
笔者设计了基于区块链技术的双链结构档案信息共享平台。该平台采用“联盟链+公有链”两个区块链结构,联盟链用于各主体之间进行档案信息共享与管理,公有链用于公众对共享档案信息中可以公开的档案信息进行访问与利用,如图1所示。
(一)档案信息共享主体及职责权限
在基于双链结构的档案信息共享平台中,可以由n(n≥3)个档案馆组成联盟,为便于理解,现选取A、B、C、D四个省级档案馆作为联盟成员进行说明。如图1所示,四个档案馆各掌握一个授权节点,它们之间实现点对点的信息交互,通过共识机制和智能合约机制共同维护联盟区块链的运行。不仅如此,各省级档案馆还可以根据需求,纵向深入基层,依次向市级档案馆、区级档案馆和机关档案馆传达指令,进行系统的信息资源整合,为共享平台提供有力的信息支撑。档案信息共享平台中的联盟档案馆依据相关法律法规制定共享标准,将共享档案信息的分类方式、鉴定标准、归档格式等进行统一规范以后再整理上链。
(二)“公有链+联盟链”双链模式
双链结构的档案信息共享平台将档案管理与档案利用的功能有机串联起来。通过档案联盟链,可以在每个授权节点上共享和管理文件资源,并对存储在数据库中的文件元数据进行管理,包括进行电子文档元数据的创建、修改、删除、压缩、审查和其他操作。档案公有链可对公众提供利用服务,通过检索档案元数据信息对云存储的电子文件进行查阅、下载和验证等操作。
在联盟链中,A、B、C、D四个档案馆作为联盟成员节点参与,每个节点通过共识机制生成相应的区块。机构之间可以通过联盟链相互联合,形成区块链网络。各节点共同制定统一的管理规则后,将可共享的文件信息上传到链上。每个节点存储一个完整的数据库,所有业务数据都是开放、透明、完全一致的,后期不需要再进行数据集成,且每个节点的操作都可以从其他节点看到,节点与节点之间可以相互验证身份,以保证没有具备主观恶意的节点,共同维护系统的稳定性和可靠性。
在公有链中,A、B、C、D四个档案馆作为主要节点负责审核并上传开放档案至链上,并对需要公众递交申请的部分档案设置密钥以及对递交的申请进行审核。公众作为次要节点,允许其对链上有访问权限的档案信息进行检索、查阅、下载操作,对于有条件访问的档案则需填写申请,待审核后方可使用。
(三)档案信息共享内容与层次
运用区块链的分布式账本技术,在各个共享主体即各个省级档案馆之间建立一个多节点的分布式数据信息系统。在此系统中,每一个主体节点形成连续且完整的账目信息,包括以下几类:(1)各共享主体写入数据系统的档案信息;(2)对已写入系统的档案信息进行的增加、删减、更改等操作信息;(3)更新后的档案信息等。其中,各共享主体写入数据系统的档案信息根据系统的预设条件进行自动确认,出于对区块链在使用成本及功能实现方便上的考虑,并不是所有档案数据都需上链。[8]考虑到对档案信息共享过程有防篡改的需求,我们可以采取将电子档案哈希值和关键元数据提交区块链的存储方式。另外,节点对系统中记录的档案信息进行的添加、删除、修改等操作信息受区块链监控,并被打上时间戳。智能合约可以根据时间戳的实时监控判断档案信息是否完整,形成可追溯的不可逆记录,并永久保存,为日后的问责提供全面的保障。一旦档案信息在区块链上被确认,任何试图篡改、删除档案信息的恶意行为都会被察觉并自动拒绝,并且记录实施该恶意操作的用户信息,拥有三次及三次以上恶意操作记录的用户将会进入用户黑名单,被限制访问档案信息共享平台。对于已通过更新确认的档案信息,则会保留其更新的所有操作,并将更新后的档案信息元数据上链。
根据提交给区块链处理并存储的电子档案数据范围的不同,可以将基于区块链的档案信息共享分为三个层次:(1)仅哈希值上链共享;(2)哈希值和关键元数据上链共享;(3)哈希值加全部元數据上链共享。其中,哈希值上链共享的成本较低,同时还可以保障档案信息真实可靠,适于电子档案产生数量多的机构;哈希值和关键元数据上链共享成本中等,全文及上链的元数据真实性有保障,适于电子档案数量中等机构,或用于存储有需求的电子档案;哈希值加全部元数据上链共享是指电子档案全文及全部元数据上链,虽然全文及元数据真实性均得到较好保障,但是管理成本高,适用于电子档案数量少的企业,或用于存储特别重要的档案。[9]综合考虑,本文认为第二个共享层次更具适用性,将档案的哈希值与关键元数据上链共享,在保证档案信息安全的同时,还可以满足档案信息共享过程中防篡改的需求。
(四)共享档案信息利用方式
联盟链传到公有链的档案信息需要进行密级鉴定。使用智能合约技术,可以对档案信息进行归类、整理。[10]根据智能合约上标注的主要参数如档案类型、密级等内容和电子签名进行查验,整理归档并进行编码。根据档案信息的密级,我们将可公开档案信息内容上传到公有链上,利用者可直接检索访问。
对于需要开放审核、控制利用的档案信息,只将其目录记录、索引、注解等描述性元数据信息与利用申请书上传到公有链上。对于有利用需求的档案信息,其所属的主体单位拥有一对密匙。公钥验证身份并对其加密,私钥验证身份并对信息解密。当用户提交的利用申请通过时,文件发送方使用公钥对文件信息进行加密,并根据文件信息生成密文。信息以密文的形式在网络上传输,由于私钥不会暴露在网络上,大大降低了信息泄露的风险;接收方在接收到信息后,必须用私钥对信息进行解密,才能访问和利用加密的文件信息。用户需要链上递交申请,等待其所申请利用档案的负责主体进行审批,利用申请若未通过将无法访问,用户可以提出质疑,负责主体应予以解释;如果利用申请通过,用户将会收到私钥,对档案进行解密后方可进行访问与利用。并且每个用户查阅档案后,都将在区块链上添加一个区块,记录相关的使用信息,既可用于档案使用率的调研又可追踪溯源以备问责。
区块链技术的去中心化、链式数据结构、不可变革和撤销等特性,为数字信任机制的搭建以及档案信息共享提供了有力的技术支撑。然而,区块链的非对称加密算法并非绝对安全,该技术还处于发展阶段,存在信息存储和信息处理速度较慢等技术瓶颈,因此,区块链在档案信息共享中的成功运用有待进一步实验和论证。展望未来,随着区块链技术趋于成熟,其可以在不同的区块链联盟之间进行跨链交流,构建由图情档等多个领域区块链联盟构成的共享体系,使信息和数据的共享体量不断提升,发挥更大的社会价值。
注释及参考文献:
[1]本刊讯.中办国办印发《“十四五”全国档案事业发展规划》[J].中国档案,2021(6):18-23.
[2]孙如凤.区域民生档案资源共享机制研究[D].南京:南京大学,2017.
[3]蔡盈芳,樊凡,虞香群.基于公民生命历程的政务档案信息整合利用模型设计[J].档案学通讯,2020(1):80-86.
[4]安小米,加小双,宋懿.信息惠民视角下的地方民生档案资源整合与服务现状调查[J].档案学通讯,2016(1):48-54.
[5]刘洪,罗茜.关于新技术热潮下在档案领域应用区块链技术的冷思考[J].北京档案,2020(9):15-18.
[6]马仁杰,沙洲.基于联盟区块链的档案信息资源共享模式研究——以长三角地区为例[J].档案学研究,2019(1):61-68.
[7]聂云霞,何金梅,肖坤.基于区块链的政务档案信息共享策略[J].浙江档案,2019(6):31-33.
[8]蔡盈芳.电子档案管理应用区块链存储方式探析[J].档案学研究,2020(4):104-109.
[9]尹洁.电子档案元数据标准化管理方案探讨[J].中国标准化,2021(7):105-108;113.
[10]李鑫,刘沛琦.区块链技术在法律信息融合中应用的前景与路径[J].经济与社会发展,2019,17(6):54-63.
作者单位:武汉大学信息管理学院档案与政务信息学系