区块链技术对现有档案管理软件的建设意义
2021-11-23黑龙江大学信息管理学院张笑玮
文/黑龙江大学信息管理学院 张笑玮
本文以南京大学档案管理系统为例,通过实践应用建立起档案管理软件的科学评价体系。同时准确把握大数据环境下信息资源的主要特征,对现有的档案管理软件运行环境和技术手段提出相应的革新建议。
一、大数据环境下的信息资源特征
(一)数据产生的海量化与价值的低密度性。在大数据背景下,信息的产生数量已经由TB级别跃升到了PB级别;同时数据类型繁多,随着电脑与个人智能终端应用的不断开发,网络日志、视频、图片、微博等多种类型的数据应运而生。由此而带来的是信息价值的密度降低,比如说产生的监控系统的视频,在整整一天的监控时段中,可能有用的数据仅仅只有十几秒钟。这些数据体量的特点要求信息管理软件必须具有高度的处理速度,“1秒定律”生动地描述了这一理念:一般要在秒级时间范围内给出信息分析处理结果,时间太长,数据价值就会降低或者丢失,这也是传统数据挖掘技术与新技术背景下的最大区别。
(二)数据存储的去中心化。以区块链技术为例,该技术使用分布式核算和存储,同时对集中的硬件或管理组织没有硬性要求,任何节点的权利和义务均相等。系统中的数据块由具有整个系统维护功能的节点共同维护,在社会管理实践中,这种维护功能大多数由第三方中介信息机构提供信任背书来实现,且这种维护的架构理念也是去中心化的。
(三)数据变更的复杂化。以区块链技术为例,信息经过验证并添加到区块链后,将被分布式永久存储在各个服务站上。除非可以同时控制系统中超过51%的节点,否则单个节点上的数据库修改是无效的,因此区块链的数据是稳定的,可靠性极高。存储信息的不可篡改性有效防范了个人用户对于档案信息的变更活动,尤其是伪造和篡改等影响档案原始记录性的活动。
(四)变更记录的可追踪性。区块链技术的防伪可追溯性主要是依赖时间戳技术的应用。在区块链网络中,每个参与节点可以使用时间戳记录对应区块中的信息交换数据和变更信息的写入时间。经大多数节点验证后,当前数据区块将按时间顺序链接到区块的主链,同时实现对时间戳记录信息的永久存储。应用时间戳后,区域链将形成一个完整的、联结紧密的数据库,并且数据被篡改或伪造的可能性几乎下降为零。
(五)信息管理的自主化。当前的网络环境在传输数据尤其是涉及个人、企业专有数据时,倾向于使用基于共识的规范和协议(例如一组开放和透明的算法),这样整个系统中的所有节点都能在受信任的环境中自由安全地交换数据,从而将“人”的信任变成对“机器”的信任,任何人为干预均无效。这就使得各个数据块之间的管理与运行实现了高度的自治,其中任何一块的运行状态不会影响到与之相关的数据板块,这对于档案资源的备份、重大风险或自然灾害后的档案恢复与档案全局网络的稳定具有重大意义。
二、南大档案管理软件的实践体验
(一)实现了多媒体档案的管理。该软件系统不仅实现了档级、案卷级和全宗级的档案管理,同时也实现了对各种媒体类型档案的管理。可以通过OCR识别将图像转化成数字化成果,同时支持用户上载各种形式的图像、音频、视频等,还可以进行在线点播,丰富了馆藏档案数据库的资源类型和利用手段。
(二)提升了管理系统的用户自定义性。系统管理者可以依据使用该系统的用户、所数字化的资源储量、该单位的资金及其实际状况选择对应的档案数据库,确定服务器、带宽、终端CPU等多种基础设备的配置状况,以实现最佳的管理效能和最有效的利用方式。
(三)三层安全机制建设。三层安全机制分别是md5算法对用户数据的加密、用户身份认证以及数据授权。Md5的作用是让大容量信息在数字签名签署私人密码之前被压缩成一种保密的格式——就是将一个任意长度的字符串变为128比特的大整数,然后再和保存在文件中的md5值进行比较,进而确定输入密码是否正确。并且通过该128比特反推到原始的字符串是很困难的,有效地保护了档案系统及其文件的安全性。
(四)管理环节的全面性。该档案管理软件不仅实现了档案管理流程的大部分功能,如档案的录入、全文自动著录与标引、管理与全文检索、信息统计、借阅利用等等,同时也支持管理者对各种全宗情况、机构、用户权限等使用主体进行详细的管理限制,基本上涵盖了从档案利用主体到档案客体的多维度的管理体系建设,提升了档案管理的科学性和完整性。
(五)个性化以及通信功能的初步实现。在南大档案管理软件中,用户实现了对档案模板和存储数据库的自定义功能。用户可以定制或自己制定某档案模板,比如基建档案、财会档案等专业化程度较高的档案类型,在以后的工作中,可以直接使用此模板进行档案的录入与管理,大大减少了冗余的信息建设时间。用户可以根据自己的需要建立不同类型的档案数据库,而且可以控制相应的监控权限,以满足不同类别档案管理的需要,同时用户也可以选择将数据库分配到不同的服务器上、配备以不同的存储设备等,科学调配数据存储资源基础设备,实现统筹优化。该系统的各个应用终端之间并不是孤立存在的,通过设立邮件系统可以利用网络环境与各个领导部门机构进行数据交换与信息交流,及时取得档案管理的最新进展。
三、新技术背景下档案管理软件开发设想
(一)尝试开发新的应用层级结构。当前传统管理软件的结构分为三层,分别是环境层、组件层、组装层。环境层就是档案管理软件运行需要的操作系统环境和数据库基础。组件层则包括md5加密算法引擎、通用规则引擎、TCP/IP协议等通用规则引擎。组装层即应用系统,也就是我们所使用的南京大学档案管理系统的外设应用与终端系统,随着当下档案管理场景的多样化发展,不同领域之间的相互渗透与交叉管理变得尤为重要,比如“健康医疗档案”“家庭档案”等成为近些年来档案的民生化热点,实现这一转变的重要关键技术就是区块链技术。区块链技术的分层目前还在变化当中,但是从大的方向把握主要分为两大层面,即应用层面和基础层面。基础层面涵盖了数据库、网络、协议共识方面的内容,即档案馆藏资源库与不同节点信息信任证书的建立等,而应用层面以去中心化为主题,涵盖了去中心化环境应用交易和分配体制等技术性内容。去中心化的应用生态方便于档案管理的跨行业分布,促进档案多维度转型和价值发挥。
(二)数据库的“轻量化”建设。在南大档案管理应用的环境层中,鉴于当前业界对于档案存储主要采用双套制管理,随着社会活动形成的档案数量增多导致以往的数据库引擎过于庞大,事务处理也过于集中,同时修改数据库的方式也过于灵活。针对这些问题,区块链技术则通过使用共识机制来分散中心的控制权力。通过建立隶属于不同档案馆内职能部门、各全宗、各个机构的数据库与服务器节点,实现去中心化存储。减轻对总服务器档案资源管理压力的同时,每个节点之下对于其所属档案资源的相关活动也实现了高度的自治管理,以往的管理信息交换形式转变为各节点与各节点之间的记录交易,从整体上提升整个档案网络管理体系的效率。此外区块链技术提出了“时间戳”的概念——要求信息变更与交易的记录内容与时间有序相关,不得变化和修改,这就为数据库下的数字资源的安全性提供了可追溯的认证机制。相关信息经过验证并添加到区块链之后将被永久存储。除非可以同时控制系统中超过51%的节点,否则单个管理节点上的数据库修改是无效的,这就意味着以个体用户身份变更档案资源信息的活动受到了很大程度的限制。区块链技术体系所应用的非对称性加密技术提供了以公钥与密钥私钥成对出现的加密手段,相关档案信息的变换与交易需要在所属节点的授权之下才能访问,为当前档案管理软件的安全性建设提供了新的思路和方向。
(三)用户信任机制的构建。针对电子档案利用的高频性特点,现行的电子档案管理需要构建一个基于用户的信用验证机制来评判用户是否对档案有利用资格。档案管理软件信用体系的构建关系到电子档案后期价值的开发与延伸,当某个用户需要利用某个档案馆的电子档案时,该馆室节点可以通过用户的信任证书来决定是否授予其利用权限、对其开放档案的程度多少等等。此外,以机构为单位形成的信任证书也会参与到馆际活动中,为馆际联合提供信息认证和过程反馈。区块链在智能合约中的应用同样适用于档案应用信用体系的构建。通过在同一级别各节点、不同级别节点之间传递信任智能合约簇,建立连接不同数据域的证书颁发与撤销机制,并依据信任列表向跨域、跨级别、跨节点用户提供证书状态信息(证书有效/撤销/失效/过时),从而为更广范围的用户利用和档案交换、机构认证提供支持。
(四)多生态领域的联结。信息社会背景下的档案管理活动不单局限于档案这一专门行业之内,“健康档案”“家庭档案”等大众化的档案类型的出现意味着档案的存储、收集等环节需要打破以往的行政与事业机构限制,把目光转向更广泛的社会公众视野。此外档案价值发挥也需要构建新的生态体系。2019年12月26日,最高人民法院发布了新修正的《最高人民法院关于民事诉讼证据的若干规定》,该规定自2020年5月1日起实行,其中细化了电子数据的种类,涵盖了包括网页、博客、微博等网络平台发布的信息;手机短信、电子邮件、即时通信群组等网络应用服务的通信信息;用户注册信息、身份认证信息、电子交易记录、通信记录、登录日志等信息,这就意味着这些新类型的电子档案均可以作为正式发挥法律效力的证据。这些新挑战的出现,使得档案管理软件的设计与开发面临了一个新的难题——不同系统之间的交换,尤其是跨领域、跨行业之间的系统交换。目前每一个独立的生活领域或系统之间都有自己独特的权限与安全认证体系,所以在系统内部容易建立起信任,但是在跨系统之间性能却难以实现。在过去,两个系统之间若要实现信息与数据的交易变更需要通过SDK,即引入一个集中式的过渡系统,让这个系统在两个交换数据的主体之间进行调用数字化资源的活动。但这种传统方式不仅造成了非常高的信用与资金管理成本,同时这一中间系统的变更,如受攻击、版本升级等情况出现时,原先的接口会发生相应的变化,从而影响信息交换的效果。基于区块链技术架构的区块链机器人为解决这一问题提供了一种思路。首先,在不同平台产生档案数字资源需要交换的时候,系统会将数据转换成相应的电子认证凭证,通过区块链总网络体系的节点设置和交换服务,将其切割为细小的相互关联的信息认证区块,并且每一个区块都通过Hash进行加密。然后在每一个系统设立专门的区块链机器人,用于专门负责接收加密后的电子认证凭证。需要交换的数据可以通过P2P协议直接进行跨系统之间的档案信息传输,同时保证原始数据不变。在这个过程中,我们通过区块链的云服务体系,实现了对不同系统之间档案信息的转化认证和寻址服务,建立了一个价值互联网,每一个系统或组织之间由区块链机器人实现了互相的协同和交流。
四、结语
总的来说,区块链技术的出现给档案管理软件设计与开发带来了新的思路和方向。通过利用区块链技术中的分布式存储、点对点通讯、非对称加密、时间戳等手段,可以将过去集中式的存储利用档案数字化资源的管理活动,利用区块链技术来构建新一代的档案全程管理互联网,从而实现档案数字化资源在各个节点(本地服务器)、档案其他服务在云端,每一个档案管理单位或利用个体按照需要自定义自己的管理系统,提升档案管理软件的普适性和推广程度。