数字化档案云存储技术研究与设计
2018-01-09张华丽杨华勇江伟
张华丽+杨华勇+江伟
摘要:
我国数字化档案系统存储主要是本地存储和局域网存储,存在档案信息孤立、建设和管理成本高、后期维护困难等问题。阐述了数字化档案云存储平台的物理架构、云存储平台的体系结构和规划设计、开放接口和服务接入设计、云存储安全策略等。设计了一套弹性云存储、异构数据存储、开放文件中心、档案一体化与全生命周期管理和电子文件加密与开放的数字化档案系统。建设安全的数字化档案云存储平台,能够普及数字化档案,降低企业档案管理成本,提高企业现代化管理水平。
关键词:数字化档案;云存储;安全策略
DOIDOI:10.11907/rjdk.172887
中图分类号:TP392
文献标识码:A 文章编号:1672-7800(2017)012-0184-04
Abstract:In the process of enterprise information construction, more and more enterprises begin to attach importance to the construction and implementation of digital archives system. At present, the storage of digital archives system is mainly local storage and local area network storage, resulting in the isolation of enterprise file information, high cost of construction and management, and difficult maintenance in the later stage. Research and design of digital archives cloud storage platform, introduces the physical architecture design of cloud platform, cloud storage platform architecture and planning and design, open interface and service access design, cloud storage security policy. The design of a flexible cloud storage, heterogeneous data storage, open file center, file integration and lifecycle management, electronic file encryption and open digital file system. The construction of a safe digital archives cloud storage platform can popularize the digital awareness of enterprise archives, reduce the cost of enterprise archives management, improve the level of enterprise archives management, and ultimately promote the modern management level of enterprises.
Key Words:digital archives; cloud storage; secure policy
0 引言
在信息技術高速发展的今天,电子化数据成为企业的重要资产,为企业制定发展战略提供重要的数据支撑。企业数字化档案系统作为企业信息化管理的重要手段之一,普及程度越来越高。
我国数字化档案系统主要以企业为主体进行部署,企业档案管理成本昂贵,对档案管理人员要求较高,档案管理规范不一,企业电子数据孤立[1],这种状况越来越不适应当代数字化档案管理要求。
1 数字化档案管理现状
数字化档案管理在企业中的普及率、管理规范性和利用效率上参差不齐,存在以下问题:
(1)数字化程度较低。目前大部分企业档案数字化工作由档案管理部门集中管理,缺乏数据的有效收集整理手段,从而造成大量有价值的档案数据分散在各职能部门,未形成统一管理。同时,由于数字化设备不足,造成大量实体档案无法有效收集、大量档案数据丢失。
(2)企业信息化系统和档案管理系统不兼容。由于历史原因,早期数字化档案系统没有提供统一的数据接口,无法将信息化系统对接到数字化档案系统,从而造成大量有价值的电子数据丢失[2]。
(3)专业档案管理人才缺失。档案数字化是一项专业性较强的工作,企业档案管理人员不仅要熟悉档案管理的要求与规范,还要熟悉档案管理相关的专业计算机知识。虽然部分高校开设了档案管理专业,但基层仍然存在大量没有经过专业培训的档案管理人员。
(4)网络安全问题严重影响档案的高效利用。传统的档案管理系统一般在孤立的企业内网中应用,由于档案管理的特殊性,档案存储和传输缺乏有效的安全性保障[4],企业对档案的网络应用缺乏信心,从而造成数字档案信息孤岛,无法发挥档案的最大价值。
(5)对云存储技术成熟度的怀疑。云存储技术已经在很多领域得到了广泛应用。虽然云存储已经很成熟,但对于稳定性和可靠性有特殊要求的档案管理来说,仍然持有怀疑态度。
2 数字化档案云存储意义
企业数字化档案发展过程中,由于硬件投入、管理成本和技术要求较高,部分基层企业档案管理人才缺乏,特别是懂信息化的档案管理人才缺乏,档案数字化整体发展缓慢,普及率较低。应采用成熟的云存储技术,采用安全、高效和可信任的数据加密技术,研究一套安全、可靠、易扩展和开放的标准化企业档案管理系统,以解决企业数字化档案发展困境。通过企业数字化云存储平台,解决数字档案发展过程中的难题,实现档案系统和企业业务系统的无缝连接,提高数字档案的利用效率,减少数字档案管理成本[5]。endprint
数字化档案云存储平台由分布式文件存储服务程序、数据存储和查询服务程序及系统控制服务程序组成,实现云平台的异步数据同步功能、数据多节点备份功能、数据错误发现与并行复制功能、数据的优化存储算法、数据压缩算法、系统运行日志保存分析与日记审计等功能。通过采用先进的分布式服务框架,提供用户开放接口和服务接入功能,从而减少软硬件投入和项目运行管理成本。通过网络隔离、数据隔离和端到端的数据校验等先进的网络安全技术和数据加密技术,防止暴力攻击和系统漏洞等网络安全威胁,提高系统安全性,以标准化的、透明的加密算法提供用户可信的原文安全存储服务[6]。
通过技术手段,最终实现企业数字档案的弹性云存储、异构数据存储、开放式文件中心、档案一体化和全生命周期管理和电子文件加密与开放策略。数字化档案云存储平台主要解决异构数据的云存储技术选择、云存储平台搭建、分布式服务框架选型、效率分析及负载均衡实现、开放平台的服务接口定义和实现、端到端的数据安全传输和验证、数据签名和加密等技术难点。
3 数字化档案云存储关键
(1)弹性云存储。数字化档案应用云存储技术,在实现数据存储的同时,要降低应用成本,通过设备共享减少硬件资源浪费。企业可根据其应用规模和数据规模,按需购买或升级服务。
(2)异构数据存储。企业数据的多元化,数据格式的多样性,要求为用户提供灵活的、可自定义的元数据存储功能。企业可根据自身实际,方便、灵活地配置元数据格式。
(3)开放式文件中心。用户可将工作中产生的数据存贮在文件中心,企业档案管理部门根据归档范围自动进行数据归档,无需重新传输和移交数据,减少了人力、物力的浪费。
(4)档案一体化和全生命周期管理。通过档案云存储开放接口存储的文件,在档案管理全生命周期内应具有统一的资源ID属性,实现文件的“文件存储-文件利用-文件修改-文件鉴定-文件销毁”的全过程管理。
(5)电子文件加密与开放策略。实现文件的安全传输和传输验证,采用有效的数字签名技术和对称加密算法,实现文件的安全存储。
(6)弹性存储空间。云存储架构采用并行扩容架构,当企业购买的容量不足时,只需采购新的存儲空间即可增加容量,从而实现文件的弹性扩容。
4 数字化档案云存储方案
4.1 数字化档案云存储物理架构
要实现数据的云存储,特别是档案数据的云存储,在进行云存储平台的体系结构和规划时必须考虑以下几个问题:
4.1.1 稳定性
数据在传输和存储过程中不能丢失和出错,当软件或硬件出现故障时,必须采用一种机制实现容错功能。
4.1.2 一致性
为保证在高并发情况下数据的缓存、持久化和读取的一致性,要求分布式文件服务器、业务逻辑数据库和内存数据库中的数据一致。
4.1.3 安全性
档案数据具有价值性和敏感性,云存储平台必须具有防御攻击能力。数据在传输和存储过程中,必须采取有效的加密措施,防止档案数据流失。
数字档案云存储平台,对传统单一数据存储的档案系统整体结构进行重新设计,以符合开放服务云存储要求。数字化档案云存储物理架构如图1所示。
企业档案云存储框架由以下几部分组成:
(1)云存储平台。采用分布式云存储技术,实现易扩展的云存储平台。云存储平台用于存储加密的数字化档案电子文件、档案元数据和应用服务数据。
(2)分布式服务框架和应用开放接口。分布式服务框架包括服务的分布控制、负载均衡、接口权限控制、应用安全管理等功能。开放接口向上层(接口用户、Web服务器)提供数据云存储开放接口。
(3)Web应用服务器。向用户提供云存储后台管理功能及开放数据的查询服务。
(4)安全服务引擎。以AOP的方式为系统提供整体的安全服务,包括数据传输加密、数据存储加密(解密)和安全认证等功能。
4.2 云存储平台体系结构和规划
新的档案系统提出了数据一体化、数据异构化和数据可追溯机制,设计和构建档案云存储平台时,既要继承传统档案系统的优点,又要对不适宜的地方进行改进,从而设计出一套健壮的可持续发展的云存储平台,如图2所示。
档案云存储基础平台主要包括3类基本构件:
(1)分布式文件存储服务程序。数据存储引擎以分布的方式安装在局域网不同的服务器主机上,提供对传统关系数据、异构元数据的存储和查询服务。为提高系统吞吐量和响应时间,内置一个内存数据库引擎,提供数据的缓存服务。同时系统需要提供一个自适应存储引擎路由组件,该组件提供一种透明的存储控制服务功能,实现对不同数据的自适应存储。
(2)数据存储和查询服务程序。数据存储和查询服务程序以开放接口的方式向外部业务程序提供服务,包括数据存储服务和数据开放服务。数据存储服务为用户提供服务目录,允许用户在权限范围内的目录中存储和管理系统数据和档案元数据。开放数据处理服务向用户提供云存储平台中的可利用数据,以便用户对数据进行加工和利用。
(3)系统控制服务程序。系统控制服务程序用于对系统效率、安全性、数据一致性和数据冗余功能的控制。系统控制服务程序除保证数据的完整性和安全性外,还应提供以下功能:①异步数据同步;②数据多节点备份;③数据错误发现与并行复制;④数据的优化存储;⑤数据压缩算法;⑥系统运行日志保存、分析和日记审计。
4.3 开放接口和服务接入
为了保证系统运行的稳定性和均衡性,用户不能直接访问存储平台及存储平台上的数据,数据存储和数据服务通过开放接口和服务接入的方式实现,如图3所示。
4.4 数字化档案云存储安全策略
4.4.1 数据存储加密技术endprint
系统通过统一的加密、解密算法,对数据进行加密、加壳存储,如图4所示。
系统通过计算得到文件的唯一MD5码,通过用户令牌,获取用户的企业公钥,通过公钥对MD5进行加密,产生电子文件的加密密匙。对电子文件加密,然后以MD5对文件加壳,最后将加壳的数据存储到服务器。
当用户下载电子文件时,传输到用户端的是加密的加壳电子文件。用户对文件去壳,并取到文件的MD5码,通过私钥解密电子文件密匙,再对电子文件解密,得到最终解密的电子文件。
4.4.2 数据网络传输校验
通过构建健壮的、灵活的访问机制及数据校验机制,加强系统安全性。数据网络传输校验机制主要包括如下技术手段:
(1)请求签名验证。所有通过网络传输的数据统一使用签名,防止文件伪造和篡改[11]。
(2)数据跨应用授权。用户申请应用接口时,系统会自动对应用进行授权,只有授权的应用才能成功访问接口。
(3)账户双层认证。系统除提供基本的密码验证外,还要提供硬件的验证保证,防止恶意访问。
(4)团队账户权限管理。系统对用户组进行细粒度的权限管理服务,只有具有权限的用户才能访问相应的功能接口。
5 结语
数据是企业生存、发展的重要资产,通过数字化档案云存储平台,能够为企业提供便捷、高效和安全的云存储服务,为企业提高核心竞争力提供有力的数据支撑。通过建设安全的数字化云存储平台,能够强化企业档案数字化意识,提高企业档案管理水平,提升企业档案管理的安全
性,促进企业现代化管理水平提高。
参考文献:
[1] 易靖涵.网络环境下图书馆档案信息资源共享机制研究[J].赤峰学院学报:自然科学版,2013(17):152-153.
[2] 杨安莲.档案信息化建设的问题与建议[J].中国信息界,2006(14):30-31.
[3] 种金成,何祖华.高校馆藏档案数字化实施方案及安全策略研究[J].黑龙江档案,2014(1):44-45.
[4] 许景艳.知识经济时代高校档案管理策略[J].赤峰学院学报:自然科学版,2015,31(11):173-175.
[5] 徐秀娟,王宇晴.新时期高校档案数字化管理的现实意义探析[J].办公室业务,2016 (13):132-133.
[6] 傅颖勋,罗圣美,舒继武.安全云存储系统与关键技术综述[J].计算机研究与发展,2013,50(1):136-145.
[7] 侯清铧,武永卫,郑纬民,等.一种保护云存储平台上用户数据私密性的方法[J].计算机研究与发展,2011,48(7):1146-1154.
[8] MELL P,GRANCE T.The NIST definition of cloud computing[R].National Institute of Standards and Technology(NIST),Washington,USA:Technical Report Special Publication,2011:800-145.
[9] 洪澄,張敏,冯登国.AB-ACCS:一种云存储密文访问控制方法[J].计算机研究与发展,2010,47(z1):259-365.
[10] 李美云,李剑,黄超.基于同态加密的可信云存储平台[J].信息网络安全,2012(9):35-40.
[11] 李晖,孙文海,李凤华,等.公共云存储服务数据安全及隐私保护技术综述[J].计算机研究与发展,2014,51(7):1397-1409.
[12] 熊智,王平,徐江燕,等.一种基于属性的企业云存储访问控制方案[J].计算机应用研究,2013,30(2):513-517.
(责任编辑:杜能钢)endprint