APP下载

浅谈云计算环境下电子文件管理的关键技术

2016-08-02高秀娟

卷宗 2016年5期
关键词:云计算关键技术

高秀娟

摘 要:随着科学技术的发展,云计算的应运而生,无疑给现行的电子文件管理技术带来的前所未有的变革,为其今后的发展动向奠定了前提条件和基础。本文从不同角度,基于云计算环境,对如何构建电子文件管理的关键技术进行了深入研究,并阐释了相关实现方案。

关键词:云计算;电子文件管理;关键技术

云计算时代的来临,且伴随着运用力度的不断加大,越来越受到人们的关注,一度成为业界人士相继研究的重要课题之一。源于云计算的普及,颠覆了以往支撑电子文件管理实现的技术框架,也促使其电子文件管理朝向多元化方向发展,但其关键技术的研究并不多见。故而,对云计算环境下电子文件管理关进技术的研究有着重要的现实意义。

1 云计算环境下电子文件管理技术框架

云计算环境下的电子文件包管理同时兼有资源虚拟化(SAAS层次上)与对云平台提供商所提供云服务的优先选择和配置双重特性,而随着私有云的渐次成熟,终究会带动公共云和混合云的发展。因此,其技术构架涵盖如下:

(1)固件或硬件层。交换机、硬件服务器等基础设备,服务于软件的内核层的管理、操作及更新;内核层经操作系统内核、集群中间件、虚拟机监控器等,实现对固件或硬件层的管理。

(2)分布式数据(非结构化)存储。事先配置好存储量大小,常以64MB为以组块,以主服务器提供的形式,在各个组块经索引后,实现不同数据管理服务器的存储,且云计算环境下的全部数据存储,均由文件系统管理。

(3)分布式数据(结构化)存储。包含Bigtable、RDS及HBase等技术,在云计算中,电子文件元数据的存储通常都是在分布式结构化表中,由其管理系统进行统一管理。

(4)分布数据处理技术。在云计算中,电子文件管理系统采用以MapReduce为主的分布式数据处理技术对电子文件进行处理。

(5)电子文件管理基础性服务。电子文件封包、凭证管理、文件完整性校验、数据分布式存取、文件监控等,提供出基础性服务与核心功能。

(6)电子文件管理业务服务。包括信息捕获、系统管理、保管与处置、安全与监控、检索与再现及非电子管理等,负责虚拟化和电子文件管理数据库的实现与形成。

2 云计算环境下电子文件管理关键技术

鉴于云计算环境较之于以往电子文件管理环境具有的特殊性,其技术突破(即关键技术)应围绕数据信息建模技术、结构与非结构数据分布存取技术、电子文件数据溯源技术进行。

1. 数据信息建模技术

要将不同电子文件封装要求不尽相同这一点纳入到数据信息建模技术中,如提交信息包(SIP)、存档信息包(AIP)及发布信息包(DIP)的信息模型及实现不同信息包之间的转换,同时要结合云计算技术特性,如大文件组块管理、多副本管理、数据分布式管理等。

2.结构与非结构数据分布存取技术

云计算环境下的电子文件管理较之于传统电子文件管理系统,最大的区别在于数据分布呈现出结构化与非结构、且异构电子文件海量,存取多具复杂性。如

Google文件系统,采用中心服务器管理技术,数据不支持缓存,只在用户端备有专用的接口。云计算环境下的电子文件管理要实现文件分块、多副本管理、MapReduce、加入结点动态等过程具有挑战性。

3.电子文件数据溯源技术

在云环境中,其特殊性为电子文件与其元数据的溯源提供了技术支持。在云计算中,电子文件的回溯基本上可划分为结构化数据表与非结构化数据。在Bigtable中,其数据模型的组成主要包括行、列及时间戳。而且,在云计算中,非结构化数据的存储通过采用多副本技术,能有效地溯源文件实体对象。然而,并不是云计算中的所有技术都能操作电子文件与其元数据的回溯,因此,在云计算中,凭证性回溯技术的管理还需要进行进一步的突破。

3 云环境下电子文件管理相关关键技术实现方案

云环境下电子文件管理关键技术的实现,要在对传统电子文件管理环境进行改观的同时纳入云计算这一因素,因而,要抓住和掌握相关实现要点,并在此基础上,渗透到云计算的各个层次中,达到电子文件管理的最优化。

1.实现要点

1.1底层技术与核心技术相平衡

云计算供应商所提供的云服务,应将操作简便性、实用性作为首要特征,电子文件管理关键技术的实现首先要考虑技术的可操作性。新技术的研发固然重要,首先要避免刻意追求新技术的复杂化,注重原有技术的重组,达到底层技术与核心技术相平衡,确保底层技术和核心技术二者之间的协调发展。

1.2经济性与稳定性相平衡

云计算环境下电子文件管理系统必须要达到经济性与稳定性相平衡目的,事实上,经济性通常会不利于系统的稳定性,在容错问题的处理上尤为多见,因其会涉及到Master、Sever、数据管服务器等部分。在计算与存储能力均等的基础上,搭建云端服务器集群的成本要远远低于对超级计算机购买的成本,而较低成本的云端部署与服务器硬件,避免了集机群更新换代的烦恼,且用户可采用瘦终端来实现加大云服务的功能。

1.3灵活性与安全性相平衡

灵活性涉及到多副本管理、节点动态管理、动态故障恢复、故障动态监测等方面,可使电子文件管理系统管理方便化,在带来方便的同时也带来了可靠性、一致性及保密性等方面更高的管理要求。因此,在云环境下,必须要保证灵活性与安全性的平衡,以保证电子文件管理系统的方便性与安全性。

1.4针对性与可持续性相平衡

实现云计算中的电子文件管理系统并不是一步到位的,而是要通过统一的规划,按照步骤一步一步实现的,并注重部门的协作及部门间的资源共享。而针对性是区别电子文件管理系统和各种业务应用系统的主要特点之一,电子文件管理务必要遵循相关功能标准,同时还要注意可持续性。

2.实现方法

在云计算中,实现电子文件管理系统的方案多种多样,但可以划分为两大类:商业解决方案与开源解决方案。但由于考虑到文件管理的特殊性与未来不可知性,因此建议采用开源解决方案。现阶段,开源方案的主流方向主要有:Hadoop、Nimbus、Eucalyptus,而Hadoop与Eucalyptus则是通过模仿商业解决方案而来的。通过对现阶段的实现技术的普及度、成熟度、技术公开性及未来的发展趋势等方面进行综合考虑,建立在云计算中的电子文件管理系统应采用Hadoop的编程模式。作为Apache开源组织所提供的分布式计算机框架,Hadoop包括多种编程技术,且具有较大的可靠性与可可扩展性。因此,在现阶段的通用技术框架中,可以采用HadoopHDFS技术实现非结构化数据的存储、采用HBase技术实现结构化数据的存储、采用MapReduce技术实现分布式处理及采用ZooKeeper技术实现锁服务。

4 结语

综上所述,随着关键技术的越来越成熟及应用的越来越广泛,电子文件管理的实现逐渐发展到采用公共云及混合云技术,并渗透到云计算的各种层次中。因此,在未来的工作中,必须要对云计算进行充分的分析,以研究出最好的实现技术。

参考文献

[1]薛四新.云计算环境下电子文件管理的实现机理[J].档案学通讯,2013,13(3):65-66.

[2]薛四新,黄萃.云计算环境下电子文件管理研究综述[J].北京档案,2011,12(9):25-27.

[3]薛四新,朝乐门,田雷.云计算环境下电子文件管理的关键技术研究[J].北京档案,2013,17(1):22-24.

[4]王玉龙.云计算环境下电子文件管理问题的思考[J].北京档案,2012,15(2):21-23.

猜你喜欢

云计算关键技术
小麦春季化控要掌握关键技术
棉花追肥关键技术
成功育雏的关键技术
老苹果园更新改造的关键技术
跨座式单轨与中低速磁浮信号系统的关键技术
杉木萌芽更新关键技术
志愿服务与“互联网+”结合模式探究
云计算与虚拟化
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器