云计算环境下电子文件管理可靠性研究*
2015-06-14毕建新
毕建新
(东南大学科研院,江苏南京,210096)
1 引言
学术界和商业界对云计算的讨论如火如荼,它具有低成本、虚拟化、存储能力强、弹性服务、资源池化、按需服务、服务可计费、泛在接入的特点,而电子文件管理的各项要求与云计算的特点几乎完全吻合,目前电子文件管理中所存在的问题绝大部分也能够由云计算来解决,可以说云计算是目前解决电子文件管理困境的最佳选择。本文尝试将可靠性理论引入到电子文件管理中来,从工程学角度分析云计算环境下电子文件管理可靠性的影响因素及保障策略。
2 云计算环境下电子文件管理的可靠性要求
2.1 可靠性理论的引入
可靠性是指产品在规定条件下和规定时间内完成规定功能的能力,它是产品的内在质量特性,体现的是产品非功能属性要求[1]。可靠性成为现代质量观的核心,以可靠性为核心的质量观关注全系统、全过程、全特性的质量管理,重视质量特性的形成过程,运用可靠性技术来强化质量设计,确保产品好用管用、经久耐用[2]。从这个角度看,可靠性理论与文件生命周期理论及前端控制思想的内涵是一致的,而且还具有更强的操作性。云计算环境下电子文件管理的可靠性同样可以从规定条件、规定时间和规定功能三方面来分析。规定条件包括电子文件管理的环境条件和工作条件。环境条件主要是指云计算环境,主要包括IaaS(基础设施即服务,以下简称IaaS)、PaaS(平台即服务,以下简称PaaS)和SaaS(软件即服务,以下简称SaaS)等三个核心服务层以及以服务质量保证和安全保证为核心的服务管理环境。工作条件主要是电子文件管理体制机制、规章制度和业务标准规范等。规定时间包含两个层面,一方面是指电子文件管理从系统设计、文件生成、捕获到最终归宿的全生命周期,另一方面是指云计算环境本身的生存周期。规定功能是指电子文件在其生命周期内所具备和完成的功能和技术指标。
2.2 电子文件管理对可靠性的要求
电子文件及其管理系统的技术性能指标仅从一个方面反映了电子文件的管理质量,却不能反映其全貌。因此,有必要将可靠性作为电子文件管理的重要质量指标加以考核和检验。
2.2.1 现有标准规范的要求
我国于2003年和2010年分别颁布了国家标准《电子文件归档与管理规范GB/T 18894—2002》(以下简称《规范》)和《电子文件管理暂行办法》(以下简称《办法》)。其中虽未直接出现“可靠性”字样,但都对电子文件的可靠性作出了详细的要求。如,《规范》对电子文件的真实性、完整性和有效性从制度、工作程序和技术措施三个层面加以保证,要求“建立规范的制度和工作程序并结合相应的技术措施,从电子文件形成开始不间断地对有关处理操作进行管理登记,保证电子文件的产生、处理过程符合规范”。在电子文件的收集和积累阶段,要求“采取严格的安全措施,保证电子文件不被非正常改动”,对不同类型的电子文件规定了通用格式,并定期制作电子文件的备份。在电子文件归档阶段,“应对归档电子文件的基本技术条件进行检测,检测内容包括:硬件环境的有效性,软件环境的有效性及其信息记录格式、有无病毒感染等。”在电子文件保管阶段,在保管环境、设备环境更新、载体转存也均提出了具体要求。《办法》中也多次提到与《规范》相似的可靠性问题。随着信息技术的发展,学术界对于电子文件可靠性的认识越来越深刻,涉及电子文件可靠性保障的相关标准规范也已撰写完毕待批。这些标准规范对电子文件管理所涉及的硬件设备和系统、管理系统功能架构、存储与交换格式、元数据基本集、管理流程等做出了详细的规定,对于未来大幅提高电子文件管理的可靠性具有十分重要的意义。
2.2.2 云计算环境下的特殊要求
云计算将大规模的共享虚拟计算资源以服务的方式提供给用户,其表现形式就是一系列服务的集合。服务的超大规模性、高复杂性、失效类型多样性、虚拟化管理和资源动态变化等特性,使得传统的可靠性保证技术难以适应云服务的新特点和新需求[3]。这就要求将可靠性融入到云计算环境搭建和电子文件管理系统设计阶段。这使得电子文件管理系统的设计框架从传统的“软件=程序+数据+文档”模式转变成为“软件=服务(集)+工作流+数据”,系统开发方法已经由传统的面向产品转变成面向服务,其运行环境由封闭、静态、可控逐步转变为开放、动态、多变。云计算环境下软硬件系统呈现出松耦合的特点,允许网络中满足功能的软硬件组件加入,而这些新加入组件的可靠性将直接影响到电子文件管理的整体可靠性。传统的提供冗余备份以及通过测试、动态替换软硬件组件等方式提高系统可靠性的方法已无法适应云计算环境的要求,如果不对软硬件组件的可靠性进行把关,未来在电子文件管理过程中所产生的软硬件维护费用之高将成为不堪忍受的负担[4]。
综上所述,目前电子文件管理可靠性还处于“事后把关”模式,即从制度设计、工作程序和技术措施等几个层面分别进行风险评估以确认电子文件可能出现的风险并设计处置预案。在电子文件管理经过近二十年的发展后,特别是在云计算环境下,对电子文件可靠性问题如果仍然坚持“事后把关”的处理模式,其可靠性保障将难以得到进一步提升。这就要求把可靠性作为设计特性,将其融入到电子文件管理生命周期及所处环境的前期设计中,使可靠性的技术跟踪与分析评价贯穿于电子文件管理的全生命周期。
3 云计算环境下电子文件管理可靠性影响因素分析
云计算环境下电子文件管理可靠性是一种综合可靠性,由制度可靠性、环境可靠性、系统可靠性和业务可靠性等四方面构成,如图1。要提升电子文件管理的综合可靠性,就必须从上述四方面分析电子文件管理可靠性的影响因素,并理解其影响机制及危害性。本文采用可靠性研究中常用的故障模式、影响及危害性分析(Failure Mode, Effect and Criticality Analysis,FMECA)方法,对云计算环境下可能影响电子文件管理可靠性的关键因素进行统计,并对其产生的影响及危害进行分析。这是一种从局部到整体的分析方法,通过这种分析方法可以发现云计算环境下电子文件管理过程中的薄弱环节、主要故障模式及原因,能有针对性的提出改进措施,进而提升电子文件管理的可靠性。
3.1 制度层影响因素
本文所述的制度层包含了电子文件管理体制机制、规章制度和业务标准规范等。电子文件管理体制机制是指电子文件管理职责在机构中的分布,其对电子文件管理的影响表现为各类管理职能、责任和权利的不能有效的衔接;电子文件管理规章制度是指电子文件管理者需要共同遵守的规章和准则,规章制度不完善主要表现为不健全、不配套、不合理、不执行[5];电子文件管理标准规范是用于指导电子文件管理取得最佳效果经一致协商制定的共同使用和重复使用的规范性文件,标准规范的不足会严重影响电子文件管理质量。目前电子文件管理体制机制、规章制度尚处于初建阶段,一些管理体制机制还处于磨合期,部分规章制度还不能对电子文件管理起到实质性的约束作用,电子文件管理标准规范也多是针对文书类电子文件和声像类电子文件,较少涉及完整的流程规范和业务规范。还谈不上针对云计算环境进行专门的制度设计。由此可见,制度层影响因素是导致电子文件管理可靠性问题的深层次原因。
3.2 环境层影响因素
图1 电子文件管理综合可靠性构成
环境层主要是指电子文件管理所处的云计算环境,即IaaS 层、PaaS层和服务管理层,环境层可靠性的缺乏会对电子文件管理和服务造成不可估量的损失。云计算环境可靠性与网络环境密切相关。云环境中软硬件具有松耦合性特点,网络中的软硬件组件可以自由加入,云计算服务提供商基于降低成本的考虑,会部分采用廉价或者可靠性不高的硬件设备,从而导致硬件节点故障的发生。如果是关键节点,如数据中心、计算节点发生故障,电子文件管理将面临崩溃的危险。云计算PaaS 层的可靠性是环境可靠性的关键环节,PaaS 层是否可靠很大程度上决定了电子文件的可靠性。云计算环境下电子文件的数量以TB 和PB级持续增长,所涉及的电子文件应用的拓扑结构也日益复杂,其状态和性能也处于不断的变化之中。如果缺乏对海量电子文件科学的数据存储与处理技术、资源管理与调度策略,电子文件的可靠性与可用性将大打折扣。云计算服务管理层对核心服务层的可用性、可靠性和安全性提供保障,包括服务质量保证和安全管理等。云计算平台规模庞大且结构复杂,很难完全满足用户的服务质量保证需求,此时,是否有针对性的制定服务水平协议和安全与隐私保护技术,就成为云计算能否广泛应用于电子文件管理的关键。
3.3 系统层影响因素
系统层主要包含业务系统、电子文件管理系统和电子文件长期保存系统等云计算应用,这些应用面向电子文件管理终端用户,构成了云计算环境的SaaS 层。系统层对电子文件管理可靠性的影响实质上是软件系统可靠性的问题。云计算环境下SaaS 层的各类应用呈现出规模庞大、复杂程度高、数据异构性的特点,科学的软件工程方法与管理就成为保证电子文件管理应用可靠性的基本手段。在遵循云计算环境下统一的电子文件元数据标准、编码标准和接口标准的前提下,充分考虑各类电子文件管理应用开发过程中的避错设计、错误校验、错误兼容。待系统开发完毕,软件测试会尽可能的找出系统中存在的缺陷和错误,并进行改正。而测试方法的不同、测试覆盖面的差异、测试阶段投入工作量的大小都直接影响着测试结果。实践证明,测试方法得当、覆盖面广泛、测试投入充分的系统,其可靠性必然高,反之其可靠性必然相对较低。是否采取有针对性的提高软件可靠性的设计、测试方法与技术,会对系统可靠性产生重要的影响。值得一提的是,软件生命周期中从需求分析,到系统设计、编码开发、再到测试、到最后的投入使用及维护,都离不开开发人员。从事系统设计、管理、开发、测试相关人员的能力、经验、素质也是影响系统可靠性的重要方面[6]。
3.4 业务层影响因素
业务层是指电子文件从机构业务系统中产生开始直至进入长期保存系统的流转过程。电子文件在不同的业务流程中呈现出不同的流转特征。业务流程的可靠性同样也影响着电子文件管理的可靠性。传统电子文件管理流程仅仅是对纸质文件管理流程的简单电子化,虽然可靠性较高,但对于提升文件管理效率作用有限。计算环境下电子文件管理要达到管理效率和管理可靠性的大幅提升,就需要构建一种适应云计算环境的具有自适应性的柔性业务流程。这种流程能够面向云计算规模庞大、结构复杂、服务动态的特性,自动的调整文件管理流程和电子文件的流转。因此,在业务层必须要综合考虑电子文件管理的业务类型、业务场景、业务流程、业务对象以及对业务对象的操作。电子文件业务流程在具有自适应的柔性特征的同时,还应当具有相当的健壮性,即不易被不合理因素干扰而导致业务流程的中断,使电子文件无法按要求完成流转。这涉及到业务流程的合理性以及不同业务流程之间的依赖性和衔接性。
综上所述,可绘制出一张电子文件管理可靠性影响因素表格,如表1。表中包含了影响因素类型、影响因素、危害性及原因,表格比较直观的体现了云计算环境下电子文件管理可靠性影响因素。
4 云计算环境下电子文件管理可靠性保障策略
可靠性作为现代质量观的核心,关注的是全系统、全过程、全特性的质量管理,重视质量特性的形成过程,强调将可靠性作为设计特性,将其融入到前期设计中。因此,电子文件管理也要将可靠性融入到电子文件管理的前期设计中,并将可靠性的技术跟踪与分析评价贯穿于电子文件管理的全生命周期。
4.1 制度可靠性设计
制度可靠性主要是从管理体制机制、规章制度、标准体系层面对云计算环境下电子文件管理作出约束和规范。科学的管理体制机制、规章制度和标准体系,可以营造出电子文件可靠管理的制度环境,给予电子文件管理科学的指导。在管理体制机制上,应当逐步建立健全国家—省—市三级电子文件管理协调机构,对电子文件管理工作进行组织协调和监督检查;在此基础上进一步完善电子文件形成单位与档案部门管理职责,建立文秘、业务、档案、信息化建设和安全保密等部门协同配合的日常管理机制,指导归档电子文件管理工作。在规章制度上,完善电子文件全程管理的规章制度、电子文件管理与现有文件档案管理有机衔接的管理办法等;制定电子文件管理系统和设备的管理制度,对电子文件管理系统和设备的认证测评、风险评估、设备采购、规范使用提出要求。在业务标准规范上,完善电子文件管理标准规范体系,对电子文件管理全生命周期提出管理与技术规范。
4.2 云服务可靠性设计
云服务可靠性由可靠云基础设施服务、可靠云平台服务及可靠云应用服务构成。云基础设施服务为电子文件管理提供可靠的网络、数据中心、计算等虚拟化资源服务,是电子文件管理可靠性的基础;可靠云平台服务属于云基础软件服务层,为电子文件管理提供平台支撑,是支撑电子文件管理的重要手段;可靠云应用服务,即电子文件管理应用,与用户的可靠性需求紧密结合,是云服务可靠性的直接体现。
表1 电子文件管理可靠性影响因素表
可靠云基础设施服务的目标是建立具有高可靠性和高容错能力的网络、大规模存储设施和高性能计算节点。其中,网络可靠性主要取决于网络设计的可靠性和设备可靠性,这两者构成了网络的固有可靠性。在网络设计上,一方面要考虑主干网络技术的发展,采取适度超前的技术和设备,使设计的网络能够适应当前和未来电子文件管理的发展趋势,确保网络具有较长的生命周期,最大限度地满足电子文件管理的需要,另一方面又要保持一定继承性,降低风险,使网络的设计具备良好的兼容和扩充能力,能够实现高可靠网络的平滑升级。在组网设备选择上,应当选择质量优秀、有良好声誉的网络设备,并且所用的网络设备都应满足可靠性设计指标要求,严格遵守网络的相关规范,所有设备及子系统均需满足最新、最高的标准规范。网络组织与维护的有效性构成了网络的工作可靠性。
冗余设计技术是提高存储可靠性和计算节点可靠性的一种有效的方法。冗余设计技术,是指产品所包含的为完成规定功能所必不可少的组成部分的额外附加成分[7]。云计算环境下关键的计算节点,通常采用多服务器作为并行计算节点,当某个计算节点出现故障时,其他节点能够实时自动接替其计算任务,使整个系统仍能正常工作,从而提高计算节点的整体可靠性。同样,数据存储也采用冗余技术的分布式存储技术以提高其存储可靠性。
可靠云平台服务面临着电子文件数据规模的日益庞大,亟需解决PaaS 层的海量数据存储与处理技术,以及基于这些技术的资源管理与调度策略。云计算环境下电子文件的存储虽然采用了分布式存储技术,但存储节点失败和错误导致存储数据丢失的现象仍然存在,为了进一步提高数据存储的可靠性和可恢复性,基于网络编码技术的分布式数据存储方法应运而生。网络编码技术的使用可以大幅提升网络的健壮性和数据的可恢复性,再配合有效的副本机制、任务调度算法和任务容错机制,不但可以降低数据丢失的风险,而且能优化作业完成时间[8]。
对于业务系统、电子文件管理系统和电子文件长期保存系统等电子文件应用而言,在系统开发前就需进行软件可靠性评估,分析传统网络环境下系统可靠性影响因素,收集详细的可靠性数据,并分析在云计算环境下可靠性影响因素的变化,使系统在设计阶段的可靠性水平就处于受控状态。在系统设计开发时,需充分运用避错设计、查错设计、改错设计和容错设计的方法,将以预防为主的思想贯穿于设计的全过程,同时开发故障监控与诊断专家模块,以便对系统运行状态进行监控,并实时收集系统运行过程中的失效数据进行可靠性评估,也为系统的改进提供参考[9]。在系统开发完成后,要完善和优化系统测试方案,对系统进行完整、详尽、可靠的测试,争取在系统上线之前发现其内部缺陷、故障等,以便快速排除故障,降低系统的失效率,达到提高系统可靠性的目的。
4.3 业务流程可靠性设计
云计算环境下电子文件管理业务流程与传统网络环境下电子文件管理业务流程存在着较大的区别。传统网络环境下,电子文件的流转呈现出实时、一体化、线性的流转特征,电子文件在整个管理流程中虽然管理效率较以往纸质文件管理有大幅提升,但总体而言,整个管理流程还是对传统文件管理的电子化模拟,还不能满足海量电子文件协同管理的要求。在云计算环境下,电子文件管理从一开始就确立了“分布”、“集成”管理的理念,电子文件从产生到流转直至永久保存或销毁,始终存在于“云端”,虽然用户不知道电子文件流转到何处、最终存储在何地,但电子文件数据流始终受到PaaS 层数据管理与调度模型的控制,整个管理流程呈现出高度实时性、高度集成性、网状协同的特征。云计算环境下电子文件管理流程需要针对云计算的特点加以再造,其流程再造必须以业务流为主线,结合电子文件管理机制体制的创新,摆脱原有组织结构的束缚,对现有的电子文件形成办理流程、利用流程、归档流程及档案管理流程重新设计和优化。需要从业务流程角度分析电子文件管理工作,包括对电子文件的来源和管理业务流程进行分析;根据云计算环境下业务流程的需要来变革电子文件管理的组织结构模式并整合管理机构,使电子文件管理的管理部门扁平化、业务部门集成化;并在此基础上构建基于协同理论的电子文件管理系统,实现电子文件管理与业务流程的有效集成。这样才能够实现业务流程的可靠性。
5 结束语
云计算环境下电子文件可靠性保障是一项复杂环境下的系统工程,必须综合运用多种手段对电子文件管理进行全系统、全过程、全特性的质量管理,只有确保电子文件管理的高度可靠性,云计算才有可能在电子文件管理中得到广泛运用。
[1]刘维信.机械可靠性设计[M],北京:清华大学出版社,1996.
[2]可靠性是“中国创造”的倍增器——访北京航空航天大学可靠性工程研究所所长王自力2013-6-6 http://www.cqn.com.cn/news/zgzlb/diyi/722679.html.
[3][9]梁员宁.云服务可靠性评估模型及关键技术研究[D],解放军信息工程大学,2012.
[4]何国伟.软件可靠性的现状及展望[J].电子科技导报,1994(1):6~9.
[5]冯惠玲等.电子文件风险管理[M].中国人民大学出版社,2008.
[6]张静.软件可靠性模型研究[D],西安电子科技大学,2012.
[7]孙怀义.冗余设计技术的有效性研究[J].自动化与仪器仪表,2007,(6):3-5.
[8]罗军舟,金嘉晖,宋爱波,东方.云计算:体系架构与关键技术[J].通信学报,2011(7):3-21.