教育数据资源中心省级备份策略分析及控制系统设计
2016-09-10季烨
季烨
摘 要:本文所介绍的系统协助建立教育行业新型省级备份系统,旨在更有效地规避人为因素带来的误操作和决策失误,开创教育行业信息化新的工作模式。该系统协助天津市教委建立长期合作伙伴关系,包括:建立系统、持续技术支持、系统及策略维护、专利申请、应用推广、培训及推广利益分享。
关键词:MVC备份模式;机器学习;数据灾备;信息安全
中图分类号:G434 文献标志码:B 文章编号:1673-8454(2016)01-0056-04
一、引言
数据中心容灾备份系统简称“灾备系统”,又称为灾难恢复系统或灾难备份系统。灾备系统是数据中心保护数据的最后手段, 其建设是一项系统工程,不但涉及数据中心的服务器、存储、网络,而且涉及组织架构、业务流程、规章制度、外部协作关系、资金投入等各个方面。灾备系统需要对可能遭受的风险进行风险分析和业务影响分析,结合数据中心的现状进行设计,同时筹备所需的各种资源,制定详细的任务进度计划,通过严格的项目设施管理措施,才能保证项目的质量和进度的要求。
1.项目背景
数据资源中心项目作为天津市教委“十一五”和“十二五”规划教育信息化的重点建设项目之一,已基本完成软硬件基础设施建设,正在进入应用服务体系建设阶段,为支撑各类应用系统的正常部署和稳定运行,需建立起满足要求并符合发展趋势的基础支撑环境,更重要的是制定系统安全规范、逐步完善备份体系,以形成数据资源中心的完整业务流程,以支撑未来数据资源中心作为全市教育行业承载各级各类应用系统的省级数据中心。
随着天津市教委教育信息化建设工作的不断深入开展,数据的重要性越来越重要,保护天津市教育信息化数据资源中心的数据安全保障即数据备份迫在眉睫。数据资源中心遂拟构建数据备份系统。该系统应尽量贴近天津市教委数据资源中心的需求,在用户量、系统架构、系统软件及安全需求等各方面,尽量接近或者类似资源中心的未来需求。
2.系统要求
(1)数据保护覆盖率高,恢复有保障。保证保护后的数据可以被恢复,保证数据恢复的影响最低。要让所有系统纳入备份系统,并保证纳入系统的数据得到了充分地保护。
(2)备份策略满足资源中心未来的RTO/RPO的需求。RTO/RPO的标准应与天津市教委数据资源中心的要求类似。RTO是指业务恢复的时间间隔,即恢复系统需要当机多长时间;RPO是指系统恢复的粒度大小,即能够恢复到什么级别的目录。总体来说RTO的时间越短越好,RPO的粒度越小越好。
(3)数据管理成本低。满足目标的前提下,维护工作应尽可能简化。制定备份策略或者进行数据恢复的时候,无需写入脚本,点击鼠标便可完成所有操作并自动归档。
(4)考虑未来扩展性。应采用统一架构的软件,未来添加归档、异地容灾等功能的扩展应非常简便。
3.现有硬件基础
图1描述了数据资源中心现有的软硬件环境,包括部署方式和各种设备的数量。
二、模型设计概要
1.项目总体目标
数据资源中心的备份系统建设在基础设施环境与发展理念上改变了原有的教育信息化建设思路,本着“物理相对集中、逻辑集中”的原则开展统筹规划的信息化建设,由此引发了针对IT资源备份管理、备份标准规范体系建设的新需求,图2描述了数据资源中心建设带来的新挑战。
2.系统设计概要
“省级MVC备份策略制定中心”要满足上面提到的所有需求,概要模式图如图3所示。
图3为系统模式图,系统分为三层:呈现层、分析层、操作层。其中中间部分的分析层应建设成企业级MVC模式的黑盒子,外部参与者无需窥见内部运维方式,直接输入系统需求即可。系统会自动输出备份策略及标准化文档,以供双方确认。
3.模型流程说明
①实例化项目需求,提交模拟化数据流;②分析数据,模拟化数据转换成数字化数据提交;③视图及文档模板建立;④备份策略及数学模型数据库向技术操作及应用实施模块输出数据流;⑤技术操作及应用实施模块反馈操作结果,更新备份策略及数学模型数据库;⑥技术操作及应用实施模块操作数据备份系统进行数据备份;⑦数据中心数据备份系统反馈备份结果;⑧备份策略及数学模型数据库传送视图及文档所需数据;⑨视图及文档生成模块传送视图及文档,送交备案。
三、模型用例解析与系统时序
1.模型用例解析
项目备份模型用例如图4所示:①针对主流业务系统,分别制定适合的备份策略并生成标准化文档,提交专家论证;②建立统一的“备份数学模型库”。每当新的业务系统需求提交至系统管理员处,由建设单位和托管单位联合进行需求分析,将系统各方面数据数字化之后,建立数学模型;③管理员将需求数学模型的参数表输入MVC系统,系统将模型数据提交给系统“系统数学模型库”进行库内模型比对;④系统找到匹配的数学模型。如没有合适的数学模型,系统需自动跨模型搜索并建立匹配的新模型,如图5所示(初期建立系统基本功能即可,具体功能可以后期完善)。
2.系统时序
如图4所示,系统时序为:项目申报方->提交需求->项目受理方->需求分析->提交分析结果->数学模型比对->合成备份策略及文档->申报方和受理方双方确认->操作备份系统实现备份->备份结果实时和阶段性反馈->反馈结果存档->指导扩充备份策略及数学模型数据库。
四、系统实现
根据数据资源中心备份系统建设要求,天津市教育数据资源中心自主创新、研发建设了“省级备份策略分析及控制系统”(以下简称系统)。系统共分四个子模块,完整实现了数据资源中心,从备份项目申报到最终备份方案确认、生成及归档的全流程体系建设。四个子模块即为①“项目申报管理”模块:通过可配置化的业务审核流程,实现数据资源中心从项目申报到项目受理审核业务的流程审批管理。②“备份方案管理”模块:通过对备份方案的规则预设,实现系统自动对申报项目的需求匹配,依照计算模型算法,自动计算出该项目最优的备份方案,并记录在案。③“备份预警管理”模块:通过对各个项目数据库的备份情况实时监听,及时发现在项目日常备份过程发生的突发备份问题,预警告知管理部门及时响应处理,降低系统问题风险。④“基础信息管理”模块:主要实现系统内基础数据、代码及常规设置的日常管理。
其中,“备份方案管理”模块是本次“省级备份策略分析及控制系统”建设的重点、核心价值功能。由“项目档案管理”、“备份规则设置”及“备份方案生成”三个部分组成。
1.项目档案管理
“项目档案管理”实现了对全部申报项目的档案信息进行集中管理,系统用户可以随时查阅每个申报项目的原始需求,数据库基本信息以及已经制定生成的备份方案。
2.备份规则设置
通过对各个项目系统抽象的备份需求进行具化,总结提炼如“系统安全级别”、“用户数量”、“数据量”、“数据增长量”等多项需求规则,每个需求规则下又细分不同级别的需求规则参数。用户针对不同的规则参数进行“备份规则”的设置,形成“系统数学模型库”。同时“备份需求规则参数”,亦可以根据备份需求的增加要求不断丰富、调整。
系统亦实现了针对不同的“备份需求规则参数”,配置不同的“备份规则”。系统目前支持不同的数据库系统按“备份周期”、“执行间隔”、“每日备份频次”、“备份完整性”及“备份过期”五个方面设置其备份的详细规则。
3.备份方案生成
根据申报项目的需求,管理员将其需求转化为需求数学模型,并参数化输入到系统中。系统根据录入的参数化需求模型数据,提交给系统“系统数学模型库”进行库内模型比对,并使用系统内置的“动态规划”算法,计算出最优的备份方案提供给用户。
五、备份方案生成模型核心算法实现
系统利用“动态规划”算法,实现申报系统需求模型数据与“系统数学模型库”进行库内模型比对时,获得最优的备份方案。
动态规划(dynamic?programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。
在决定是用哪种数据库备份策略的过程中,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。基于此方法,先将各个条件(如系统安全级别、系统用户数、系统数据量、数据增长量等等)两两拆分开来,求出每个阶段的最优策略,再求出最终的最优策略。
“备份方案生成”功能实现调用“动态规划算法”代码实现如下:
/* 申报项目备份方案生成 */
@Controller
@RequestMapping("dataBaseBakController")
public class DataBaseBakController {
@Autowired
private DataBaseService dataBaseService;
/**
* 根据输入获取返回策略
* @param request 前台参数,包括:“系统用户级别”、“用户数”、“在线用户数”、“数据量”等参数信息
* @return strResult 返回最优备份方案,包括:“备份周期”、“执行间隔”、“每日备份频次”、“备份完整性”及“备份过期”等结果信息
*/
@RequestMapping("/getStrategy")
@ResponseBody
public List
// 根据request获取前台输入的参数
List
strParam.add(request.getParameter("safeLvl").toString()) ; // 系统安全级别
strParam.add(request.getParameter("userCnt").toString()) ; // 系统用户数
strParam.add(request.getParameter("onlineCnts").toString()) ; // 在线用户数 strParam.add(request.getParameter("dataCnts").toString()) ; // 系统数据量
strParam.add(request.getParameter("dataUpCnt").toString()) ; // 数据增长量
strParam.add(request.getParameter("LogUpCnt").toString()) ; // 日志增长量
//参数输入格式合法性检查
string strError = "" ;
strError = dataBaseService.CheckParam (strParam) //判断输入参数格式是否合法
if (!"".equals(strError)) {
return strError ; // 返回格式错误信息
}
//计算数据模型参数对比决策优先级
List
// 获取决策优先级
strParamPriority = dataBaseService.ParamPriority () ;
//调用“动态规划”算法,获取最优备份方案
List
//根据参数及决策优先级,计算最优方案
strResult = dataBaseService. dynamicProgramming (strParam , strParamPriority) ;
return strResult ; //返回最优备份方案
}
}
六、系统优缺点
优点:①责任明确化、分工精细化、成果共享化、项目数字化、模型实例化、管理自动化。②建立标准化服务模式,离开信息孤岛和传统的政府衙门式服务方式,开创教育行业的“云服务”时代。模型建立好之后可以向多方面推广,如,横向推广至其他省市或纵向推广至本市其他应用。③为后期数据资源中心监控项目创造数据来源、数据接口和工作模式等有利条件。
可能出现的问题:①项目初期企业利益相对较少,有实力的技术团队不愿参与技术指导。②政策支持力度欠缺,新工作模式胎死腹中。③技术支持力度欠缺,MVC模式架设出现缺陷。
七、结束语
基于MVC架构的备份模式,是在数据及信息安全理论基础上的数据备份模型的尝试。它最大的优点就是实现了利用数学模型系统,建立了基于数据及信息安全理论的“MVC架构”备份模式,它代替了以往数据中心管理员的繁杂而低效地工作,它使得备份技术无需编写针对特定类型页面的分析器程序。它采用MVC模型化算法的数据及信息安全能力使此技术能够提供更加准确的结果。它提供给人们应用技术手段制定工作方法和策略的难题。
虽然它无法保证像编写分析器程序一样获取百分之百准确的结果,但它显著提升了数据中心数据及信息安全的准确性,从一定程度上弥补了以往我们在数据备份工作中的部分人为因素带来的缺陷,使人为的错误备份策略和备份中的错误率控制在一个更小的范围内。实际上,即使是人有时候也无法肯定目标页面的特定部分是否是有效文本。另外,这种技术的通用性使它拥有更加广泛的应用领域,未来有望应用于数据中心其他业务中。
参考文献:
[1]徐鹏,刘琼,林森.基于支持向量机的Intemet流量分类研究[J]计算机研究与发展,2009,46(3):407-414.
[3]赵俊阁.信息安全工程[M].武汉:武汉大学出版社,2008.
[4]王娟,慈林林,姚康泽.特征选择方法概述[J].计算机工程与科学,2005,27(12):68-71.
[5]许孟晋.张博锋.基于机器学习的Intemet流量分类.计算机应用(第30卷增刊1),2010(6).
[6]苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859.
[7]邹芳.信息系统安全等级测评方法研究[D].长沙:国防科学技术大学,2005.
[8]沈昌祥.把握焦点问题推进等级保护工作实施[J].信息网络安全,2005(2):23-25.
[9]骆斌.面向对象的数据仓库技术的研究[D].南京大学博士学位论文,1999.12.
[10]JI Zeng—rui,JING Qian—yuan.Establish information system answer for requirement of hierarchy protection[J].
[11]Jeff Heaton.Using JOONE for Artificial Intelligence Pr0gramming.http://www.developer.cam,2007-10-01
[12]吉增瑞,景乾元.建立符合等级保护要求的信息系统[J].信息网络安全,2003(1):8-21.
(编辑:王晓明)