APP下载

快照管理充当“中场球员”?

2016-03-14董剑波

软件和集成电路 2016年2期
关键词:快照中场运维

董剑波

在数据管理这个球场上,核心系统需要主机和存储架构在第一线冲锋,而当前锋出问题的时候,则需要可靠的中场随时防守和反扑;归档和备份技术则是最为可靠的后防线。

IDC最新调查显示,企业宕机1小时会带来8,220美元到25,600美元的损失 。从这个角度来说,数据恢复可谓一项争分夺秒的激烈比赛。而快速的数据增长和日益增多的虚拟服务器正在生成海量数据,传统的恢复模式已经无法适应关键的业务需求。

数据恢复需求日益凸显

在数据恢复中,除了大家熟知的灾难修复,还有一种对IT管理员来说最常见但可能也是最耗费精力的恢复工作—日常运维中的数据恢复。

日常运维中的数据恢复工作主要集中在为业务部门准备数据、恢复校验,或者应对硬件错误/软件错误/人为错误等。这类数据有两个显著特点:次重要保护级别,且数量很大。因此,企业很少会像保护Tier0/1数据那样也为此类数据提供昂贵的存储级别复制方案。在整个系统中,不同层级(比如应用层、存储层、网络层)有不同的恢复方法,但都存在明显不足:

·效费比不高,难以覆盖除Tier0/1以外的系统—一些数据库应用级别的高可用复制,需要高昂的授权费用,因此并不适用于重要保护级以下的系统。

·人工密集型操作,自动化水平/效率不高(难以满足SLA)—基于数据库或基于应用级别恢复时操作复杂,往往需要数据库管理员大量重复性的工作。

·针对日常运维对应的备份窗口和恢复窗口,难以全面满足业务需求(RPO<24hr,RTO<6-8 hr)—海量数据的增长和日益缩小的应用恢复窗口,给IT管理员带来巨大挑战。

·单点方案,难以综合管控、分析和报告等—几乎在整个OSI 7层都有不同的恢复方案,而从管理层角度来看,这些单点方案无法针对日常运维业务需求进行系统地分析和流程管理。

·难以标准化/服务化,整合到自服务框架中—目前日常运维中有很多复杂的恢复工作,很难被纳入IT整体框架中,实现标准化和自动化。

因此,各种规模的企业都需要采用一种或几种混合方法,来增强数据保护,提高恢复性能、易管理和可靠性,且无需大幅增加成本。针对这些挑战,快照管理技术凭借其高效恢复和自动化特性,全面满足不同业务,尤其是日常运维中的数据恢复需求,并逐渐成为业界的一个重要趋势。

与传统数据恢复技术相比,快照管理由于在存储内部进行,而且是原生格式,省去了格式转换过程,因此恢复速度更快,从而最小化了数据恢复行为,对生产层系统性能的影响。根据Gartner调查显示,目前快照管理在全球的占有率约为7%,到2016年将会有20%的企业采用单纯的基于快照和复制的备份技术,两年内年增长率将达100%。

快照管理充当何种角色?

快照管理的设计,是在传统数据保护层中加入一层基于企业主存储的快照层,从而保留多个版本的历史数据。通过对这些数据的挖掘和应用,IT人员可迅速响应企业生产层的恢复需求,同时在几乎不影响业务系统主机性能的情况下,利用快照层做长期留存。形象地快照克隆的作用相当于数据管理系统的中场球员,进可攻、退可守。在数据管理这个球场上,核心系统需要主机和存储架构在第一线冲锋,而当前锋出问题的时候,则需要可靠的中场随时防守和反扑;归档和备份技术则是最为可靠的后防线。当前锋(双机/双存储)不能解决数据恢复问题(比如出现逻辑错误或人为错误)时,IT人员就可以使用中场球员—快照技术回滚到历史最近的时间点,快速进行数据恢复。作为完整的数据管理解决方案,往往需要多种技术的结合使用,就像足球场上的一个团队是一样。

智能快照管理方法如何运用?

CommvaultIntelliSnap智能快照管理是Commvault基于快照技术的一套现代快照管理方案,通过跟存储厂商API的结合,来触发、调用、编排存储硬件本身的克隆或快照功能,最终实现自动化的快照管理。例如,如果企业使用HDS高端存储作为其核心系统的在线存储,且购买了HDS的克隆或者快照授权许可,CommvaultIntelliSnap智能快照管理就可直接通过Commvault软件界面,进行一些图形化的设置,来调用存储提供的API,实现快照或克隆管理。

IntelliSnap智能快照管理完全基于软件,因此拥有广泛的存储兼容和层级兼容,客户无需进行硬件绑定,也不需要在存储层或主机层进行架构的改变。另外,由于通过在同一个在线平台上的零脚本、一键式操作,CommvaultIntelliSnap智能快照管理可以保证业务的一致性,也大幅降低了操作的复杂性和人员成本。

值得注意的是,CommvaultIntelliSnap智能快照管理不仅支持使用传统的Copy On Write,而且也支持中高端存储流行的Copy After Write技术,即:将IO直接写入Cache返回,再异步复制变化数据到快照区,省去了前端主机的等待时间。来自业内专家的量化对比显示:传统的Copy On Write快照技术会对整个主机延迟增加10%到15%左右,而Copy After Write技术,只要在Cache空间足够的情况下,基本上对主机性能没有影响。

Commvault中国区技术总监蔡报永强调快照管理是企业应对IT系统逻辑错误的重要手段。“我相信中国用户在容灾方面其实投资了很大,特别是在一些所谓的物理故障方面。但他们在逻辑错误的防范上面,可能相对投入的并不够。

而在整个灾难方案当中,逻辑故障其实占了更大一部分,我们希望Commvault智能快照管理能够作为逻辑灾难防范的补充,帮助企业在发生逻辑错误时进行快速的数据恢复。”

猜你喜欢

快照中场运维
基于GPS的电力运维轨迹定位系统
IT运维管理系统的设计及应用
巧破困局,快速恢复本本活力
注册表拍个照 软件别瞎闹
啪!一个瞬间讲述一个故事
让时间停止 保留网页游戏进度
电子政务甲方运维管理的全生命周期