APP下载

新常态下的灾备挑战

2015-04-25石菲

中国信息化 2015年10期
关键词:灾备异地数据中心

文 | 本刊记者 石菲

“在灾备领域,99%的努力+1%的幸运=真正的幸运,但这个1%的幸运跟我们之前所做的努力关系非常大。”海通证券股份有限公司信息技术管理部副总经理王洪涛说。

伴随着互联网技术的不断发展,网络可以说是已经渗透到千家万户,有网友调侃:“不吃饭可以挺7天不死,不喝水可以挺3天不死,没有网络,我现在就去死。”因此,伴随着对网络依赖程度的不断提高,互联网+背景下的安全,已经越来越引发大众的关注。

随着全球化的发展,世界每天都在变化。互联网的融入缩短了全球交流的距离,如今互联网+不仅带来了新的经济形态和新的社会、人文环境,随之而来的还有新的挑战和新的机会。

2015年伊始许多行业都曾出现过一些重大事故,对企业的业务发展和相关产品的用户造成了极大负面影响。在此趋势下,依托互联网+与新常态模式所带来的新发展机遇中,更需要业务连续性和灾难恢复管理为各行业的快速发展来保驾护航。

“互联网+”放大蝴蝶效应

在英国,每天银行自动清算业务系统的转账金额高达500亿英镑。2015年9月的一天,很多企业在发薪日突然发现,由于汇丰银行支付系统的瘫痪,有27.5万人的款项未能及时到账。银行自动清算业务系统是所有银行进行转账的主要方式,而这次系统的崩溃也就意味着与汇丰银行合作的单位无法支付员工薪资,无法支付账单或进行其他转账活动。许多受害者纷纷抱怨说无法支付自己的抵押贷款,而且更甚的是,账户里一分钱都没有了。务。对于企业而言,云灾备帮助企业减少投入,并得到了更高的服务水准。

在灾备领域,99%的努力+1%的幸运=真正的幸运,但这个1%的幸运跟我们之前所做的努力关系非常大。

随着互联网公司越来越多进入金融服务领域,其背后对业务连续性的规范需要也越来越凸显。

其次,企业自身对业务连续性越来越重视。随着互联网服务规模越来越大,越来越多的业务基于互联网之上,在用户和市场的压力下,企业开始对业务连续性越来越看重。

第三,互联网金融催生了更高的业务连续需求。众所周知,金融业的信息系统标准一直有明确的监管要求,而且严于其他行业。我国金融行业标准中的《银行业信息系统灾难恢复管理规范》对灾难分级、恢复时间有详细规定。中国银监会印发的《商业银行数据中心监管指引》也已经明确,总资产规模一千亿元人民币以上且跨省设立分支机构的法人商业银行,以及省级农村信用联合社,应设立异地模式灾备中心。而随着互联网公司越来越多进入金融服务领域,其背后对业务连续性的规范需要也越来越凸显。

异地多活成为共识

在今年5月份的宕机事故中,异地多活的系统架构成为业界一个重要的关注点。

在过去两地三中心的架构下,大家的普遍痛苦是建一个灾备中心容易,维护一个灾备中心太难了。在单活模式下,为保持生产和灾备中心的设备比例,需要不断的追加灾备的硬件投入,对于备份数据的有效性、恢复的及时性也要不断的进行验证演练,同时,出于对灾备切换之后的数据丢失风险的考虑,不到万不得已,企业是不敢贸然切换。因此,传统的灾备体系就和核武器一样,是最后一道防线,不得不建,但建完之后,维护成本非常高,能用到的机会非常少,投入产出比很低。

通俗地说,异地灾备一般是指部署A、B两个数据中心。A作为日常访问,B作为灾备。在A服务出现问题后,B首先需要进行数据核对,确保无误后才能启用。异地多活则是业务在多个数据中心上同时运行,当有一个或多个数据中心故障时,其它数据中心将自动接管所有应用业务。在这样的情况下,数据中心多活很自然的成为大家的追求目标,如果能和服务器集群一样,多个数据中心能同时提供服务,灾备中心也同时承载生产中心的职能,自然是最好的灾备解决方案。

对此,IBM全球信息科技服务部大中华区首席架构师业务连续性服务首席技术官苏卓举了一个例子,2年前一家位于欧洲的全球性企业被美资公司收购,在一年之内要求原本的全球2000家办公室要符合母公司的法律法规要求。同时由于用户分布在全球,希望在全球都有数据中心能够接入,不管任何一个数据中心出了问题都不会对用户产生直接影响。此外,由于新产品发布时业务量会激增几十倍,甚至在热销季节新产品推广后业务量可以差别130到150倍,对业务连续性提出了非常高的要求。

IBM为这家企业提供了混合式架构设计,在香港、阿姆斯特丹、美国达拉斯构建了全球三活数据中心结构。利用公有云提供跟用户数据相关的1200多个应用服务,用户数据和访问服务都存储在三个数据中心当中,无论任何一个数据中心出现大规模障碍,流量自动分流到另外两个数据中心。

由于在开始设计时就采用了标准化、开放的全球部署环境,在面临不同需求时,很容易进行相关调整。例如每个国家法律法规不一样,比如韩国对用户数据隐私要求较高,新加坡对于数据敏感性要求较高,要求所有数据处理时要全部加密。而由于底层IT技术提供的是标准化服务,根据不同国家的不同法律法规要求进行修改时非常容易。

还有一家金融企业在亚洲十几个国家拥有多个数据中心。在搭建灾备环境时不仅要面对不同国家的不同法规要求,还要考虑不同数据中心的硬件规模不同。IBM为它在香港和新加坡搭建了两个比较大的私有云结构,将这2个私有云变成双活结构,对内提供公有云服务。所以在业务连续需求下私有云的搭建也需要转型,使原来的服务结构更加标准化,更加虚拟化,更加自动化。

灵活化解存储压力

异地多活架构更加灵活,更加稳定,但面对几何倍数增加的数据,对存储增加了不小的压力。对此,苏卓表示,基于云的用户访问习惯虽然使得访问量激增,但有一个重要的特点是用户行为类似且非常同质化。“比如有30000个点击率,但其实这30000个人关注的焦点是一致的。对此可以采用基于云的多活模式,让数据更贴近用户端。将用户数据尽量放在离用户最近的部分,因为任何一个数据中心里用户最活跃的数据都是3天之内的访问。以新产品推出为例,也许在新品推出时数据量增长了80%,但这80%的数据都来自本地用户的访问。可以将相关数据进行整合后再备份,即在2、3天之后再将这些数据备份到其他数据中心。也就是说将用户数据第一时间进行分流,让活跃数据尽量留在本地。这里面会应用到新的互联网技术,如压缩去重、大数据拆分、读写分离等。对于传统的应用开发和架构来讲,也要做相应的改变。”

除了对存储造成的压力,庞大的架构,昂贵的费用也成为企业采取异地多活灾备架构的障碍。特别是对于中小企业用户来说,异地多活的架构似乎还离他们很遥远。苏卓认为其实云环境为中小企业实施灾备提供了更加便利的条件。“云计算提供的是标准化服务,并且自动增长,为分布式多活带来更多可能。我们在香港有一个金融用户,每年交易量超过十亿港币。但公司员工只有7个人,数据中心只有7、8台虚拟机。传统思维下这样规模的公司不太可能采用IBM的服务,但这家企业采用了IBM在香港和新加坡的数据中心服务,将北亚区和南亚区的业务分别部署到这两个数据中心后,在两地完全对等分别部署后形成双活架构。在一个数据中心发生问题后,另一边可以完全接管。云计算让小企业拥有了更便利接触多活架构的机会。此外,传统企业有更多历史包袱,转换思维反而没有中小企业接受新事物快,并且由于系统庞大,往往需要专业服务团队。而由于业务相对简单,中小企业在云环境下采取云服务使用服务商提供的模板进行选择即可,这也为中小企业搭建多活架构提供了便利。”

猜你喜欢

灾备异地数据中心
关于间接蒸发冷机组在数据中心中应用的节能分析
浅析数据中心空调节能发展趋势
图解跨省异地就医
异地恋——闭上眼睛,你就在我身边
黑皮精灵异地
2017第十届中国数据中心大会榜单
深蓝云海“云灾备”正式上线
共享灾备走向智能化
灾备建设的新思路
GDS将建19个数据中心