应用超融合架构 高效推进数字化转型
2018-01-27郭涛
郭涛
“超融合”的概念近几年风头正盛,不仅各路玩家集中推出相关解决方案,用户们也纷纷将更多目光投向这一能让IT基础架构简化增效的“新式武器”。
不过,任何新技术在被广泛接受和认可的过程中,都会充满波折与不确定性。当市场期待新技术能够解决燃眉之急时,也不免怀着隐隐的担忧与疑虑。
事实上,在超融合领域,已经有这么一批早期采用者正凭借超融合技术成功破解当前的IT架构难题,并在行业数字化转型中保持领先。
碧生源便是这样的开路先锋。
作为中国保健茶市场的领军企业,碧生源已拥有17年的信息化历史,然而随着碧生源近年来业务的快速发展,作为承载整体业务运营的信息化体系也亟待升级。从2016年下半年开始,碧生源开启了史上最大规模的信息化重构改造。
主管碧生源集团信息系统建设的副总裁张峻,在操刀系统改造的过程中发现,最严峻的挑战不仅来自于应用层面,还有IDC的扩容成本及维护复杂度正急剧增长。这曾让张峻感到措手不及,并意识到传统模式无法逾越的局限性,因此不得不寻求其他的替换方案。
此时,超融合技术进入了他的视野。那么,从起初满腹疑虑到最终拍板,到底碧生源经历了怎样的决策过程?碧生源超融合架构的探索之路又如何呢?
业务挑战来自哪里
谈及碧生源信息化的历程,张峻提到,碧生源在应用信息化的手段上还是比较早的。大约在 2009 年就已开始使用 ERP 系统,财务系统,生产线上使用扫码追溯系统,还有很多销售在使用的传统手机系统。
但在 2016年以后,这个系统就显得相对比较落后了,那时碧生源的业务就严重地受制于此。问题主要体现在两方面。一方面是应用。由于原先的应用设计基本上是基于每个部门的需求来开发的,所以各部门之间的割裂比较严重。另一方面是系统越来越集成,数据量越来越大。我们传统的底层平台,无论从网络(局域网、广域网),还是传统租用的 IDC 的存储能力、处理能力,都已经非常薄弱。比如,原来的机房分布在两个地方,一部分在外包租用的 IDC 里,一部分在办公大楼,条件非常简陋。所以原来业务经常中断,中断的时候业务部门就会出现混乱状态,出现问题时,IT 人员只能一个系统一个系统去查找原因,然后再解决。
所以从 2016 年下半年,碧生源就开始了大规模的信息化重构及重实施进程。因此,碧生源引入的一系列新应用对底层架构的支持也提出了更高的要求。在 2016 年年初,碧生源就预见到了传统的技术平台已远远不能适应2017 年的业务发展。所以 2016 年年底就开始设计新的IDC和服务器集群系统。
为什么选择超融合
对此,张峻表示,根据 2017年、2018年的业务规划,碧生源确定了底层系统扩容的需求。方案分为两部分,原计划只是扩容就可以,但是扩容完之后发现整个 IDC 空间并不够。所以为了完成系统扩容而必须先进行机房设备的扩容,这比实际系统扩容还要增加一倍的预算,时间上也差不多需要一年左右的时间才能完成。在这种情况下,碧生源才反复论证超融合这个实施方案。
重压之下,面对全新的概念和技术,碧生源在评估和选择超融合厂商上也经历了一段过程。在前期,有四五家服务商提供了相关方案,这四五家厂商当中涉及到超融合的大概有三家。其中,SmartX 是专注在超融合领域的,另外两家是既提供传统架构,也提供超融合架构。不过在方案的比较中,有的厂商提出超融合不太成熟,并不建议碧生源使用超融合方案,更多的还是考量传统架构。
然而,当时项目本身的计划预算已获得公司批准,业务已经启动,碧生源是在这个进展当中发现机房扩容反而变成了系统扩容必须先要面对的条件。如果设备机房扩容的投资、实施耗费时间都要翻倍的话,对碧生源来讲是很大的挑战。
在比较这三种方案时,虽然觉得超融合可能会存在未知的问题,但是对于碧生源当前阶段和规模来讲,应该是适合使用条件的。
在规模可控的前提下,碧生源评估了所有系统迁移和未来运营可能存在的风险,结论是超融合在一定阶段来讲是可以驾驭的。
在运行维护方面,针对传统架构,碧生源为了去维护整个网络、服务器、安全、数据库, 当初拟定要组建一个 3~5 人的运营团队,去运作升级好的平台。但实际考察超融合解决方案中发现,如果使用了超融合平台,其实并不需要这么复杂的运营团队。
不过,虽然已经决定采用超融合架构,当时碧生源还是没有太强的信心,所以也提出一个观点,就是不仅做技术论证,也希望进行实测。所以在最后四家方案当中,有一家听到实测之后就选择直接退出,另外两家很犹豫,实测的计划大概持续了将近一个多月,最后不能落地。但实际上在听到实测这个建议的时候,SmartX 的反应非常积极,所以虽然碧生源跟三家同时在谈实测计划,但最先落地的是 SmartX。
一开始,SmartX 就明确提出愿意参加实测,并用一周左右的时间在碧生源搭出了实测环境。在实测过程中,一是迁移方案,也就是即将上线的测试系统,二是运维的实际演练都进行了实测。部署实测环境大概用了一周,实测测了将近三周到一个月的时间。
从实测结果来讲,张峻提到,他們的实际感受比在当时做方案评估时的感受会更加落地和踏实。也正是基于实测,让他们最终下定决心认为超融合是完全接受和完全可以驾驭的一种方案。实测结果一出来,他们大概用了一周的时间就进入了项目实施。
最后的实施结果确实也和碧生源当时的预设极其接近。从真正实际设备到货到安装,计划迁移的系统在一周以内,就完成全部迁移。
超融合应用
显著提升系统性能
张峻表示,如今,他们更新之后的 ERP 系统、HR 系统、OA 系统、数据备份系统、数据分析系统,现在已经全部迁移到超融合体系里了。
在使用超融合以后,有了几个方面的进展。第一,业务连续性有了充分保障;第二,存储空间在原有空间内还有若干倍扩展能力;第三,原计划需要3~5 个运维人员来运行整个系统的维护,实际上只有 2 个人;第四,碧生源不再使用越来越贵的传统意义上的存储柜设备来存储数据。
关于应用超融合架构之后所获得的经验,张峻进一步解释道:“因为超融合是比较新的概念,从我们引入到真正上线的心路过程还是非常犹豫的。因为一个技术平台的调整对公司的影响非常大。但是,从我们实际使用来看,现阶段的感觉还是不错的。”
不过,张峻也认为,毕竟超融合还没有经历过 5 年到 10 年业务压力的长期测试。所以有几个因素可以考量。第一,在业务规模可控的前提下,对于需要快速上线、想尽可能简化运营的业务环境下,超融合是一个很好的方向和尝试选择。第二,如果规模很大,不一定非要把全部业务一次性迁移上去,可以在某些系统中先尝试。因为对超融合平台的驾驭、运营的驾驭,包括超融合系统对应用系统的适应能力,还需要一个过程。
另外,张峻觉得可能跟合作方有关系,所以碧生源为什么在开始特别强调实测,其实也是非常担心对于新的技术,服务商消化技术的能力和对用户最终提供服务的能力到底是否能够相匹配。所以,选择一个比较可靠的服务厂商,控制好初级的试用规模,可能是现在使用超融合非常重要的方法。endprint