IBM: 企业级数据分析大不同
2015-12-24张贝贝
文 本刊记者 张贝贝
IBM: 企业级数据分析大不同
找准企业级数据分析的特点,提升企业数据分析能力,才能将大数据应用落到实处,使得大数据分析方案真正做到“为客户所用”。
“我们在大数据领域的定位不是拥有数据,而是让企业的数据‘唯您所用’。近年来IBM在全球通过战略收购、研发等举措大幅投资于CAMS等战略新兴领域,包括大数据、云计算、移动互联、社交、信息安全等,通过这些举措将IBM在未来不断地打造成更新的公司。随着在中国的客户需要创新的速度不断发生改变 ,IBM的战略也发生了很大改变,从为中国制造‘Made for China’变成‘Made with China’与中国一起创新。”在近日举办的IBM Insight 2015大数据分析峰会上,IBM大中华区首席执行总裁钱大群传递着IBM的不断转变。
大数据分析与雾霾预估
环境保护是关系国家、政府、社会民生的重要议题,特别是人们对雾霾的关注程度已经到了一个前所未有的高度,如何防治雾霾,让每个人呼吸新鲜的空气已经成为一个必须解决的问题,那么科技如何为雾霾的治理提供帮助呢?2014年,IBM推出了一个长达十年的计划——“绿色地平线”(Green Horizon) ,这项计划的主要目标是利用IBM的大数据分析和认知计算科技,提升对于雾霾的预估能力,进行北京地区的雾霾预报和应对建议。
据钱大群介绍,目前这个项目已经将雾霾的预报时间从之前的24小时提升到72小时,精度从之前的100平方公里提升到1平方公里,将能够为首都地区最终应对雾霾挑战提供重要支持。这里面将收集到的不同数据进行整合,包括监控单位的数据、卫星的数据,再通过不同数学模型及IBM的认知能力,使得不同的模型能够达到最优组合,这一过程也使得人们慢慢对雾霾的认知、预估、应对能力不断加强。“越有好的预估能力,对任何的判断和决定就将更有效,而任何事情判断和决定事实上都是很大的社会成本,IBM希望做到帮助客户、企业或者个人能够拥有这种能力。”钱大群说道。
关于具体的细节,IBM研究院资深研发总监张盟给出了详细的说明:“为了改善重大会议期间的空气质量,IBM协助相关机构为京津冀地区搭建了高精度三维网格模型,这一模型可以清晰呈现未来三天的空气质量状况,每半径一公里的单元都会生成自己的空气指标读数。”这个平台背后是海量数据的分析。举例来说,这些数据包括了地面传感器收集的数据,涵盖北京市及周边省份,河北、山东、山西、内蒙,可以反映出污染源来自于哪里,到哪里去。而污染还包括了输送的监测,在输送过程中,风往哪里吹?会不会下雨?这都会对污染产生很大影响。“而IBM提供的是,通过大数据分析把这些数据都收集起来。另外,通过认知计算把我们对这些数据的模型模拟结果,或者一些历史结果收集起来,为政府或者企业管理者提供决策支持。”张盟分析道。
企业级数据分析有特色
IBM对准的企业级用户的大数据分析与针对个体的大数据分析又有哪些不同呢?对此,IBM中国开发中心信息管理总经理朱辉认为,企业里对于数据的留存都是有顶层设计的,在企业的数据仓库存放数据与在Hadoop里面存放数据有很大的不同,数据仓库是先把房间建好,格子先放好,放好之后标明每个格子都存放哪些数据,剩下的工作就是往格子里面放数据,这个顶层设计的好处就是你处理存储的数据就只存你有用的东西,在处理数据上面也会显得更高效,因为不需要处理那么多的数据。在企业里面有一句话叫no data is garbage,我要存下来的都是已经预先想好的。
相比于企业在系统内部分析数据,互联网上的大数据分析都是跨界分析,比如淘宝上根据购物客户的年龄、消费习惯、购买的物品,会推测这个人最近的动态,可能是在装修,可能是在准备结婚,由此分析来做针对性的精准营销。但是企业级大数据分析的关键点更多的体现在:技术上、流程上、顶层设计上,如何能够充分地打破数据壁垒做到整合分析,这方面的创新性思维现在企业还是比较欠缺的,其中有一个很重要的原因是,企业里并没有这么一个人,能够站在一个超脱的高度,统筹地来看企业内部的数据资源,然后思考这些资源整合在一起做分析的话会带来什么新的价值。
对此,上海宝信软件股份有限公司研发部总经理董文生表示十分赞同:目前企业里的数据往往都是预先结构化设计好的,这带来的问题是如果想做新的尝试和改变,却没有数据来支撑你来做这件事情。这也是很多企业遇到的实际问题,也就是现在数据量很大,但单体数据价值很小,如果合起来做一些挖掘和分析之后,它的价值才能释放出来,而这个也是企业需要不断去适应和接受的思路,对于企业来说也确实要有一个过程。
成为“D世代企业”
通过大数据的引领,落实“与中国一起创新”的战略成为IBM开年的首发选择,这是因为IBM认为目前的市场已经清楚的在传递一个信息:即数据对一个国家、一个企业、一个行业或者个人都已经变成很重要的资产。IBM的定位是协助企业或行业更好地利用这些数据并透过科技转型的能力,提升客户的数据分析能力,使得数据变成Insight(洞察)唯客户所用。
IBM通过调研发现,目前使用数据变成最有竞争力、最成功的企业为“D世代企业”。也就是说如果把企业分四种的话,第一种是用传统的手段处理企业级的数据,比如生成一些基于结构化数据的报表等;第二种企业不只是对企业里面来自ERP、CRM这样的业务数据进行处理,还了解如何把社交媒体的数据引如企业进行分析,但是处理数据的能力并没有走到最前端;第三种的企业是对企业级外面的数据,包括社交媒体、移动终端的数据能够比较好的掌控和分析,但是对于企业级数据的预估能力、判断能力并没有很好的技术手段;真正成功的企业是“D世代企业”,这类企业不仅能处理分析好企业内部数据,还能把社交网络、物联网等其它外部收集的数据联合使用,调研也显示这些企业的平均市场份额、成长速度、获利能力,以及客户的满意度比前三种更高。
然而想成为第四种企业,必须具备更多的行业转型和数据的分析能力,对此,IBM全球Analytics Platform副总裁Scott Sampson表示,“从IBM的分析来讲,我们有能力为行业提供转型的能力,而且这些转型正在发生,如电信行业、银行业、汽车行业,所以IBM不只是分析市场的参与者,IBM正在塑造这个市场,并通过自己的创新来推动。”
他进一步强调到:首先IBM在过去两年内,收购了30家具有最好技术能力的企业,并把他们组合起来帮助IBM推出最好的分析产品来适合市场以及客户的需要。其次,可支持不同的职位,无论是分析师,还是IT专业人士或商务人士,IBM都可以让客户有这种能力,并在工作的每个阶段都能实现这种能力;最后,IBM正在推动使用数据的转型,这些数据,有来自社交媒体的数据、也有来自核心业务的数据,如何使用和集成这些数据得到最好的业务成果,这是IBM所做的事情。