Autonomy非结构化数据处理优势显现
2014-08-11邱燕娜
邱燕娜
在结构化数据处理变得越来越重要的今天,在非结构化处理方面具有显著优势的HP Autonomy的价值逐渐凸显。在惠普推出的新一代大数据平台HAVEn中,Autonomy新一代信息平台HP IDOL扮演着非常重要的角色。
惠普对Autonomy的收购曾经饱受争议,但是不能否认的是,HP Autonomy在惠普大数据战略中的地位越来越重要。在7月4日举办的媒体沟通会上,惠普软件集团Autonomy信息分析部副总裁兼总经理Rohit De Suaza和惠普中国区副总裁、惠普软件集团大中华区总经理于志伟详细介绍了Autonomy HP IDOL在惠普大数据战略中的重要意义和最新进展。
大数据下的机会与风险
这是一个不能不重视大数据的时代。于志伟认为,大数据蕴含着机会,也蕴含着风险,企业即便不能利用大数据来提升竞争力,也要避免因为没有处理好大数据而蒙受损失。
加拿大歌手Dave Carroll乘坐美联航航班从加拿大哈利法克斯前往美国内布拉斯加时,他那名贵的吉他在托运过程中被美联航的行李运输工摔坏。历经九个月后,Carroll索赔未果。无奈之下,Carroll制作了一首名为《美联航摔坏吉他》的音乐视频并上传到Youtube上。没想到这个视频在短短10天内就获得了近400万人次的点击量,成了互联网上最红的视频之一。美联航为此付出了惨痛的代价——股价暴跌10%,还被数以百万计的人指责。在这个时候,美联航不得不乖乖地给Carroll赔偿。
“我们都了解大数据很重要,但是很多企业都不知道怎么有效利用大数据。”于志伟以这个知名的大数据案例来说明大数据给企业带来的挑战。他同时通过这个案例指出,非结构化数据将变得越来越重要,对企业决策产生的影响越来越大。
处理非结构化数据优势显著
正是在这一背景下,各大软件厂商都推出了大数据平台或者大数据解决方案,以免错过当前的大数据发展良机。
为了强化大数据战略,惠普于去年推出了新一代大数据平台HAVEn。据了解,HAVEn平台实际上是一个惠普大数据产品的组合,它整合了HP Autonomy、HP Vertica、HP ArcSight 和惠普运营管理的技术和产品,还支持Hadoop等。
于志伟认为,HAVEn具有两大特性:一是开放性,二是能够处理100%的信息,其中包括结构化数据、非结构化数据和半结构化数据。其中,在处理非结构化数据和半结构化数据方面具有很大优势的HP Autonomy 发挥了非常重要的作用,其代表产品是新一代信息平台HP IDOL。
Rohit De Suaza强调,HP IDOL可以直接输入和分析任何类型的数据,包括社交媒体、电子邮件、视频、音频、文本和网页等,而且这些资料可以来自任何系统,如微信、微博和传统的企业应用系统等,而其他厂商则需要将这些数据移动到数据仓库后才能进行分析。
“在信息爆炸式增长的时代,如果要把海量数据移来移去后才能发现其价值,成本和难度就会大幅增加。”谈到HP IDOL的优势,Rohit De Suaza指出,HP Autonomy具有专有技术,只要拥有访问权,只需通过连接器就可以连接到400到500个系统中去进行分析。
循序渐进推进大数据应用
“如果公司想一下子就对所有信息进行大数据分析,那注定是要失败的。”Rohit De Suaza认为,企业部署大数据不能一蹴而就,而是要一步一步行动,逐渐完善。他建议,企业应该从充分挖掘之前没有好好利用的数据的价值开始做起,逐渐扩大数据范围。
比如说,汽车厂商可以通过挖掘社交媒体上的信息发现刹车片等存在的问题,提前两三个月行动召回相关的产品,就能避免很多损失。
Rohit De Suaza补充说,对于企业来说大数据只会变得越来越重要,涵盖的环节会越来越多,因此企业在选择大数据平台时,应该注意到这个平台能否涵盖大数据应用的各个环节,以满足企业未来的大数据应用需求。Rohit De Suaza指出,惠普可以从技术到软硬件产品,再到服务,全方位帮助企业不断完善大数据战略。
最近惠普还推出了下一代服务IDOL On Demand,这样开发人员就可以将先进的处理功能嵌入到企业的应用系统中,并通过预览查看服务效果。
进一步强化非结构化数据分析
值得一提的是,惠普近日推出了IDOL的新版本IDOL 10.5。IDOL 10.5强化了与HP HAVEn大数据平台的关键组件的集成,其中包括HP ArcSight、HP Vertica和Apache Hadoop等,大幅提升了HP IDOL的分析能力、可靠性和易用性:
第一,可靠性提高。HP IDOL 10.5更加稳健可靠,比如,具备更好的资源管理与检测功能,可实现系统从故障中智能地恢复等。
第二,具有更高的可管理性。HP IDOL 10.5改进了HP IDOL Admin控制台,大幅简化了映像服务器接口,支持异步查询支持,改进了压缩机制,通过差异化备份与时间点恢复带来更灵活的备份体验。
第三,具有更优越的能力。这主要体现在针对关键云应用软件和系统的新接口、通过精确的情感评分改进情感分析、针对具体业务使用案例的全新预定义实体、强化的音频和图片分析、更高的查询性能,以及动态结构化数据分析(允许虚拟分析域的移动中定义)等。
来自惠普的资料称,HP IDOL与HP HAVEn的主要组件集成使得不同规模的企业都能利用大数据来获得竞争优势。其中HP IDOL for Hadoop在某种程度上把Hadoop从传统数据存储仓库变成强大的智能分析平台,从而让用户从PB级的数据中获得洞察。该产品通过把HP IDOL强大的情感分析、集群和实体抽取等功能嵌入Hadoop节点,进行先进的客户、安全、运营分析等。
链接 Autonomy部分应用案例
阿富汗安防应用
在阿富汗某个比较敏感的地区,有关部门在离地面约1.6米高的气球上安装了摄像头,并借助IDOL分析画面来找出异常现象。2012年的平安夜,系统在发现有两辆车先后沿着公路开到同一位置转向绕行离开后,自动发出警告。后来有关部门派人去现场调查后,果然发现恐怖分子在公路上埋了炸弹,绕行的是当地车辆,因为当地人知道恐怖分子的行动。HP Autonomy的视频分析因此避免了恐怖分子攻击带来的死伤。
美国纳斯卡汽车赛事互动
非常受欢迎的美国纳斯卡汽车赛,主办方非常关注粉丝的情感变化。主办方会在一个中心实时监测所有粉丝发布的涉及纳斯卡赛事的推文。在一次赛事中,因为发生了撞车事件,导致所有电视停止直播。当时很多粉丝看不到直播,发推文表示不满。而现场的一些粉丝通过手机上传视频到推特上受到追捧。主办方通过系统及时发现故障,并快速恢复直播。
自动聚合新闻网站
内容丰富且类别清晰,全球热点新闻一个不落的新闻网站,却不需要任何一个编辑、记者?是的,这个无人值守的网站的服务器位于英国剑桥,内容由HP Autonomy通过抓取各大新闻网站信息自动聚合而成。据悉,HP Autonomy可以聚合各种语言的新闻网站。endprint