把脉世界杯热点
2014-08-21涂兰敬
涂兰敬
2014年巴西世界杯赛场上的每一粒进球都牵动着数亿中国球迷的心。对新闻媒体来说,最重要的就是及时发掘热点话题引起球迷的讨论。通过IBM社交大数据分析系统的深度挖掘,腾讯得以把握世界杯期间每个阶段的热点。
2014年巴西世界杯已经渐渐离我们远去了,但中国球迷仍然在社交媒体上谈论着各种感兴趣的话题。虽然中国队没能参加本届世界杯,但是这似乎丝毫没有影响中国球迷的热情——他们通过社交平台和工具发出自己的声音。
7月7日,腾讯曾经根据中国球迷支持率公布了一份本届世界杯四强名单。现在看来,这份名单让我们感到十分吃惊,因为它竟然与本届世界杯最后的比赛结果完全吻合:德国队获得冠军,阿根廷队是亚军,荷兰队是季军,巴西队只获得了第四名。
在这里,“群众的眼睛是雪亮的”这句话再次得到了验证。事实上,这份四强名单是根据6月15日到7月7日这段时间里中国球迷对所有球队的支持率里统计出来的,而幕后的功臣就是IBM社交大数据分析系统。
腾讯携手IBM挖掘世界杯热点
每逢世界杯,各大网络媒体的编辑都会挖空心思去寻找球迷最感兴趣的话题。本届世界杯与社交媒体的高度融合,让球迷的心声能够在社交媒体上得以释放。编辑可以凭借多年的经验去感知话题,但是现在在巨大的社交大数据里寻找信息源变成了一件非常耗时耗力的事情。
2014年巴西世界杯期间,腾讯与IBM正式合作,将所有中国球迷在社交媒体上的声音进行汇总分析,得出本届世界杯的实时热点,为腾讯的编辑提供报道所需的全新信息源和话题来源。
在本届世界杯的社交大数据采集过程中,IBM并非只是简单地统计网民点击“支持”的次数,而是深层次挖掘球迷的真正心声。例如,有很多球迷支持阿根廷队,但是不一定会直接说:“阿根廷加油”,可能会说:“荷兰再强也比不过我阿”。球迷这样的观点,会被IBM社交大数据分析系统看作是对阿根廷队的支持。
通过IBM社交大数据分析系统提供的分析数据,腾讯发现,每一个球迷的性格与其所喜欢的球星性格有着惊人的相似度。为此,腾讯与IBM联手绘制了中国球迷中人气最高的十大球星球迷的性格画像。以阿根廷队的球星梅西为例。根据分析,喜欢梅西的中国球迷性格特征是敏感、玻璃心、有条理和具有宅男宅女型的气质。
在这个关联关系中,我们似乎也明白了一个道理:喜欢一个人不是无缘无故的。通过IBM社交大数据分析,腾讯能够解读每一位存在于网络另一端的球迷的性格特征,这对商家来说是一个非常有价值的发现。
同时,IBM还发掘出很多热词,为腾讯的世界杯报道提供主题和方向。例如,本届世界杯1/8决赛阶段,IBM社交大数据分析系统捕捉到一个最热的词语“门神”。究其原因,IBM发现,进入1/8决赛阶段,很多场比赛都是通过点球决定胜负。因此,门将直接决定了一场比赛的胜负。随后,腾讯就策划了四大“门神”的主题文章,吸引了大批网友的互动和评论。据腾讯统计,在世界杯期间,腾讯发布的32篇热点赛事文章都是基于IBM社交大数据分析得出的结论。
在总结IBM社交大数据分析工具给腾讯带来的价值时,IBM大中华区全球咨询服务部高级经理郭树勇表示,它大大降低了腾讯编辑的工作强度,让他们能够在一场比赛结束以后,及时获得全新的信息源和更多的热点话题,让编辑只需要加入一些观点就可以快速撰写出一篇受多数球迷关注的文章。
IBM中国研究院亲自操刀
一般情况下,一家公司的研究院不会直接与客户接触。但是在与腾讯的合作中,IBM中国研究院不仅冲在最前线做客户的需求分析,还负责该项目的实施和运维。
“IBM中国研究院的角色正在转换。”IBM中国研究院信息分析研究部研发总监苏中表示,“与其他研究院不同,我们特别强调技术的实用性。在IBM社交大数据分析系统在各行业推广的过程中,我们经常主动去见客户。IBM希望研究院所研发的产品和技术能够真正给客户带来价值。”
如果按照传统的项目周期来算,与腾讯合作的这个项目至少需要6个月的时间。苏中表示,IBM中国研究院与GBS团队一起做规划和部署,以小时为单位推进工作进度,在极短的时间内就在腾讯上线了IBM社交大数据分析系统。连腾讯的人都很惊讶,IBM能够在这么短的时间内成功搭建起这套系统。
苏中看到,有网友发帖子说“别人在熬夜看球,我们在熬夜看看球的人”,他转发这条微博时评论:“我在熬夜看那些看看球的人的人。”IBM中国研究院不仅负责实施,还参与了项目的运维。为什么IBM中国研究院还去做后期的系统运维呢?苏中表示,研究人员在系统运维的时候能第一时间发现问题并及时解决问题,同时这些问题日后将成为很好的研究课题。
不过,随着世界杯进入中段,该系统运行正常化之后,IBM中国研究院研究人员熬夜的次数就逐渐减少了。在该项目中,IBM中国研究院用到了很多新技术,苏中表示,首先通过“实体分析”判断社交媒体上内容是否与世界杯相关;其次,通过“深度情感挖掘”判断内容质量——评论的好不好和哪方面好。
事实上,IBM中国研究院希望达到的目的是:计算机能像人一样理解语言表面和背后隐含的信息,即机器的语音、语义分析。
在分析为何IBM与腾讯此次能成功合作时,郭树勇认为,一方面源于IBM中国研发团队和CRL研究团队对IBM社交大数据分析系统引擎的支持,另一方面也因为得到了SoftLayer在IT基础架构层面的支持。
SoftLayer的公有云服务为社交大数据的抓取提供了最直接和最有力的原动力。IBM大中华区全球信息服务部云计算服务总经理余忠宁表示,社交大数据都是实时的、动态的数据,甚至每一秒钟对运算资源的需求都不一样。SoftLayer可以根据系统访问量的动态变化,提供可视化和动态扩充的运算资源,满足系统的实时性要求。
小试牛刀
IBM研究院研究语音技术近50年,研究图像技术大约40年。因此,苏中表示,IBM在图像、视频、语言、文字、语音等非结构化数据领域拥有非常成熟的技术。现在,IBM希望创造更多机会把这些新的技术应用到更多行业中,而社交网络为IBM提供了一个绝佳的平台。
在解读IBM社交大数据分析系统的架构时,郭树勇表示,IBM社交大数据分析系统是一个非常成熟的引擎,未来需要做的是,一方面还需要从算法上进行不断的优化,另一方面需要将各种特征的应用与之进行融合。
郭树勇表示,从价值链的角度来看,IBM社交大数据解决方案已经可以为企业提供一套全方位、全生命周期的服务:收集企业及其市场的信息为企业预警;收集客户反馈的信息来影响客户的购买心态和提高客户关怀度;收集企业的产品和服务信息改进产品的设计,进而影响服务流程的改进;收集企业的市场和公关活动信息以帮助企业提升品牌和信誉;甚至还可以通过精准的数据分析直接影响到企业的销售业绩。
如此看来,与腾讯的合作,对于IBM社交大数据分析系统来说,只是小试牛刀,更大的价值将会陆续在各行各业的应用中展露出来。据记者了解,目前,国内已有多家企业主动与IBM联系,开始深入了解IBM社交大数据分析系统的商用价值。endprint