谷歌的预测
2014-04-29
数据积累大到一定规模,就具备了生命体特征,无数隐藏在碎片事实之后的线索和规律,通过科学算法的提炼,就会变得无比强大。
7月5日凌晨,身为资深德国球迷,体验了一个欢快的夜晚。是役,德国队1:0击败法国队,连续四届挺进世界杯四强,创造了一项新纪录。
同时,笔者也长長出了口恶气!此前谷歌说,法国对德国的胜率高达69%,多少让德粉揪了一把心。之所以揪心,乃是此前谷歌对十六强的赛果预测——竟然全对了!
这个基于谷歌云计算平台的大数据挖掘和研究系统,基础数据来自Opta Sports,评估每个职业足球联盟过去多个赛季的情况,以及世界杯小组赛期间的统计数据;加之BigQuery工程师乔丹·提加尼开发的实力排行榜系统,同时参照观众热情程度数据,以计算预测世界杯淘汰赛阶段的每场胜率。
当然,对十六强赛果的准确预测,并不能说明太多问题,连谷歌自己也承认,“16强赛中没有冷门出现”,并且“不是唯一做出完美预测的公司”。
实际上,长期使用大数据进行体育赛事预测的,以博彩公司为首,否则无法支撑确保庄家稳赚不赔的赔率精算。另外,还有足球发达国家的足协、各大职业联赛的豪门俱乐部热衷此道,那是为了系统对每场比赛进行科学指导。无独有偶,就在7月4日的SAP论坛上,笔者就亲身体验了其与德国足协联合开发的Match Insights方案,远在巴西的德国队正在使用该系统,对每一场比赛、每一个球员、每一次跑位和传球的数据进行监测、汇总、计算、分析,辅之以可视化的3D全景界面,甚是直观。
数据积累大到一定规模,就具备了生命体特征,无数隐藏在碎片事实之后的线索和规律,通过科学算法的提炼,就会变得无比强大。足球如是,电影亦然。谷歌曾在去年发布《Quantifying Movie Magic with Google Search》报告,通过电影正片开画前一个月电影预告片在谷歌的搜索行为等数据,与该片档期和观影周期进行对比能够预测该片首映周末的票房收入情况,准确率高达94%。
根据已知,探索未知,大数据是个好手段。更重要的是,开放的互联网为每一个普通人都提供了撬动支点的可能。从谷歌到亚马逊,再到国内的B.A.T,云计算已不仅仅是高大上的稀罕玩意,而是一种实实在在的平台能力输出,从企业到个人,只要接入平台,就可以获得相应的云计算和大数据能力。
这时候,能否具备充分的技术自觉,利用云计算开放平台的机遇,结合自身行业特点和应用特征,建立相应的大数据模型,挖掘潜伏着的运营规律和商业线索,决定了在互联网思维时代的竞争力。
目前,正如火如荼搞这个的有两个行业。其一是O2O,线下商家尤其是大型百货商场,在经受过数波电子商务的席卷后,转型情势之迫切,毋庸多言;其二是传媒业,这个几乎已经被互联网彻底颠覆的行业,面临的是比商贸物流业更加严峻的生死之局——新技术和新产品层出不穷,面对利用数据分析进行“内容搬运”的“今日头条”们,传统媒体除了祭出版权大棒争取正当权益,更重要的是自己要拥有这种大数据时代的能力,才能避免陷入日复一日的被动。
不过,回到世界杯最后的四场比赛,笔者还是希望大数据预测不要再“显灵”了。毕竟,圆的足球才有趣儿,不是吗?