Netflix利用大数据的三步法
2013-12-26编译秦建秀
编译 秦建秀
产生数据很容易—有效地使用数据则并不易。
在最近的一篇文章中,GigaOm阐述了Netflix所使用的复杂的数据分析方法,在最初实施的几轮分析中,已引起了激烈的争论,与每年生产超过50个实验的有线电视网相竞争,并同时取得了出乎意料的成功。就此我们可以看出,Netflix公司利用大数据的方式,可以在任何组织,无论小型企业还是大型企业,都可以进行复制。
收集正确的数据
大多数组织都有存储在不同地点的孤立数据,其实根本不曾使用。而从这些囤积的数据中获得任何价值的最好办法就是辨别哪些是可以用来描述理想客户的数据,以及客户最想要的是什么。例如,Netflix公司发现,75%的用户都会从公司推荐的清单中选择电影节目。因此,该公司的成功很大程度上取决于其能否推荐给观众恰如其分的建议。
尽管Netflix从来不愿意分享其绝密算法,但从下面的清单里我们仍然可以看看他们究竟收集了哪些信息,用来优化完善其推介系统:
●超过来自2500万用户的数据
●每天约3000万次的视频播放,而且跟踪电影播放过程中的每次快退、快进、暂停
●超过20亿小时的视频流
●每天400万次的评价
●每天300万次搜索
●地理位置数据
●设备信息
●每周、每天时段信息(Netflix公司已经归纳验证—用户平时观看更多的电视娱乐综艺节目,周末则更青睐电影)
●来自第三方的源数据
●来自Facebook和Twitter的社交媒体数据
Netflix公司充分审视分析自身服务,如捕捉视频的JPEG截图和时间信息。正如有线电视所提出的建议,“仔细斟酌多种因素,如声音、色调及场景,对于了解观众的喜好,非常有意义。”
确定合适的客户
使用公司所收集到的大数据资源,Netflix公司越来越善于为受众找到恰当的可供选择的推荐节目。GigaOm认为,搞清楚某些特定受众的喜好简直是太容易了。通过分析观众正在观看的节目——《监狱风云》、《火线》、《黑道家族》、《护士贝蒂》、《嗜血法医》或《单身毒妈》,Netflix公司的预测模型就可以很容易地找到相通的主题或元素,找到如出一辙的系列电视,甚至考虑到数据的误差,包括某些社交偏见。
开发更好的产品
Netflix的当前热播剧《铁窗红颜》横空出世,在首播的第一周,有显著数据的观众观看了更长时间的节目,超过之前其它任何一部。以后所有Netflix公司参与制作的节目都不得不选择了类似元素—一个以监狱为背景题材的黑色喜剧,这正是通过对收视行为趋势所做出的分析而得到的结论,热播电视的核心元素如“系列、监狱、犯罪、黑色喜剧以及女主角领衔主演”。
对视频的分析将大有作为,构成实现成功热播电视的必要元素。Netflix可以精确测量收集到在片头就被观众按暂停的时间点,进而该公司就可以制定出更多数据驱动的决策,如增加更多被观众重放的画面,去掉那些被观众快进或跳过的情节画面,以确保他们所推荐的片花内容可以立刻引人注目。
“有句名言我很欣赏—无法实施的创意只能是垃圾。”Netflix首席内容官泰德·萨兰多斯说。
对于大多数公司来说,大数据是一个全新的领域。随着数据量的增加,分析技术只会变得越来越时尚、精明;无论对于大型还是小型企业来说,都很难想象,一旦没有了数据所提供的承诺为基础,企业该如何运作决策。