APP下载

《纸牌屋》背后的大数据生产力

2014-06-17沈禄政

网络传播 2014年5期
关键词:纸牌屋数据类型纸牌

沈禄政

《纸牌屋》的原版是英国的一部迷你电视剧,Netflix买下版权,请来导演大卫·芬奇和老戏骨凯文·史派西在Netflix网络上做独播,首次进军原创剧集就一炮而红,在美国及 40 多个国家成为最热门的在线剧集。这部剧也是互联网从业者讨论的重点,不仅仅是剧集剧情和明星,而是其特别的诞生方式。

《纸牌屋》的诞生最重要的一个关键词是大数据。在任何一个国家的电视剧行业都没有什么是确定的。特别是美国这种竞争充分的市场,即便是找齐了金牌导演、实力演员和时下最流行的题材剧本,结果很可能仍然不受观众的待见。但在《纸牌屋》这部剧集上,Netflix通过业务所沉淀的用户数据判断用户喜好,成功催生了热门剧集。应该说《纸牌屋》的成功得益于 Netflix 海量的用户数据积累和分析。

对于《纸牌屋》剧集的播放,Netflix采取这样的策略——一开始就把整季内容全放出来,而不是以前传统美剧采用的周播制,以每周一集的方式吊足观众胃口。可能有人会质疑这样会剥夺观众等待剧集的乐趣。但Netflix的观点是,由于DVD 和网络剧集的流行,很多观众已经习惯了一下子就能得到整部剧集。总体来说,后者会让观众获得更大的满足感。这就是互联网用户的观看习惯。网络让用户有更多选择的同时,用户也期望得到更多。显然Netflix比其他的电视剧制作商更了解用户。也正是基于用户大数据的挖掘才让Netflix有更多的底气投入一亿美元来赌《纸牌屋》的成功。

如今的海量数据中,包括各种各样的数据类型,最常见的普通文本、照片、视频等等,还有像位置信息、链接信息等XML类型的数据。这些数据很难通过传统的技术手段进行提炼和分析。这是绝大多数企业面对大数据无所适从的主要原因,这也催生了企业之间的跨界合作,即便是Netflix也不是独立完成所有的数据挖掘工作,也有赖于Amazon的协作。依靠Amazon,Netflix每天可以分析超过3000万条播放记录,包括用户在何时、何地、何种设备上观看什么内容,用户给节目添加的恐怖、必看等个性标签,并在记录暂停、倒退、快进、评分、搜索的同时,进行大量截图,试图分析用户在音量、画面色彩甚至场景选取上的喜好。

大数据时代不可抗拒,应该是毋庸置疑的,但对于绝大多数企业来说大数据本身仅是一个空泛的概念,不仅难以参与,更难于控制。大数据与传统的数据分析有很大的不同,它有四个特点:第一,数据体量巨大,从TB级别跃升到PB级别;第二,数据类型繁多,网络日志、视频、图片、地理位置信息等等无所不包;第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒;第四,处理速度快。这都和传统的数据挖掘技术有着本质的不同。

大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是拥有大量的数据。这个全局数据的时代很快就会来临,现在所要做的就是拥有并尊重数据。endprint

猜你喜欢

纸牌屋数据类型纸牌
详谈Java中的基本数据类型与引用数据类型
天狗送的纸牌
纸牌塔的无限可能
灵活猜纸牌
如何理解数据结构中的抽象数据类型
纸牌屋
范畴数据类型上的子类型*