数据的变革与电影的发展
2019-07-14太原师范学院文学院影视艺术系山西晋中030619
⊙赵 鹏[太原师范学院文学院影视艺术系,山西 晋中 030619]
纵观电影史,技术的进步一次次地推动电影的发展,带来了新的主义与新的浪潮,产生了新的流派与新的体验。近些年以来,“大数据”一词在各个领域都异常的火热。在新闻报道中会不断地出现,例如“某某产品利用大数据改良了新的产品”,“某某行业利用大数据产生了新的模式”等类似的消息。对于电影行业来说,大数据更是被捧得火热,很多人对其视如珍宝,但被视若珍宝的大数据有时却让人们大跌眼镜。
一、被绑架了的“大数据”
2013 年被业界称之为“大数据元年”,自此之后大数据这一新兴的媒介技术便被影视行业所深度裹挟。2014 年百度公司与中影股份、中信信托和北京德恒律师事务所联合发布了国内首个电影大众消费平台——百发有戏。一期产品选定由汤唯、冯绍峰主演的影片《黄金时代》。选择《黄金时代》作为一期产品,除了考虑到该片的题材以及豪华的主创班底外,也充分利用了百度即将上线的票房预测产品提供的数据支持。当时百度大数据部产品规划负责人表示,从即将上线的百度票房预测数据可知,电影《黄金时代》的票房有望一路飘红,预计票房为2 亿至2.3 亿,但实际票房仅为5000 多万,预计票房与实际票房相差达到了75%之多。在电影《后会无期》上映前,片方购买了一种数据预测服务,简单来说就是根据电影首映日的票房,预测最终的票房成绩。承担预测服务的公司为ABD 爱梦娱乐,这家公司对《后会无期》的票房预测为4.3 亿到4.8 亿,但实际票房为6.5 亿。相差2 亿。
与《黄金时代》和《后悔无期》不同,搜狗与Netflix 这两家公司对于“大数据”的应用,呈现出一种“时灵时不灵”的状态。当年1 月份,搜狗公司的助理研究员在微博上称,搜狗预测小黄人《神偷奶爸2》的票房为1.53 亿,随后的结果显示,这与实际结果几乎完全一致,这引起了一些电影界人士的惊呼。但是在预测《熊出没》时,搜狗公司就出现了较大的失误,预测票房为0.64 亿,最终首周票房就达到了1.48 亿。另外,当年年初《纸牌屋》迅速走红,依据Netflix 公司的说法,Netflix 在美国有2700 万订阅用户,每天用户在Netflix 上产生3000 万多个行为,Netflix 的订阅用户每天还会给出400 万个评分,还会有300 万次搜索请求,正是基于此原因《纸牌屋》才会取得如此成功。但是接下来,该公司推出的另一部自制剧《铁杉树丛》也遭遇了滑铁卢,被誉为是“2013 年年度最烂美剧”。
面对让百度与ABD 爱梦娱乐公司让人大跌眼镜的预测结果,面对时灵时不灵的Netflix 和搜狗公司,“大数据”作为一种新兴的媒介技术手段被电影行业所深度裹挟。大数据技术作为一种实现手段,其本质与原始社会中人类捕猎时使用的石头无异。正确使用新兴技术的前提应为追本溯源、厘清对象与方法得当。
二、电影史上数据的最早运用
纵观电影史,对数据最早、最成功的运用应当为《乱世佳人》这部影片,它的制作虽然起始于20 世纪30 年代,但是它对今天的电影行业来说还是有很大的借鉴意义的。
20 世纪30 年代,美国电影制片厂体系已经初步建立,商业法则的竞争与工业化方式的制作已经渗透到了好莱坞电影制作、发行、放映的各个环节,此时的电影采取一种分工合作的方式制作电影,制片人对电影的各个环节起到一种把控和监督的作用,对影片有着绝对的控制力。在此背景下,1936 年,小说《乱世佳人》在美国十分畅销,畅销的同时也引起了好莱坞的关注,但是因为在此之前,好莱坞所出品的与南北战争为题材的影片接连亏本,对于要不要把这部小说改变为剧本拍成影片,在好莱坞的内部产生了分歧。当时好莱坞的大佬们找到了一个叫做乔治·盖洛普的人,问他到底这本书有多流行,他的回答是此书非常流行。得到这个答案后,当时著名的好莱坞制片人大卫·塞尔兹尼克就高价买下了《乱世佳人》的电影版权。之后盖洛普还告诉他,这本书是美国有史以来最流行的小说,其流行程度仅次于《圣经》,约有1400 万美国人读过此书,塞尔兹尼克听到这样的答案之后信心大增。
与制片厂制度并行的另一个制度是明星制度。明星制度就是在影片当中突出演员的作用,为演员量身定制影片,在这种制度的作用下,影片的制作都必须围绕着演员来展开。就在这样的大背景下,对影片有绝对控制力的制片人塞尔兹尼克提出了让英国女演员费雯·丽来出演影片女主角的方案,但由于这部影片涉及美国独立战争、南北战争等重大历史事件,让一个英国女演员来饰演片子的女主角这种做法遭到了一些人的抵制。于是作为制片人的塞尔兹尼克就又找到了盖洛普,委托他调查一下民众对选择英国女演员来担当此片的女主角是否赞同。盖洛普调查之后告诉塞尔兹尼克支持英国女演员出任主演的人数要比不支持的人数多出很多。另外,盖洛普还告诉塞尔兹尼克大多数的观众想看彩色片,大部分的人不反对影片拍成上下两集。得到答案的塞尔兹尼克几乎全部采纳了盖洛普的建议。
在影片上市前,塞尔尼兹克听取了盖洛普对于影片广告要突出“书”元素的建议,因此,首轮影片的广告设计无论是从图片还是字体都完全模仿了小说书本的封面,在影片上映那天观影人流如潮。在影片后期的四轮上映中,每次都依据盖洛普的建议来调整影片的营销策略和电影票价。影片的最终结果证明了当初盖洛普所做出的预测是十分成功的,共有5997 万人次观看了这部影片,与之预测的5650 万人次相差不到6%,票房毛收入为3400 万美元,成为美国有时以来最卖座的影片。
盖洛普做出精准的预测,并促使影片产生巨大的社会反响和票房奇迹,这一切的背后都归因于其使用了数据的科学抽样法,这种抽样方法不一味地追求庞大的数据量,而是追求其样本的代表性。回看当下,如果我们今天脱去伪“大数据”的外衣,踏踏实实地利用科学的数据抽样调查方法来制作、宣发和研究电影的话,我认为,处于网络信息时代的我们一定会比处于第二次工业革命时期的盖洛普预测得更加精准。
三、当前电影行业中的“大数据”
依据学者涂子沛对数据的时代划分方法,在盖洛普之前所用的调查方法处于数据的单一量化阶段,盖洛普的调查方法处于数据科学的抽样时代,其本质的区别在于样本代表性的不同。现在电影行业中炙手可热的“大数据”概念与数据抽样时代的本质区别在于两点,第一点为数据的调查样本不同,第二点为逻辑关系的转变。
(一)调查样本的不同
对《黄金时代》做出票房预测的是百度公司的“百度票房预测”,据百度大数据部产品规划负责人介绍,百度票房预测结合了百度每日60 亿次的搜索查询数据、1 亿规模的微博数据,以及中国电影过去五年的历史票房数据,从演员热度、导演热度、电影关注度、上映时间等维度对一部电影进行票房预估。利用此方法得出的预测票房为2 亿至2.3 亿,但实际票房仅为5000多万,预计票房与实际票房相差达到了75%之多,之所以会出现这样的现象,究其根本是由于调查的样本出现了问题。
百度公司的百度票房预测产品,它的数据来源主要是基于互联网这一单一平台,所依据的数据样本不具有足够代表性,真正意义上的大数据从样本的覆盖率上来说,是一种数据的全覆盖,换句话说就是大数据的研究样本为研究对象的全体数据。前文中提到过盖洛普所采用的数据的科学抽样法,这种方法之所以开启一个新的数据时代是因为它把数据样本的代表性问题提高到了一个新的层次。在数据的量化时代,人们对于样本代表性的追求体现在单纯数量的叠加;到了抽样时代,人们对于样本代表性的追求体现在了依据样本的差异性进行科学的抽样;那么到了大数据时代,对于样本代表性的追求我们已经可以利用现如今的科技手段在某些方面达到一种样本的全覆盖,也就是说大数据时代是在研究全体样本而不是经过抽样以后得到的样本。和大多数的数据公司一样,百度票房预测在面对电影这一复杂的艺术领域时,它单纯地依靠互联网平台所拥有的数据显然不能称之为“大数据”。
(二)认知关系的转变
大数据时代区别于前大数据时代的另一重要的不同在于认知关系的转变,简单来说就是大数据是利用事物的相关性来代替因果性。由于人的认知在一定程度上是存在误差的,所以人所理解的因果关系其实在某种程度上来说并不一定是一种真正的因果关系,换句话说就是人所看到和听到的并不一定就是真的。大数据不一味地追求这种事物间的因果联系,而是转而寻找事物间的相关联系,找出一个或多个对研究对象相关的变量,从而达到影响或者预测未来的研究对象。
目前大多的电影数据公司,对电影的研究还只是单一的对关于电影的数据进行研究,其实这是远远不够的。从数据搜集的角度来看,对于预测电影票房来说,除了与电影相关的导演、演员、视听、档期、影院拍片等与电影相关的因素有关以外,文化的认同、地域的差异,甚至是气候的改变等都可能会对电影的票房产生影响,大数据要做的就是找到事物之间的这种相关性。从数据真实度的角度来看,在对电影受众进行调查的时候,获得的并不一定都是真实的数据。例如,网络上充斥着大量的水军,微博上有着大量的僵尸粉,就算找到真人面对面地填写调查问卷,也许碍于某些原因得到的答案也不一定是真实的。在这种情况下,大数据也可以找到其他一些相关的因素来代替某一类不容易辨别真伪的数据。
四、结语
在电影行业中,被绑架了的“大数据”始终不缺乏现象级的话题与喧闹后的质疑。无论是从数据样本上来讲,还是从逻辑关系上来讲,电影行业离真正的大数据还存在一定的距离,距离的存在是由于我们现在其实是正在迈向大数据时代,而并没有真正跨入大数据时代。大数据的兴起是基于信息时代的互联网平台,大数据的成熟是基于云技术的成熟与普及,我们现在已经拥有了前者,正在拥抱后者。对于研究电影的数据公司来说,在现有的技术条件下我们完全可以利用科学的数据抽样方法来进行多维度的研究,得出可靠的结论,那么“《乱世佳人》式”的成功也一定会不断地涌现出来。
①肖扬:《黄金时代:带观众挣钱》,《北京青年报》2014年9月22日,第B08版.
② 张曦:《黄金时代上映10天票房未过5千万 文艺片如何突围》,中国新闻网,2014年10月12日,http://www.chinanews.com/yl/2014/10-12/6669020.shtml
③④ 郑道森:《不要因为票房预测失灵就全盘否定大数据》,虎嗅网,2014年19月23日,http://www.huxiu.com/article/45114/1.html.
⑤ 范晓东:《〈纸牌屋〉的大数据争议:革命还是包装?》,腾讯网,2014年02月19日,http://tech.qq.com/a/20140219/014987.htm
⑥⑦ 涂 子沛:《数据之巅:大数据革命,历史、现实与未来》,中信出版社2014年5月 第1版,第180—181页,第182—183页。
⑧ 数 据的时代划分“量化时代、抽样时代、开放时代、大数据时代”参见涂子沛:《数据之巅:大数据革命,历史、现实与未来》,中信出版社2014年5月第1版.
⑨⑩〔奥〕 维克托·迈尔-舍恩伯格 肯尼斯·库克耶 :《大数据时代:生活、工作与思维的大变革》,浙江人民出版社2013年1月第1版,第27页,第67页。