APP下载

“大数据”批判:网络数据影响之下的网络剧创作误区

2017-03-06张晗

戏剧之家 2017年3期
关键词:网络剧大数据

张晗

【摘 要】目前,随着大数据概念的普及,更多的视频网站已经开始注重在网络剧的创作过程中对网络数据的应用。但是所谓“大数据”是否具有可用性,如何妥善使用大数据,还是亟待解决的难题,本文着重分析网络数据的特征,剖析数据依赖下网络剧创作误区。

【关键词】大数据;网络剧;网络剧创作

中图分类号:TP393 文献标志码:A 文章编号:1007-0125(2017)02-0135-02

在“互联网+”的大环境下,“大数据”成为一种流行词汇,由于数据提取变得更加及时、方便、可视,诸多视频网站都越来越依赖于对数据的应用。许多视频网站在进行生产之前,会根据数据判断目前市场的稀缺题材、思想风潮、观众比例和观剧倾向。但目前,大数据在中国发展还不是很成熟,大数据是否能给网络剧创作提供指导性意见,还需要打一个问号。

IBM曾经将大数据特点总结为三个V:即大量化(Volume)、多样化(Variety)和快速化(Velocity)。[1]这也意味着,对于网络剧来说,大量的数据基础可以扩大对潜在观众的研究面,从而达到“激活”观众的目的,而大数据的多样化特征可以使分析更加全面,将不同的声音囊括其中,使得最终意见形成过程更加民主。而快速化使数据更加直观,更明确,这有利于生产者更迅速地把握市场风向。但同时,我们也需要看到大数据的复杂性。

首先,大数据的大量化同样也意味着数据的体量不断增大,但数据体量大也给数据分析、挖掘等多个方面造成了不小的困难。目前主要面临的困难是数据具有复杂性,这体现于两点:第一是数据抓取的复杂性。随着社交网络的兴起,微信、微博、博客这些短小的文本在进行数据抓取的过程中,由于其短小,有时候会带来情感缺失,语义不明,主题不明确的负面特征,这使得文本数据抓取的时候,出现“噪声”。比如骨朵网络剧数据机构在2016年针对《幻城》的网络舆情评价时遇到了这样的难题,在进行微博抓取的时候,某一条微博内容大意为:“《幻城》制作非常粗糙,逻辑生硬,演得莫名其妙,这剧唯一能看的就是马天宇的脸,我坚持看下去了!”从语义上来判断,该用户的评价使数据分析无法将其归类为正面评价或是负面评价,最后从观众由于某种原因最后选择了追剧,该条微博被算成正面评价。

第二是数据结构具有复杂性,不仅仅只有文本和访问量才能构成数据,同样图形、文档、视频都可以构成数据,这些数据被称为“非结构化数据”。目前微博出现了许多影视网络大V,他们会用视频的方式对影视剧进行点评,由于其粉丝众多,他们的影响力甚至远超专业的影评人。但是他们的视频内容无法通过文本读取,进入数据分析系统,这不能不说是数据分析的一大缺口,目前国内已经有相关科研单位开始对非结构化数据处理的基础设施进行开发,但非结构化数据处理还没有深入到网络剧行业。

其次,大数据的多样化使数据可以被感知和提取,但是却很难进行清洗和提炼,数据干扰大大增加,最后会导致数据汇总和处理出现困难,甚至导致一定的结论偏差。爱奇艺的网络剧《余罪》第二季由于拍摄仓促,逻辑前后不一,转折生硬,让许多观众留下了负面评价,但同时这其中的部分观众却一直追到了最后一集,甚至从免费观众转为了付费观众。单单从评价数据来看,是无法预判这样的结果的。所以我们可以认为大数据的多样化方便于采集更多的意见,但是也给意见统一化造成了难度。

最后,大数据的快速化也反映在网络剧上,如今大多数网络剧页面都有播放量、评分、评论量,大数据不仅可以快速获取,而且可以快速被“可视化”。一些单独的数据抓取网页上,观剧者的地域、年龄层、观剧时段也可以被快速地反映出来,它是观众观剧行为的一种集中体现,这对开发网络剧续作的制作团队无疑是一种有效反馈,但是对于正在开发新网络剧的人来说,其它网络剧数据的确是具有“效率”的,但是否具有“效能”,还无法判断。人们每天在接收大量信息的同时,也很难注意力聚焦,思维变化极快。这就使得曾经一度在网络剧中出现的“屌丝”风、快节奏风在短暂的成为网络剧的流行性特征之后,迅速地消失了。

所以中国网络剧尽管在运用“大数据”,但目前中国的数据处理技术,还不足以让大数据来支撑网络剧的生产。用户的数据无论是分离处理还是聚合处理,都各有缺陷,虽然这些数据都富有极高的商业价值,但在技术暂时还无法完全做到去冗存真、去繁就简的情况下,数据本身只能作为参考性意见,贸然依赖大数据反而是一种不科学的做法。

但目前中国网络剧生产者对大数据产生了不正确的判断,并且过度迷恋其表面含义,极力渲染“大数据”的作用,而拒绝深挖其内涵,这给网络剧投资、生产、宣传环境都带来了极深的误导。目前网络剧对“大数据”的迷信体现于三点:第一,相信数据可以指导创作。一些资深的电视剧制作公司,如克顿传媒甚至还打出了“一切依靠大数据”的旗号。一些网络剧为了追赶网民的兴趣潮流,去研究微博话题讨论量较高的现象级话题以及流行网络词语,比如“冰桶挑战”、“江南皮革厂”等等,这些都被应用在了网络剧中,有的甚至已经失去了原有的语义,单单作为一个流行因素被强行夹杂在剧情之中,它并没有起到搞笑的作用,反而增加了剧本的硬伤。

第二,对网络点击率的过分炒作。传统电视剧需要警惕“收视率”是唯一标准,而网络剧也需要谨防对网络点击率的过度追捧。但是由于网页页面上的点击率可视化,获取方式更简便,直观,所以网络剧似乎从诞生之日起就与点击率有着分割不开的关系。《万万没想到》系列,用率先破亿的网络短剧来标榜自己的成功。之后号称大制作的《盗墓笔记》也以全年27亿播放量“荣登”年度点击冠军。2016年暑期,网络剧市场连续推出几部大剧《九州·天空城》、《老九门》等等,《老九门》自从上线之后,就不断地炒作其点击量成绩傲人,十分钟破亿的数据成绩被大肆渲染宣传,最后其点击量达到100亿次,被称为“完美收官”。点击量不仅成了一种新型营销手段,也成为了网络剧互相攀比的硬指标。

第三,点击率造假。由于对数据的过分依赖,再加上网页页面数据直观,具有一定的消费引导性,点击率造假已经成为了网络剧业内的潜规则。2014年,前十名网络剧的单部剧点击量还在1亿左右。但是到2015年,这个数字攀升到了10亿左右。到2016年,热播的网络剧基本都可以达到40亿,甚至破百亿的点击量。这个数字并不能说明网络剧市场繁荣,而只是说明其注水的现象越来越猖獗。截至2016年6月,我国网民规模达到7.1亿,网络视频用户规模为5.1亿的,网民使用率为72.4%。[2]那么一部50集的网络剧,其点击规模达到100亿,核算每一集的点击量就在2亿左右,如果估算一下重复观看的数据,其水分仍然很大。与此同时,视频网站对一些网络剧制作者自身刷点击量,保持默许甚至是助推的态度,甚至淘宝网上也有公开刷数据的业务交易链接,并且可以评论、点赞、弹幕、点击量同时刷,其造假态度之明目张胆,令人大开眼界。

如今我们看到,大数据尽管为网络剧带来了更科学和精确的参考性指标,但是数据污染如此严重并愈演愈烈的情况下,大数据变成了滥数据,数据沦为了营销工具,而丧失了其基本作用。网络剧的生产者并没有被大数据的民主性所影响,反而助涨了单一的数据思维,只注重网络剧是否能够拉高点击率和具有讨论热度,从而对内容和品质不再做要求。目前娱乐相关数据普遍水分较大,点击率污染严重,脱水不易。水军公司在背后助推,做假点击率、假评论和假话题,使一条黑色的数据产业链正在形成。在这样的情形下,大数据已经丧失了原有的价值,甚至成为网络剧创作的阻碍,数据只能让创作者被动地、甚至是错误地追逐观众,丧失了网络剧故事的原动力。

参考文献:

[1]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].計算机学报,2013,36(6):1125-1138.

[2]2016年7月第38次中国互联网络发展状况统计报告[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201608/P020160803367337470363.pdf

猜你喜欢

网络剧大数据
解读受众视域下网络剧的发展路径
草根主义视域下网络剧创新模式分析
大数据环境下基于移动客户端的传统媒体转型思路
喜剧网络剧“把关人”前期剧作策划的几点核心
网络剧的底线可以比电视剧低吗