大数据在媒介实践中的悖论
2017-05-24贾梦梦
贾梦梦
摘 要 当前大数据在媒介实务中的應用发展如火如荼,然而,我国目前的媒介大数据实践尚处于摸索阶段,仍面临着多方面的悖论,主要包括数据规模大与数据价值密度低的悖论、数据的全面性与真实度不确定性的悖论、数据的开放性与模糊的所有权的悖论、内容生产的便捷性与工业化倾向的悖论、预测的可能与自由意志丧失的悖论、精准的广告服务与媒介消费主义的悖论、定向化服务与信息窄化的悖论等。
关键词 大数据;媒介实务;悖论
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2017)07-0012-03
“大数据”在中国是从2009年开始,作为一个技术热词最先在互联网圈内广为流传。在短短几年时间内,大数据的媒体格局发生了巨大变化,被广泛应用到媒介实践中。“大数据(Big data),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工或者计算机,在合理的时间内达到截取、管理、处理、并整理成为人类所能解读的形式的信息。”[1]大数据在数据的采集、储存、处理及应用等各方面,都与传统数据有着根本性的变革。然而,我国目前的媒介大数据实践大都尚处于摸索阶段,一些关键性的问题尚未解决,大数据在媒介实践中仍面临着多方面的悖论。
1 数据规模大与数据价值密度低的悖论
数据规模庞大是大数据最基本的属性,但是,数据量在呈几何级量级增长时,其背后隐藏的有意义信息却并没有呈现相应比例的增长。类似于经济学中“边际递减效应”,当数据规模很大时,也同样面临单位数据量“贬值”的风险。
一方面,受众在某些方面具有高度同质性,而且随着总体样本的增加,垃圾数据和噪音也可能增长,真正有意义的信息比重可能很低,而有用信息的获取和处理难度不断加大,人力物力成本也随之增加,数据的边际意义递减。例如,现在很多地方都安装了监控,能够获得连续的监控视频信息,这可能为有关部门提供了便利;但这些实时录制、储存的海量视频数据,可能能派上用场的只有几秒钟,甚至可能常年都不会被用到。
另一方面,大数据多以不确定的碎片化形式存在,目前我国大多数公司对数据的挖掘和应用能力不足,距离从大数据中提取最大战略价值还相距甚远。如果借用马斯洛的需求层次理论,将大数据战略分成不同层次的金字塔,依次为:数据—信息—知识—智慧,那么大多数媒介组织对大数据的利用水平还只停留在信息和知识阶段[2]。尽管企业掌握着大量数据,但将数据转化为知识和信息,甚至是智慧,仍任重道远。
2 数据样本的全面性与真实度不确定性的
悖论
大数据提供了几乎全样本的数据,但不得不承认,其真实度和准确性都可能存在偏差。因为即使大数据的规模和处理速度都非常大,但数据本身的增长速度仍远大于数据分析速度;在数据呈几何量级的增长的同时,“垃圾”数据也随之增多。因而,大数据的方法必须是有一定时效性的,其结果也只能以宏观的模糊呈现为特点。
此外,大数据的主要采集渠道——互联网上的数据的真实性也值得怀疑。首先,因为网络空间的匿名性和草根性,很多时候,我们很难在浩如烟海的信息中甄别数据真实与否,更何况是纯粹的技术处理过程。其次,戈夫曼的“拟剧理论”告诉我们,在日常生活中,人们会运用各种符号的选择和运用,来控制呈现在他人面前的形象,即利用符号进行表演。社交平台正是利用文字、图片、视频等符号,将我们的“后台”生活搬到了“前台”,出于印象管理的需要,人们很可能会故意“乔装打扮”展示其美好的一面,而删除或掩盖与其理想的形象不一致的活动或事实,这个过程就产生了一些“伪数据”。大数据是全样本数据,它包含了所有真实或者虚假的数据,但计算机进行大数据处理时,并不会自动识别,而是对收集到的所有数据加以批量处理,这种分析方式在某些方面可能会导致较大
偏差。
3 数据的开放性与模糊的所有权的悖论
毫无疑问,大数据具有巨大的经济效益,而由于“数据”这种经济资源具有很强的特殊性,如可能涉及个人隐私、可被轻易复制和共享等。因此,清晰的所有权归属是大数据共享与管理的基础,这既是技术问题,更是法理问题。我们一旦进入网络世界,就在产生数据,在开放的网络空间,数据看起来也是人人生产、人人可及、人人可用的;然而目前,这些数据的所有权是属于用户本身,还是属于数据储存平台,抑或是可被共享的公共资源,业界和学界都莫衷一是。很多数据垄断方,如国内的百度、腾讯,国外的谷歌、Facebook等,这些互联网巨头掌握着各种各样的大数据,他们是否能将这些转卖给第三方,如广告商?数据访问权、使用权或数据共享机制的界线又在哪里?这些问题都尚待解决。
2014年曝光的Facebook私自对其70万名用户进行社交媒体情绪的实验引起了不小的争议,把很多数据实验卷入社会道德讨论中。这一试验中,有两点值得注意:其一,很多被试验者对此毫不知情,Facebook的用户在未被告知的情况下被当成了小白鼠,而大量的用户数据被作为了研究对象;其二,也是更重要的,为了验证实验假设——用户的情绪会受到社交网络上帖子情绪的影响,Facebook私自修改了用户的原始数据。这种数字实验也许能带来一定的价值,提高在线服务的质量,但是在面对大数据的市场推销或研究行为与社会道德的悖论时,我们首先应该尊重当事人。
4 内容生产的便捷性与工业化倾向的悖论
大数据给媒介内容生产带来了极大的便利,也催生了一些新的媒介生产模式和表现方式,如数据新闻。数据新闻又称数据驱动新闻,“数据新闻是一种工作流程……通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。”[3]目前我国很多媒体也开始了数据新闻的积极探索,如人民网的图解新闻频道、新浪的“图解新闻”以及搜狐的“数字之道”等。然而,便捷化的数据新闻生产过程也导致了媒介产品的工业化和传统新闻价值的异化,这是大数据给媒介实务带来的又一个悖论。
首先,基于大数据技术的媒介生产,丧失了人的主體性。传统的新闻生产方式把新闻现场作为第一消息源,记者、编辑是信息提供者,他们在一定的社会情境中考察新闻事件,赋予其一定的社会意义与人文关怀。但大数据把媒介生产变成一种信息集成过程,记者和受众的角色都被重构。美国利用计算机分析撰写报道的先例Narrative,“大约每30秒就能够撰写出一篇新闻报道,2011年该软件通过收集相关信息写出了大约40万则关于少年棒球联盟的新闻报道”[4]。这样如同工业流水线的新闻制作,虽然效率惊人,但也必然是千篇一律、缺乏个性、没有温度和质感的模式化数据呈现。长此以往,也会使受众产生审美疲劳,传播效果将大打折扣。其次,大数据呈现的是数据之间的相关关系,而不能展现其背后的因果关系。也就是说,它只能告知我们某些社会现象或问题,而不能给数据赋予背景,深度解释为何如此,放弃了对其背后原因的追问和反思,以及对社会现实的否定与批判。表现形式上,虽然数据漫画、数据图表等方式在有些报道中可以产生形象直观的效果,但若只是沉溺于表面的形式,而忽视了新闻本身的深度和故事性以及语言文字的丰富性,就是舍本求末了,并与传统的新闻精神相悖。
5 预测的可能与自由意志丧失的悖论
通过对庞大数据进行分析、整合,大数据技术使人们可以从历史的发展轨迹中得到数据或事件之间的相关性,找出一定的规律,从而对未来的发展倾向作出一定的预测。例如,通过对大量经济数据的分析,预测市场走向;通过对特定新闻事件的分析,预测可能的发展态势;通过对受众已采取的行为进行分析,推测其兴趣及行为偏好。可以说,大数据不仅帮助我们从宏观层面对某一社会事件进行把握,也使得对特定个体的行为预测成为可能。
但这也正是大数据最可怕的地方,它不仅可以全面洞察我们的过去与现在,而且能预测我们的行为和未来;数据越大,预测的准确性也就越高,其预测行为发生的可能性也就越大。例如,当我们长期关注的对象有了新动态时,大数据知道我们会想要了解,于是将有关的信息推送给我们;比如我们定期购买的产品到了一定时间,会自动弹出相关广告;当我们搜索某地天气时,去往该地的机票酒店等广告也会自动呈现……此时的大数据,已经凌驾于人的自由意志和尊严之上,扭曲了人类最本质的东西,即理性思维和自由选择。由大数据而变得可预测的世界仿佛变成了一个被随时追踪的黑匣子,我们的生活变成了一个被安排和被设计好的“楚门的世界”,我们的每一步行为则在印证和实践着大数据的预测结果,而忘记了对自我和世界的深入探索,这足以让我们惶恐不安。
6 精准的广告服务与媒介消费主义的悖论
大数据带来了广告模式的变革,实现了广告的定向投放和广告效果的合理评估。以Facebook为例,目前,Facebook在全球有9亿用户,每天可采集到约500TB碎片化、非结构化的数据。Facebook首先对这些数据进行集结和归类,形成身份类数据(注册的基本信息)、需求类数据(“赞”过的信息、心情状态等)和关系类数据(与其他社交网络用户之间的关系)等多个数据模块;对用户的浏览行为、搜索的关键字等的持续分析,得出用户的长期爱好和近期需求;通过对其朋友圈的分析,可以获得用户的教育、工作、收入等诸多信息,从而进行精准的广告投放[5]。
但另一方面,精准的广告投放也大大刺激了我们的消费欲望,广告商通过对受众心理的分析和商品符号意义的构建和营销,诱导用户进行符号消费;同时,不断刺激消费者欲望,诱导其进行超前消费。例如,众多的电子商务平台会根据你的浏览记录或兴趣偏好,利用大数据得出你的兴趣图谱,并预测你的购买行为,再不断向你推送“猜你喜欢”板块。这给企业带来了巨大的商业效益的同时,也使得原本是为受众提供交流和信息平台的媒介逐步沦为商家获取数据资源的渠道,成为各方达到其目的的桥梁,成为建构媒介消费主义的一种重要力量。我们的线上生活,不断被各种消费信息充斥,在获得个性化产品服务的同时,也不免被众多的广告所打扰。精准的广告服务与媒介消费主义盛行之间的悖论由此可见一斑。
7 定向化服务与信息窄化的悖论
媒体基于对大数据的整合和分析,可以充分洞察受众的性格、偏好及需求,针对性地为其提供个性化的信息服务。大数据在信息的个性化订阅和精准化推动方面,优化了受众的媒介体验和信息获取,但也同样面临着“信息茧房效应”的悖论。桑斯坦在著作《信息乌托邦》中提出了“信息茧房”的概念:“信息传播中,因公众自身的信息需求并非全方位的,公众只注意自己选择的东西和使自己愉悦的通讯领域,久而久之,会将自身桎梏于像蚕茧一般的‘茧房中”[6]。通常情况下,人们更愿意选择性注意、选择性理解和选择性记忆那些对自己有利的或与自身原有认知一致的信息,大数据的定向化推动更强化了这一机制。
新媒体的个性化订阅和基于用户兴趣的信息推送,本质上就是排除一种“信息偶遇”的可能,即你获得的信息都是你想要的。这类例子有很多:购物网站会根据你在其网站浏览、收藏以及购买的商品记录,不定时的向你推荐相关商品;Facebook可以根据你的关注兴趣和浏览记录,向你推荐相关好友,使你很容易的找到兴趣相投或观点一致的人或网络社区;当你浏览有关某一话题的网页时,也会出现各种很多同类话题的链接提示。总之,大数据会通过各种方式,把你感兴趣的东西和你偏向的观点都尽可能地聚集在你面前,长此以往将在无形中使用户接收到的信息限制某一偏向中,形成信息的“窄化”,这与桑斯坦提出的“信息茧房”概念如出一辙。而“信息茧房效应”的后果,从个人层面而言,可能阻碍个人的全方位信息获取,强化个人偏见;对群体来说,“小世界”的意见交流可能产生群体极化现象,甚至衍生出网络暴力;而对整个社会而言,“信息茧房”将破坏一个社会的基本共识,加剧社会的分化。
8 结束语
大数据对媒介实务的各个方面,从新闻内容生产到受众和效果分析,再到媒介经营与管理,都产生了深远的影响。而反过来,各种形态的媒介又反哺了大数据产业,使得大数据得以源源不断地产生和发展。我们也必须认识到,大数据为媒介实务带来巨大价值的同时,也存在很多的悖论,面临多方面的困境。机遇与挑战并存,我们既不能因噎废食,否认大数据的社会价值;也不能掉以轻心,忽视大数据存在的潜在风险。只有清楚地认识问题,采取正确的态度,在社会和经济效益与个人利益保护之间需求平衡,才不会在大数据时代的转型道路上迷失方向。
参考文献
[1]Dan Kusnetzky.What is “Big Data?”[EB/OL].[2010-02-16].http://www.zdnet.com/article/what-is-big-data.
[2]Martha L. Stone, Big Data for Media, Reuters Institute for the Study of Journalism Report[R]. 2014.
[3]方洁.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6):74.
[4]彭兰.大数据时代:新闻业面临的新震荡[J].编辑之友,2013(1):7.
[5]曾凡斌.大数据对媒体经营管理的影响及应对分析[J].出版发行研究,2013(2):23-24.
[6]凯斯·R.桑斯坦.信息乌托邦——众人如何生产知识[M].毕竞悦,译.北京:法律出版社,2008:15.