数据新闻:价值与局限
2014-06-11丁柏铨
丁柏铨
【摘要】当今时代,大数据正在发挥愈益重要的作用。数据新闻的出现,给新闻业界和学界带来诸多正面影响:影响一部分前卫的新闻工作者的新闻理念,影响一部分新闻传媒的组织架构和人力资源整合,影响一部分新闻工作者的新闻实务,影响一部分新闻学者的研究旨趣。这是其价值所在。但数据新闻也存在局限性:倘若缺乏是非判断和价值判断的正确标准,传播者和受众都会被大数据误导;对于大数据的过分依赖,将使不可或缺的质性分析缺位;完全由数据构成的新闻,一旦固化,将成为新的程序化和模式化的报道;数据新闻存在“短板”。
【关键词】大数据新闻价值局限
在“数字化生存”的当今时代,大数据和对大数据的处理,在社会生活中已显得愈发重要。在当下新闻业界和新闻学界,大数据不仅是常被提及的一个概念,且已然成为对新闻业界产生实质性重大影响的一种重要动因。业界甚至已出现数据新闻这一新样态。先是国外后是国内,几年前,讨论大数据和数据新闻的研究成果不断涌现,并有趋热之势。本文将在业界已有新闻实践和学界已有研究成果的基础上,就数据新闻提出自己不成熟的看法,以就教于方家。
上篇:数据新闻给业界和学界带来了多方面的积极影响
著名未来学家阿尔文·托夫勒在《第三次浪潮》一书中,便有将大数据称为“第三次浪潮的华彩乐章”的赞美之辞。而所谓大数据,依刘建明教授之见,即为“巨量资料、浩瀚信息的另一种称呼”“实际是上世纪80年代末盛行一时的信息爆炸的同义语”。[1]笔者对此界定性表述深表赞同。
关于数据的极端重要性,有专家进行过如下阐述:“数据在生活中占据越来越重要的位置,同时数据也会对各项改革作出智力支持。当下,一个大规模分享、利用大数据的时代正在来临,谁拥有了大数据谁就占领制高点,取得主动权。世界上许多发达国家都已把大数据的开发、应用上升到国家战略层面,大数据必将成为宏观调控、国家治理、社会管理、企业决策的基础信息。”[2]数据乃至大数据,是与运行速度超常快捷的计算机联系在一起的。它与搜索功能、储存功能和传播功能惊人的互联网联姻,演绎出了以往无法想象的许多奇迹。至于说“谁拥有了大数据谁就占领制高点,取得主动权”,此说法在强调拥有大数据重要性方面全然没有错;然而如果仅仅是拥有大数据,而在对此所作的处理方面,缺乏科学理念和有效手段,大数据的存在也就只能是徒有其表,没有任何价值。就此而论,上述說法存在有待商榷之处。
毋庸讳言,大数据对新闻业界及新闻学界,已发生并正在进一步发生着积极的、深刻的影响。数据新闻的出现与存在,有很高的价值——
1. 使一部分前卫的新闻工作者的新闻理念发生了相应变化
有报媒在相关报道中提出:“大数据时代来临,数据分析成为核心竞争力。”[3]该报道传递了如下信息:在一部分新闻人看来,在特定主体的竞争力构成中,数据分析能力占据着核心位置。有人甚至认为:“大数据时代,数据是市场核心竞争力。”这一表述,干脆将数据作为特定主体的市场核心竞争力。虽对数据的重要性进行了强调,其良苦用心可以理解;但把数据本身直接界定为核心竞争力,这一命题无法成立,因而不可取。某媒体高管在一次演讲中说:“在‘大数据时代,知识竞争就是基于数据的竞争,而数据的竞争将成为经济发展的必然产物,数据已成为企业乃至于民族和国家的新核心竞争力。”[4]这一观点的意义在于:在一个很高的层面,阐明了数据非同寻常的价值;对核心竞争力作了区分,数据被认定为“新核心竞争力”。在很高的立足点上强调数据的重要性,这是必要的,本身就很有价值;然而与前一论者一样,未同时强调对数据的科学处理和合理使用的重要性,是其不足之处。
2. 一部分新闻传媒的组织架构和人力资源因此而进行幅度较大的调整整合
在大数据成为时代重要特色的当下,传媒对新媒体、云计算、大数据都十分重视,大都已顺势而为,在推动媒介融合的过程中,对内部组织架构进行了相应调整,对人力资源进行了相应整合。祝建华教授提出的构想是“优秀的新闻团体应包括研究组、设计组、发布组三部分。研究组应具备数据搜索、数据挖掘和数据统计分析能力,设计组应具备文字编写和分析能力,发布组则应具备在网络平台、传统平台发布信息的能力,具有这些能力的新闻人,才能算合格的新闻人”。[5]在今天,新闻传媒更应善于打与大数据、新媒体紧密相联的“组合拳”。
3. 推动了一部分新闻工作者的新闻实务创新
是否可以这样说:数据是事实的一种特殊的存在方式。在新闻规律中,有一条规律是用具有新闻价值的事实说话,即需用数据这样一种特殊形态的事实说话。某些情况下,用数据化的事实说话,比用一般形态的事实说话更显言之凿凿,因而更为有力、更能服人。
以往,确实存在报道中涉及的点难以说明或涵括面的情况、局部难以反映全局的问题,即使做成综合报道、取若干个点来反映整个面,仍难以做到有很强的说服力。这使记者常处于纠结之中。学者彭兰曾说过:“在大数据技术面前,无论是在反映全局性事实还是趋势性规律方面,媒体现有报道方式与报道成果的缺陷都日渐暴露。但大数据技术既是参照物,又可成为专业媒体未来的方法与工具,利用大数据技术,专业媒体的报道水准将得到有效提升。”[6]新闻传媒现有的报道模式,可在经由深入调查采访所获素材的基础上,将事实或故事叙述得较好或很好。而缺乏数据和对数据所作的分析的支持,报道在由点推及面时,往往会被受众质疑,这其实也就是报道信度受到的质疑。而数据新闻依靠数据和对数据的解读,则可有效解决上述问题。
另一位学者则论及:“一直以来,新闻报道者受困于呈现片段真实与追求整体真实之间的悖论。数据新闻业务的开展则为记者提供了一种全新的解题思路,即基于更大的样本量,采取数据挖掘与统计的量化研究方法,更全面、完整地报道重大新闻主题。在2013年美国联邦政府关门危机中,《纽约时报》运用静态图表和大量数据展示了包括美国航空航天局、国家环境保护局、劳工部、内政部等诸多部门在内的雇员总数、‘被休假人数比例、休假雇员与坚守雇员的职能区别。”[7]基于大样本量加上对此所作的数据挖掘与统计分析,对事实或事件进行报道,这是只涉及若干个点、以此支撑整个面的一般报道望尘莫及的。由此,数据新闻的说服力陡增。
不能否认,数据新闻在某些方面具有无可取代的优势。2011年夏英国骚乱发生后,Twitter等社会化媒体被认为是导致骚乱的“罪魁祸首”之一。但英国《卫报》进行的一项调查结果显示,实际上在此期间Twitter在应对骚乱事件方面也扮演了重要角色。《卫报》对250多万条Twitter消息进行了分析,发现有20.6万条消息是市民呼吁清理骚乱后的大街上的杂物,占所发送消息总量的8%。[8]一般报道不可能对数量如此之大的Twitter消息进行分析和梳理,也不可能给出“市民呼吁清理骚乱后大街上的杂物”的消息的具体数目和在所发消息中所占比例的精确数据。数据新闻建立在海量信息和对此所作分析的基础上,其可信度是毋庸置疑的。如果离开了大数据和对此所作的分析,就只能是按逻辑推理和模糊方式进行报道,无法达到毋庸置疑的境界。
更有甚者,出自机器人的数据新闻也已出现。当地时间2014年3月17日,美国加利福尼亚州发生4.4级地震。第一个报道此消息的是名叫Quakebot的机器人。它接收到美国地质勘探局电脑系统发出的地震数据后,利用《洛杉矶时报》的新闻自动生成系统迅速将数据输入事先准备好的新闻模板,仅用3分钟就报道了这个消息。[9]这就为数据新闻与机器人结合并具有良好的发展前景提供了佐证。
在国外,迄今为止已出现了较多的数据新闻(其中有些作品很为受众所称道),且已经有数据新闻奖项和获奖作品(如2013年全球数据新闻奖)。根据国外新闻界的情况,或许可以说:“到现在为止,已有一些记者向我们展示如何利用新闻数据深刻探究我们身边所发生的事情及其将会以何种方式影响我们。”[10]
在国内,记者以往所作的包含大量数据的报道并不冠以“数据新闻”的称谓。即使如此,一部分报道对运用数据和分析数据相当重视。据有关研究者统计,在第20届中国新闻奖(笔者注:2010年举行,所评的是各媒体选送的于2009年刊播的新闻作品)29篇报纸消息类获奖作品中,经济类消息有14篇,占了半壁江山。对数据进行不同层次的运用,是这14篇经济消息共同的特点。[11]可见,最近若干年来,在大数据的时代氛围中,通过数据进行报道业已受到新闻业界人士的重视。
2013年以来,我国新闻业界出现的与大数据密切相关、值得引起特别关注的现象是:2月6日,“继农历大除夕夜用大数据盘点春运后,央视《新闻联播》再次运用百度大数据来盘点春节长假”。这被解读和评价为“从数据中发现新闻,用数据来解读新闻,这是全球新闻业应对大数据时代来临所作出的关键革新,《新闻联播》《晚间新闻》等王牌新闻节目对于数据新闻的重视,显示了央视在新闻报道方面寻求突破和创新的坚决态度”。[12]人们分明可以感受到,在报道中有意识地使用数据,利用大数据推动新闻改革,已成为央视品牌新闻栏目与时俱进的重要举措。
前述诸例似乎印证了如下说法:“身处信息时代的记者,比以往任何时候都更加需要对大量数据进行核实、分析和整合(Howard,2012b)。”[13]可以这样说,在今天,不善于挖掘、分析、使用数据的记者,是存在缺陷的记者,甚至可能是落伍的记者。
4. 使一部分新闻学界人士有了新的研究旨趣并拓展了其研究视野
近年来,一部分颇具学术敏感的新闻学人,对新闻业内出现不久的、与大数据相联系的数据新闻,作出了灵敏反应,展开了有一定深度的学理探讨,对现象有所概括和抽象,将业界的经验提升到理论的层面,研究者本身的学术视野得到了拓展。新闻传播学术研究密切关注数据新闻实践的发展,理论研究呈现出良好的势头。有学者提出了在新闻学界和业界都有相当影响力的主张:数据驱动新闻——大数据时代传媒核心竞争力。[14]
數据新闻是大数据技术带来的新闻新样态。其积极意义在于有利于在传统的新闻采访写作过程中融入高新科技的因素,有利于记者获得相应的素材和改进采访的手段,有利于推动和促进新闻报道的改革创新,有利于学者获得鲜活的研究对象和研究素材。就此而言,大数据和数据新闻的意义,无论如何都是不可低估的。
下篇:数据新闻存在着一定的局限性
笔者在肯定数据新闻的积极影响及带来的令人欣喜现象的同时,不能不指出对新闻而言,大数据是一柄“双刃剑”:如果能够合理驾驭、妥善使用、竭其所利,那么,它有利于新闻工作者拓展视野和思维空间;如果处置不当,会使新闻工作者失去准星,无所适从,陷入难以作出正确判断以致不能自拔的困境。数据新闻的弊端是:
1. 倘若缺乏正确的是非判断标准和价值判断标准,传播者和受众都会被大数据误导
数据来自社会各方面。数据提供者既可以是权威机构或部门,也可以是专业人士,还可以是其他社会机构和社会成员。不同的主体,在提供数据的目的动机及负责程度、严肃程度和精确程度等方面存在差异。数据在可信度方面也有差别:既有信度较高的数据,又有虚假和不实但并不存在主观恶意的数据,也还有恶意做假的不良数据。
李希光教授在论及大数据时指出:“研究人员在研究了谷歌、Twitter、百度、腾讯、新浪等搜索引擎和社交网络媒体后,开始预言大数据带给人类的危害:不会自我删除有害、仇视、无用、虚假信息和个人隐私的信息。虚假、仇视和个人隐私的信息往往更容易聚集大量的信息和人群。如果有害的、仇视的和虚假的信息聚集得愈来愈多,大数据制造的人类大脑空间会带来一种世界末日的恐惧。”[15]这段论述提及的大数据在诸多方面存在的负面性,不能不引起高度关注。
在浩若烟海的巨量信息中,特定主体如果对此不作相应选择,则将沦为信息的“奴隶”;而如果缺乏进行正确判断的是非标准和价值标准,则可能会以是为非、以非为是和选择隐含价值观偏颇的信息进行传播,从而误导受众。从这个意义上说,大数据对新闻工作者提出了新的、更高的工作要求和素质要求。
2. 对于大数据的过分迷信和依赖,将使不可或缺的质性分析缺位
新闻报道的对象是社会生活中发生的具有新闻价值的各类事实。有些事实是数字化了的,有些事实是可进行数字化处理的,有些事实则无法通过数字与数字化来处理和表现。因此,不宜不加区分地提倡对任何类型的新闻事实都采用数据新闻的方式加以报道,也不宜不作限定地将数据报道作为新闻改革的方向和新闻发展的趋势。而提高大数据处理的能力,可能是未来新闻传媒提升竞争力的重要路径之一,但似乎并不是媒体核心竞争力的唯一内容和全部内容。
新闻报道中的一部分,完全可以对大数据的分析解读为主形成文本和视频,但这类报道不应只是停留于植入数据这样一个层面。对于数据乃至大数据,需进行深度挖掘和精细分析。原因之一:数据量大,必然鱼龙混杂、泥沙俱下。进行甄别和筛选以去伪存真、去粗取精,是不可缺少的环节。在此基础上,分析数据中包含的事理和价值,此环节同样不可忽略。正如《大数据时代》一书的作者维克托·迈尔·舍恩伯格所言:“在小数据时代,因数据是如此稀少,可以确保自己收集的每一个数据点都是非常准确的。相比较而言,大数据往往是凌乱和质量参差不齐的。但相比以高额代价来保证测量和收集少量数据的精确性,在大数据时代,我们将接受这种杂乱,因为我们通常需要的只是一个大方向,而不是努力了解一种现象的细枝末节。我们并不是要完全放弃精确性,只是放弃对精确性的热衷。失去微观层面上的精确度,为的是获取在宏观层面上的洞察力。”[16]舍恩伯格的着眼点并不是新闻,其所论是颇有道理的;倘若在新闻领域中讨论问题,情况并非如此。对于受众来说,既希望报道者在宏观层面上具有洞察力,又要求报道者在微观层面上体现精确度,对于不具备微观层面精确度的报道则难以容忍。
进而言之,数据新闻以及撰写数据新闻的机器人,或可较好地告诉受众发生了什么事(是什么),但不可能清楚地告诉受众特定事实(事件)因何故发生(为什么)。而探寻事物之间的因果联系,则是有资格被称为深度报道的一类报道的必备条件。因果联系可体现于数据,但往往与数据无关,而涉及人(个体或群体)与人(个体或群体)之间的这样那样的关系和联系,涉及政治、经济、文化等各种因素,涉及现实中的利害关系和历史上的恩恩怨怨。所有这些,在数据中或有所体现,或无迹可寻;即使是在数据中有所体现,也可能只是微妙地体现,不是一眼就可看穿看透的。获得有利于释疑解惑的素材和本身就很鲜活的素材,有赖于深入的、细致入微的调查采访。即使以撰写数据新闻为己任的新闻工作者,也不可在采访方面有一丝一毫的懈怠。
实际上,社会生活中任何一件较复杂事情的发生,都有着机器人永远无法理解的各种复杂因素,在数据背后也会有需通过解读才能读懂的内涵。笔者认为:数据的存在离开人们的准确解读,就仅仅是一堆没有派上用途的数据。数据新闻不应满足于使用和罗列数据,而应当力图用好数据。数据应为新闻报道增色。
3. 完全由数据构成的新闻,一旦固化,则将成为新的程序化和模式化的报道
对前文引用的机器人就美国加利福尼亚州地震所作的报道,笔者关注的是:数据由机器人植入了事先准备好的模板。这里有两个问题值得深思:
(1)可通过万能式的模板来报道的新闻,还有什么创新性可言?这其实包含了对新闻工作者创造性劳动的无视,使新闻工作者的精神生产由不可复制、取代蜕变为可以轻易被复制、被取代。这是新闻和新闻工作者的悲哀,而绝非幸事。
(2)如果没有那种事先准备好的模板,机器人又会把新闻写成什么模样呢?难道能够指望机器人在特定主人预设的指令外,进行自主的深入采访吗?能希冀它(们)由于灵感突降而给受众带来神来之笔吗?能期待在它(们)所作的数据新闻中包含人文精神和人文关怀方面的内容吗?受众期望得到这些本应和本能得到的东西,而机器人却使这一切最终成为人类的奢望。由此看来,采用数据丰满新闻报道,使之避免空洞抽象,这是可取的;而将数据新闻说成是新闻未来发展的方向,就大可不必。
如同马克思所主张的那样:不能要求玫瑰和紫罗兰散发出同样的芳香,更不能要求世界上最丰富的东西——精神,只能有一种存在的形式。新闻就本质而言,是对新近发生的具有新闻价值的事实的报道。新闻报道属于人类精神的范畴,丰富多样是值得提倡的,而贫乏单一则是不值得提倡的。
4. 数据新闻存在短板,在诸多方面局限性颇为明显
数据新闻有无可取代的优势和强项,有自己的适用范围和擅长之处,这是不争的事实;但同时存在着局限性,这也是事实。数据新闻在报道自然现象包括提供一部分自然灾难信息这一方面,自有其得天独厚之处。拥有海量数据,对数据进行迅速处理,并从中迅捷地获得对于报道来说十分有用的资料,这只有计算机或者机器人才能做到。
毋庸讳言,数据新闻也存在着短板。
短板一:在不是通过数据能显示新闻价值的地方,数据新闻往往显得捉襟见肘。有时,数据表现不了事实的复杂内涵,如各种力量之间的暗中博弈或幕后交易,并非数据能表现的。
短板二:数据新闻并不擅长讲生动的和有意味的故事。这里涉及两个问题。一则,能不能让数据自己讲故事?虽然有文章说“让数据自己讲故事”,但仔细拜读以后,笔者很难认同这种大量运用数据的做法是在讲故事,讲受众喜欢听的故事,讲属于新闻范畴的故事。笔者由此得出的结论是很难设想,数据会自己讲故事。一则,记者有可能借助于数据讲故事并把故事讲好吗?笔者认为吸引人、感动人的情节是好故事不可或缺的元素,如果将数据理解成无所不包的东西,那么,此处的讲故事似乎应另当别论;倘若是严格意义上的数据,那么它通常是缺乏故事元素的。要记者根据数据讲故事,实在是勉为其难。
短板三:数据新闻所缺的是人情味和趣味性因素。一般而言,新闻报道应为客观报道。但并不排斥一部分报道可以且应该写得具有人情味和趣味性。新闻价值是西方新闻理论中的核心概念之一,而新闻价值中的一个要素是趣味性。说数据全无趣味性是不恰當的,但为数不少的数据不以趣味性取胜,也是无可否认的事实。
结语
综上所述,数据新闻作为新闻中的一支一脉,作为新闻的新样态,自有其特点和价值,有别的新闻样式无可取代之处,如果将它抬高到居于其他新闻之上的位置,认为其他新闻未来都应该向它靠拢,或认为只有它才能一枝独秀,则不免言过其实。
参考文献:
[1] 刘建明. “大数据”不是万能的[N]. 北京日报,2013-05-06.
[2] 颜宏晖. 大数据时代来临 数据分析成为核心竞争力[EB/OL]. 红网-潇湘晨报,2013-12-07.
[3] 颜宏晖. 大数据概念 大数据时代:数据是市场核心竞争力[EB/OL]. http://ido.3mt.com.cn/Article/201403/show3550170c7p1.html.
[4] 刘长乐. 数据已成为企业和国家的新核心竞争力[EB/OL]. http://news.xinhuanet.com/gangao/2013-07/09/c_124979167.htm.
[5] 祝建华. 数据驱动新闻——大数据时代传媒核心竞争力[EB/OL]. 人民网-传媒频道. 2012-07-18.
[6] 彭兰. “大数据”时代:新闻业面临的新震荡[J]. 编辑之友,2013(1):06.
[7] 方洁. 数据新闻:全球新闻界的新宠 前景被看好[N]. 光明日报,2014-01-11.
[8] 李明,彦飞. 英国《卫报》:Twitter在骚乱中利大于弊[EB/OL].http://tech.sina.com.cn/i/2011-08-26/18285986351.shtml.
[9] 机器人用时3分钟完成美加州地震报道——数据创新传统新闻报道模式[N]. 中国社会科学报,2014-04-04.
[10]“数据新闻”是什么?[EB/OL]. http://article.yeeyan.org/compare/291931.
[11] 张祝彬. 数据运用与经济新闻写作——以“第20届中国新闻奖”经济消息为例[J]. 媒体时代,2011(3).
[12] 央视借大数据开创“数据新闻”时代[EB/OL]. 环球网http://www.enet.com.cn/enews/2014-02-07.
[13] 方洁,颜冬. 全球视野下的“数据新闻”:理念与实践[J]. 国际新闻界,2013(6):73-83.
[14] 祝建华. 数据驱动新闻——大数据时代传媒核心竞争力[EB/OL]. http://media.people.com.cn/n/2012/0718/c120837-18543917.html.
[15] 李希光. 大数据时代的舆情研判和舆论引导[J]. 思想政治工作研究,2014(1):10-16.
[16] 田晓玲. 大数据时代带来更理性、更可靠的决策[N]. 文汇报,2013-03-11.