浅谈大数据时代预测性报道的困境和出路
2017-08-14许梦勉
许梦勉
摘 要 信息时代数据成为无价之宝,在大数据浪潮的推进下,新闻界对预测性报道的发展充满期待,然而预测性报道面临着技术壁垒、数据依赖、方法吊诡等困境。大数据的相关性分析为预测性报道提供新方法和新思路,但同时新闻界存在将大数据技术“神话”的可能,大数据能否从根本上解决预测性报道面临的诸多障碍还未有定论。本文以预测性报道的现状为切入点,研究造成其发展限制的原因,并探寻大数据与预测性报道的结合之路。
关键词 大数据;预测性报道;相关性分析
中图分类号 G2 文献标识码 A 文章编号 1674-6708(2017)190-0030-02
信息时代数据成为无价之宝,随着企业和政府对大数据的大力发展和推进,大数据在社会各行业中渗透程度逐渐加深,并被普通民众所熟知。近几年,大数据一词频频出现在新闻报道中,并成为科学和权威的代名词,普遍观点认为大数据将重构新闻业,基于大数据挖掘和分析下的预测性报道将是新闻业未来发展方向之一。然而,大数据从根本上来说属于新技术,尚处于上升期的发展阶段,其预测功能是否会对预测性报道产生根本性的影响还需要大量的实践进行检验。
1 预测性报道的发展和现状
预测性报道是“依据已发生的事实,对新闻事件、某一重要问题或重要领域的未来发展前景所进行的分析报道”。[1]预测性报道诞生于20世纪30年代的美国,随着60年代未来学理论的兴起,逐渐成为深度报道的一种独立类型。在发展初期,因为社会转型带来的不确定因素增多,需要大众媒体即时准确地发布信息和预测趋势,因此,业内对预测性报道的前景普遍持乐观态度。
中国新闻界在初期发展阶段同样对预测性报道抱有期待,20世纪90年代后期,预测性报道兴起,以一些预测性新闻报道的专栏、专版出现为主要标志[2]。有学者认为“它是符合时代发展要求的新事物。”[3]现在互联网的飞速发展使得信息需求变得更加紧迫和关键,大数据的出现似乎为预测性报道的发展注入了一支“强心剂”,业类人士认为数据的全面和多元所带来的预测能力的提升能够帮助预测性报道获得更大的发展空间。然而,相较于调查性报道和解释性报道,作为深度报道之一的预测性报道的影响力却一直无法与前两者相比肩。
从学术研究方面来看,关于预测性报道的研究明显较少,并且内容同质化严重,多以单一的乐观视角前瞻大数据对预测性报道的影响,而能够提出可行性意见和措施的寥寥无几。在实践应用层面上,预测性报道仍旧局限于经济和体育新闻领域,并常以主观性的评论等新闻形式呈现,基于大数据的预测性报道还未能在深度报道领域占有一席之地。
2 大数据时代预测性报道的困境
舍恩伯格在《大数据时代》中提到“大数据的核心就是预测”,喻国明在书中指出“未来越来越多的深度报道和调查性报道将是由数据驱动,或者是基于大型数据挖掘与分析而对事件发展趋势的预测性分析”[4]大数据对于消费者购买习惯、疾病预防、出行安排等的预测效果确实显现出极大地潜力和商业价值,但是在新闻领域的预测作用却并不明显,更多是以“数据新闻”的形式对统计的数据结果进行解释分析。
2.1 技术和资金的限制
大数据属于新兴技术,从数据收集、整合到分析都需要专业人士进行操作,并根据算法的不同呈现出不同的结果,对于新闻从业人员来说,解读并运用大数据进行预测基本不可能。因此,预测性报道的新闻生产过程与大数据处于分割的状态。
另外,海量的数据获取本身就需要巨额资金的支撑,在媒体融合的趋势下,“中央厨房”的理念逐渐得到实践,《人民日报》于2015年两会期间首次试运行了该平台[5],其中大数据的获取和融合也包括在“融媒体”计划之内,此类项目是在足够的资本和政策支持下建立起来的,无法被中小规模的媒体所复制。因此,基于大数据的预测性报道只能被各大媒体集团所垄断。
2.2 对互联网企业数据的依赖
自麦肯锡发布大数据报告以来,大数据成为社会各界讨论的热点,尤其是商业领域中与互联网密切相關的企业,诸如谷歌、百度、网易、阿里巴巴、联想等都设立了大数据中心,帮助搜集和分析用户的行为,第一时间掌握市场动态,而如今新闻行业中比较多的大数据报道多是与此类企业进行合作的结果。
以中央电视台的节假日出行报道为例,其数据和可视化图表来源于高德地图或百度地图,从整体角度展现实时路况并预测拥堵路段,为市民出行提供便利。然而,从内容来看,核心部分基本由他者提供,记者在新闻生产的过程中的作用体现较少,对于数据的依赖限制了新闻的发挥,企业对数据的垄断让新闻媒体成为附庸。
2.3 相关性预测不能代替因果分析
大数据时代,处理的是全体数据而非抽样,关注于相关性关系而非因果关系。舍恩伯格认为这将会改变人类的思维方式,“大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。”“通过去探求‘是什么而不是‘为什么,相关关系帮助我们更好地了解了这个世界。”[6]传统的预测性报道主要以因果逻辑作为预测的方法,通过事物间的相互联系探寻未来,这是两者本质的差异。希望完全以大数据技术进行预测性报道的生产这一观点本身就存在矛盾,在现今的新闻实践中表现为方法上的分离和预测结果的偏差。
2.4 对预测性报道的争议
预测性报道在诞生之初就被寄予厚望,但是经过几十年的发展仍旧没有大的起色,其原因与其特点密切相关。新闻被普遍认为是“对新近发生事实的报道”,而“预测”是对未来事物的推测,本身带有不确定性,其真实性受到质疑。同时,预测性报道存在着方法吊诡的现象和非独立的特征,其定义也饱受争议,而从长远来看,大数据并不能缓解突破这些障碍的难度,即便是逐渐成熟的大数据分析技术也不能保证预测结果的准确性,“黑天鹅事件”的存在预示着预测永远存在风险,这是无法仅靠技术就能解决的。
3 预测性报道的出路探析
即使大数据时代预测性报道仍旧面临重重困境,新技术带来的变革对于新闻业的影响却不能小觑。现今,大数据处于蓬勃发展的态势,影响着社會的方方面面,被誉为“第四次工业革命”,在普遍的赞誉声中需要我们以辩证的态度看待大数据为新闻业带来的影响,取长补短寻求进阶
之路。
3.1 正确认识大数据
大数据作为新兴技术还没有发展成熟,“大数据热”中不乏炒作的成分,网络语境下存在对“技术神话”的建构。[7]被业界称道的谷歌流感预测在四年后遭遇了滑铁卢,由于媒体对成功预测的大肆报道让“流感”一词的搜索量迅速攀升,直接影响到了数据的客观性,这说明预测过程中仍然无法摆脱人为因素的干扰。然而,大众仅对成功案例留下印象而忽略了失败的可能性,在官方媒体、专家等权威机构对大数据的一致认可下,形成大数据无所不能、无处不在的认知。值得一提的是,公开报道的成功案例中很多并未涉及专业的大数据挖掘和分析技术,甚至其数据量远未达到“大数据”的标准,因此并非所有贴上“大数据”标签的结论都是可信的,大数据被过度魅化了。
3.2 定量和定性方法相结合
预测性报道多是对社会领域事件的预测,20世纪初有学者指出社会预测的变化趋势就是“由以定性为主的传统科学预测走向定性与定量相结合的现代预测”。[8]契合大数据时代的现状可以说大数据技术将成为预测性报道中的重要方法之一。一方面,一旦确定算法的严密性和客观性,根据全数据而分析得到结果的过程中基本不存在干扰因素,这也是大数据能够精准预测的原因;另一方面,传统的经验性预测能够弥补因数据源中无效和空白信息而产生的偏差。
3.3 回归新闻的本质
新闻产生于人们沟通和了解情况的社会需要,“预测性报道的核心功能可归纳为:趋利避害,表现为把握先机、计划安排、辅助决策、社会预警等功能”[2],无论是对全数据的抓取和挖掘,还是利用相关性对数据的分析,都不是新闻业的长项,如果用单一的数据和图表来代替新闻报道,那么就脱离了新闻的本质,也无法体现社会意义和价值。新闻从业者应创新思维方式,深入挖掘数据背后的原因并进行分析和预测。
总体来说,大数据能够为预测性报道的发展提供新的思路和方法,但是现阶段其影响力有限,社会中存在诸多的“黑天鹅事件”,新闻的本质也要求从业者不能仅凭借数据进行预测报道。虽然预测性报道在大数据时代仍然面临重重困难,但是当大数据脱离“神坛”,发展成熟时,其数据的全面性和客观性将会成为预测性报道发展的一大助力。
参考文献
[1]程道才.西方新闻写作概论[M].北京:新华出版社,2004.
[2]刘勇.社会转型中的预测性报道刍议[J].安徽大学学报(哲学社会科学版),2009,33(6):69-73.
[3]李晓静.中国预测性报道:现状、问题及前瞻[J].现代传播,2004(2):45-48.
[4]喻国明,李彪,杨雅,等.新闻传播的大数据时代[M].北京:中国人民大学出版社,2014.
[5]李天行,周婷,贾远方.人民日报中央厨房“融媒体工作室”再探媒体融合新模式[J].中国记者,2017(1).
[6]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.
[7]何睿.微博语境下大数据“技术神话”的建构与批判[J].当代传播,2015(2):69-71.
[8]阎耀军.社会预测学基本原理[M].北京:社会科学文献出版社,2005.