大数据新闻的认识误区分析
2015-04-29王咏梅刘研
王咏梅 刘研
【内容提要】大数据及相关分析技术推动着新闻报道方式与新闻生产手段的变革,对传统新闻报道的运作范式提出了新的挑战。本文主要针对大数据新闻报道的3个认识误区,即大数据新闻非全数据新闻、大数据新闻的基础数据并非全部是真实数据、分析方法制约着大数据新闻的客观性等进行简要分析,旨在提示在新闻报道中应当科学地运用大数据,避免产生错误的新闻报道。
【关键词】大数据 新闻 认识误区
人类信息的传播方式与传播效果既受到科技手段的制约,也受到科技能量的推动。新闻的本质是有价值的信息,新闻的历史演变大致经历了口头新闻、手抄新闻、早期印刷新闻、报纸、广播电视、电子新闻等几个阶段,其传播方式与效果同样与科技密不可分。如何确保新闻报道的真实性、客观性、全面性,始终是新闻从业者面对的重要问题。计算机技术、互联网技术与通讯技术的不断发展,为新闻从业者更好地解决这些问题提供了重要的辅助手段。①比如,兴起于20 世纪60 年代美国的精确新闻报道,“为新闻报道提供了更高的精确度和效率”。②
除了精确新闻报道以外,将科技用于提升新闻报道的真实性、客观性、全面性的具体表现还有计算机辅助新闻、数据库新闻、数据驱动新闻以及大数据新闻。③ “大数据”的概念来源于维克托·迈尔-舍恩伯格与肯尼思·库克耶所著的《大数据时代》,作者将大数据时代描述成生活、工作与思念的大变革,认为大数据对社会的好处将是无穷无尽的。④而“大数据新闻”尚不是一个成熟的专业概念,本文将其粗略地理解为依托大数据进行新闻内容挖掘与报道、受大数据驱动的新闻生产方式。
从现有的研究和讨论的成果来看,学者与业者主要关注大数据背景下新闻生产所面临的机会与挑战、新闻传播理论与实践的范式创新、新闻与传播学教育中的专业设置和人才培养、新闻生产中大数据运用的伦理等问题。虽然有学者对大数据新闻的认识误区问题进行了研究,但尚不具体,需要进一步加强。本文主要针对大数据新闻报道的3个认识误区进行简要、具体分析,旨在提示在新闻报道中应当科学地运用大数据,避免产生错误的新闻报道。
首先,大数据新闻并非全数据新闻。
对于大数据新闻而言,最重要的变化体现在报道思维的转变,即由传统媒体的定向性思维转向互联网的发散性思维,发散性思维意味着依托大数据进行新闻报道的创新。需要指出的是,大数据的数据来源非常复杂,任何事物(比如某个组织、个体)所具有的自然属性与社会状态以及状态的变化,都有可能成为大数据中的一个数据单位——byte。“在目前被广泛引用的IDC和EMC联合发布的‘2020年的数字宇宙报告预测,到2020年,全球数字宇宙将会膨胀到40000EB,均摊到每个人身上是5200GB以上。”⑤尽管大数据的数据量非常巨大,即使某个特定的大数据新闻前期具备40000EB的基础数据,对这个基础数据的分析、挖掘也可能只是全部新闻数据“冰山的一角”,而非全部数据。如果不注意大数据新闻的本身不是全数据新闻,在一定条件下会对新闻报道的全面性造成影响。
对于大数据与非全数据的关系,王馥芳在其《从大数据危机到全数据革命》一文中指出,大数据的“不完全代表性”体现在4个方面:一、大数据在很大程度上是外部事件驱动以及数据服务商商业模式主导的结果;二、大数据有可能受到数据运营商的操纵;三、大数据在某些情况下可能只是诸多无效信息的无度膨胀;四、真正有价值的数据是认知无意识数据,但限于目前的大数据挖掘技术,这部分数据仍不可能被挖掘出来。⑥
其次,大数据新闻的基础数据并非全部是真实数据。
大数据中的数据有很大比例来源于互联网,数字化是大数据新闻的显著状态。从这个意义上来看,大数据新闻是某种语境下的宏观抽象,而非鲜明的个体形象,通常不能为读者讲述生动的、引人入胜的、真实的“故事”。互联网生态系统中存在着大量虚假信息、伪劣数据,而真相信息、重要数据极其匮乏。针对这一现象,邵培仁教授提到了“信息污染”的概念,认为媒介信息中混入了有毒性、有害性、欺骗性、误导性的信息元素,对媒介生态、信息资源以及人类身心健康造成破坏、损害等不良影响。⑦因此,大数据新闻的基础数据中所包含的数据并非全部是真实数据,在新闻数据飞速增加的背后,很可能裹挟着大量的“被污染了的”虚假数据、娱乐数据、广告数据,这些附加数据的存在同样影响着大数据新闻的真实性,从长远的传播效果来看,会逐步降低读者阅读新闻时的情感体验。
最后,分析方法制约着大数据新闻的客观性。
丹纳·博伊德与凯特·克劳福德认为大数据成为文化、技术和学术研究的现象,其依据是技术、分析方法、神话三者的互动,其中,研究方法是大数据的重要组成部分。⑧大数据新闻的分析方法具有自己的特性,是否恰当地运用了分析方法,制约着大数据新闻报道的客观性。相对于大数据以前的新闻进行随机抽样、精确分析以及探求因果关系而言,大数据在理论上囊括所有数据,强调效率,而非精准;强调相关性,而非因果关系。⑨面对与特定新闻相关的海量的数据,“我们传统的数据组织和处理模式已经无法满足其需求,再加上大数据具有规模大、价值高、交叉复用等特征”,⑩因此,大数据新闻需要在分析方法、分析理念上进行全面创新。大数据的背后隐藏着有关人类行为特征的客观、普遍规律,只有科学地对大数据进行分析才能充分体现出大数据新闻的价值。
大数据新闻的特别价值在于采取科学的分析方法对某些危害社会、个人健康乃至生命安全的重大事件进行预测式报道,从而减少这些重大事件的危害范围与危害程度,比如即将出现的大规模传染性病毒、将要发生的食品卫生安全事件等。一个典型的运用大数据进行重大社会事件预测式报道的案例,是在2013年10月“中国网”等相关媒体报道的。日本NHK电视台报道了日本相关机构运用大数据预测大规模流感即将发生的事件,为相关部门采取恰当措施防止流感的进一步扩散提供了情报支撑。根据最终的统计数值来看,除了个别偏远地区的情报统计并不十分确切以外,流感的实际情况与大数据预测分析的结果基本一致,而这些个别情况所造成的影响,也可以通过“社会媒体”等大数据进行弥补。
结语
“在运用大众传播手段创造共识时我们必须时刻提醒自己:人类传播科技日臻完美的同时也使得进行空前的大规模破坏的手段逐渐完善。无论是大众传播工具还是原子能,这些工具的发明者本人并没有指明怎样去使用这些工具。”将大数据作为新闻报道的手段具有两面性,需要我们在实际工作中正确地运用大数据,发挥其应有的正面价值,避免在新闻报道造成不必要的损害。为了更好地面对大数据新闻带来的机会与挑战,需要我们在新闻与传播学的教育上进行相应的调整,比如从新闻专业设置、师资队伍建设、人才的培养模式等方面进行重新思考和重新定位,努力培养兼具新闻与传播学、计算机科学、信息科学等学科才能的综合性人才。
注释: ①米切尔·斯蒂芬斯、新闻的历史[M].北京大学出版社, 2014.
②③喻国明、从精确新闻到大数据新闻——关于大数据新闻的前世今生[M].青年记者,2014,(12).
④ 维克托·迈尔-舍恩伯格、 肯尼思·库克耶.大数据时代[M].浙江人民出版社,2013.
⑤数据转引自“中国统计网”:http://www.itongji.cn/article/040I14R014.html
⑥王馥芳.从大数据危机到全数据革命.中国社会科学网,http://www.cssn.cn/zx/201503/t20150324_1557599.shtml
⑦邵垃仁等.媒介生态学[M].中国传媒大学出版社,2008,168-188.
⑧danahboyd& Kate Craw-ford (2012) CRITICAL QUES-TIONS FOR BIG DATA, Information, Communication & Society, 15:5, 662-679, DOI: 10.1080/1369118X.2012.678878
⑨郑宇.大数据与小数据:节目生产、营销与评估的秘密.看传媒,2015-5-10.
⑩陈力丹、李熠祺、娜佳.大数据与新闻报道[J].新闻记者,2015,(384)
中国网:日本用大数据技术预测流感 预测与分析结果精确http://www.china.com.cn/news/world/2013-10/21/content_30353446_2.htmLouis Wirth.Consensus and mass communication. American Sociologist Review. Vol.13, No.1(Feb.,1948),pp.1-15
(作者单位:王咏梅,内蒙古日报社;刘研,内蒙古大学文学与新闻传播学院 )
编辑:范永