我国新闻实践“大数据”应用热的批判性分析
2015-08-15郭云麒
郭云麒
(湖北大学 新闻传播学院,湖北 武汉 430062)
一、核心概念及我国实践现状分析
(一)大数据是什么
维基百科对“大数据”的定义——“大数据”,或称巨量数据、海量数据,指的是所涉及的数据规模巨大到无法通过人工,在合理的时间内达到截取、管理、处理、并整理成为人类所能解读的信息。大数据一般具有数量巨大、处理速度快、类型多样、价值密度低四个特点
从“大数据”的定义和特点中可以看出,大数据并非简单意义上的数据总量巨大,其技术应用的关键在于对海量数据的挖掘、分析、处理过程,只有通过准确的挖掘分析,大数据才能发挥其真正作用。而其庞大的数据体量也使得有用数据的筛选和分析变成了大数据应用的核心难点和决定性环节。
(二)数据新闻与精确新闻
要研究基于“大数据”技术所生产出的数据新闻,就要将其与早已有之的“精确新闻”加以区分——精确新闻指记者在采访调查新闻时,运用调查、试验和内容分析等定量社会科学研究方法来收集资料、查证事实,从而报道新闻。由此,精确新闻形成了与传统新闻的一个重要区别,即它是把“事件、人物、行为或态度用数字来表示,然后进行分析。[1]
数据新闻则是“大数据”时代兴起的一种跨学科、跨领域的新闻生产方式,它与以往以文字叙述为主的新闻报道不同,是以数据为中心,利用互联网和计算机技术对海量数据进行抓取、分析,最后使用多媒体手段呈现出的新闻。
某种程度上,精确新闻可以看作是数据新闻的延伸和发展,但是其二者之间也存在显著差别——首先,数据新闻分析和处理的数据量要远远大于精确新闻。其次,数据在精确新闻中多是作为背景材料,用于辅助文字,而数据新闻则是“数据驱动新闻”,数据的分析是其最有新闻价值的部分,相比传统的精确新闻,数据新闻的生产流程和思路都发生了根本变化。
(三)中国的大数据新闻实践现状
我国目前还没有专门从事利用机器进行新闻撰写的公司,仅有数据新闻写作的初期尝试。
最初的数据新闻探索要数2004年百度基于搜索技术和计算机算法将新闻整合推出了“百度新闻”网页频道,而在2010迅速崛起的新浪微博利用词频统计技术生成的微博热门话题模块从广义上看也是“大数据”技术的新闻应用。
传统媒体入央视和人民日报,也曾有过数据新闻的报道。例如,央视的“据说春运”、“两会大数据”、“据说两会”等节目,但总体看,我国的数据新闻的实践仍然相当有限。
二、“大数据”应用热的批判性分析
(一)技术逻辑与新闻报道基本理念冲突
“大数据是一种资源和工具,其目的是告知,而非解释;其意在促进理解,但仍然会导致误解——关键在于人们对它的掌握程度。”[2]由丘基尔的话可以看出,“大数据”的技术逻辑是通过数据直接给出“告知”的结果,是机器逻辑的分析,这与天然具有人文主义取向的新闻业在理念层面上大相径庭,因为“新闻业是政治民主、言论自由、公共服务的代名词”,[3]新闻报道侧重的是对于新闻事实发生缘由、发生过程、最终结果以及所造成影响的具体分析,而非冰冷的数字结果。在我国的具体新闻实践中,应认清“大数据”天生伴随的技术逻辑,在应用该技术进行新闻报道写作时不能仅仅“高唱技术赞歌”而完全抛弃新闻报道的基本理念。
(二)“大数据”的数据技术理性限制新闻报道创造性
大数据基于算法结论给出的结果会限制新闻报道的创造性——在新闻报道创作过程中,若仅从数据层面考察新闻事实逻辑和影响,会导致对其他维度的思维发散的可能。例如,对于春运的报道,若仅从数据分析,只能得出春运人流量的庞大等结论,而无法揭示春运背后蕴藏的文化背景和社会问题。
新闻最具魅力的地方是人的思维的宽度和广度,若一味高唱技术赞歌,过分沉迷于“大数据”技术威力,从业者极有可能丧失对新闻价值的辨识能力,并在思想和行动上产生惰性,在进行新闻写作时停留在表象就事论事,无法揭示事实本质。
(三)“大数据”机器新闻的高成本与局限
机器新闻,可以简单定义为利用“大数据”由机器分析后直接生成的新闻。
有研究认为,在大数据时代,计算机技术高度发达,美国学者克里斯蒂安·哈蒙德表示,“未来机器生成的新闻将占到媒体新闻的90%。”其他对机器新闻充满热情的研究者极力鼓吹机器新闻——“相对于较高成本的人工新闻来说,机器新闻要廉价得多。”[4]
但在笔者看来,其相对人工成本的缩减忽略了机器新闻的分析模型研发、数据的收集、存储成本,以及分析数据所要使用的大型服务器的购置费用和维护费用,若将这些成本计算在内,机器新闻的生产远比人工成本生产新闻要昂贵的多。其次,在机器新闻所谓高效、“低廉”的背后,智能软件写的新闻还存在其与生俱来的局限性——机器创作的新闻大多都只能应用于金融和体育领域,且只能生产出简单的消息,无法进行深度挖掘和报道。
(四)数据挖掘与分析不足,造成技术制约媒体困境
我国的新闻媒体大多不具有直接生产数据新闻的数据存量和分析技术,只能依托外部机构(如百度、谷歌、新浪等网络公司)提供的数据分析结果进行新闻的写作——很多数据新闻仅仅是简单将数据进行可视化直接呈献给受众,忽略对数据的分析和深入挖掘,无法揭示新闻事实的本质。
“大数据”技术追求相关关系、忽略因果关系,这使得基于“大数据”技术生产出的数据新闻在报道上也过度侧重于呈现新闻故事中的相互关系,无法回答新闻故事背后的因果逻辑。“正如我们看到的那些数据新闻那样,它们主要用来简单描述新闻事件中相关联的人物;而背后的因果,依然需要深度报道这些传统的新闻表现形态。”[5]
“大数据是一种资源、一种工具,他的目的是告知,而不是解释。”[2]具体到大数据的新闻报道中,对新闻事实的“解释”,就是新闻团体实现自我价值最重要、最核心的一步。在数据新闻的采写报道时,应从冰冷的数据中找到最有价值的角度、发掘事实的本质意义。
(五)数模型建构和数据分析导致时效降低
面对巨大的数据量和低密度分布的数据价值,数据的筛选、数据来源合法性的判断、数据分析的模型构建、数据可视化处理的过程消耗了大量时间。其次,对某一特定报道主体的数据收集积累也需要一定过程,往往需要等到事件结束后才能得到结论,这样的新闻生产流程将导致新闻时效的降低。
因此,大数据新闻的数据积累、分析模型建构和数据可视化处理的过程与新闻追逐的时效性原则向左。
(六)因新闻真实的基本理念相左
数据信息资源无限扩大之后,网络媒体、社交平台上充斥大量错误信息和大量垃圾数据,且容易出现篡改、伪造风险,即使是高科技的分析模型也难以完全排除所有有误信息,而这样基于“污染重”、“垃圾多”的数据产生出的数据新闻,有悖于新闻真实性原则。
大数据时代数据信息存在着:要素不足、精度有误、类型不一、动态变化、详略失当、过时失效等特点。[6]基于这样的数据产生的新闻,其真实性必然受到危害。其次,数字本身就是对事物的一种简化——而一旦简化就有失真的危险,对于社会现象规律的总结离开人的思考和思辨是无法想象的。
三、改进措施初探
(一)保持新闻品格,坚守新闻理念
“大数据”技术的一大特点是注重数据间相关关系的挖掘。这就存在着我们掌握的数据越多,通过数据挖掘出的相关关系就越来越多的困境,但事实上很多相关关系都是没有意义的。新闻价值的判断依旧需要依靠新闻直觉,如何使受众在接受信息时用情绪赋予新闻人物、价值以新的价值,这都需要依靠记者编辑通过新闻直觉和新闻专业素养去捕捉,而不能仅仅依靠冰冷的机器分析。大数据技术可以提升我们对相关关系的发掘能力,但是只有人类的直觉和巧妙心思才能使新闻更符合受众期待,更有“人情味儿”。
(二)丰富数据呈现方式,让技术为故事服务
媒体应对大数据还需要提高数据呈现和表达的能力。目前我国媒体数据新闻报道往往只是“大数据”的简单可视化呈现,往往无法让受众直观的数据揭示出的事实本质。
数据新闻以“以数据为中心”的面貌出现,在一定程度上改变了传统新闻报道中的传统叙事。但不可仅仅耽溺于这种数据创造的可能性而忽视故事本身。因此,笔者认为应当将“大数据”技术视为新闻报道的一种创作工具,而不应是创作主体,应利用这种技术手段为新闻报道中人们最关心的“故事”服务。尤其是在重大新闻选题中,应将数据挖掘的可视化呈现与记者的故事化稿件相结合,从而丰富读者对新闻事件的认知。
(三)加强记者独立思考能力和数据应用能力,谨防惰性
如前文3.2中指出,“从业者过分沉迷于大数据的深坑,就难以展示自己个性化语言和独特的风格”。
这就要求媒体应当加强独立思考的能力,应谨记大数据技术作为一种技术手段,只能作为辅助记者找寻最新关注点的工具。基于这个前提,数据新闻的制作者应当具备“呈现数据、展示趋势、数据对比、提示要点、梳理流程、揭示关系组织、构架分析解读”的能力,高校新闻教育也应顺应时代,开设相应的技术培训课程,不能仅止步于采、写、编、评的传统新闻业务能力的教育。
四、结论
“大数据”技术的确对当今的新闻生产产生了巨大的影响,但是作为一种技术在积极应用的同时也应提高警惕,应认识到其可能对新闻生产产生的负面影响和其本身具有的局限性,不可一味地高唱技术赞歌,忽略新闻直觉和新闻素养的重要性。另一方面,新闻从业者只有提升自身的专业能力和对“大数据”技术的应用能力,才能摆脱技术逻辑制约新闻理念的尴尬局面。最后,我国的新闻教育应重视对高校学生的新技术应用能力的培养,更新新闻人才的培养视野。
[1]肖明,丁迈.精确新闻学[M].中国广播电视出版社,2002:2.
[2]肯尼思·内尔·丘基尔.大数据的挑战和局限[J].哈佛商业评论.
[3]潘忠党.新闻与传播之别[J].国际新闻界,2006(4).
[4]毕良宇.大数据背景下的数据新闻的研究[D].研究生论文.
[5]刘义昆.大数据时代的数据新闻生产、现状、影响与反思[J].现代传播,2014(11).
[6]王树良,丁刚毅,钟鸣.大数据下的空间数据挖掘思考[J].中国电子科学研究院学报,2013(1).
[7]刘建明.“大数据”的迷思与新闻媒体的应对[J].中国广播电视学刊,2013(7):6-8.
[8]陈敏.对精确新闻中的数据的冷思考[J].新闻知识,2005(02).
[9]丁骋.大数据背景下数据新闻的生产和挑战[J].新闻知识,2014(6).
[10]方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6).