机器人新闻对新闻报道的挑战与反思
2017-01-30王晓楠
文/王晓楠
机器人新闻对新闻报道的挑战与反思
文/王晓楠
机器人新闻是借助计算机程序和大数据分析而产生的。机器人新闻的出现对传统新闻报道的时效性、客观性和背景材料整合等方面带来了挑战。但这并不代表机器人新闻可以取代人工新闻报道,因为机器人新闻报道仅限于事实,对事实背后的原因很难表达,客观性表现使新闻失去了人文关怀,且其提供的背景材料也是十分有限的。
一篇关于地震的机器人新闻引发关注
中国地震台网在2017年8月8日21时40分,根据测定结果自动发布了一篇名为《四川阿坝州九寨沟县发生7.0级地震》的短消息。在这条消息中,不仅将地震信息完整、及时、准确地发布了出来,同时在文章末尾中也同样做出了这样的标注:“上述内容由本站机器自行编写,编写耗时25s。”在这条短消息中,用540个字和4张图片,将所需要传递的八项内容完整地表述了出来,并且在语法、文体上都非常规范。而在这条信息发布不久之后,被新华社官微全文引用,于3分钟后发布了这一条消息,证明了中国地震台网所发布信息的真实性和有效性。随后,中国地震台网还相继发布了后续13次余震情况,均采用了机器人自动生成报道的形式编写。
机器人新闻在中国第一次受到广泛关注,引发了学界对机器人新闻的热议。40年前,世界上第一个“故事写作机器人算法”出现在耶鲁大学,40年后的今天,随着大数据技术的发展,机器人新闻已经成熟。机器人新闻究竟如何运作,对新闻业又哪些影响,存在哪些问题,值得学界和业界关注。
机器人新闻的发展及其生产机制
笔者所介绍的“新闻机器人”,实际上是一种具有新闻素材自动搜集并编写成符合人类阅读习惯、语言规范的内容的一种算法或者软件。也就是说,“新闻机器人”从本质上来说,是一种通过一系列数据规则而完成新闻信息素材抓取、分析以及自动编制成符合人类阅读习惯的新闻生产方式、方法,具有一定的创新性和技术性。
我国的机器人新闻起步较晚,直到近年来大数据技术发展起来后才受到关注。腾讯新闻在2015年首次发布了国内第一篇机器人新闻——《8月CPI同比上涨2%创12个月新高》。同年年底,新华社的新闻机器人“快笔小新”系统正式上线,只要输入一个股票代码,“快笔小新”即可在短短3秒钟时间里完成一篇专业性极强的财报分析文稿的撰写工作。
机器人是如何生产新闻的?哥伦比亚大学新闻学院Tow数字新闻中心曾把其生产流程分解为五个步骤:第一,学习大量标准化、结构化的信息资料;第二,对信息资料中所隐藏的“新闻性”进行有针对性的分析和判断;第三,结合实际情况,将确定下的一系列报道角度,按照优先度进行排序;第四,匹配报道内容和报道角度;第五,按照预先设定的流程和结构生成新闻报道文本。
第一步,无论采用何种算法,都需要有相应的海量数据输入。而所输入的数据越丰富、越“干净”的领域越容易开发出具有实用价值的自然语言自动生成系统。数据的数量和质量,决定了新闻机器人所能够提供的新闻文稿的最终质量。
第二步,完成数据输入和读取操作之后,算法将会对信息资料中所隐藏的“新闻性”进行针对性的判断和分析。算法会挑出数据中最“反常”的方面,再通过历史数据的对比分析,找寻“不同寻常”的地方,并以此为依据判断信息存在“新闻性”。
第三步,在判断信息具有“新闻性”之后,算法将会结合实际情况,将确定下的一系列报道角度,按照优先度进行排序。而这里的报道角度,实际上是预先输入的框架结构,选择可行度最高的组织新闻报道的内容。
第四步,完成上述工作之后,算法将会结合信息的实际情况,在其中搜索“故事点”,作为报道的主要方向。算法可以按照“接近性”原则优先或重点报道相关新闻事实。
第五步,以自然语言的规范为基础,对所编纂的新闻稿件进行润色。这一步对于算法的技术有着极高的要求,也同样是影响新闻报道可读性的主要因素。
事实表明,在一些财经类、体育类的机器人新闻报道文稿中,读者基本上无法分辨文稿是真正的人所撰写的,还是机器人所生成的。而这种情况的客观存在,证明了在新闻报道领域,机器人或者说机器算法的应用有着广阔的前景,一些特定题材的新闻已经对新闻记者带来了挑战。
机器人新闻对新闻报道的挑战
尽管不少人对机器人新闻仍存质疑,但不可否认的是,机器人新闻的出现已经在逐渐改变一些领域新闻报道的情况。特别在新闻的时效性、客观性和背景材料选择上,可以做得比人类的采访报道更快、更好。
一是前所未有的时效性冲击传统时效观念。新闻的时效性历来是新闻的首要特点,也是新闻报道竞争的焦点。传统的新闻采访报道高度重视速度,甚至引发“抢新闻”的说法。尽管互联网时代,新闻时效性已经由于出现自媒体现场新闻而发生了变化,但机器写作的出现却极大提升了新闻的时效性。相对于新闻编辑来说,新闻机器人完全可以做到7×24小时在岗,只要发生突发事件,机器人就会通过各种渠道进行数据的采集工作,并按照预先设定的算法完成稿件的编写工作,及时发布出去。
实践中,机器人新闻在突发事件报道上已表现出不俗的成绩,挑战了人类新闻报道时效的极限。如,当前已经投入实际使用的 Wordsmifh平台,可以在1秒钟时间完成2000篇文章的编写工作。而我国的新闻机器人技术也同样处于世界领先水平。早在2015年,腾讯的新闻机器人就能够根据政府所提供的CPI资料,在短短几分钟时间内完成相关领域新闻稿件从编写到发布的一系列操作;2017年8月9日,新疆发生地震,中国地震台网机器人新闻发布消息仅用时8秒。机器人新闻对新闻时效的挑战,或许将彻底改变传统新闻理论中对新闻时效的认知。新闻机器人的出现,不仅极大地提升了新闻出产的效率,同时对于新闻时效性的提升所具有的重要意义更是不言而喻的。
二是基于事实的客观性挑战选择性报道。客观性是新闻报道的基本原则之一。客观报道讲究用事实说话,不掺杂个人评论。在传统新闻报道中,由于新闻事实是人为选择的,无论其如何运用事实进行报道,终究难以摆脱人为的感情倾向,进而影响客观性。机器人新闻的出现,在客观性方面对传统新闻报道“选择性的客观报道”带来强烈冲击。
全自动的新闻生产,是机器人新闻最为显著的特征。在实际的新闻内容撰写过程中,人在其中只是程序设定时发挥了作用,而整个写作过程都是机器人自行完成的,实现了写作主体由人向机器的转变。机器人写作新闻时,对已有资料或数据库进行大量数据采集,运用算法对采集到的数据进行关键信息提取和结构化处理,完全是客观存在的数据和事实。
以中国地震台网对8月8日四川发生的地震报道内容为例,机器人编纂的新闻内容涵盖了当地的热力人口、震中天气、速报参数、周边村镇、历史地震以及震中地形和震中简介在内的八项内容。这些事实都是机器人根据程序计算出来的,完整全面且客观地报道了相关事实。而如果换作是人类记者采访,难免会根据其认定的新闻价值进行选择。
三是背景材料整合力度超出人为搜集。作为新闻中描绘事件环境、人物客观条件、烘托主题的重要内容,新闻背景对于新闻信息立体化有着重要的现实意义。在深度报道中,新闻背景材料的运用可以使报道更加全面、完整,加强报道的深度。特别是新媒体的发展对传统新闻报道带来冲击之后,基于背景材料的整合的深度报道甚至被视为迎接挑战的出路。
机器人新闻的出现,冲击了传统新闻报道人工的资料搜集整理工作。在机器人新闻的产生和发展过程中,互联网数据、用户生成内容等资源起到了重要的推动作用。而数据挖掘等技术,则为机器人新闻素材的整合奠定了坚实的基础。机器人新闻对背景材料及数据的搜集整理广度、深度和时效都是人工所不能达到的。
机器人新闻的问题及其反思
机器人新闻在给传统新闻报道带来挑战的同时,存在一些技术本身所无法避免的问题。正是因为存在这些问题,让我们可以冷静看待机器人新闻的意义,而不至于过于夸大机器人新闻的作用。
一是报道对象限于客观事实。机器人新闻是基于计算机软件程序和大数据分析的,这就导致机器人新闻只能在拥有庞大数据的分析基础上产生。然而,新闻事实往往不仅限于新闻事件本身,还有各种历史和背景信息,有宏观真实和微观真实之分,机器人新闻在这些事实的判断上显然缺乏人工新闻的智能。
所以,新闻机器人的应用,只能局限于固定的部分领域之中。实际上,在这些可供新闻机器人发挥作用的新闻领域中,客观的数据及分析是其最大优势,而一旦进入时政、文化、社会类新闻,必然受限于数据。即便是这些机械化的领域,机器人新闻也只能在分析结果基础上根据人工设定程度选择新闻点,套用相应的模板生成新闻内容。可见,机器人在新闻写作上的创造力,实际上仍然是人类创造力的直接体现,大可不必对其心怀愤懑。
二是客观形式缺乏人文关怀。诚然,客观报道是新闻报道的原则。但是,新闻报道之所以有魅力,在于其深刻的人文关怀,一则缺乏人文关怀的新闻将失去灵性,显得乏味。因此,在机器人新闻发展势头强劲,业界、学界赞誉有加之时,我们也应当意识到其技术上的不足,导致机器人记者只能以现有的模板和知识库为基础撰写新闻文稿,不仅模式化问题严重,而且缺乏人文气息、缺乏必要的情感。
美国国家公共电视台在2015年组织了一场新闻编辑和新闻机器人新闻稿件撰写比赛。虽然新闻机器人只用了短短2分钟就完成了撰写工作,但是在文章质量的投票上,得票数却远远少于人类所撰写的新闻。从中我们可以发现,新闻机器人所生成的新闻难以具有足够的吸引力,对受众而言,显得“冰冷”而缺乏吸引力。
究其原因有三点:一是新闻机器人在实际应用过程中,只能呆板地提取知识库和模板库中的东西,而不可能对情绪做出有效的判断;二是新闻机器人很难做到归因和举证,无法引导读者深入思考新闻;三是新闻机器人本身严重依赖于内置逻辑的特征决定了无法适应叙事性新闻稿件的撰写要求。
三是背景材料限于事实材料。新闻背景材料的内容是十分广泛的,它不仅涵盖了相应的社会背景、历史条件等内容,同时也必然涉及到政治背景、知识背景等一系列新闻环境。与此同时,新闻背景运用方式上的差异,也同样可以将其进一步划分为说明性背景材料、对比性背景材料、注释性背景材料等多种情况。在实际的报道过程中,结合同期声、录像、图片以及各种电脑图表等一系列声画资料,可以给受众以直观的感受。
如上文所述,机器人新闻受技术自身限制,报道范围集中在体育、经济、灾难等涉及大量数据、图表和量化分析的专业领域。这些背景材料存在其局限性:一方面,背景材料是否可以进入新闻,取决于软件程序员编程时的设定;另一方面,对一些社会背景、知识背景类的材料,机器人很难根据程序获得。事实上,机器人新闻的背景材料,在信息海洋中是十分有限的,况且很多背景材料受众可以通过网络渠道获得,并未体现出人为加工后的特定语境和用意。
作者系吉林师范大学传媒学院讲师
本文系2015年吉林省社会科学基金项目(基地项目)“新媒体语境下吉林省传统文化的传播与发展研究”(项目编号:2015JD7)的研究成果。