从新闻叙事学角度看机器人新闻写作的局限性
2018-10-21李薇薇
李薇薇
摘要:机器人记者是人工智能技术在新闻写作领域的一次有益实践,机器人记者在数据挖掘和写作速度方面存在着优势。但是从新闻叙事学的角度分析,其作品在文本和话语结构存在局限性,具体表现为:语义理解缺陷,段落结构混乱和新闻要素缺失。受到模板的限制,叙事行为方面也存在不足,具体表现为:语言机械化,角度同质化和报道浅显化。
关键词:机器人新闻;新闻叙事学;新闻话语;叙事行为
“新闻”是我们司空见惯的一种叙事形态,“叙事”是报道新闻和传播信息的一种手段,穆青就曾经说过“新闻是一种叙事文”。[1]对新闻叙事学的建构问题是21世纪初学界的热门话题,1969年茨维坦·托多洛夫第一次提出“叙事学”这个术语[2]。随着“叙事学”体系建构的不断完善,许多学者开始将目光转向新闻叙事的研究上,不少学者开始提出“新闻叙事学”的概念,比如范步淹提出,“新闻叙事学是以新闻事件、叙述及叙述目的为对象,研究新闻叙事的学科”[3],比如黄挺提出“新闻叙事学是研究新闻叙事的本质、属性、功能和形式的学科,它的研究对象包括一切新闻叙事作品和新闻叙事行为”。[4]
新闻生产传播的目的是运用一定的语言系统,叙述、重构受众欲知、应知而不知的新闻事实,它的编码方式应满足人类对新闻信息的取舍和信息效益最大化的需求,即新闻话语。[5]新闻话语是新闻叙事研究的逻辑起点,新闻话语详述的事件——故事是新闻叙事研究的所指,而“叙事行为”是新闻话语完成故事的动作。新闻叙事学的话语研究包括新闻话语事实建构的字词选择、句式选择和意识形态;“故事研究”包括故事的内涵和故事的叙事节奏、频率和顺序安排;叙事行为包括叙述者、叙事角度和叙述方式的研究。[6]
技術总是在更新迭代,犹如人类社会的推动器。计算机新闻已经成为新闻生产提高效率的核心技术,“计算机生产新闻”(CGC)将和“专业记者生产新闻”(PGC)以及“用户自生产新闻”(UGC)共同成为信息生产的主要方式。[7]
最早将人工智能技术应用于新闻生产的是在2006年,美国信息供应商汤姆森金融公司开始运用电脑程序来替代财经记者,自动撰写经济和金融方面的新闻,汤姆森公司称,它的机器人记者可以在公司发布信息后的 0.3秒内提取有效数据。而后西北大学、美国“叙述科学公司”和“自动洞察力”公司纷纷开发这样的软件,美联社在2014年正式使用。[8]国内此类人工智能的新闻写作软件也已经出现,如腾讯在2015年开发的软件“DreamWriter”,2015年11月新华社使用智能软件“快笔小新”进行新闻稿件的写作,今日头条的“张小明”在2016年奥运会报道中大放异彩,百度的“度秘解说”和南方都市报的“小南”以及广州日报的“阿同”等机器人新闻写手的出现使得自动化生产成为新闻学研究的前沿领域。
机器人新闻话语依赖丰富的数据库和模式化的数据整合,内容和结构有相对固定的模式,在新闻叙事的完整度、叙事风格和语言特色等方面存在着“先天不足”,“非人格化”和“表达局限”成为机器人新闻的短板。本文根据机器人新闻的特点,着重从其新闻话语和叙事行为两方面对其局限性进行探讨。
一、新闻话语和文本结构的局限性
新闻传播活动的本质是一种叙事行为,叙事行为离不开语言,新闻叙事有一套独特的话语体系——新闻话语。新闻话语典型的结构代表是“倒金字塔结构”,其他结构可以看作是这种结构的变形,都是由新闻核心事件、背景和评论等组成。机器人依赖程序和模板嵌入性完成写作,其作品缺乏灵活性,存在表达不清、衔接不顺和缺少新闻要素的弊病。
(一)语义理解缺陷
机器人写作新闻可以分为三种模式:模板填充式,抽取式和生成式。[9]摸板填充式和抽取式依赖建立的数据库,机器人只能在现有数据的支持下进行词汇和语句进行抓取,然后进行排列组合,真正的个性化生产还没有办法实现。机器人记者的理解能力和逻辑能力远远低于人类,因此依赖算法的自动化新闻写作常见于数据为主体的财经新闻和体育新闻领域。本文以“张小明”在2016年8月17日写作的一条快讯为例:
北京时间8月17日06:40时,奥运会羽毛球女子单打四分之一决赛在里约会议中心-4号馆如期举行,耗时3场大战,比赛中选手山口茜表现不理想,绝望之际,失败女神朝其抛出了橄榄枝。最终现世界排名第6的选手奥原希望以2:1的比分战胜了日本选手山口茜,成功晋级下一轮,继续向冠军发起冲击。各局小分分别为:11:21,21:17,21:10。
虽然这篇报道可以看出机器人记者尝试在写作中注入更多的情感色彩来增强可读性,比如“耗时”、“橄榄枝”和“发起冲击”等等,但是文本中仍然存在着明显的语法错误,如“耗时三场大战”和“失败女神朝其抛出了橄榄枝”,这些语言显然不会出现在人类写作的新闻文本中,这表明一些简单的逻辑错误仍然是机器人新闻无法避免的。
(二)段落逻辑混乱
机器人记者新闻的写作依赖于记者输入的写作模板,不可避免的带来逻辑的混乱,体现在文章的结构上就是段落之间链接障碍,缺少过渡性的语言。
本文选取腾讯公司的财经智能记者“Dreamwriter”发布的《8月CPI同比上涨的2.0%》为例。
腾讯财经讯 国家统计局周四公布数据显示,8月CPI同比上涨2.0%,涨幅比7月的1.6%略有扩大,但高于预期值1.9%,并创12个月新高。
国家统计局城市司高级统计师余秋梅认为,从环比看,8月份猪肉、鲜菜和蛋等食品价格大幅上涨,是CPI环比涨幅较高的主要原因。
……
8月份,全国居民消费价格总水平环比上涨0.5%。
银河证券的分析报告认为,预计到年末生猪价格将超过上一轮“猪周期”价格高点,如果猪肉价格集中在四季度上涨,并且重合蔬菜上涨周期。
……
文章第一段开门见山,列举了8月CPI的涨幅,之后的两个自然段用专家的观点解释了发生上涨的原因。第三自然段以“8月份,全国居民消费价格总水平环比上涨0.5%”独立成段,将文章的内容引向另一个层次,但是之后的论述并没有围绕“居民消费价格增长”,反而是引用了专家对未来CPI涨幅的预测,第二层次的内容论述过于分散,甚至专家观点还有冲突的地方,因此存在段落之家衔接不紧密,逻辑混乱的问题。
(三)新闻要素的缺失
机器人记者在写作过程中依赖数据源而没有独立采访的能力,在报道过程中经常会出现缺少新闻要素的缺点。
作者以两条关于同一事件的新闻报道为例:
上周末,今日头条获得了中国人工智能最高奖项吴文俊奖。
获奖项目是写作机器人张小明。2016年6月上线以来,张小明创作超过两万篇文章。包括体育、财经、房产等十几个领域。
2017年12月23日,第七届吴文俊人工智能科学技术奖颁奖盛典在苏州举行。今日头条人工智能实验室凭借“互联网信息摘要与机器写稿关键技术及应用”项目荣获吴文俊人工智能技术发明奖。本年度获得该奖项的机构还包括清华大学、中科院以及北京航空航天大学等国内顶尖高校。
前者来自于机器人记者“张小明”写作的新闻文本,后者来自于界面新闻发布的记者采写的新闻。就新闻要素“5W+H”来说,机器人新闻文本包含的新闻要素包括“上周末(时间)”、“今日头条(人物)”以及“今日头条获得了中国人工智能最高奖项吴文俊奖,获奖项目是写作机器人张小明”(事件)这三个要素。人类记者写作的新闻文本中包含了“2017年12月23日(时间)”、“苏州(地点)”、“今日头条人工智能实验室(人物)”、和“今日头条人工智能实验室荣获吴文俊人工智能技术发明奖”(事件)这四个新闻要素之外,还包括了今日头条人工智能实验室获奖的原意以及此次奖项的背景。
机器人记者依赖模板,它们写作的新闻更多就事论事,局限在“时间”、“地点”、“人物”、和“事件”这四个新闻要素。与之对应的专业记者写作的新闻报道,更能体现人类思维的创造性和灵活性。事件的意义和背景都会介绍,能够增加新闻的深度,也使读者在阅读过程中兴趣盎然。
二、新闻叙事行为的局限性
叙事行为分为“理解”和“讲述”两个层面,前者强调叙事文本的内容和意义层面,后者强调叙事文本的风格和特色。[10]新闻叙事行为作为一种普遍的社会传播行为,要求其行为坚持“真实性”和“时效性”,在保证这两个要求的前提下,最大程度的提供可读性是判断新闻文本优劣的标准。
新闻叙事行为研究的一个层面是风格叙事。所谓风格叙事,就是把某个原始事件呈现为新闻事件的过程中保证真实性、不损害真实性的前提下所进行的个性化表达和差异化表达。[11]风格叙事背后的动力机制在于对传播效果和传播目的的关注,风格叙事又囊括了叙事语言和叙事角度等。机器人新闻写作基于数据库和“定制指令”,在叙事风格方面存在局限性。
(一)语言机械化
機器人新闻依靠人工输入的模板,由于报道题材、报道环境、新闻时效性以及技术水平的较多制约,其文本在人情味方面依然有不可避免的制约和缺陷。
本文以“DreamWriter”写作的《8月CPI同比上涨2.0%创12个月新高》这篇文章为例。
腾讯财经讯 国家统计局周四公布数据显示,8月CPI同比上涨2.0%,涨幅比7月的1.6%略有扩大,但高于预期值1.9%,并创12个月新高。
国家统计局城市司高级统计师余秋梅认为,从环比看,8月份猪肉、鲜菜和蛋等食品价格大幅上涨,是CPI环比涨幅较高的主要原因。
这篇文章的首段先介绍了国家统计局公布的数据。第二段直接引用国家统计局城市司高级统计师余秋梅的观点,内容分别是鸡蛋、蔬菜和肉类等和上个月相比CPI的上涨指数,而对百姓的生活确实的影响却很少提及。
与之对比的是央广网的记者采写的新闻。
央广网北京9月10日消息 据中国之声《全国新闻联播》报道,国家统计局今天发布数据显示,8月份全国居民消费价格总水平(CPI)同比上涨2%,涨幅时隔1年重回“2时代”,也创下12个月来新高。
进入夏季以来,细心的市民们肯定会发现,猪肉的价格上涨了不少……
8月不仅是猪肉价格在持续上涨,蛋价环比也上涨了10.2%……
姚景源:肉禽蛋菜的价格还有可能再进一步回升,总的来说,即使是这些类的产品回升,我们全年也就是个2%左右这么一个状态,和我们年初预期的要把物价总水平控制在3%以内啊,应当讲我们还有比较大的空间。
首段同样是介绍国家统计局的数据,采用了“涨幅重回‘2时代”这样的背景介绍,无形之中拉近了与读者的距离。其次,第二段的第一句是“进入夏季以来,细心的市民们肯定会发现,猪肉的价格上涨了不少”拉近与读者的距离。在第三段的内容中,同样是介绍专家的观点,但是语言更加生活化,比如出现的“物价”、“回升”等字样,这些字样不仅有助于读者更好的理解文本内容,更能使读者产生一种阅读下去的兴趣。
(二)角度同质化
机器人记者只能通过数据归纳和简单语法写稿件,对于报道角度的把握还需要依靠专业记者的嗅觉。机器人记者报道一般都选择“零聚焦叙述视角”,就事论事,平铺直叙,缺少发掘焦点事件的报道角度。
作者以今日头条的机器人记者“张小明”写作的新闻文本为例。“张小明”写作的新闻文本主要集中在体育类新闻的报道,2017年3月24日的,“张小明”共发表了6篇关于NBA新闻报道,本文发现新闻的报道角度都是以全知的叙事者来陈述事实,标题都是比分和结果,导语是时间、比赛双方和得分,主体部分是对每小节的比赛赛况进行简单描述,结尾是双方得分情况。对于球迷来说可能结果更加重要,但是对于大多数读者来说,对一些场面、赛点和个人表现的描写更能引起读者的阅读兴趣,而且角度同质化的报道也使新闻个性化缺失。相比之下,专业记者写作的稿件,除了报道比分之外,还将一部分关注放到赛场上的精彩瞬间或者是乌龙事件上,从多个角度还原精彩的赛事,也能引发读者的阅读兴趣。
(三)报道浅显化
由于新闻写作对时效性的要求较高,快速的发稿必然要使用已经存在的观点,而某些新的内容还没有数字化,旧的观点堆砌使机器人写作的新闻呈现浅显化的特点。
作者以2015年NPR驻白宫前任商业记者Scott Horsley和自动机器软件Word Smith撰写的新闻稿件进行对比,他们写作的题材都是Dennys餐饮公司公布的财报数据在同一时间进行写作。
丹尼斯公司在周一报告称第一季度的利润为850万美元。这家南加州斯帕坦堡的公司表示每股獲利10美分。该结果高于华尔街的预期。四位来自扎克斯投资研究公司的分析师的平均预计为每股获利9美分。
丹尼斯公司在第一季度完成了一记全垒打,由于餐厅的销售额蹿升超出7%,赢得了高于预期的10美分每股……丹尼斯成为全国最大的全品类连锁餐饮服务公司之一。销量的上升表明消费者在打开他们的钱袋子来购买薄煎饼、土豆和鸡蛋。收入增长还受益于价格更低的原材料。[12]
第一条新闻为机器人记者写作,第二条是专业记者写作的。机器人新闻首先举出了该公司在第一季度的利润收益额,之后表示每股的收益额和整体的收益额都高于华尔街的预期。记者写作的新闻在开头也介绍了该公司的整体收益额,之后也分别比较了实际的股价和华尔街的预期。和机器人新闻不同的是,记者新闻最后分析了“目前该公司成为全国最大的全方位服务连锁餐饮公司之一”,“销量上升表明消费者在打开他们的钱袋来购买煎饼、鸡蛋和土豆煎饼”,“收入增长还受益于价格更低的原材料以及拥有高客流量的拉斯维加斯皇家赌场餐厅的重新开张”等等,分别从受益上升的原因、结果和影响等方面进行了分析,使整个文本更有意义,对读者也更有价值。Scott写作的文本不仅在遣词造句方面更加简洁、形象,而且在原有数据上的总结使信息的深刻性大大提升,有助于读者在第一时间把握住文章的主旨。
三、结语
麦克卢汉将媒介视为一种讯息,认为信息技术和媒介形态将会给人类带来无限的可能。不可否认,机器人记者的出现是“技术改变生活”的有力佐证,一方面人工智能技术大大解放了人力,使记者从电脑屏幕前解放出来;另一方面也提高了报道的时效性,实现了信息的有效传播。但是,机器人记者写作的新闻目前来说仍然存在着不少的弊端,仅从叙事学的角度来分析,首先存在话语和结构的局限性,其次在叙事行为方面,也体现出同化有余而个性不足。
本文运用概念分层的方法将新闻报道分为三类:浅层报道、连续报道和深度报道。浅层报道即不详述事件的细节和经过,着重报道事件的五要素,财经报道和体育报道多属于此类。深度报道是一种反映重大社会问题的新闻报道,强调挖掘事件原因和阐释事件意义。连续报道介于两者之间,反映完整的新闻事件经过及影响。目前机器人尚不能做到对情绪的判断,对形容词的选择依靠数据库的检索,同时机器人很难做到归因和举证,所以机器人记者目前主要应用于浅层报道,对需求故事内核的连续报道和深度报道仍然需要人类记者来完成。机器人记者与人类记者仍然有显著的区别,人类记者的创造性是机器人记者难以媲美的。
因此,首先需要明确的是在日新月异的技术冲击下,记者要发挥特长,找准方向,提升新闻写作中的人文价值;同时,也提示机器人写作技术要朝着更加智能化的方向发展,不断丰富数据库,解决新闻写作的“硬伤”。
参考文献:
[1]穆青.新闻散论[M].北京:新华出版社,1996:16.
[2][3]范步淹.新闻叙事学刍议[J].新闻前哨,2000,12.
[4]黄挺.学好新闻叙事学[J].军事记者,2003,1.
[5]杨琴.新闻叙事与文化记忆:史态类新闻研究[M].北京:华夏出版社,2008:101.
[6]蔡之国.新闻叙事学研究框架的构想[J].南通大学学报·社会科学版,2006,4.
[7]何苑,张洪忠.原理、现状与局限:机器写作在传媒业中的应用[J].新闻界,2018,3.
[8]申屠晓明.机器人写稿的技术原理及实现方法[J].传媒评论,2017,9.
[9]何苑,张洪忠.原理、现状与局限:机器写作在传媒业中的应用[J].新闻界,2018,3.
[10][11]齐爱军.关于新闻叙事学理论框架的思考[J].现代传播,2006,4.
[12]《资深记者与机器人比赛写稿,谁会赢?》,好奇心日报http://www.qdaily.com/articles/9871.html.