APP下载

弱人工智能背景下新闻机器人的写作模式

2019-08-29邢旭东

新媒体研究 2019年13期
关键词:模板文字机器人

邢旭东

摘  要  機器人还处在弱人工智能阶段,无法思考文字含义,无法有意识地运用文字指代周围世界,其写作像是玩文字组合游戏,按照某些方式将文字与数据组合起来形成新闻。其写作模式主要有三种。一是基于定制模板的数据填充模式,结构和文字由人类设置好,部分地方留出“空格”,让机器人抓取数据填充。二是基于自动摘要的二次创作模式,机器人提取同一主题下多篇报道的摘要进行整合写作。三是基于机器学习的智能化写作模式,全方位模仿人类,写出有倾向性、有特色的作品。

关键词  新闻机器人;人工智能;媒体;写作模式;定制模板;自动摘要;机器学习;深度学习

中图分类号  G2      文献标识码  A      文章编号  2096-0360(2019)13-0024-04

新闻机器人指的是能够模仿人类的思考和行为方式,从事新闻采访、写作和编辑工作的智能化软硬件系统。新闻机器人可以在特定领域写作出合格的新闻作品,甚至在有些方面超越了人类记者。但是由于新闻机器人目前还不具有自我意识,因此不能真正的理解新闻事件对于自身、对于人类、对于世界的含义。

1  新闻机器人的发展现状

1.1  引入新闻机器人从事采编工作已经成为传媒业的趋势

纽约时报明确指出,由机器人记者主导的新闻行业正在迅速崛起[1]。2014年开始,华盛顿邮报、洛杉矶时报、卫报、路透社、美联社等国际顶级媒体分别拥有了新闻机器人系统。目前,美国的彭博新闻社,有1/3的新闻都是由机器人完成的。从2015年开始,国内的新华社、腾讯、百度公司也拥有了自己的新闻机器人,目前国内至少有数十家媒体和公司拥有了自己的新闻机器人。

1.2  新闻机器人还处在不懂装懂的弱人工智能

阶段

新闻机器人的核心是人工智能。“人工智能可能需要一段时间才能充分发挥其潜力。这一潜力的范围大到难以想象”[2]。依据其对人脑模仿的程度分为两个大类:强人工智能和弱人工智能。强人工智能指的是机器人具有与人类相同的认知能力,能够理解事物的意义。弱人工智能指的是机器人不需要具有与人类一样完整的认知能力,只要设计的看起来像具有智慧即可[3]。

目前,机器人还处在弱人工智能阶段,其写作更多像是在玩文字组合游戏,按照某些特定的方式将文字与数据组合起来,写出看起来有意义的新闻报道,其实就是不懂装懂。现阶段的新闻机器人无法思考文字的真正含义,无法理解文字对于现实世界的指代关系,不能够有意识地运用文字符号去指代周围世界,也无法真正理解事物的意义,还处在弱人工智能阶段,“机器人能够通过编程来解释符号,可他们无法感觉其中的含义”[4]。

2  研究新闻机器人写作模式的意义

2.1  新闻机器人给人类记者带来了挑战和机遇

新闻机器人既是人类记者的竞争者,又是人类记者的有力助手。新闻机器人在一方面取代记者的部分工作,特别是机械性、重复性的材料收集、数据计算和文字校对工作,进而取代记者完成那些有着固定数据来源与写作模板的新闻报道,记者在内容创作中的独一无二的地位正在受到机器人的挑战,部分新闻人会因为机器人的到来而失业。但是另外一方面它又可以使得记者从繁重而枯燥的重复劳动中解放出来,从以人为本、审美需求和社会发展的角度,进行批判式的思考,进行深度调研、深度思考,探索新闻事件深层次的价值与意义,挖掘新闻事件的情感诉求和审美价值,从事更具创造力、更具挑战性的新闻活动,更好地理解和阐释新闻事件对于人类社会和特定个体的意义。

2.2  理解机器人的写作模式可以帮助记者抓住机遇、应对挑战

新闻记者要想更好地应对机器人带来的挑战和机遇,就必须对新闻机器人的工作方式有一个基本清晰的认识,才能更好地利用机器人的特点,扬长避短,提高工作效率,将更多的时间用于深度调研、深度思考和深度分析,更好地引导机器人成为自身的合作伙伴而不是竞争对手。同时,记者在理解了机器人的工作模式之后,还可以受到启发,提高自己的采写技能。因为机器人的工作模式一定程度上是对人类工作模式的优化,可以让人们看到自身工作中的不足,以及提高工作流程的方式方法,记者可以从机器人的写作模式获得启示,从而提高自己的新闻采写效率。

3  新闻机器人写作的三种主要模式

3.1  基于定制模板的数据填充模式

这种模式就像让机器人做填空题一样,新闻报道的基本结构和文字表述都是人类记者和编辑预先设置好的,只是在文中的部分地方留出“空格”,让机器人填充。机器人在互联网上抓取数据,如人名、地名和数字等,对数据进行相应的计算或其他形式的处理,然后填充到人类预先设置好的文字模板中。针对同一个主题预先设置好的模板可以有多个,机器人会根据获得的数据选择使用具体的模板。

比如,机器人要写作一篇基于模板的单只股票的报道,编辑们已经设置好了如下模板,“**年**月**日,**股份股价进一步(拉升/下跌),上涨**,截至发稿,该股报**元每股,成交**手,换手率**,振幅**。”,“**”部分就是机器人需要从互联网上抓取数据、计算并填充进入模板中的。括号中(拉升/下跌)的文字部分需要机器人对数据计算后进行选择判断。这种写作模式适合于由数据驱动的财经新闻、体育新闻和天气新闻,对于深度报道是无能为力的。

机器人采用这种模式可以轻松的分析出一家上市公司业绩变化的趋势,以及与同行业其他公司相比其经营状况的优劣。美联社新闻机器人Wordsmith可以在一秒钟生产数千篇财经,之所以能够实现这种高效的写作,其实它就是将上市公司的数据及其处理的结果放入预制好的模板。《华盛顿邮报》的写稿机器人heliograf针对大选所写的报道,也采用了这种模式。《华盛顿邮报》的编辑,需要先设置好故事模板,“模板建立以后,可以将相应的数据签套到heluigraf的模板当中。”[5]

那种数据驱动的体育报道也比较适合这种模式。下面这条新闻由“今日头条”的机器人AI小记者撰写的,“北京时间8月15日07:30时,现世界排名第8的戴资颖在奥运会羽毛球女子单打小组赛中胜出。戴资颖本轮的对手是现世界排名第52的娜塔莉亚-佩米诺娃,实力不俗。但经过28分钟的激烈较量,最终,戴资颖还是以总比分2︰0战胜对手,笑到了最后。”除了人名和数字以外,其他的文字表述应该都是事先模板里面设计好的。包括“实力不俗”“激烈较量”“笑到了最后”等带着人类感情的词汇,其实都是预先放进机器人写作模板的。此种写作模式只适合于由数据驱动的新闻报道,那种需要叙述故事情节和描写场景细节的新闻报道显然不能使用这种写作方式的。

3.2  基于自动摘要的二次创作模式

这种模式就是让机器人在互联网上自动获取特定主题下的大量新闻报道,在分析处理之后,提取同一主题下多篇报道中最能表现主题的精华摘要,然后进行整合写作,形成一篇新的报道,对机器人而言,可以看作是二次创作。记者和编辑提供的主题关键词,机器人根据关键词去查找和收集相关的文字报道,按照一定的算法提炼这些文字素材的摘要,然后将这些摘要进行二次加工,整合形成一篇新的报道。当然为了体现创新性,会对语言做一些处理,比如句子的压缩、同义词的替换等。

自动新闻摘要就是用正文中的一些关键语句来概括整篇新闻报道的大致内容,用户通过阅读摘要就可以了解原报道的主要意思。自动摘要方法“基于一个假设,一篇文章的核心思想可以用文档中的某一句或某几句话来概括,那么摘要的任务就变成了找到文档中最重要的几句话,也就是一个排序的问题”[6]。这里介绍一种文章比较常见的自动摘要模型。机器人程序对报道中的所有句子打分,得分高的句子按照顺序组合在一起。对句子打分的标准分为三部分。第一,句子位置。根据句子在全文中的位置给出分数。比如第1句话得分最高,第2句话次之,第3句话的得分又稍低。当然,每段第1句话也可以赋予较高的分数。第二,文章内容与文章标题的关系。句子是否包含标题词?包含多少标题词?根据句子中包含标题词的多少以及对标题意义的呼应程度来打分。第三,句子关键词。首先对文章进行分词,统计每个词语的频率,将排名前5或者前10的有意义的词语提取出来,作为关键词,通过统计句子中包含关键词的情况以及关键词之间的间隔距离来打分。除了这种摘要模式,还有其他的摘要模式,都有一定的合理性与不足。

该过程涉及自然语言处理(Natural Language Processing,简称NLP)技术,它是人工智能和语言学交叉融合下的全新研究领域。主要研究如何帮助计算机最佳地理解、处理和生成人类的自然语言。主要技术范畴包括自动分词、词性标注、句法分析、文本分类,文本情感分析、自动摘要、语音识别与合成等。涵盖了语言学、数学、心理学、哲学、统计学、计算机科学、生物学等领域的理论知识。这也是百度机器人writing_bots的写作方式之一,百度机器人“在已有稿件的基础上,通过内容分析聚合生成新的文章。因为是基于己有稿件内容创作的新的稿件,因此可以看作是二次创作”[7]。

新闻机器人在写作体育新闻和娱乐新闻时,也经常使用这种模式。在体育报道中,机器人获得比赛的直播文字之后,依据关键词出现的频率或者其他标准,对直播文字进行语句进行打分,将得分高的句子抽取出来,按照一定顺序重新组合,最后生成一个比较精彩的体育报道。如果是娱乐新闻,机器人按照一定的算法标准,分析明星微博中和网民跟帖中最具哪些语句得分高,然后把明星微博和网民跟帖中得分高的语句摘录出来,同相关的背景信息组合在一块,就可以形成一篇不错的娱乐新闻。

3.3  基于机器学习的智能化写作模式

这种模式就是让机器人全方位地学习与模仿人类记者的写作方式,对采集到的新闻素材进行完全自主的加工处理,写出有倾向性、有情感、有风格特色的新闻作品。不需要预先定制好的模板引导,也不会只是将获得的摘要进行简单组合,而是在对新闻素材进行语义解析的基础上进行真正意义上的全新创作。人工智能领域现在还在对这种模式进行艰难的探索,取得了一定的成果,但是进展还不是很理想。

这个模式的核心是机器学习。机器学习“用类似于人类的方式来学习,即从经验中学习并在获得更多经验的同时继续完善其表现”[8]。机器人在写作之前,会在人类的指导下进行学习,通过解析海量的新闻文本,掌握基本的写作技能,这也是新闻机器人真正的魅力所在。“机器自己就能从大数据中寻找特征、发现规则、总结模型……是擅长‘发现套路的行家里手”[9]。“比如把某日报过去10年每期的所有文章标题,以及专业人士对这些标题的评判结果输入给深度学习(机器学习的方式之一),它自己会琢磨出其中的规律并建立预测模型”[10],然后机器人根据挖掘出的规律和模型为文章制作出比较优秀的标题。

这类新闻写作機器人的智能核心,一定程度上模仿人类的神经网络,对获取的海量的新闻报道进行深度解析,分析与梳理出新闻报道中字词的搭配、语句的衔接以及段落的过渡方式。进而学习和模仿人类的新闻写作模式,学习和模仿名记者的写作风格。在训练完成之后,可以实现完全自主的数据抓取、新闻线索发掘以及新闻写作。此类机器人可以对平淡的原始新闻素材进行加工,使其具有某种典型的写作风格和情感倾向性,可以是模仿某位名记者的,也可以机器人自己独创的。此类机器人也可以对某个话题下的网民言论进行有效的分类、总结和情感分析,从而揭示网络舆论的走向。当然,也可以揭示某些事物之间的复杂联系,并呈现在新闻报道中。

当然,人类目前对于大脑的运作机制的认识还不是很深刻,对于自我意识的本质还没有搞清楚,因此,人工智能的算法不能完全模拟人类的思考和行为方式,采访写作和编辑活动总体而言还显得比较呆板、简单。但是,随着人工智能学科的快速发展,基于机器学习模式的新闻机器人在未来数十年应该有迅猛的发展,新闻机器人在对外部环境的感知和理解方面,对新闻价值的判断方面,以及对文字符号的运用方面,可能有一个质的飞跃。

这三种写作模式并不是截然分开的,很多时候是有机融合在一起的。就目前而言,前两种写作模式已经投入了新闻传媒业的实践应用,一定程度上替代了新闻采编人员的低端重复劳动,引导新闻采编人员从事更有创造力、更有价值的新闻活动。第三种写作模式目前还处在探索和萌芽阶段,但却是最有发展前景的机器人写作模式。

4  人类记者如何应对机器人的挑战

人工智能正在深刻而迅速地改变着新闻传媒业,媒体为了应对竞争,必然会引进机器人来提高工作效率,机器人写新闻已经成为无法避免的趋势。不少新闻人已经感受到了人工智能带来的威胁,认为记者的饭碗会被新闻机器人抢走。在新闻写作方面,人类记者如何应对机器人的挑战?

首先,记者应该充分发挥自身进行现场采访的优势,深入现实生活的各个领域、各个角落,进行深入、细致的调查采访活动,获得第一手的、原创性的新闻素材,并保证资料的真实性和可靠性,在此基础上进行新闻创作。在采访思维和采访行为的创新方面,新闻记者都远超机器人,很多对人类记者比较轻松的采访活动,对于机器人而言,都是很难实现的。

其次,人类记者在新闻写作中应该充分体现人文关怀的意识,体现出对人类尊严、人类情感、人类自由、人类价值的重视,这种重视必须是发自内心的、真诚的,而不是像机器人运用预设语言模板来模拟出的人本色彩。

再次,人类记者应该通过灵活多变的写作风格,来同机器人相对呆板的写作风格竞争。机器人的写作很大程度上受到预设模板和程序算法的限制,变化比较少,写作风格比较呆板,也很难运用暗喻、反讽等修辞手法。人类记者具有无穷的创新力,具有天马行空的想象力,在写作方式、写作风格,以及语言的表述上,可以有无穷无尽的创新力,可以巧喻善比,可以巧妙地运用多种修辞手法,人类记者应该充分发挥这方面的优势。

5  结束语

通过对机器人写作模式的探析,不难看出,机器人在基于模板和基于摘要的新闻写作中,已经可以完成合格的作品,很大程度上可以减轻甚至是替代人类记者的工作。但是,也不必对此感到过度的悲观。人类有很强的适应性和无穷创造力,具有自我意识和情感倾向性,这些都是目前处于弱人工智能阶段的新闻机器人所不具备的优势。即便是基于机器学习的智能化写作模式,也无法消解人类记者在深度调查与深度思考方面的优势。并且,机器人可能永远也无法具备人类的同理心和悲天悯人的情怀,哪怕发展到了强人工智能阶段也是如此。人类记者应该将机器人视作自己的合作伙伴,将重复、枯燥的低端工作留给机器人去处理,将时间和精力放在更有价值的新闻环节中,创作出更有深度、更有内涵、更具有人类情感的新闻作品。

参考文献

[1]机器人記者崛起,难道我们工作真有价值吗[EB/OL].(2019-02-09).http://mini.eastday.com/mobile/190209120706584.html.

[2]费朗索瓦-肖莱.Python深度学习[M].北京:人民邮电出版社,2018:11.

[3]林大贵.TensorFlow+Keras深度学习人工智能实践应用[M].北京:清华大学出版社,2018:26.

[4]约翰普利亚诺.人工智能时代的人类生存法则[M].北京:文化发展出版社,2018:79.

[5]机器人写新闻这件事,现在进展到哪一步了?[EB/OL].(2017-02-19).http://tech.qq.com/a/20170219/005801.htm.

[6]人工智能,基于深度神经网络的自动文本摘要[EB/OL].(2017-08-13).http://www.360doc.com/content/17/0831/04/37113458_683452166.shtml.

[7]你看到的文章其实都是它写的.解密百度智能写作机器人[EB/OL].(2017-04-12).http://www.sohu.com/a/133447139_500657.

[8]路易斯德尔.人工智能大爆炸[M].深圳:海天出版社,2019:54.

[9]王作冰.人工智能时代的教育革[M].北京:北京联合出版公司,2017:31.

[10]王娈.深度学习给新闻行业带来的机遇和挑战[J].新闻战线,2018(1):27-28.

猜你喜欢

模板文字机器人
文字的前世今生
热爱与坚持
Inventors and Inventions
梦中的文字
把握数学解题模板,轻松做题一二三
SOLIDWORKS Electrical清单模板定制方法
文档提效 用好WPS模板
机器人来帮你
认识机器人
机器人来啦