机器人记者在发酵
2015-03-15
本刊记者丨鲁烨
人工智能时代,新闻生产的第一线上,我们又多了一位新的伙伴,它就是“机器人记者”。
自2014年大数据在媒体行业的深度应用以来,新闻生产的流程、报道的广度深度、新闻的展示方式和传播能力都在发生着微妙的变化,媒体行业总体呈现出从数字信息化向智能化转变的明显趋势,可视化的数据新闻、高冷酷炫的智能轻应用、“瑞士军刀”之称的智能手表、不现颜值的“机器人记者”等智能化产物纷至沓来。今天,让我们来聊聊初露锋芒的“机器人记者”,看她是如何惊艳的。
先让我们猜猜,下面这两篇体育报道的开篇哪篇是“机器人记者”写的,哪篇是真实存在的人写的?
如果你无法分辨哪一篇是由人类写的,那你不是唯一一个。而答案是:左边是机器写的,右边是人写的。你猜对了吗?
“机器人记者”初露锋芒
机器人写作新闻开始备受关注,是由于2014年7月美国加州发生一次里氏4.4级的地震,《洛杉矶时报》在地震发生后三分钟内发出消息,是所有新闻媒体中最快在网站报道该消息的,而作者却是一个名为Quakebot的“机器人”。这个“机器人记者”实则是一套新闻自动生成系统,开发设计者是《洛杉矶时报》的一名记者兼程序员,按照他的设计,Quakebot能够在地震发生后,根据美国地质勘探局发出的数据,自动将信息输入模板并提交至采编系统。
所谓“机器人”写作新闻,实则是直接利用算法程序撰写新闻报道,通过采集大量的各种题材以及高质量的数据,建立各种分类的庞大数据库,从中寻找模型、趋势以及相互的关系,最后由机器自动化生产新闻。美国Automated Insights(自动透视)和Narrative Science(叙事科学)都是这样的公司。
从2014年7月份开始,美联社与Automated Insights签署了550万美元的协议,开始启用该公司开发的程序撰写有关公司财报的新闻报道。具体而言,先收集公司公开盈利报告的数据,最终提供分析每家公司的发展情况、解析它们金融策略的报道。只要输入一些数据,如公司收益报表之类,这个聪明的程序就能在几秒钟之内生成一篇新闻报道。
可以看到,美联社与Automated Insights合作,共同促进了自动化新闻写作的发展。算法的惊人之处在于,其充分利用了模式和规则。尤其是新闻写作,从故事的构思、素材的采集、组织与整理、文章结构的处理,到最终的遣词用句,大都有模式和规则可循。只要有模式和规则,就有算法的用武之地。
除了Automated Insights以外,Narrative Science也开发了撰写新闻的机器人。他们用的方法很简单,就是创造模板,机器人能够采取数据并填入相关空格里。很多新闻是有一定格式的,如财报、球赛、突发事件等。只要有格式,机器人就能够完成工作。福布斯利用Narrative Science的Quill平台撰写类似报道,并称该公司是他们的合作伙伴。
随着技术成熟的“变本加厉”,再加上用户使用各种数字渠道对内容的多元需求,不久后,越来越多的内容不再是由人类编写,而是由计算机算法完成,由此滋生了一个“文本自动生成”产业,或者说催生了一种新新人类——“机器人记者”。当然,这些“机器人记者”并不只是重复数据,它会以适合目标受众的风格,比如,从古板到活泼,写出看起来像是人类编写的报道。
毫无疑问,“机器人记者”可以弥补传统记者应对突发事件的不及时,做到数据收集和分析的快速、准确。这在一定程度上,减轻了人类写作过程中的负担。
这样看来,机器人的工作效率、数据储备、整理能力、写稿速度和超级编辑能力等,都会令传统记者自愧不如、望尘莫及了。
那么问题来了,会不会像业内人士所担忧的那样,“机器人记者”将成为记者的终结者呢?
“机器人记者”会成为人类记者的终结者?
传统记者是否会因此而担忧和焦虑?有人乐道,在新闻行业进入争分夺秒的网络媒体时代,机器人写稿的快速高效,给苦于竞争的媒体优先突围的机遇;也有人担忧,机器人给人类记者带来了“竞争压力”,机器人是否会抢了记者的饭碗?
随着人工智能技术的发展,未来机器人甚至可能拥有人类的某种智能。在“机器人记者”可能会抢了传统记者饭碗的隐忧面前,人们开始在拥抱还是拒绝“机器人记者”的选择上摇摆不定。
让我们来看看大家对这个问题的看法:
业内人士表示,机器人写手只是一种辅助形式,它可以节省时间,把记者从一堆基础数据和信息中解放出来。然而,说机器人会抢记者的饭碗,未免有点杞人忧天。机器人撰写新闻的过程就像一个复杂的填词游戏,一些具有固定模式的行业性文章更符合它的能力。机器人无法进行深度分析,更不会炼字锻句。如果有一天记者真的被冷冰冰的机器人取代,新闻恐将沦为诸多报道模式的生硬“拼盘”。
名为Quakebot的“机器人”的设计者舒文克表示,机器人写手虽有其技术优势,但却无法完全具备人的灵活性和创造力。让机器人成为记者的帮手,我相信,它会使工作更有趣。
美联社表示,机器写作并不意味着记者会丧失工作,而是将美联社记者解放出来,专注于做更多注重人性化色彩、体现人类智慧的内容,依靠机器做其擅长的大量数据收集整理、模式化有规律所寻的文字工作。以往美联社每季度生产大约200个报道,现在每个季度能生产3000-5000个报道,效率是人类记者的15倍。
浙大智能系统与控制研究所的朱秋国老师认为,要它去做深度报道,可能够呛!有血有肉的记者对业务精钻细磨,应该还是保得住饭碗的——这个机器人的出现是为了刺激我们来的。
叙述科学联合创始人克里斯蒂安·哈蒙德认为,这股机器自动撰写新闻的海啸将不会淹没付费新闻撰稿者的工作,他们研发的软件系统并不是想要夺取任何人的饭碗。相反,电脑能开采出更多信息宝矿,并生产出非常廉价却完全可读的针对时事、潮流等领域的报道,而这些可能是人类记者从未涉及过的。
由此可见,大部分业内人士还是普遍乐观的,“机器人”写手作为传统记者的辅助形式,可以把记者从繁重的工作者解放出来,使传统记者有更充足的时间备战深度报道和人性化分析中来。相信,人类和电脑运算可以天衣无缝地充分合作,机器人利用其完美的记忆系统成为人类新闻工作者的完美采编助手。
“机器人记者”被赋予的未来猜想
有关“机器人记者”的猜想和未来之说,业内众说纷纭。
《纽约时报》报道,某软件公司开发的机器人记者很可能在2016年获得普利策新闻奖。该机器人使用的软件能够通过推断得出结论,并从某个特定的视角出发来写文章。在体育报道方面,它能够充分理解“反败为胜”“团队努力”之类的专业术语,同时根据自己的判断对体育比赛最重要的方面进行报道。因此,它不会像其他软件那样单纯地复述事实,而是会给文章加入一些不同的元素。更有专家预测,不远的未来机器人还能够与人进行自由聊天和邮件通信,甚至可以演讲并回答人类的提问。
叙述科学公司联合创始人克里斯蒂安·哈蒙德认为,未来15年完全由机器人撰写的文章达到90%。
关于“机器人记者”的预测或者猜想,或许都能让我们感到人工智能的强大力量,但是,这些能不能实现、什么时候能实现,可能还很难有一个明确的答案。因为即使是智能机器人,它的智能依然有限,无法真的像人类一样思考。
不过,机器人记者对新闻的作用还是不可小视的。在中国,目前还没有机器人记者这一概念,但已出现有网络媒体利用计算机采集信息辅助新闻报道。虽然这些程序没有完成记者“写稿”这最后一步,但是实践中由计算机程序“采买”、人类记者“加工”,这一模式取得了理想的效果。
让我们担忧的地方
互联网时代,我们产生数据规模越来越庞大,而且很复杂,凡人难以处理,需要人工智能,而不是人类智能,来从中获取有益的信息。特别是在金融、体育和销售规划等数据繁多的领域,将人工智能应用于大量资源,这种新的软件平台就会应用先进的度量标准,去确认模式、趋势和反常数据,然后,迅速产生解释性文本。
“机器人记者”写作的重中之重就是积累高质高量的数据。这也是为什么金融和体育会成为软件写手的前沿阵地:这两类话题都包含了数据的起伏,比如每只股票的收益,股票震荡等等。
目前,机器人记者碰到了一个小问题:所有的新闻和评论都只会针对胜利者。比如当一支球队被意料之外的对手打败后,所有以结果数据为出发点的评论都会瞬间变得非常刻薄并充满羞辱。美国体育联会要求叙述科学想办法让软件在队伍失利的情况下也能写出赞扬队员们表现的文章,但是显然机器人们写不出“虽败犹荣”这样的话。
最高的呼声中彰显着最常见的解放主题,“机器人记者”将会解放人类,使人类能够更多地进行报道,减少数据处理工作。
但是,据叙述科学联合创始人克里斯蒂安·哈蒙德估计,到本世纪20年代中期,将有90%的新闻由计算机算法生成,其中大多都无需人工干预。倘若这个预测接近事实,那么我们就会处在一个滑坡之上。
自动透视公司指出,其软件去年一共创作了10亿个报道,许多都没有人工干预,它和叙述科学公司的主页上,展示着我们耳熟能详的客户标志:三星、康卡斯特(Comcast)、美联社、Edmunds.com和雅虎,所以,用户极有可能在没有意识的情况下消费了这种内容。
法国的欧洲工商管理学院管理科学教授菲利普·M·帕克的专利算法系统已经生成了超过100万本图书,其中有10万多本在亚马逊上销售。他说,给他一个技术性或晦涩难懂的话题,他的系统就能模仿可能就此题目进行写作的人的思维过程,挖掘数据,撰写一本书或一篇报告,比如《红斑痤疮患者官方资料》。叙述科学公司声称它可以创作“与出自人类的作品分毫不差的文本”,自动透视公司则称它的专长是“像一个人一样”写作。
但这正是让我们担忧的地方。在国外,机器新闻正在攻城掠寨,在科技的帮助下,“机器人记者”或许终有一天会悄悄取代人类传播者的优势能量。算法生成的内容也在迅速向我们文化中的各个角落和缝隙渗透,未来,我们会不会因此逐渐丢失、放弃自己?