千万别小看机器人写手
2015-04-30雪莱·波多利内
目前有相当多的阅读内容不是由人类编写的,而是由电脑算法完成的。
这些机器人写手并不只是重复数据,它们以适合目标受众的风格——从古板到活泼——写出看起来像是人类编写的报道。它们非常聪明。当你阅读这些报道时,你绝不会猜到这个作者没有心跳。
看看这两篇体育报道的开篇:
“周日,天使队在第九局中落后两分时,情况看起来不妙,但凭借弗拉迪米尔·葛雷诺赢得的关键一分,洛杉矶天使队挽回败局,在芬威球场以七比六的比分击败波士顿红袜队。”
“周六下午(4月24日),密歇根大学棒球队在威尔彭棒球场——具有历史意义的雷·费舍尔体育场的所在地,通过赢得四分的第五局比赛,扭转局势,最终以七比五的比分赢得了与爱荷华棒球队在周末举行的三场比赛中的最后一场。”
如果你无法分辨哪一篇是由人类写的,那你不是唯一一个。瑞典卡尔斯塔得大学的克里斯特·克莱瓦尔的研究显示,当看到类似的体育报道时,调查对象无法辨别其中的区别。(在上述例子中,第一篇是机器写的,第二篇是人写的。)
机器人记者悄悄取代人类
人类的努力已经无法满足我们现在能够使用的各种数字渠道对内容的需求。这种需求,再加上更加成熟的技术,滋生了一个“文本自动生成”产业。
该领域中的公司旨在利用算法和自然语言生成器编写内容,使人类摆脱写作过程中的负担。只要将一些数据输入它们的平台,然后“嗖”的一声,几秒钟之内就会产生一些内容,提供人们需要的各种报道。
算法和自然语言生成器已经存在了一段时间,但随着对它们的需求刺激了投资和创新,它们变得越来越好,越来越快。将之应用于大量资源,特别是在金融、体育和销售规划等数据繁多的领域,这种新的软件平台就会应用先进的度量标准,去确认模式、趋势和反常数据。然后,它们会迅速产生解释性文本,成为代替人类的机器人记者。
美联社每季度利用自动化洞察力公司的Wordsmith平台撰写3000多篇金融报道。他们在苹果公司公布最新创纪录收益几分钟之后,就发表了一篇报道。福布斯利用叙述科学公司的Quill平台撰写类似报道,并称该公司是他们的合作伙伴。
然后又出现了Quakebot,《洛杉矶时报》利用这种算法分析地质数据。它是第一篇有关南加利福尼亚州去年发生的4.7级地震的新闻报道的“作者”。地震发生后,该报立即在其网站发表了这篇报道。该报还利用算法加强命案报道。
这一切所表达的呼声,包含着常见的解放主题——机器新闻将会解放人类,使人类能够更多地进行报道,减少数据处理工作。
目前,机器新闻已经占据主导,但它并未就此止步。随着软件悄悄取代我们成为传播者,从政府事务到梦幻足球,再到对你下一双鞋子的评价,算法生成的内容也在迅速向我们文化中的各个角落和缝隙渗透。
自动化洞察力公司指出,其软件去年一共创作了10亿个报道,许多都没有人工干预;它和叙述科学公司的主页上,展示着我们耳熟能详的客户标志:三星、康卡斯特、美联社、Edmunds.com和雅虎。
机器人作家写书驾轻就熟
机器人还在写书。来看看法国的欧洲工商管理学院管理科学教授菲利普·M·帕克的作品:他的专利算法系统已经生成了超过100万本图书,其中有10万多本在亚马逊上销售。
他说,给他一个技术性或晦涩难懂的话题,他的系统就能模仿可能就此题目进行写作的人的思维过程,挖掘数据,撰写一本书或一篇报告。比如,《红斑痤疮患者官方资料》。
叙述科学声称它可以创作“与出自人类的作品分毫不差的文本”。自动化洞察力则称它的专长是“像一个人一样”写作。这种说法事实上已经成为一段插入语——不只是对内容创作,而且对于大多数科技都是如此。
“人”又放弃了什么
我们的手机可以(像一个人一样)和我们说话。我们的家用电器能够(像一个人一样)接受指令。我们的汽车将能(像一个人一样)自行驾驶。那么,“人”究竟是什么意思?
在科技的帮助下,下一个革命性的进展似乎总显得顺理成章。这就是危险所在。鉴于它反复引诱我们,我们就会放弃一小部分自己。我们很少会后退一步,反思我们最后放弃的东西是否比得到的更多。
(本文作者雪莱·波多利内是专门从事信息搜索的H5公司的一位主管,并从事电子信息相关问题的写作。)
(许欣、陈柳译)(编辑/袁红)