美国出版业人工智能应用研究*

2019-01-28杨晓新

中国出版 2019年24期

□文│苏磊杨晓新

1995年，亚马逊网络电子商务公司成立，开始在线销售传统出版物。1998年，谷歌搜索引擎诞生，大量网站如雨后春笋般崛起，网页文本的自然语言处理得到了迅速的发展，海量的数据为机器学习提供了大量的素材。欣顿教授领衔的深度学习算法可以从数据中发现特征量，这使得人工智能的准确性发生了质变。云计算、图形处理器等多核并行计算流的方式为人工智能的算力提供了保障。全球著名的互联网咨询公司高德纳在2018年发布的报告指出，今后10年人工智能技术将为大众所用，无处不在。其中一些技术如深度神经网络和虚拟助手，将在今后2～5年内进入主流采用阶段。毫无疑问，人工智能技术已经融入社会生活中，并已成为不可逆转的趋势。这也是人类继以蒸汽机、电力、互联网为标志之后的第四次革命，人工智能成为这次革命的新动力。

美国作为引领世界科技的强国，政府先后发布《为未来人工智能做好准备》《美国国家人工智能研究与发展策略规划》《人工智能、自动化及经济》等文件，从技术、经济、伦理、政策扶持等多个维度指导行业的发展。2019年2月，特朗普签署《美国人工智能倡议》，明确要求联邦机构在研发投入中把人工智能列入优先地位，扩大科研人员权限，同时要促进人工智能在各行各业的应用发展。

一、人工智能在出版业的应用

传统出版业率先受到人工智能的冲击。由于图书具有完备的各种信息，包括书名、作者、出版社、出版日期、国际标准书号（ISBN）等，信息非常容易上网并被检索。亚马逊通过收集用户购买图书的消费行为，自动分析用户的需求，为每个用户提供个性化的定制书目。随着算法的不断改进，出版业中的人工智能已不再被局限于那些重复的机械的统计工作，它们开始变得越来越聪明，通过对各类数据的挖掘思考，可实现精准预测、智能编辑、个性交互和精细操作的能力。

1.发现基本规律，做出精准预测

对用户进行分析。以大数据挖掘为特征的人工智能技术可以帮助出版社做出更精准、高效的决策。出版社通过利用人工智能技术，根据互联网的热门事件、热点词汇、用户参与度、图书论坛、销售数据、阅读数据、评论数据等，通过各种算法，对用户进行精准的个性画像，从而为出版社的内容生产和推荐提供决策依据。成立于2011年的卡利斯特传媒（Callisto Media）公司在2015年和2016年被《出版人周刊》评为增长最快的独立出版商之一。该公司使用人工智能技术分析用户的需求，每月收集大约6000万条消费数据。用户在亚马逊上搜索一条信息，如果没有产品能满足用户的需求，这就意味着潜在的商机。公司首席执行官本杰明·韦恩表示他们会及时联系作者，根据数据分析的大纲快速撰写，并在9周内将图书推向市场。因此他们可以在一本销售约1500本的书上盈利。

对内容进行分析。传统的书籍有不可否认的文化成分，但它们也是数据。通过文本数据的采集和整理，可以分析内在的规则和形式。自然语言处理技术将文本的每一部分分为积极的、消极的或者中性的。把这些结果画出来，就可以看到文本的情感弧线。机器人虽然对文本的具体内容不了解，但它通过收集阅读人类文本的情感反应能力会逐步增长，对人的“理解”也就越精确。美国的故事情节（StoryFit）是一家专注于出版的人工智能分析公司。其利用人工智能分析图书，构建多维的内容分析模型，如影响故事内容情感的单词、短语和术语，对读者重要的关键元素、角色类型、冲突类型、时代特征等。再将这些内容、主题模型与谷歌趋势以及亚马逊流行进行比较和过滤，可以挑选出潜在的畅销书。

对供应链进行分析。图书从出版社收到稿件开始，通过审查和编辑等流程，确定新书的出版。根据经验，制定印刷册数。经过物流中心进入批发市场到书店销售给读者构成了完整的供应链。通过人工智能分析各个阶段的数据，作者、出版社、物流中心、销售渠道等都可以对读者需求做出灵活积极的响应，不断调整人力、财才、物力以适应市场的需求。基于图书销售数据，人工智能可以帮助书店建立完善的图书供应系统，调整出版社的图书供应量与仓储量，调节物流中心的仓库配置，扩大书籍销售的机会。亚马逊网上书店为了缩短物流配送时间，它与印刷公司合作，将部分图书和杂志从印刷工厂直接出货给读者。同时，亚马逊也和出版社开展合作，便于读者能以最快的速度从分发渠道获取他们想要的图书。通过将客户的数据与供应商分享，人工智能技术可以实时分析读者需求，为出版社、书店等做出预测判断并制定最佳的决策，提高企业运营效率。

2.具备专业知识，实现智能编辑

数据分析。人工智能应用于数据分析主要是数据内容是否能够被结构化表达，如果结构相对固定，则其模块化程度也就愈高。体育、财经、地震等领域都涉及大量的可被采集的高质量数据，其叙事结构都有各自报道的逻辑和路径模块。机器人可以从这些数据中发现有价值的信息，也就是“异常数据”，如最大值、最小值、异数、阈值等，然后将数据代入算法的模块中，就可以自动生成文章。2010年年初，叙述科学（Narrative Science）公司开发了一款专为儿童棒球比赛写作的平台统计猴（Stats Monkey）。它可以使用棒球俚语，根据玩家的活动、游戏分数和获胜率等即时处理统计数据和生成比赛报告，深受小球迷的喜爱。2011年，它为儿童联盟撰写了40000份报告。2014年3月17日美国洛杉矶遭遇地震，《洛杉矶时报》内部研发的地震机器人（Quakebot）在地震发生3分钟后就完成新闻的撰写和发布，成为新闻史上的一个里程碑。2014年起，美联社开始使用AI技术平台语言大师（wordsmith）进行上市公司的财务报道和体育新闻报道。

文学创作。随着数据的采集从文本逐渐扩展到语义、情绪等非语言数据，文学创作的过程也在逐步被量化和建模。从故事的构思、素材的采集、组织与整理、文章结构的处理，到最终的遣词用句，都能发现一般模式和规则。而且分析不同作者的写作风格，机器人也可以从语义上进行模仿。美国麻省理工学院媒体实验室的研究团队设计了一个叫雪莱（Shelley）的AI恐怖故事作家，它在社交新闻网站（Reddit）平台上学习了大量的恐怖故事，然后在多层次循环神经网络和在线学习算法的结合下，与人们在推特上互动，根据人群的反馈，创作恐怖故事。

文章翻译。人工智能翻译每天可以提供数亿级别翻译次数，能够快速学习和迭代相关领域的术语、词语、句子、段落等，基本能满足翻译“信”和“达”。虽然对于一些复杂语法和语境还不能理解，不能够将信息呈现给不同文化背景的用户，远未达到“雅” 的级别，但其高效性还是受到了广大翻译工作者的欢迎。2016年，谷歌翻译推出了一个全新的人工智能翻译引擎。对于未经专业翻译训练的人而言，其翻译的文本几乎与人工翻译没有区别。《纽约时报》将其誉为“伟大的人工智能的觉醒”。

图像匹配。华盖创意（Getty Images）公司专门为出版商提供查找新闻故事的最佳配图的人工智能助手。它会根据诸如词频、已知的人或地方等参数来确定文本的含义和相关性。然后将其与来自存储库里超过1亿张照片数据进行匹配，显示一系列图像选项。华盖创意高级副总裁安德鲁·汉密尔顿指出：“在今天的数字世界中，出版商一直面临着讲述最新故事并争夺消费者注意力的压力，引人注目的图像对于创建在线互动非常重要。”[1]

3.辨别人类情感，营造个性交互

1997年，美国麻省理工学院的皮卡尔（Picard）教授提出“情感计算（affective computing）”概念。她把情感计算定义为“与情感有关、由情感引发或者能够影响情感的因素的计算”，并指出人机交互的过程中，可以通过人的脸像、声音、文本、肢体行为来了解人的情感反应。[2]即赋予计算机像人一样具有观察和理解的能力，并可以针对用户的情感做出友好反应。图书出版商哈珀·柯林斯出版社在2017年率先开始使用名叫史诗阅读（Epic Reads）的聊天机器人，它主要为用户推荐各类图书。只要用户对自己阅读内容有一个模糊的想法或者想随机寻求一些建议，它都会给用户明确的答案。企鹅兰登书屋在2018 年发布了一款名为图书记录（Book Recs）的聊天机器人。这款机器人通过与用户交流，可以为用户推荐最多18本可能符合兴趣的图书。同时还会提醒用户，如作者的新书、签售会以及更多和图书相关的消息。BAM Mobile公司与脸书公司合作，在脸书的Messenger、Slack和Telegram等平台上推出“作者机器人”，为亚马逊的智能音箱（Amazon Echo）和谷歌即时（Google Now）提供声控找书和阅读服务。通过该软件，为用户创建一个“真实”的对话，作者也可以参与对话用以协助读者了解作品或回答读者提问。

4.精细机械操作，讲究任务技巧

智能仓储机器人。智能仓储机器人是由一系列移动机器人来完成包括图书上架下架、订单识别、品种拣选、补货退货，盘点等流程的智能系统。2012年亚马逊收购了机器人制造商基瓦系统（Kiva Systems），目前已在其物流配送中心部署了超过10万台基瓦机器人。基瓦机器人依据算法指令规划路径找到货架，运用超声波传感器与架货进行交流。当基瓦识别到货架上的货物需出库时，顶起货架并将货架运送到拣选位置，然后以优先顺序一字排开等待工人作业。据统计，它的工作效率是传统物流作业的2～4倍，准确率达到99.99%。

智能教育机器人。教育机器人是面向教育领域专门研发的以培养学生分析能力、创造能力和实践能力为目标的机器人，具有教学适用性、开放性、可扩展性和友好的人机交互等特点。教育机器人广泛应用于STEAM（科学、技术、工程、艺术、数学）教育、儿童娱乐教育和自闭症儿童教育等方面。美国的通用机器人技术（General Robotics）公司的RB5X是专门在教育中应用的全智慧教学机器人，具备各种感应器，学生通过编程来控制RB5X说多国语言，让它行走、旋转、跳舞和捡拾物品。研究表明教育机器人作为一个学习工具有着巨大的潜力，不仅对教育环境产生积极的影响，而且适用于各种人群，通过多样化的互动达到寓教于乐的目的。

二、人工智能对美国出版业的影响

人工智能已经进入了美国出版产业链中，越来越多的曾经需要人类执行的日常行政工作，在许多不同机器的帮助下，变得高效、简单和高质量。同时，那些需要人类预测、创作、交流和技巧的工作也出现了机器的身影。当机器越来越智慧时，人机工作的边界就会逐渐模糊，这给美国出版业带来了深刻的影响。

1.知识“把关人”升级

在传统媒体时代，信息量小、来源少、传播方式单一，出版社是知识生产传播的主要渠道。如今，这种运作模式正受到来自互联网的影响，信息流通加速和渠道的多样性，极大地提升了用户获取知识的便捷性。现在出版社发现为每本书找到用户变得越来越困难，一方面来自于同行的竞争，例如美国每年出版的图书数量在过去10年中增长了400%，现在达到了每年100万本的数量；另一方面，来自于互联网的数据科学家、系统程序员和知识工程师等，建立了维基百科，开发了共享开放存取模式。出版社的知识服务把关人角色受到了严重的挑战。

如今，根据国际商业机器公司（IBM）的数据，59%的出版企业正在利用数据进行分析以达到“更快地将洞察力转化为行动”，从而改变他们的工作流程。作家德布·瓦纳斯在《独立》杂志中指出，“今天的出版业创新者正在深入挖掘21世纪科技产生的海量数据，以做出更加聪明智慧的决策”。[3]大量的出版企业在数字化建设的基础上自主研发或者直接购买第三方的人工智能技术，有分析图书内容Booxby软件、StoryFit软件等；有向用户推荐内容的Contextly插件；有采集用户信息并提供咨询的聊天机器人Authorbot；有辅助作者的写作平台Narrative Science。出版社的工作边界正在被重新界定，学习运用人工智能技术成为智能时代“把关人”的基础。

2.服务质量升级

尼葛洛庞帝曾在《数字化生存》一书中提出了“我的日报”的设想：“未来界面代理人可以阅读地球上每一种报纸、每一家通讯社的消息，掌握所有广播电视的内容，然后把资料组合成个人化的摘要。这种报纸每天只制作一个独一无二的版本。”[4]尼葛洛庞帝的想法现在已经通过个性化的算法实现了。

不同算法可以应用于出版的不同流程中，最大限度地提升了出版社服务质量的时效性和个性化。特征词算法和聚类算法可以协助编辑从海量的文稿中挖掘出有价值的作品；通过AFPR算法对信息进行聚合排序，可作为畅销作品的重要参考；基于n元短语模型算法和神经网络算法的写作软件可以实现部分作者创作的工作；循环神经网络算法可实现文本的翻译；随机森林算法和协同过滤算法可分析用户网络行为，形成用户画像，自动对不同用户推送个性化的内容。人工智能算法有效地提升了编辑决策的效率，提高了企业运行效能，并根据用户需求提供高质量的个性化服务。

3.数据共享升级

随着出版活动对数据的依赖性不断增强，以数据为导向的出版模式正在形成，但由于数据的价值无法估量以及公司固有的商业模式，大量的数据并不共享。亚马逊的Kindle电子书阅读器记录了一些读者反复标注和强调过的内容，但是亚马逊并没有把这些数据卖给作者或者出版社。各大学术出版商将大量的科学文献锁定在收费的壁垒内，有价值的研究成果更是出版商版权保护重点。数据的不开放对于科学文献的深度解析、机器学习带来巨大的挑战。

2002年，《布达佩斯开放获取计划》被提出后，开放获取运动便在全球蓬勃兴起，欧美国家经过数十年的发展，其开放获取在理论和实践上都形成了较为完善的体系。一些开放获取期刊已成为顶级的科学期刊，如CA-A Cancer Journal for Clinicians等。同时，各国政府也大力支持数据共享。如在2019年《美国人工智能倡议》中要求，联邦政府的数据将更多向人工智能研发人员和企业开放，以消除各行业之间“在功能上不关联互助、信息不共享互换以及信息与业务流程和应用相互脱节”的信息孤岛现象。数据增值的关键在于整合，但自由整合的前提是数据的开放。现在，越来越多的出版企业开始进行联盟，共享数据，促进知识服务的提质增效。

三、结语

出版分析师伊莎贝尔·汤普森指出：“出版社创造价值的方式正在改变。例如发现内容、分析知识、记录用户行为、服务作者已成为出版社的关键组成部分，而这在十年前是根本不可能的。人工智能将加剧这些变化。”[5]这意味着出版社要在出版领域保持竞争力，就必须将人工智能应用到出版工作中。今后，人机合作将是一种常态。人工智能可以完成大部分机械重复的工作，提升数据收集、整理、挖掘、检查等方面的效率，并成为作者和用户的桥梁。效率的提高必将有助于人类进行更多的创造性工作。这是出版业前所未有的时代，出版人应该积极拥抱技术，推进人工智能快速、有序、健康地发展。