AI与出版融合视角下图书选题策划与内容生产的优化路径
2023-02-06王羽佳
王羽佳
(电子工业出版社,北京,100036)
人工智能(AI)研究浪潮席卷全球,出版领域也迎来智能化转型的机遇,“AI+出版”议题成为行业热点。在应用层面,许多出版企业在出版生产中引入了人工智能技术,诸如增强现实(AR)、虚拟现实(VR)等,借由这些技术应用,将传统的纸质出版物变换成更适应读者个性化阅读体验的形式,重塑了出版物的传播介质,并改变了出版物的传播途径和传播模式,促进出版行业向智能化方向发展。
基于人工智能神经网络深度学习性能,AI技术在出版生产中有诸多形式的应用,比如基于信息处理技术的AI编辑、AI审稿和AI校对等。当前,许多出版企业应用了较为前沿的AI技术,能够辅助编辑完成图片识别、格式转换、语音文字交互等任务,有效提升了编辑的审核效率,替代了一部分重复劳动,也使编辑对信息的利用更加充分,提升了选题策划与内容生产效率,缩短了出版周期。但是,随着AI在图书选题策划与内容生产中的运用越来越普遍,也浮现出诸多问题。本文基于“AI技术并不完善,但其与出版融合的趋势不可逆”这一基本前提,从AI对传统出版工作中图书选题策划与内容生产的影响和赋能角度,尝试提出“AI+出版”的图书选题策划与内容生产优化路径。本文中的图书选题策划与内容生产主体是出版单位和编辑,涉及图书著作类型包括原创著作、译著、论文集、编著图书等。
1 AI赋能图书选题策划与内容生产的优势
2017年5月,北京联合出版有限公司出版了AI诗人小冰创作的诗集《阳光失了玻璃窗》。这是小冰学习了19世纪20年代以来519位中国现代诗人的上千首诗、经过万次迭代后“创作”的139首诗的结集。该诗集的出版显示,AI技术的发展和应用,实现了图书选题策划与内容生产的自动化、智能化,开启了机器创作(Machine Generated Content,MGC)的新时代,赋予图书选题策划与内容生产新的优势。
1.1 实现选题策划与内容生产的人+AI智能协作
传统图书的选题策划与内容生产高度依赖编辑和作者,而“AI+”图书选题策划与内容生产模式中,AI算法可以替代编辑进行智能化数据筛选、信息识别、归纳整理等工作,AI内容生产辅助功能可以实现内容的多样化呈现,从而使图书选题策划与内容生产降低对人力的依赖,实现人与AI的智能协作。
2018年4月,电子工业出版社出版了网易有道推出的译著《极简区块链》。该书以全方位的视角,结合通俗有趣的案例及150张插图深入浅出地讲解区块链的核心理论和最新发展。全书20万字,由AI翻译技术翻译、人工参与审校,从原文录入到翻译完成,用时不足半分钟。龙源数字传媒集团旗下的AI平台“知识树”,能够在数千万篇文章中寻找已获取授权的内容,然后基于编辑定义的主题和创作的部分内容,自动组织和生成剩余内容。“知识树”利用龙源集团旗下数千万篇授权文章的积累,让旧的内容焕发出新的活力。如果没有AI协同,在数据库中查找相同主题的内容都需要几天甚至更长的时间,更不用说把这些内容编成一本书。内容生产完成后,“知识树”会对接亚马逊、当当、京东等电商平台,将内容输出到各种数字出版分发渠道,快速完成一系列出版发行工作。在“知识树”的帮助下,一本书的编写只需要一个半小时,发行只需要一天,并且内容可以分发到所有渠道,实现“流量在哪里,内容就可以被输出到哪里”。
现在的AI水平仍处于弱人工智能阶段,内容生产过程中,人与AI协同工作是最佳方式,AI能够有效提升内容生产的效率。在选题策划和内容生产过程中,人利用AI,更易获得选题灵感,更易把握市场需求,从而使图书内容生产更符合市场期待。
1.2 拓展图书内容交互功能
AI赋能图书选题策划与内容生产,不仅能够实现传统出版规范化知识生产和传播的功能,而且能够借助AI技术实现内容的融合出版,增强内容与读者的互动。AI参与图书选题策划与内容生产,使图书不仅可以是“实体纸质图书+电子书+音视频”等简单的融合出版物形态,而且可以是集文字、图像、语音、视频、VR/AR等于一体的复杂的融合出版物形态,但无论是哪种,都大大提高了内容与读者的交互性能。如美国作家詹姆斯·帕特森(James Patterson)在2018年发表的AI对话式小说《大厨》(The Chef),读者可以通过与书中人物进行线上互动推动情节发展,从而提高作品的表现力与市场吸引力。
随着AI技术在选题策划与内容生产中的深入应用,传统的图书选题策划与内容生产模式将被打破,出版服务将不再局限于向读者单向输出内容,出版社、编辑、作者与读者之间将真正实现自由“对话”,交互式学习、沉浸式阅读将日渐普及,读者将真正成为“主角”。
1.3 增强选题策划与内容生产的信息集成功能
2019年3月施普林格·自然(Springer Nature)出版的《锂离子电池:机器生成的前沿研究摘要》(Lithium-lon Batteries:A Machine-Generated Summary of Current Research),是基于对530000篇论文的学习、通过Beta编写器(Beta Writer)算法,由AI创作出来的第一本学术图书,聚焦于锂离子电池的前沿研究,是巨量研究论文的精华合集。2021年,施普林格·自然又采用混合人机交互方式出版了第二本AI创作的学术图书—《气候、行星和进化科学:计算机生成的文献综述》(Climate,Planetary and Evolutionary Sciences:A Machine-Generated Literature Overview),这是一本将人工撰写的文本和计算机生成的文献融合综述而成的图书。2022年7月,该社推出第3本由AI整合生命科学专业领域的文献而集成的学术图书—《CRISPR:计算机生成的文献综述》(CRISPR-A Machine-Generated Literature Overview),这也是首次有中国学者参与的AI创作图书。这些书的出版,显示了AI对于信息极强的整合能力,这种能力,毫无疑问会推动图书选题策划与内容生产迈上新台阶。
2 AI应用于图书选题策划与内容生产存在的瓶颈
AI技术在图书选题策划与内容生产中崭露头角,应用领域从篇幅较小的诗集、小说等,已逐步拓展到学术著作等大部头图书,成为传统出版业转型发展的重要趋势之一。但AI技术本身并不成熟,在出版领域更是远未达到普及的程度,这就使得AI应用于图书选题策划与内容生产存在质量与法律管理方面的瓶颈问题。
2.1 AI主导或导致选题策划与内容生产个性化丧失,作品“缺少灵魂”
AI主导的图书选题策划与内容生产很难呈现真正意义上的“原创”,而是在已有资料、数据的基础上进行的“二次创作”。严格来说,AI并不是其自主创作的图书的“著者”,而应该称为“编者”或“译者”。从原创性、文学性或学术性来说,AI创作的图书内容距离文学名著、社会科学和自然科学的创新性著作相去甚远。由于AI图书是基于既有数据库的总结、归纳和模仿,因而创作深度不够,提供给读者的价值有限。
对于AI技术应用于图书选题策划与内容生产,出版业内外都存在较大的质疑,这些质疑主要表现在两个方面。一种质疑指责AI主导的图书选题策划与内容生产过于屈服于市场,过度应用流量导向,导致内容同质化现象愈发严重,且拉低了出版内容的精神文化属性,使其流于文本形式,而丧失了文字的内涵深度与个性化色彩。例如,在传统出版选题策划中,内容写作角度、写作方法、写作素材都会融入编辑、作者的个体价值,具有较强的个体性特征。但在AI出版中,AI提供的基于数据分析的、可能更受市场欢迎的写作方案,尽管写作素材或写作角度可能不完全被编辑、作者认同,但出于市场考虑,他们可能会产生一定的妥协,从而使图书的个性化程度降低。另一种质疑指责AI技术过度干预选题策划,造成选题策划中的“劣币驱除良币”现象。由算法和流量主导的内容生产可能导致大量人工创作的优质内容无法得到有效的展示,基于算法和流量推荐,真正有内涵的作品可能无法被出版方发现,继而导致出版行业在精神文化价值方向上的迷失,导致出版的作品“缺少灵魂”。例如《阳光失了玻璃窗》中,字里行间不难找到冰心、徐志摩、汪静之、李金发等一批著名诗人的影子和名句。正是这种明显的直接“挪用”暴露了AI内容生产的本质—通过一定的算法和程序对海量的数据进行筛选和整合,通过改造和重组别人的作品进行“创作”。该诗集中的诗歌,诗句基本是各种修辞堆砌的华丽语句,看不出立意的深度和事件的细节和场景,部分诗句语句不连贯、情感表达混乱、思维逻辑跳跃。《人民日报》这样评价这本诗集:“诗歌语言向来模糊、多义,文体自由度和读者的理解包容度都比较大,微软小冰的诗集《阳光失了玻璃窗》能够‘以假乱真’被读者接受,多多少少得益于这种自由度和包容度。”的确,该诗集的出版在一定程度上得益于作者是AI诗人为读者猎奇心理所带来的市场。
2.2 AI创作情感表达缺乏温度,人文关怀不够
与人类情感充沛的文字表达相比,AI的文字表达显得相对冰冷—计算机算法的世界里,所有信息被归化为“0”和“1”。AI创作的作品中,情感表达只是对大量作者既有的情绪和思维的机械整合,文字往往止步于字面意思,因此,存在情感缺乏和人文关怀缺位现象。同时,由于目前AI技术不成熟,很多AI作品中存在句子不连贯、表意不清晰甚至乱码的情况,这进一步制约了AI创作的情感表达力。人类使用文字已经有几千年历史,基于情感的表达方式、理解思维已形成完备体系,显然,短时期内AI还难以达到人类的文字表达水平。
AI的学习算法决定了内容的写作角度与写作水平。尽管AI技术已经迭代多次,但相对传统出版行业仍显得稚嫩,复杂的算法还无法准确地表达所有的写作实践,这是因为图书不仅具有商品属性,更具有精神文化属性。通过算法迭代,AI技术可以实现对图书商品属性的最大挖掘,可以尽可能深入地模仿数据库中内容的写作模式,但缺乏人类真实情感的转化,很难比肩人类书写。因此,在图书选题策划与内容生产过程中,仍然需要人工因素与AI技术的协同。
2.3 相关法律不健全,实施困难
AI技术应用于图书选题策划与内容生产时,会遇到诸多具体法律问题。例如在选题策划阶段,AI大数据技术智能搜索依托于海量的数据库,通过对来源于虚拟网络世界中的浏览数据的高效分析获得关键数据,提取并进行大量的样本统计归纳后,将可能受市场欢迎的选题方向提供给编辑。这一过程如果没有得到用户授权,那么就存在侵犯用户著作权的问题。在内容生产阶段,AI的“二次创作”可能会侵犯其学习数据库中相关作品的著作权。AI选题策划与内容生产使著作权的归属变得复杂,由此产生了诸多关于AI出版著作权问题的讨论。
但是,目前我国与AI内容生产相关的法律体系不完备,针对性核心法条缺位。AI介入内容生产属于新生事物,因而我国尚未出台相关法律,而现有的著作权法、出版管理法律法规等缺乏明确的关联条款,这使得对AI参与选题策划和内容生产的法律监管在具体实施时面临许多困难,存在明显的执行性和可操作性不强的问题。
3 编辑、AI、法律“三位一体”优化路径
出版行业正站在产业变革的十字路口,为了促进知识与文化的最大价值化发展,满足人们对图书的多样化需求,出版业和人工智能的深入融合是必然选择。就AI技术在图书选题策划与内容生产中的应用而言,笔者认为,可以选择编辑、AI、法律“三位一体”的优化路径,见图1,以编辑主导选题策划与内容生产的价值导向,同时聚焦AI技术的突破和法律法规的保障。
图1 “三位一体”的AI图书选题策划与内容生产
3.1 构建“编辑决策+AI协同”的选题策划与内容生产模式
选题策划是重要的出版环节,在某种程度上来说,选题决定了图书的受欢迎程度。传统出版行业,选题策划要经过编辑的前期调研和判断,提炼出选题构思,再经过团体决策寻找出价值点后形成选题。这一过程通常需要花费较长的时间来进行信息筛选、沉淀和整合,而且对信息利用的程度并不能充分保证。但如果将AI技术应用于选题策划,则能够有效地提升信息检索、筛选和整合的效率,使信息得到更全面、充分的利用。AI能在选题关键词的引导下,高效地搜索出大量与选题相关的数据,并能在数据分析模型之下有效地筛选出关键信息、隐蔽性信息和相关性强的信息,为图书选题提供精准的信息支撑。
虽然AI对选题策划的助益良多,但只能作为协同图书选题决策的一种有力手段,选题策划的决策者应该仍然是“人”—编辑和作者。具体来说,图书的主题、形式等应该由“人”而不是“机器”来决定,即使是AI创作的作品,也有必要经过人—编辑和作者的再次整理和编纂,对AI创作的内容“取其精华,去其糟粕”,锤炼内容,决策成书。有“灵魂”的作品,才能成为隽永的“好书”。因此,“编辑决策+AI协同”模式,应成为AI赋能图书选题策划与内容生产的主流模式。
在这一模式下,既要充分发挥AI在学习广度和深度上的优势,为选题策划与内容生产提供精准的参考选项,更要合理规划编辑主体、作者与AI在选题策划与内容生产体系中的话语权,必须坚持以“人”为本。要做到不过度依赖AI算法,不完全以流量和市场商业价值为导向,必须始终坚持选题策划与内容生产的价值导向,坚持出版内容的精神文化属性。
3.2 建设选题策划与内容生产数据库,助力AI技术优势发挥
AI应用于图书选题策划与内容生产的核心技术是基于数据库的深度学习和算法创作,因此,在技术层面,AI赋能选题策划与内容生产的重点是做好选题策划与内容生产数据库建设。
选题策划与内容生产的整个流程涉及很多数据,如图书信息、作者信息、销量信息、内容评价信息、读者信息,以及用户偏好和购买行为信息等,这些数据是图书选题决策的基础和依据。如果能将这些数据汇总到数据库,就可以通过AI大数据技术帮助编辑进行分析判断。比如,可以借助AI分析社会事件的热度以发现选题方向,优化选题构思;可以通过AI对销售数据、阅读数据、评论数据、传播数据、同类图书影响力数据等的分析,帮助编辑定位目标市场和分销渠道。AI还可以重塑内容分发机制,基于AI大数据的智能分发和个性化推荐,可以做到千人千面,或者每个人都可以独享自己关注的内容。因此,AI的应用,还可以在发行和精准营销上起到很好的支撑作用。
要提升AI赋能内容生产的质量,出版社必须建立更大、更全面的数据库。出版企业应该积极构建和扩充版权数据库、作者数据库、选题数据库、读者数据库、销售数据库等各类数据库,加强数字化建设和基础设施建设,也可以尝试与AI技术企业达成数据库共享合作机制,构建规模更大、容纳类型更多样、来源更广泛的数据库。小型出版机构可以采用联盟机制,共建数据库。
有了强大的数据支持,结合读者和市场导向思维—社交思维和对话理念,AI赋能图书选题策划与内容生产就能更加高效和可行,就能从算法机制上实现选题策划和内容生产与读者个性化需求之间的精准适配,为读者提供个性化的出版服务,构建稳定的读者社群,优化出版企业的选题策划与内容生产生态链,最终实现智能化出版。
3.3 建立和完善AI出版相关法律法规
《人工智能指数2022》报告显示,自2014年以来,关于AI法律研究的出版物数量增长了5倍,学术界对人工智能的版权法律规则的讨论十分热烈。不过,目前有关AI法律层面的诸多问题仍处于讨论阶段,并未达成共识。本文想指出的是,出版行业在推动AI出版相关法律建设的过程中,要追求技术变革与法律规则的协调发展,既要保障AI技术价值的发挥,也要在法律层面约束其可能产生的不利影响,确保AI技术真正促进出版产业的繁荣发展。
具体而言,建立和完善AI出版相关法律体系,首先应补充和完善《中华人民共和国著作权法》和《出版管理条例》中有关AI内容生产的相关内容和实施细则。科学技术飞速发展并与出版行业的紧密结合,凸显了出版相关法律法规调整的急迫性。对AI内容出版的相关流程和实施细则均应设置详尽的操作规范,确保有法可依。其次应修改和废止原有不合理的法律和行政法规,以推进AI技术的应用以及出版行业的革新和升级。第三,在新法律法规出台或对原有法规进行修订后,适时出台有关司法解释,对涉及概念、术语及其含义等进行清晰解释,帮助出版企业及相关主体深入理解这些法律法规,从而提高法律法规执行的有效性,保障执法权威。
在当下的工作实践中,为了避免AI内容生产侵权的相关法律风险,出版企业可以在每本图书的出版合同中加入取得本作品内容后续可能被用于AI内容生产素材的相关权利,如发表权、署名权、修改权、保护作品完整权、复制权、发行权、信息网络传播权、改编权、翻译权、汇编权等。可以根据作品具体内容,与著作权人商议采取有偿或者无偿的方式取得这些权益,在充分保障著作权人合法权益的基础上,为建设内容数据库和后续的AI内容生产做好充分的法律授权准备。
4 结 语
AI引入出版行业,改变了传统图书选题策划与内容生产模式,但并没有改变出版行业对优质内容的极度渴望。AI或许能改变出版物内容这种图书的呈现形态、传播渠道,但不可能改变出版物内容这种人类精神文化的表现方式。从长远看,AI+出版融合发展趋势下的图书选题策划与内容生产必然要坚守的仍然是文化价值和文化自信,而非对技术的无止境追求。