生成式人工智能在图书编辑工作中的实践与思考
2025-02-20宗育忍
[摘要]出版业与生成式人工智能的融合正在发生,编辑的工作模式也在这场产业浪潮中经历着深刻变革。文章从生成式人工智能的现状及其在出版业的应用出发,结合图书出版的流程和具体案例,讨论生成式人工智能在图书编辑工作中的实践路径,从而启发编辑创新工作模式,以适应新时代对出版工作提出的新要求。
[关键词]生成式人工智能;图书编辑;实践
一、生成式人工智能的现状及其与出版业的融合
(一)生成式人工智能的现状
“生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。”[1]生成式人工智能模型大致可分为两类:一类是自然语言模型,以OpenAI公司的聊天机器人ChatGPT为代表;一类是图像与多模态模型,以文生图模型Midjourney、Stable Diffusion和文生视频模型Sora模型为代表[2]。
与此同时,我国的科研机构与互联网企业也踊跃入局。国内目前主流的生成式人工智能大模型有文心大模型、混元大模型、通义千问大模型、星火大模型、盘古大模型等,分别来自百度、腾讯、阿里、科大讯飞、华为等互联网巨头。根据《国家信息化发展报告(2023年)》,截至2023年底,已完成备案的生成式人工智能服务达60余款,已在知识问答、医疗咨询、娱乐、视频生成等数十个行业场景领域,展现出广阔应用潜力[3]。
(二)生成式人工智能与出版业的融合
生成式人工智能已成为出版业关注的创新焦点,正在推动出版生态重构。出版作为科学、文化、教育传播的重要领域,将是AIGC的主要使用行业之一[4]。同时,出版业在多年发展中积累有大量高质量内容,长期关注数据安全与知识产权建设,也将为人工智能的发展带来助益。
生成式人工智能在出版业的应用有两个主要方向,一是与互联网企业为主导的基础通用大模型展开合作。例如,包括国家图书馆、上海辞书出版社、人民交通出版社、四川人民出版社等已与百度文心大模型建立合作伙伴关系。二是以出版文化机构为主导的垂直行业大模型。相对通用大模型,垂直行业大模型更关注解决某一特定领域或问题中的某一具体方面或垂类任务,例如,“荀子”古籍大语言模型(中华书局)、方正星空出版大模型(方正电子)、平行出版实验室项目(中信出版集团)、BOOKSGPT大模型(数传集团)等。这些模型正在深度参与图书出版和知识服务的全流程,开创编辑工作的新模式。
二、生成式人工智能在图书编辑工作中的实践
生成式人工智能有三个显著优势:一是计算能力强,在文字处理和内容生成领域表现突出;二是效率高,流程化操作,学习能力强,擅长内容识别、批量生产;三是掌握大数据来源,擅长趋势预测和判断[5]。基于以上优势,生成式人工智能在选题策划、内容创作、编辑校对、营销推广等多个出版环节发挥积极作用。
(一)支持选题策划
选题策划是保障出版物品质的源头环节,是编辑专业能力的重要体现,要求编辑能够捕捉提取信息,把握出版热点风向标;分析并研判市场,掌握消费市场数据和读者需求;寻求创新与突破,填补市场空白;发掘整合资源,盘活已有出版内容。选题策划一方面依赖于编辑的出版经验和直觉,另一方面考验编辑的数据洞察能力,这也恰恰是生成式人工智能可为选题策划提供有效助力之处。
一个完整的选题策划所需要搜集的数据是海量的,也是多维度的:图书市场定价、竞品销售情况、读者社交媒体评价、图书榜单排名、行业研究报告、国家政策文件等,这些数据是选题策划的基础。生成式人工智能能够快速搜集这些数据,从中挖掘有效信息,并提供客观的洞察,如对图书价格走向的分析、阅读趋势的预测等,为编辑的选题策划工作提供全方位的数据支撑和科学的指引,为后续的选题论证环节提供事实依据。
以百度“文心一言”为例,编辑可以通过对话对“文心一言”下达指令,深度搜索各个维度的公开数据,直接通过导入表格等方式,提供私域数据,使用数据可视化插件快速制作图表,提供相应的数据洞察。在此基础上,编辑也可以结合自身出版经验和兴趣找到适合切入的选题方向,从而明确选题方向,搜索出版动态,了解作者信息、读者评论、营销方式等信息,掌握相关出版动态,借鉴有益经验。此外,编辑还可以在人工智能指令下,进一步细化选题思路,逐步完善主要价值及卖点,图书定位、目标读者和同类书,媒体专家评价,宣传营销建议等多方位的选题立项依据,从而形成一份以数据为基础的全面精准的选题报告。
可见,人工智能在选题策划环节起到了智库的作用。在人工智能的帮助下,选题策划的效率大大提升,但值得注意的是,编辑仍然是选题策划的主体。编辑工作作为一项创造性文化工作,具有政治性、思想性、创造性等突出特质,这些特质是人工智能所无法取代的。因此,在选题策划方面,编辑应在学习人工智能使用技巧的基础上,建立以编辑为主、人工智能为辅的工作模式,为工作寻求有益助力。
(二)协助图文内容创作
生成式人工智能突破传统人工智能的局限,从单纯的数据分析和预测转向内容创作,既开启智能创作的新时代,也激发新一轮的内容创作浪潮,让人人都能够通过简易、便捷、低成本的方式,借助人工智能完成文本、图片、视频、音频等多媒体内容的高效高质量生产。
在文生文领域,2024年5月,华东师范大学教授王峰团队取得一项重大突破—他们成功创作出一部百万字的人工智能小说《天命使徒》[6]。2023年10月,清华大学新闻与传播学院沈阳教授团队采用生成式人工智能创作的小说《机忆之地》匿名参加了江苏省青年科普科幻作品大赛,并获得了二等奖[7]。在文生图领域,2023年3月,浙江文艺出版社上海分社·KEY-可以文化推出斩获法国幻想文学大奖的长篇科幻作品《拉丁姆》中文版,这是国内首部由AI辅助封面设计的科幻作品[8]。2023年5月,由人类画师和生成式人工智能共同完成的百米长卷《新西湖繁胜全景图》在西湖AIGC文化论坛首发。生成式人工智能的内容创作能力趋近成熟,已成为值得信赖的辅助创作助手。
需要明确的是,内容创作也是人机协同的过程。在以上案例中,内容创作者所下达的提示词是连接人与人工智能的桥梁,传达创作者在内容创作过程中的核心创意与预期。在撰写《天命使徒》的过程中,王峰教授团队大约给出了共计2000个提示词,并需要根据人工智能输出的结果不断调整。而沈阳教授也表示,他与人工智能进行了66次对话,最终才得到一篇较为满意的参赛作品。《拉丁姆》一书的设计师陈威伸介绍到,他给出的英文关键词有:天蓝色细节、红色细节、绿色、森林、鲜艳的色彩、奥德赛、航天器被爆炸摧毁、希腊幻想风格的巨型太空船、美丽的灯光等,经过20多次调整,人工智能才输出较为令人满意的画面初稿。
实践证明,生成式人工智能正在改变内容创作的生态,而这也是编辑需要面对的未来和机遇。内容创作上人机协同的特质为编辑在早期介入内容生产提供了一个新的抓手。编辑要提升知识储备,积极实践,以便更顺畅地与内容创作者沟通交流,建立互助合作关系,共同讨论如何利用人工智能提升内容质量。
(三)优化编辑校对流程
当前,编辑出版通常使用的校对软件是黑马、方正等规则类校对软件,但是规则类校对软件校对精度较低,不具备语言理解、上下文推理能力,在漏报率、误报率上都距离人工校对存在较大差距,只能作为一个辅助工具,无法替代人工开展工作。生成式人工智能的加入将进一步提升编辑校对环节的准确性,并提升编辑的工作效率。
针对中文语言环境,垂直行业大模型已有相关落地产品。例如,蜜度研发出了国内首个专攻智能校对场景的垂直领域大模型—文修智能校对大语言模型。该模型依据出版领域的行业规范、标准和业务知识,形成文字标点差错、知识性差错、内容导向风险识别三大审核与校对类型[9],仅需要90秒即可完成对一部20万字书稿的自动审核与校对,可支持文字、图片和视频等多种内容的校对。在编校领域,编辑与人工智能的关系可以类比成互相查漏补缺的同事。一方面,编辑受制于专业知识局限、疲劳问题、主观偏差等因素,难免会有校对疏漏,而这恰好是人工智能的优势。另一方面,人工智能也有其局限,它会因无法理解某些专业术语或上下文背景而产生错误判断,因输入数据的大量错误和不规范内容而被误导等。这都需要编辑基于专业知识进行纠正。可见,编辑与人工智能协同工作的模式将进一步提高编校效率,降低差错率,对提高内容质量发挥重要的作用。
(四)赋能营销推广
当前,出版营销推广已渗入全媒体社交平台。当前,百度“文心一言”、字节“豆包”、 讯飞“星火”等生成式人工智能均能够在小红书、微博、微信、抖音等社交媒体平台生产爆款文案。具体来说,编辑只需要输入相关信息,生成式人工智能就可以迅速产出适用于不同社交媒体平台和不同用户的营销推广内容,包括爆款标题、图文内容、短视频脚本等,减少编辑的营销推广压力。然而,若想实现有针对性的营销推广,编辑只有应用针对垂直领域的生成式人工智能,才能根据出版业痛点着力优化整体营销推广流程。
例如,数传集团依托BOOKSGPT动态大数据分析以及大算力中心为技术支持,提供三大核心服务:一站式营销策划案的定制、全方位新媒体矩阵的搭建以及爆款内容的高效创作[10]。具体来说,生成式人工智能通过对市场进行分析和洞察、精准读者定位,建立读者画像,量身定制营销推广方案,并搭建全方位、多层次的新媒体渠道矩阵,整合新媒体平台资源,高效产出营销推广素材。
同时,生成式人工智能在文生视频领域的进展也为营销推广带来新的可能。2024年2月16日,文生视频大模型Sora发布,其能够遵循提示词的指令,直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色[11]。这能有效还原真实世界场景,可以说是全行业发展的里程碑。2024年4月28日,我国首款自主研发的文生视频大模型Vidu发布,其由清华大学携手北京深数科技有限公司开发。这些模型的迭代结合短视频的流行趋势,将在未来为图书营销打开新的窗口。
在图书编辑工作中,生成式人工智能在编辑的指令下,生成适用于全媒体社交平台的营销素材,助力编辑把握营销的关键要素和节点,推动新媒体环境下的营销推广。
三、人工智能时代对图书编辑工作的新要求
随着技术的发展及其应用的深入,生成式人工智能颠覆原有的编辑出版模式,对图书编辑工作提出新要求。
(一)应用生成式人工智能
2018年10月,习近平总书记在中共中央政治局第九次集体学习时强调,“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的‘头雁’效应”。2024年《政府工作报告》提出“人工智能+”行动。当前,生成式人工智能对出版业生态进行重塑,一方面作用于顶层设计,推动自上而下的产业升级;另一方面作用于编辑出版实践,助力编辑发挥在出版流程中的核心优势。编辑不仅是人工智能时代的参与者,更是这个时代的建设者,应用生成式人工智能成为编辑的必然选择。首先,编辑要对生成式人工智能基本概念和原理进行学习,包括机器学习、自然语言处理、图像处理等,从根本上理解人工智能的优势和局限性。其次,编辑要积极应用生成式人工智能,不断探索和创新,并为智能工具的迭代献计献策,形成实践经验。最后,编辑要关注生成式人工智能技术层面的创新突破和应用层面的最新实践,开阔视野,主动思考生成式人工智能与图书编辑工作的结合点,寻求突破。
(二)坚守编辑主体性
自从ChatGPT问世,编辑是否会被人工智能所取代始终是出版业热议的话题。人工智能既提升了出版工作的效率和精准度,也有难以克服的局限性。编辑在使用生成式人工智能辅助图书编辑工作时,要牢牢把握自身的主体性,在实践中明确自身优势,规划职业发展方向。
在人工智能时代,编辑主体性集中体现在以下方面。一是坚持把社会效益放在首位。编辑要始终牢记自身肩负的社会责任,在借助人工智能提升工作效率的同时做好把关人的角色,不被市场和流量所裹挟。二是依托出版经验,做出专业判断。一方面,受限于算法和数据训练模式,人工智能有时会凭空编造部分事实,以表面合理且有逻辑的方式呈现,对此,编辑要对人工智能给出的方案保持警惕,凭借专业知识储备,甄别此类问题。另一方面,人工智能的优势虽能够快速整合、分析既往数据,但也使其创新性与前瞻性存在不足,对此,编辑要结合出版经验,以前瞻性的视野打造选题与内容。三是创新探索,开拓多元出版模式。出版业的实践日新月异,部分业态仍处于起步摸索阶段,受制于数据的缺乏,人工智能在面对这种新兴业态时难以做出全面判断。对此,编辑要立足多年深耕行业和积累的深厚经验,承担守正创新的角色,在夯实内容质量的同时,积极探索知识服务新模式,关注电子书、有声书等多元出版形态,寻求与影视、动漫、游戏等领域的跨界合作,实现对图书高质量内容的多形态开发,推动出版融合转型。
(三)强化知识产权意识
生成式人工智能的发展给知识产权保护带来了新的风险。各国的知识产权相关法律法规还未及时做出针对生成式人工智能的调整,因此在该领域其存在诸多模糊不清之处。其争议主要集中在两个方面。一方面是人工智能在模型训练阶段所使用的内容是否侵犯原作者的著作权。出版业也对此问题给予了关注。在2024年10月的法兰克福书展上,德国出版商和书商协会主席提到,成千上万受版权保护的文本和图片被用作人工智能的训练材料,但这种行为根本没有获得作者同意或支付报酬[12]。在我国,相关法律法规尚未明确模型训练阶段的版权责任豁免条款,《生成式人工智能服务管理暂行办法》要求生成式人工智能服务提供商在训练人工智能时不得侵害他人的知识产权。另一方面是人工智能生成内容的著作权问题。从司法实践来看,国内关于人工智能生成内容可版权性的案例围绕《中华人民共和国著作权法》第三条对作品的定义,尤其是独创性要件而作出的判决。通过相关案例判决,可以发现我国秉承面向未来的司法理念,在总体上承认人工智能生成内容的可版权性,并重视个案分析,强调人工智能必须体现“人”的个性化表达[13]。实践证明,争议的解决需要多个行业的共同参与。对此,编辑要加强版权风险意识,了解知识产权领域的法律法规,关注司法实践的最新动态,并通过学习提高对人工智能生成内容的敏感度,从容合理应对相关问题。
四、结语
生成式人工智能是发展新质生产力的重要驱动力,编辑要树立创新意识、加强专业知识学习,关注行业的最新动态,合理利用人工智能在选题策划、内容创作、编辑校对、营销推广等方面的优势,主动寻找实践路径,提升编辑工作的质量与效率,并意识到人工智能的局限性,在实践中牢牢发挥自身的主体性,形成一套与人工智能相互协同的高质量工作模式。
[参考文献]
[1]生成式人工智能服务管理暂行办法[EB/OL].(2023-07-10)[2024-12-15].https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm.
[2]车璐,张志强,周金佳,等.生成式人工智能的研究现状和发展趋势[J].科技导报,2024(12):35-43.
[3]国家信息化发展报告(2023年)[EB/OL].(2024-09-08)[2024-12-15].https://www.gov.cn/lianbo/bumen/202409/P020240908376506774369.pdf.
[4]高少华.人工智能重塑出版业生态[N].经济参考报,2024-06-21(A07).
[5]徐敬宏,张如坤.ChatGPT在编辑出版行业的应用:机遇、挑战与对策[J].中国编辑,2023(05):116-122.
[6]刘江伟.AI创作出百万字小说,“人人皆能写长篇”不再是梦:华东师范大学教授王峰谈《天命使徒》[N].光明日报,2024-07-06(09).
[7]余梦珑.AI将提升科幻文学的创造力:《机忆之地》创作的启示[N].光明日报,2024-07-06(09).
[8]施晨露.以AI绘制AI故事 首部AI辅助封面设计科幻书出版[EB/OL].(2023-03-23)[2024-12-15].https://www.shanghai.gov.cn/nw4411/20230323/eb8124044d9b48df8b48f85af933ddba.html.
[9]晓雪,管若潼.文修智能校对2.0领跑ChatGPT[N].中国出版传媒商报,2024-06-07(015).
[10]张馨宇.智绘书海新篇:数传集团施其明谈BooksGPT与出版业的智慧蝶变[EB/OL].(2024-10-09)
[2024-12-15].https://www.cbbr.com.cn/contents/533/
94674.html.
[11]OpenAI发布首个视频生成模型Sora:输文字出视频,1分钟流畅高清 [EB/OL].(2024-02-16)[2024-12-15].
https://www.guancha.cn/industry-science/2024_02_16_
725430.shtml.
[12]杜哲宇,褚怡,刘向.综述|法兰克福书展聚焦人工智能发展与监管[EB/OL].(2024-10-19)[2024-12-15].http://www.news.cn/20241019/0bab742a85804215a7bb6434c9e47814/c.html.
[13]郭鹏,李展鹏.论复杂人工智能生成物在著作权法的定性:兼评“AI文生图著作权案”[J].科技与法律(中英文),2024(04):73-82.