APP下载

人工智能生成内容(AIGC)及其在图书出版中的应用探讨

2023-05-31王峻峰

传播与版权 2023年10期
关键词:出版图书

[摘要]近年来,人工智能生成内容(AIGC)随着人工智能技术的发展而不断发展完善,取得突破性进展,其生成的内容愈发接近人类创作,而人工智能聊天机器人程序ChatGPT的出现再度引发AIGC技术讨论和研发的热潮。目前,AIGC在图书出版各环节都具有广阔的应用前景,其需要在实践中不断提高和完善,并加强技术研发和管理规范,从而更好地推动图书出版的创新和发展。

[关键词]AIGC;ChatGPT;图书;出版

人工智能生成内容(Artificial Intelligence Generated Content,AIGC)是人工智能领域中的一个重要分支。在数字世界与现实世界加速融合的大背景下,近年来AIGC技术发展迅速,而人工智能聊天机器人程序ChatGPT的出现再度引发AIGC技术讨论的热潮,其将重塑甚至颠覆数字内容的生产方式和消费模式。尽管AIGC对图书出版行业的影响至今仍未充分显现,但其具有的颠覆性能力和广阔的应用前景已受到业内密切关注。

一、AIGC的概念与发展历程

AIGC指利用人工智能技术生成内容的新型生产方式,是相对专业生成内容(Professional Generated Content, PGC)、用戶生成内容(User Generated Content, UGC)而提出的概念,如AI作曲、AI绘画、AI写作等都属于AIGC的分支。AIGC使用的技术主要包括机器学习、自然语言处理等,通过学习大量已有的文本、音频、图像等数据集,进而生成新的内容,其所生成的内容与人类创作的内容极为相似。

AIGC伴随计算机技术和人工智能技术的发展而不断发展完善。早在1957年,莱杰伦·希勒和伦纳德·艾萨克森就通过将计算机程序中的控制变量换成音符,完成了历史上首支由计算机创作的音乐作品—Illiac Suite。但早期的AIGC只能依照指定的模板或规则进行简单的内容制作与输出,并不具备学习能力,也不能理解数据,无法灵活地生成内容。20世纪八九十年代,由于系统成本高昂、商业变现困难,各国政府在人工智能领域的投入不断减少,因此AIGC未能取得重大突破。2006年,杰弗里·辛顿提出深度信念网络概念,深度学习算法取得突破,加上此时计算机设备算力提升,互联网数据膨胀提供海量训练数据,因此人工智能发展取得显著进步。但此时的AIGC仍受限于算法技术,创作能力有限且效果不佳,未能获得广泛应用。2007年,世界上首本完全由人工智能创作的小说1 The Road问世,但其整体可读性不强,存在拼写错误、辞藻空洞、缺乏逻辑等缺点[1]。自2012年起,深度学习时代到来,卷积神经网络、变分自编码器、生成式对抗网络、强化学习、流模型、扩散模型等深度学习算法的出现和应用,使得人工智能的学习能力和生成能力迅速提升。2016年后,深度残差网络和Transformer大模型等深度神经网络的结构升级,使得模型参数量从数万升级到数千亿,深度学习网络层数从几层发展到成百上千层,模型规模的量变引起能力上的质变,高质量的文本、优美灵动的曲调、超高清晰度的图片和视频等内容的智能生成成为现实。AIGC开始应用在各类场景中,其所生成的内容五花八门,内容效果逐渐接近人类创作,让人难以分辨[1]。例如,英伟达发布的StyleGAN可以自动生成与现实照片非常相似的图片;OpenAI推出的DALL-E 2可根据用户输入的简短描述性文字生成风格多样、质量极高的绘画;DeepMind发布的DVD-GAN可以生成在草地、广场等明确场景下的连续视频。

2022年11月,OpenAI推出了基于Transformer大模型的人工智能聊天机器人程序ChatGPT(Chat Generative Pre-trained Transformer,即生成型预训练变换模型)。它是一个专注于对话生成的大型语言模型,能够与人即时对话,并自动生成流畅、连贯的自然语言文本。ChatGPT一经上线便引起大量关注,开放试用的短短几天就吸引了超100万互联网用户,推出两个月后其月活跃用户数过亿。从回答简单问题到写诗、写故事、写程序,从语言翻译到文本归纳总结,从行业分析到撰写商业计划书,不论是用中文、英文还是用其他语言表达,ChatGPT几乎无所不能。

ChatGPT采用了预训练和微调的方式进行模型训练[2]。在预训练阶段,模型使用大规模的未标注文本数据进行训练,目标是学习文本序列的概率分布和词语之间的关系。这使得模型能够形成对人类知识和自然语言的理解和内容生成能力。在微调阶段,模型使用人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)的方式进行训练,即先用有标注的数据(指由人根据问题给出的高质量答案)来微调预训练模型,然后由模型根据问题给出多个答案,人工对答案满意度进行打分、排序并建立奖励模型,如此多次循环[3]。这使得模型生成的内容更加贴合人类的认知、需求、价值观。ChatGPT可以与其他AIGC模型联合使用,获得更加独特、实用的功能。例如,我们在ChatGPT中输入简单文字描述,让其生成一段详细文字描写,再将该段文字输入AI绘图软件即可生成设计图像。OpenAI计划在未来的ChatGPT更新中引入多模态学习能力,即结合图像、音频、视频等多种模态的数据进行学习。另外,微软也在其New Bing中接入了ChatGPT,在一定程度上实现了智能搜索。这些方式都极大地提升了AIGC的实际应用能力,人工智能大规模落地未来可期。

ChatGPT再度引燃了人们对AIGC的关注热情,其出现以来相关讨论层出不穷。从简单到复杂、从量变到质变,虽然现今的AIGC离理想中的通用人工智能还有一定差距,但是无疑已经迈出重要一步。随着数据量的增加、算法的迭代升级,以及与现实世界交互功能的加强,多模态AIGC大模型将通过不断的学习试错以及自动总结客观规律,帮助人类创造更美好的生活。

二、AIGC在图书出版中的应用探讨

在图书出版领域,虽然各出版机构对人工智能技术的应用情况和应用程度并不一致,但数字化、智能化是大势所趋已成为出版界的共识。随着ChatGPT的推出,AIGC技术的快速发展会给图书出版带来什么改变也在行业内引发讨论。目前,学界和业界已对人工智能在图书出版中的应用进行了研究和探讨,与人工智能相比,AIGC在数据挖掘、机器学习、自然语言处理等技术的基础上,更注重应用场景的特定性,能通过针对特定领域的深入学习和优化,实现更高效、更准确的数据分析、决策支持和智能服务。

(一)在图书选题策划中的应用

在图书选题策划环节,AIGC技术可以帮助出版社和编辑有针对性地对市场需求进行分析和预测,以更好地把握市场趋势和读者阅读需求,为图书选题策划提供参考。第一,编辑可通过AIGC技术分析社交媒体、搜索引擎、图书评论、图书销售数据等大数据,快速发现当前热门的图书话题,获取有关某一类图书的需求量、市场容量、竞争情况等信息,并自动生成文本、图表等可视化内容以供参考。第二,出版社可以利用AIGC技术分析和预测读者的特征和偏好,包括年龄、性别、教育水平、兴趣爱好等,自动生成读者画像,从而确定图书的目标读者。第三,出版社和编辑可以通过自然语言处理技术,对历史图书的内容进行分析和比较,挖掘出与当前市场需求相符的主题和话题。第四,出版社可以利用AIGC技术比较同类图书的市场表现和销售情况,如销售额、评价指数等,生成同类图书的优缺点分析报告,以便更好地制订图书营销策略。第五,AIGC可以通过对大量的文本数据进行学习和分析,自动生成潜在的主题和创意,作者和编辑可据此拓展思路,增强图书选题的创意性和多样性。

(二)在图书组稿和内容创作中的应用

在图书组稿环节,出版社和编辑可以利用AIGC技术来寻找合适的作者,如分析读者的购买历史和购买偏好,利用推荐算法为其推荐适合的作者;通过联网直接搜索潜在作者的背景信息,包括教育背景、工作经历、专业领域等,自动生成其背景调查报告;挖掘社交媒体、博客、网站等平台上的信息,分析潜在作者的知名度、影响力和粉丝数量等,以评估作者的潜在市场价值;分析潜在作者的写作风格、主题偏好、写作文笔等,以了解作者的文学风格和写作特点;等等。AIGC可通过自然语言生成模型对大量文本进行学习和分析,自动生成图书内容的各个组成部分,包括章节、段落、句子等,或者为图书的内容创作提供灵感和素材[4]。通过AIGC的自动化生成,图书的内容创作可以更加高效,从而缩减图书出版周期,降低出版成本。同时,AIGC也可以在一定程度上增强图书内容的创新性和个性化,使读者更容易接受。此外,AIGC还可以在图书创作过程中提供实时的语言纠错和写作风格建议,帮助作者减少写作错误和提高文本质量。

(三)在图书编辑加工和审校中的应用

编辑加工和审校是图书出版过程中的重要环节,需要耗费大量的时间和人力。一些自动化工具,如黑马校对软件、方正智能辅助审校系统等已经应用于字词、标点、敏感词、知识、格式、逻辑等方面的辅助审校[5],在一定程度上提高了图书编辑加工和审校的工作效率和编校质量。AIGC的发展大大提高了人工智能的语义分析和上下文联系能力,知识库构建更完善、能够与互联网实时连接的AICG将能够做到智能判断各类知识点的正误或存疑情况,其将在深层语法、语义逻辑等方面为编校人员提供更有益的参考。另外,AIGC能有效识别符号公式和插图表格等,以及有效处理大小写、正斜体、角标等格式规范问题,这可帮助编辑高效完成理工科类专业书籍或中小学理科教辅图书的编校加工。

(四)在图书美术设计中的应用

图书的美术设计是吸引读者注意的重要因素之一,AI绘图工具比ChatGPT更早引起大众关注,目前已有不少此类AIGC工具。例如,谷歌的AutoDraw可以根据用户的手绘图形自动识别并替换成更美观的图形。另外,还有Midjourney、Stable Diffusion、DALL-E 2、NovelAI等工具,能够根据用户的简单文字描述自动生成或真实或具有想象力的图片。此外,AIGC可通过对大量已出版的图书封面和插图进行学习和分析,自动识别各种元素之间的关系,如颜色、形状、文字、图片等,进而分析市场需求和读者偏好,生成更具吸引力的图书封面和插图。

(五)在图书营销中的应用

在数字化出版时代,图书营销渠道和方式的多样化给了出版社更多的选择,而出版社应用AIGC可以进行精准营销,提高营销效率和销售量。首先,AIGC可用于预测潜在读者的阅读喜好和阅读兴趣,从而增强图书的推广效果。例如,出版社可以通過AIGC分析社交媒体平台上读者的阅读兴趣和行为,以便更好地了解读者的喜好和需求,并根据这些信息制订相应的营销策略。其次,AIGC还可用于图书的个性化推荐。在数字化出版时代,越来越多的读者选择在线阅读和购买电子书。通过对读者的阅读历史和行为进行分析,AIGC可以为读者推荐符合他们阅读兴趣和需求的图书,从而提高图书的销售量。最后,AIGC还可用于制作图书广告和宣传素材。通过对图书内容和读者需求的分析,AIGC可以自动生成相关的营销文案、海报、宣传册等内容,助力出版社高效开展图书营销。

尽管AIGC可以分析数据、归纳总结信息,也可以模仿人类创作,生成各类文章、图像、报表等,但其也存在一些不足。例如,AIGC主要依靠对已有数据的学习和模仿,难以创造出真正意义上的原创内容,缺乏真正的创造性。第一,由于模型训练数据存在局限性和片面性,AIGC在生成内容时难以完全考虑文化差异和情感因素等,导致其在生成某些类型的内容时可能失之偏颇[6]。第二, 一些专业领域的问题需要更深入的领域专业知识和经验以及更复杂的推理演算,而AIGC难以学习和模仿这些知识和经验,使得其处理复杂问题可能出现困难。第三,AIGC生成的内容可能缺乏人类审美和主观判断的因素,难以满足读者的需求和兴趣。第四,语言文字有时存在歧义和多义,AIGC在处理这些问题时可能出现偏差,导致生成的内容不准确或不恰当。因此,从这些不足来看,AIGC应用于图书出版离不开使用者的审核把关,在分析、决策、生成方面AIGC仍应扮演工具性的协助角色,以更好地发挥人工智能和人类双方的优势。人机协同模式仍是未来相当长时间内的主流[7]。

三、AIGC应用于图书出版可能涉及的问题

AIGC应用于图书出版可能涉及的问题主要有隐私保护、知识产权保护、算法歧视、信息准确度以及透明度。第一,出版社应用AIGC需要访问和处理大量的用户数据和个人信息,这就涉及隐私保护的问题,如果未经充分授权和明确告知,用户的个人数据和隐私信息则可能被泄露或滥用。第二,AIGC应用于图书出版可能会涉及知识产权的保护问题,如在数据挖掘阶段存在合理使用风险,在内容生成阶段存在可版权性和版权归属风险,在内容生成后的使用阶段存在流转风险与侵权风险[8]。第三,由于AIGC的学习和决策是基于数据的,如果数据本身存在偏差,算法也可能出现歧视,如出现价格歧视、性别歧视等,从而影响信息推荐和决策结果。第四,AIGC的训练数据库过于庞大,且多来自互联网,其中存在许多错误信息,因此其所生成的内容并不能保证准确无误,如果公众长期使用AIGC来获取信息而不加以仔细甄别,就容易导致错误信息传播更泛滥。第五,由于算法透明度较低,其运行规律和因果逻辑难以解释,一旦出错则难以纠偏除误,且训练数据库过于庞大、参数过于复杂,也难以审核其训练原材料的公允性等因素,因此出版社应用AIGC进行的分析、决策可能不够客观和公正。

为了规范和管理AIGC的应用,保障知识产权和用户权益,未来关于AIGC的一些措施有待研究与施行。例如,相关部门可制定相关的法律法规,明确AIGC在图书出版中的应用范围和限制条件,加强知识产权保护,防止AIGC在图书出版中的应用侵犯知识产权。出版社可建立健全监管和审查机制,对AIGC的应用进行审查和监督,防止不当使用和滥用。业界应加强人工智能行业自律自治,强化“伦理先行”意识,制订行业公约、标准、指南等,打造AIGC健康发展生态。社会层面要加强知识普及,提高公众对AIGC的认识和理解,促进公众对AIGC的应用与影响的理性思考和讨论。

[参考文献]

[1]中国信息通信研究院,京东探索研究院.人工智能生成内容(AIGC)白皮书(2022年)[EB/OL].(2022-09-02)[2023-02-28].http://www.caict.ac.cn/sytj/202209/P020220913580752910299.pdf.

[2]OpenAI.IntroducingChatGPT[EB/OL].(2022-11-30)[2023-02-28].https://openai.com/blog/chatgpt.

[3]陈巍谈芯.ChatGPT发展历程、原理、技术架构详解和产业未来(收录于GPT-4/ChatGPT技术与产业分析)[EB/OL].(2023-02-27)[2023-02-28].https://zhuanlan.zhihu.com/p/590655677.

[4]王俊美.ChatGPT写作:出版界怎么看[EB/OL].(2023-02-24)[2023-02-28].http://cssn.cn/skgz/202302/t20230224_5598227.shtml.

[5]宋萃薇.人工智能在图书出版的应用与编辑的转型[J].采写编,2023(01):134-136.

[6]王羽佳.AI与出版融合视角下图书选题策划与内容生产的优化路径[J].出版科学,2023(01):44-49.

[7]胡嘉思.人工智能在出版行业融合传播及运营模式中的应用与展望[J].科技与出版,2023(01):79-82.

[8]丛立先,李泳霖.聊天机器人生成内容的版权風险及其治理:以ChatGPT的应用场景为视角[J/OL].中国出版:1-6[2023-02-28].http://kns.cnki.net/kcms/detail/11.2807.G2.20230221.1908.002.html.

[作者简介]王峻峰(1991—),男,重庆人,新世界出版社教育编辑部副主任。

猜你喜欢

出版图书
无障碍图书联盟
图书推荐
欢迎来到图书借阅角
班里有个图书角
图书推介
接龙小说“出版”,开学大家嗨起来!
众筹出版是一种出版创新
民国时期老课本出版略探
玛丽·安·伊万斯小说在中国的出版与接受
从西方青年学者与翻译家看中国出版“走出去”