生成式AI浪潮下国际数字出版产业发展态势探析

2024-06-25丁靖佳李佰珏庄红权

中国数字出版 2024年1期

丁靖佳?李佰珏?庄红权

摘要 ChatGPT等应用的崛起引发了国际出版界对生成式AI的广泛关注与讨论。学术出版商在谨慎规制生成式AI工具的学术伦理的同时，积极借助生成式AI开发增强型科学搜索引擎和聊天机器人；在大众出版领域，生成式AI则引起了内容生成与分发的范式更迭“革命”，一定程度上造成了大众出版生态的破坏；交互式、个性化的生成式教育出版知识服务逐渐成为现实，教材出版模式变革处于“现在进行时”。对此，进一步结合我国数字出版产业的发展特征，分别提出了相应的发展对策。

关键词生成式AI；国际数字出版；内容生产；生成式出版

ChatGPT、Midjourney、Stable Diffusion等生成式人工智能（Generative Artificial Intelligent）应用的出现引发了国内外各领域的热议，出版界也不例外。作为一个以知识内容选择、传播、传承为内在追求的内容产业，出版业与服务内容自动生成的生成式AI天然地有着紧密联系[1]。事实上，生成式AI并不是一类新生事物，早在2017年，微软聊天机器人小冰就出版了诗集《阳光失了玻璃窗》。受限于数据、算力及算法的制约，当时的生成式AI模型还未具有类人的学习、理解、推理和语言表达能力，故而没能对出版业产生颠覆性的影响。近年来，得益于生成式AI算法的创新迭代、大规模语言模型（Large Language Model，LLM）的成熟以及技术应用成本的降低，生成式AI对出版业的“变革”从“远在天边”转变为“近在眼前”。而国际数字出版产业因其相对开放灵活的市场环境、技术获取与应用的便利性以及国际市场的竞争压力，更为敏锐地感知到了这一变动。在此背景下，探讨生成式AI浪潮下国际数字出版产业的发展态势，不仅能够勾勒出当前国际数字出版产业发展的整体性图景，也能为我国数字出版业迈向生成式智能出版这一新业态提供有力参考[2-3]。

以国际视角来看，数字出版产业普遍被认为是使用在线技术、以数字形式复制和分发数字内容的内容产业，其市场可按内容分为文本、音频和视频三大细分市场[4]。粗略地看，国际关于数字出版产业的认知较之国内，内涵上整体具有一致性，外延则更为宽泛，更倾向于将所有数字内容产业都囊括进数字出版产业的范畴，甚至将奈飞（Netflix）、谷歌（Google）、苹果（Apple）等视为国际数字出版产业的核心活动主体，致使国际数字出版产业与内容产业、科技产业的发展边界也相对模糊。为兼顾内外，本文将数字出版产业的外延界定在互联网期刊、移动出版、数字报纸、在线教育、电子书等细分市场内[5]。

1 学术出版：谨慎规制与大胆尝试

从当前生成式AI的应用体验来看，生成式AI非常擅长于输出看似合理、实则存在事实性、知识性错误或偏见的内容，这显然与学术出版对科学内容创新性、科学性、严谨性、可靠性的高标准有所相悖。因此，学术出版商规制生成式AI工具的使用是必要的，但他们也没有为此忽略生成式AI的创造性应用潜力。可以说，在对生成式AI谨慎规制与大胆尝试的博弈中，学术出版不断涌现出新的发展机遇。

1.1 生成式AI工具的学术伦理规制

基于LLM的生成式AI已在学术界“大行其道”。事实上，不少研究人员已经利用生成式AI的相关工具及应用协助其学术思维组织、代码编写、文献总结、论文修改撰写等[6]；基于生成式AI创作的学术论文、著作也开始在同行评议期刊以及大型学术出版商上出版；部分论著和预印本甚至将生成式预训练变换器3代（Generative Pre-trained Transformer 3，GPT-3）、ChatGPT、Beta Writer（施普林格开发的生成式AI算法）等生成式AI模型或应用列为共同或唯一作者。对此，学术出版界普遍认识到了生成式AI及相关工具对学术交流过程的影响，纷纷发布相关政策、规范或指南以规制生成式AI的使用，部分代表性政策如表1所示。

从已发布的政策来看，大部分出版商或学协会都不允许将LLM、聊天机器人等生成式AI工具列为作者。基于问责制和对权利归属的考量，学术出版商或学协会普遍认为AI作为非法人实体，不能对已发表成果或研究设计的原创性、准确性和完整性负完全责任，也不具有法律地位或版权转让能力。也就是说，AI并不能履行作者的基本责任或行使作者的基本权利，因此不能被列为文章作者。

在生成式AI工具的使用上，不同出版商的态度和意见相差较大。总的来说，大致可分为三类，一是完全禁止使用，如《科学》（Science）系列杂志便表示未经编辑明确许可，包含文本、图片、图像在内的人工智能生成内容（AI Generated Content，AIGC）都不能在文章中出现，违反这一规定即被视为科学不端行为[7]。二是有条件的禁止或许可。如爱思唯尔（Elesvier）、国际机器学会议（International Conference on Machine Learning，ICML）、美国医学协会杂志（Journal of the American Medical Association，JAMA）等主体允许生成式AI工具用于语言编辑和润色，或认为仅当AIGC本身是研究过程中的一部分时方能适用（如研究ChatGPT的回答是否具有意识形态倾向时，可将AIGC作为实验数据写入文献中）。从限制条件来看，该类出版商或学协会旨在禁止文章的框架、观点、思路等创新性内容由AI生成。三是开放式的使用许可，但需在恰当部分透明地披露使用情况，泰勒·弗兰西斯（Taylor & Francis）、施普林格·自然（Springer Nature）、威利（Wiley）、国际出版伦理委员会（Committee on Publication Ethics，COPE）、世界医学编辑协会（World Association of Medical Editors，WAME）等均实行此政策。值得注意的是，许多出版商或学协会对人工智能生成图像、视频进行了单独说明，其态度或与生成式AI工具的使用一致，或全然相反。可见，国际学术出版界在讨论生成式AI工具的应用时，主要是强调人工智能生成文本介入科学生产过程的合理性与合规性，而人工智能生成图像、视频则需额外加以讨论。

此外，WAME还在其《聊天机器人、生成式AI和学术手稿》（Chatbots，Generative AI and Scholarly Manuscripts）的建议指南中特别指出了编辑、同行评审专家使用生成式AI工具的规范，即“编辑和同行评审员应向作者和彼此说明在评估稿件以及生成评论和信件时使用聊天机器人的情况”“编辑需要适当的工具来帮助他们检测人工智能生成或更改的内容”[8]，将生成式AI的学术伦理规制对象从研究者扩大为编辑与审稿专家，也将规制流程从学术写作延伸到了学术出版流程。

1.2 科学搜索引擎与聊天机器人

国际学术出版商，文献数据库或管理机构等主体长期以来都非常重视AI与学术出版、学术交流的融合。在直面ChatGPT等生成式AI应用可能对学术领域带来的风险后，各类机构也积极涌入生成式AI的浪潮之中，希望借助生成式AI实现已有功能或服务的转型升级。

基于LLM的科学搜索引擎是生成式AI在学术出版中的典型应用之一。2023年6月，科睿唯安（Clarivate）宣布与生成式AI领域领先的AI21实验室签署战略合作伙伴关系协议，旨在将LLM集成至Web of Science中，以实现智能的学术对话搜索、发现等服务[9]。凭借其数十亿的文献、书籍以及专有数据点，科睿唯安认为它完全有能力把握生成式AI这一机遇并引领市场，为用户提供更多的、更高质量的可信内容与服务。同时，Elicit、Scite、Semantic Scholar等学术服务平台也开始在科学数据库中应用LLM，以对比检索上下文信息并回应用户的具体问题。以Semantic Scholar为例，它开发的TLDR（Too Long; Didn't Read）功能通过融合专家背景知识和类似GPT-3的自然语言处理（Natural Language Processing，NLP）技术，通过生成基于文献主要研究目标和研究论文的超短摘要，以缓解当前科学信息过载之困境、提高研究者的生产力和创造力。目前，TLDR功能的测试版本已发布，适用于计算机科学、生物学和医学领域的近6 000万篇论文[9]。

聊天机器人则是学术出版商应用生成式AI的另一典型场景。2023年8月，国际学术出版商巨头爱思唯尔发布了聊天机器人“Scopus AI”的alpha版本。Scopus AI是一款将LLM（GPT-3.5）与Scopus中的可信内容和数据相结合的新一代生成式AI工具，能够通过交互式的对话实现知识服务。为保证返回内容的可靠性和安全性，爱思唯尔还组建了由17名来自主要学科的世界知名科学家、研究人员和图书馆员构成的独立审查委员会，以保证Scopus AI遵循相应的AI原则和基本伦理。目前，Scopus AI的功能包括：基于Scopus数据库摘要的观点总结、提供“深入链接”以扩展探索更多相关内容、自然语言查询、生成图片以揭示研究关联。当然，Scopus AI也存在一定限制，即它只能基于5～10份研究摘要来生成答案，该规则旨在防止LLM经过大量文本训练和学习后输出可能包含事实错误或偏见的内容[10]。同日，数字科学（Digital Science，隶属于德国霍尔茨布林克出版集团）宣布为其Dimensions数据库推出AI助手Dimensions AI Assistant的Beta测试版本。Dimensions AI Assistant在接收到用户查询的请求后，一则能提供摘要总结，即在数据库中查询最符合情境化需要且相关性排名前4的文献摘要，并经Open AI的GPT应用程序接口（Application Programming Interface，API）处理后生成摘要总结；二则能够提供知识解决方案，即基于它自开发的LLM在排名前10的文献中抽取核心内容加以学习和理解，由此生成最佳答案[11]。

2 大众出版：范式更迭抑或混乱再起

大众出版领域，包括大众出版商在内的多元主体都将生成式AI视为创新发展的关键资源，期望借此实现内容生产与分发的范式更迭。然而，由于生成内容质量的参差不齐以及潜在的著作权争议，生成式AI也潜在破坏了国际出版生态，致使包括出版在内的整个内容产业处于一种紧张的混乱状态。面对这一情形，大众出版界采取了主动的应对措施，拟通过协助立法、出台政策、技术开发、使用限制等一系列行动重构国际出版生态。

2.1 内容生产与分发的范式更迭

面对来势汹涌的生成式AI，各类新闻出版主体都采取了积极包容吸纳的姿态。路透社（Reuters）最新报告称，81%的受访者认为AI对于自动化新闻生产（Automated Journalism）及编辑室工作流程加速有重要作用[12]。实际上，生成式AI已悄然融入出版内容生产和营销推广的全流程，以生成式之新特征推动出版内容生产与分发的智能转向和范式变革。

辅助内容创作是大众出版领域应用生成式AI的常见方式。阿根廷《国家报》（La Nación）自主建设了AI新闻室，通过机器学习和NLP技术进行文本分析和数据处理，辅助新闻报道的选题策划与内容撰写，目前该媒体已基于生成式AI技术发表了有关陷阱音乐、大选新闻、性别差异等议题的多篇报道。《华盛顿邮报》（The Washington Post）、荷兰地域性媒体集团北方报刊集团（Noordelijke Dagblad Combinatie）等也已利用生成式AI实现了新闻的自动化报道，发表了近900篇报道和6万场足球比赛的报告。在图书的内容生产上，生成式AI主要服务于智能审校和长文本生成。基于生成式AI的写作助手QuillBot便能够借助NLP技术实现文本的自动纠正和语义增强，实时提供语法错误修正、抄袭检查、文档摘要生成等服务功能，极大地提高了内容的检校质量和效率。在长文本生成上，日本公立函馆未来大学松原仁教授团队通过向自训练的生成式AI模型输入小说的基本架构、人物设定等关键信息，与生成式AI合著完成了小说《计算机写小说的那一天》（The Day A Computer Writes A Novel），成功入围了日本“星新一微型小说文学奖”。可以说，训练有素的生成式AI语言模型已经能够在人类指令的指导与调整下，生成堪比乃至超出专业作家水平的内容作品，出版内容生产上游的范式更迭无疑也将蔓延至出版活动的核心环节与步骤。

此外，大众出版领域各主体也在利用生成式AI进行内容的分发推广，通过个性化的营销内容构建出版物与读者间的联通渠道。目前，Shimmr公司正在尝试解决图书的可发现性这一难题，其AI工具Shimmr.ai可以在计算图书内容的情感与叙事技巧向量的基础上，自动生成该图书与类似作品关联之处的智能模型，以图书的相关性计算帮助读者发现阅读目标。而在图书的反向发现性上，Shimmr公司利用图书AI广告帮助图书“找到”读者[13]，其基本原理在于：首先，提取包含图书结构、价值观、兴趣、情感等关键信息在内的“书籍DNA”，并为每个“书籍DNA”贴上符合用户阅读需求的若干标签及关键词；其次，将不同的“书籍DNA”进行“联网”，形成一个大型“书籍DNA基因库”；再次，基于读者的阅读痕迹、行为数据、用户偏好等信息，在“书籍DNA基因库”进行搜索、匹配最佳结果并进行广告内容的个性化生成和推送，由此便实现了图书与读者“端到端”的纳米级营销。目前，福布斯图书公司（Forbes Books）已经与Shimmr公司达成合作，旨在借助Shimmr.ai开展针对性的图书营销活动。

2.2 生态破坏与修复措施

尽管生成式AI能够为大众出版的内容生产与分发提供强大助力，其缺少人工监督、训练数据良莠不齐等现实问题也带来了诸多负面影响，如低质量的AIGC泛滥、版权争议、用户隐私泄露等。具体来看，生成式AI的应用为国际大众出版产业带来了以下两方面的挑战与问题。

一则，LLM的滥用致使劣质内容广泛充斥大众出版业。由于缺乏监督和筛选，AI生成的“伪书”正在渗透亚马逊等电商网站与其他在线书店。2023年6月，亚马逊“青少年当代浪漫电子书”畅销书排行榜上的前100本书中就有81本由AI生成，这类“伪书”往往存在格式混乱、文本无序、封面拼凑、缺乏概要信息等诸多问题[14]，极大地影响了大众出版市场的市场生态。同时，《纽约时报》（The New York Times）、《泰晤士报》（The Times）、《幻想与科幻小说》（The Magazine of Fantasy & Science Fiction）、《阿西莫夫的科幻小说》（Asimovs Science Fiction）等在线出版商也称AI生成的低质量图书、虚假消息及平庸文章在其关键板块中占据较大比例[15-16]。

二则，LLM的使用也存在多重风险。首当其冲的是著作权，对于著作权人来说，生成式AI未经授权且无偿使用其所有作品进行模型预训练或内容生成，本身就是一种侵害其作品复制权、改编权及汇编权的表现。2023年1月，美国3名漫画家指控Stability AI在内的3家公司侵犯版权，认为它推出的付费AI图像生成工具使用受版权保护的图像生成“新”图像，并因此获利，使得原作品在交易市场中遭受损失[17]。其次，生成式AI因具有廉价、高效、便捷、即时的特征而被优先应用于不同场景，挤占了作者原有的工作机会，也减少了他本可能获得的劳动报酬。出版商的生存空间也因此缩小，例如，搭载生成式AI的搜索引擎、聊天机器人将以内容摘要、知识解决方案等形式，直接服务用户的各类知识需要。尤其是在生成式AI应用发展愈加成熟的趋势下，用户向出版商直接寻求知识服务的需求降低，出版的诸多服务功能或将被生成式AI替代。

面对生成式AI带来的诸多风险，大众出版业的各主体发布了不同政策。具体来看，可分为四个方面：①对AI划分等级，以针对性实施管理，如欧洲议会（European Parliament）发布的《人工智能法案》（AI Act）就提出要将AI及其相关应用划分为禁止使用、高风险、有限风险以及低风险四等，并针对不同级别制定监管规则。②要求生成式AI模型的训练过程尊重版权，公布训练集作品来源并取得受版权保护作品的权益人的权益人的使用许可，如意大利文化协会就提出AI开发人员必须确保所使用的受版权保护内容（包括预训练数据集）得到权利人的批准和许可，且数据处理和收集过程必须尽可能透明[18]。③开发AIGC鉴别工具，识别“深度伪造”内容，防止AIGC冒名顶替人类作品，如内容来源和真实性联盟（Coalition for Content Provenance and Authenticity）正在开发基于防篡改或显窃启元数据的“真实性证书”来验证内容来源；BBC、《纽约时报》等也领导了“起源计划”（Project Origin），旨在追溯内容的真实发布者，打击假冒和虚假的AIGC信息[19]。④限制数据使用，禁止将非授权的出版资源用于生成式AI训练，确保版权内容利益不受损害。如美国作者协会（The Authors Guild）就起草了一项新的出版条款，禁止在未经作者明确许可的情况下使用出版内容来训练生成式AI模型；且出版商只有在获得作者的书面同意后，才能将生成式AI用于书籍智能翻译、有声读物配音或封面图片创作。

然而，提高数据访问壁垒、设置访问限制等措施又带来了次生危害。为应对AI爬取数据，拥有大量用户在线互动数据的Reddit网站大幅提升了数据访问定价，这使得依赖于API的一系列应用程序无法再以低成本方式访问该网站。对用户而言，持续升级的访问限制又降低了用户体验，用户需要付出比以往更多的精力对优质内容进行识别验证。而随着网络上AIGC以及对抗生成式AI的内容比例逐渐增大，人类痕迹如同福柯所言的“沙滩上的脸”逐渐被AI抹去，网络或将进入“死亡互联网”状态[20]。

3 教育出版：“毁灭”还是“生存”？

生成式AI对学术出版和大众出版的深远影响主要发起于内容生产端，即是由出版产业链的上游驱动的。教育出版领域则相反，它更多是由用户端，即出版产业链下游“倒逼”所形成的产业变革。

3.1 “一石激起千层浪”

生成式AI对教育出版业的“蝴蝶效应”始于一场“高科技抄袭”——大量学生开始频繁使用ChatGPT来完成作业。2023年2月，沃尔顿家庭基金会（Walton Family Foundation）对美国1 002名K-12教师和1 000名12～17岁的学生进行了调查，发现51%的教师都使用过ChatGPT，其应用场景包括课程规划（30%）、为课堂提出创造性想法（30%）或提供背景知识（27%）；学生使用ChatGPT的比例则为33%（若不设年龄限制的话，这一比例将高达89%[21]）；且大部分使用过ChatGPT的教师（88%）和学生（79%）都认为它对教育产生了积极影响[22]。5个月后，受访人群中老师和学生使用过ChatGPT的比例分别上升到63%和42%且61%的老师认为ChatGPT将具有“不容忽视的合法教育用途”[23]。

硬币的另一面，则是因ChatGPT等生成式AI应用潜在的抄袭、造假风险而掀起的一股教育恐慌。英国40%的高校表示他们已禁止ChatGPT的使用或正在修订政策以取缔聊天机器人的使用[24]，美国纽约、西雅图、洛杉矶等区的学校也逐渐宣布禁止学生访问ChatGPT[25]……同时，ChatGPT等生成式AI的强大教育功能使投资者发现许多教育类机构的产品及服务极易被取代，进而引发了教育出版市场的股市“骚动”——美国在线教育公司Chegg预计将因此蒸发9.94亿美元市值，而英国培生集团（Pearson）的股价则下跌超过15%[26]。

对此，新加坡、美国、芬兰、韩国等数十个国家纷纷开始布局、更新教育领域的AI战略或立法提案。在2023年5月最新颁布的《人工智能与教学的未来》（Artificial Intelligence and the Future of Teaching and Learning）中，美国教育部发现社会对教育领域的生成式AI的关注与讨论兴趣日益高涨。固然这些AI在个性化教育、智能辅导系统等方面具有强大的应用功能，美国教育部仍然呼吁所有相关群体以批判性之视角审视AI系统及相关工具在教育领域的应用。同时，国际教育技术协会（International Society for Technology in Education）、可汗学院（Khan Academy）、培生集团等全球共计56家教育科技公司、53家政府机构联合发起了TeachAI项目，旨在为AI教学、AI素养提升建立一个全球性的框架[27]。

3.2 Open AI赋能教育出版新发展

在面对ChatGPT等生成式AI所带来的恐慌后，不少国际教育出版、教育科技公司开始冷静下来，重新审视生成式AI与教育融合的可能性，并开始或主动或被动地拥抱生成式AI的到来。目前国际市场上也出现了不少基于生成式AI的教育出版服务工具，部分如表2所示。

从开发团队看，教育出版团队普遍与Open AI建立了紧密的合作关系，旨在加快教育出版服务智能化转型进程。除了本身就具有教育技术优势的Paragon Prep之外，培生、Edx等教育出版机构普遍与掌握生成式AI技术的技术公司开展了合作，Open AI开放的ChatGPT API成为生成式教育出版服务工具构建的最优选择。目前，Open AI开放提供GPT-4、GPT-3.5-turbo、babbage-002等已经训练好了的LLM，用户或机构通过Open AI的API接口就可以调用或调试相应模型，且整个调用或调试过程都十分简单，其操作流程在Open AI的GPT指南中都有详细介绍。出版机构便可以将这些模型集成至已有的应用或者产品之中，或是基于Open AI的LLM调试出更符合教育出版应用场景的新产品。在使用成本上，Open AI的官方网站显示，GPT-3.5-turbo模型输入1 000 token为0.001 5美元，也就是说，输入100万单词的成本为2美元（约16元人民币），较之ChatGPT刚发布时降低近90%，这无疑也将激励越来越多的教育出版机构将GPT等生成式AI模型接入出版场景中。

从平台功能看，交互式、个性化的生成式教育出版知识服务成为现实。教育出版领域已有的生成式AI应用或工具的功能可大致分为两类，即教育辅导和课程建构，而交互式、个性化是上述功能的共性底色。教育辅导功能主要面向学生群体，通常以聊天机器人或AI导师的形象出现，它能够个性化分析用户的学习特征及学习需求，为学生选择或生成恰当的教材、视频等教育资料，并以交互反馈、学习引导的方式参与进学生的学习、阅读、测评、评估的全过程。如学生在Khanmigo平台阅读《了不起的盖茨比》时，就能与AI版的杰伊·盖茨比（Jay Gatsby）进行实时对话，共同探讨书中的内容及象征意义。课程构建功能则主要面向教师群体，能够根据教师的授课需要以及班级学生的整体学习状况制定课程计划，包括确定相关阅读材料、生成课堂测试问题、布置作业、追踪学生学习进度等。教师可以准备多个版本的教材或课件来满足一个班级中不同类别学生的教学需要。可以说，在生成式AI的加持下，教育的个性化、适人化理念得到了完美的实现。

从出版流程来看，教材出版模式变革已是“现在进行时”。生成式AI进一步推动了教材按需定制成为可能，也使以往静态的、以文字呈现为主的教材“活”了起来。PhotoStudy基于GPT-3 APIs开发的MathGPT就旨在彻底变革教科书的出版模式。它以OpenStax在线开源的初等代数教材为训练数据源，在融入数千名数学专家的训练数据之后，开发了初等数学的AI教材。该教材能够以学生的学习需要为导向随时进行自主调整，同时具备文字、音频、图像等多模态呈现形式，能够以问答乃至虚拟交互的形式进行教学或辅导。Quizlet的Q-Chat功能可以为每个用户按需定制教科书，并基于每位用户的学习进展和学习偏好调整教科书的测试题难度。从这个意义上说，未来的教材出版流程变革方向将更多是智能化、一体化、生成式的，而未来的教材内容及呈现形态则是个性化、跨模态和动态交互的。

4 国际数字出版产业发展态势之启

生成式AI对国际数字出版产业的影响可谓是全方位的。对此，国际学术出版界、大众出版界和教育出版界分别交出了一份不尽相同的答卷，并逐渐形成了对待生成式AI的共识态度，即在合理规制的同时推动出版与生成式AI的创新融合应用，为我国数字出版产业的未来发展提供了参考依循。值得注意的是，由于国内外出版体制机制的差异，“刻舟求剑”“照猫画虎”地将国际数字出版产业的成功经验和范例移植至中国大地，显然是不合适的，也不利于推动出版业的中国式现代化进程。对此，我们还需在面向国际数字出版视野的基础上，立足中国数字出版实践，切实把握好生成式AI浪潮下的数字出版发展时代脉搏[28]。

在学术出版领域，出版主体应借助生成式AI强化出版内容来源把关、评审加工和多维传播。从国际数字出版产业发展态势来看，目前抢先进入生成式AI赛道的出版机构的规模普遍较大、影响力较强、资源也相对充沛。而我国学术出版机构的核心主体——学术期刊则整体呈现“小、散、弱”的分布特征，在运营规模、产业影响力及资源储备上都有所差距。因此，独立自主开发科学搜索引擎和聊天机器人更适合规模较大的期刊集群和期刊知识服务商。事实上，中国知网已开发了CNKI AI学术研究助手和知网AI智能写作的测试版，但其中涉及的技术伦理和学术伦理问题，还未有明确的解释和说明。对其他大部分学术期刊主体而言，一则，更应关注因生成式AI而引起的学术造假、AIGC泛滥等问题，需在明确生成式AI工具使用规范及使用边界的基础上，强化学术稿件的审核把关。对此，可引入AI检测工具作为学术稿件内容把关的第一道防线，以达到“以AI监管AI”的目的。同时，还可要求作者提供学术稿件的相关数据及迭代版本，辅助编辑更好地审查稿件来源。二则，鉴于生成式AI在知识学习、知识复杂推理等方面的优势，学术期刊可尝试训练审稿机器人并将它作为评审辅助工具，以帮助编辑更高效地评估稿件主题、研究结构、内容完整度及创新性是否满足期刊的基本要求，缩短期刊审稿周期。三则，学术期刊还可借助生成式AI实现学术作品的摘要总结或科普化表达，服务科研成果的科学传播和科普传播；实现学术作品的智慧化、情景化翻译，服务科研成果的国际化传播。

大众出版机构则应借助生成式AI实现出版的再定位，在以往的内容编辑加工和分发商的基础上，成为新型内容供应商。从当前国际大众出版领域的已有实践来看，大众出版产业链上游的内容生产已呈现混乱趋势，知名大众出版商则处于观望与被动应对的状态，这对我国大众出版机构而言无疑是一种警醒，也预示着新的发展契机。一方面，在内容编辑加工与分发上，大众出版机构可借助生成式AI强化自身的专业技能与服务能力。如引入生成式AI工具，服务出版内容文本、图像、音视频的智能编校和多模态转化，实现人机协同的内容编校与加工；综合利用生成式AI与分析式AI工具，基于图书内容与用户大数据生成图书关键信息“基因库”与读者画像库，并进行“端”到“端”匹配，实现精准、高效的内容分发。另一方面，就内容生产而言，国际大众出版领域已充斥了大量的AIGC作品，虽然整体质量堪忧但也出现了少部分优质作品，这侧面反映出生成式AI的内容创作能力有望在人类的恰当提示和语言模型的优化支持下达到较高的水平。对具有敏锐把握用户和市场需求、擅长选题策划和内容质量把关的出版机构而言，他们完全可以主动拥抱生成式AI的到来，在部分选题上形成“自给自足”的生产机制，以内容供应商的角色实现高质量出版作品的优质供给。

对教育出版主体而言，需借助生成式AI实现生成式教育出版知识服务。教育出版一直以来都强调教书育人、立德树人导向[30]，而从国际教育出版机构的产业实践来看，生成式AI有望成为推动教育出版核心价值实现的关键“拐点”，尤其是在国际教育出版机构已抢先布局和发力的背景下，我国教育出版机构也需积极开拓生成式教育出版新模式。具体而言，首先，我国教育出版机构要整合教育出版数据资源，建立教育出版知识库。海量、高质量、多样化的语料资源是开展生成式教育出版知识服务的关键。因此，教育出版机构需在合法合规的基础上，标准化整合已有的内容数据、用户数据、交互数据，并对这些数据进行知识抽取、标引、表示和加工，架构教育出版知识库，为教育出版的“生成式”转型奠定资源基础。其次，我国教育出版机构要积极与生成式AI公司建立合作，合力打造教育出版LLM。随着生成式AI技术模型的迭代优化及API接入应用成本的降低，诸多国际知名教育出版机构都选择接入Open AI的API快速开发生成式教育出版知识服务工具或功能。我国教育出版机构亦可主动与生成式AI技术服务商开展合作，快速搭建教育出版领域的LLM，以弥补当前的技术短板。最后，我国教育出版机构要融合LLM与教育出版机构主营业务，在合理借鉴国际经验的基础上，实现

[9] Clarivate Plc. Clarivate Announces Partnership with AI21 Labs as part of its Generative AI Strategy to Drive Growth[EB/OL].[2023-09-04]. https：//www.prnewswire.com/news-releases/clarivate-announces-partnership-with-ai21-labs-as-part-of-its-generative-ai-strategy-to-drive-growth-301857301.html.

[10] Semantic Scholar.What Are TLDRs？[EB/OL].[2023-09-04].https：//www.semanticscholar.org/product/tldr.

[11] VAN N R. ChatGPT-like AIs are coming to major science search engines[J].Nature，2023，620（7973）：258-258.

[12] MISHA K. Powering research with Dimensions AI Assistant.[EB/OL].[2023-09-04].https：//www.dimensions.ai/blog/powering-research-with-dimensions-ai-assistant/.

[13] NIC N，RICHARD F，CRAIG T R，et al.Reuters Institute Digital News Report 2022[R].2023.

[14] PORTER A.Artificial Intelligence：Threat，Opportunity and Shimmr[EB/OL].[2023-09-07].https：//publishingperspectives.com/2023/07/ai-building-shimmr-on-the-threat-opportunity-continuum/.

[15] ADRIANNA N. Amazon Is Full of AI-Written Novels That Don't Make Senser[EB/OL].[2023-09-12].https：//www.extremetech.com/computing/amazon-is-full-of-ai-written-novels-that-dont-make-sense.

[16] CHRISTIANNA S.How ChatGPT and AI are affecting the literary world[EB/OL].[2023-09-12].https：//mashable.com/article/chatgpt-ai-books-literary-magazines.

[17] SCOTT R.AI-generated books are infiltrating online bookstores[EB/OL].[2022-09-12].https：//www.axios.com/2023/08/16/ai-book-publishing-fake-amazon.

[18] MATTHEW B.Because AI needs to be fair & ethical for everyone[EB/OL].[2023-09-12].https：//stablediffusionlitigation.com/.

[19] Confindustria Cultura Italia. LA POSIZIONE DI CONFINDUSTRIA CULTURA ITALIA SULL'INTELLIGENZA ARTIFICIALE[EB/OL].[2022-09-12].https：//confindustriaculturaitalia.it/2023/07/20/intelligenza- artificiale-cipolletta-cci-come-settore-abbracciamo-questi-progressi-tecnologici-ma-allinterno-di-un-contesto-regolatorio-che-tenga-conto-del-rispetto-del-diritto-d/.

[20] BILL K.The Effort to Help Publishers Fight Disinformation Is Underway[EB/OL].[2023-09-12]. https：//www.publishersweekly.com/pw/by-topic/digital/content-and-e-books/article/ 91398-will-artificial-intelligence-make-authors-irrelevant.html.

[21] The Conversation. The importance of editors in the age of（highly unreliable）AI[EB/OL].[2023-09-12].https：//mediamakersmeet.com/the-importance-of-editors-in-the-age-of-highly-unreliable-ai/.

[22] CHRIS W.Educators Battle Plagiarism As 89% Of Students Admit To Using OpenAI's ChatGPT For Homework[EB/OL].（2023-01-28）.[2023-09-12]. https：//www.forbes.com/sites/chriswestfall/2023/01/28/educators-battle-plagiarism-as-89-of-students-admit-to-using-open-ais-chatgpt-for-homework/？sh=5857d166750d.

[23] Impact Research.Teachers and Students Embrace ChatGPT for Education[R].2023.

[24] Impact Research.Americans See Need to Better Prepare Students for National Security Careers of the Future[R].2023.

[25] POPPY W. Oxford and Cambridge ban ChatGPT over plagiarism fears but other universities choose to embrace AI bot[N].News：2023-03-01.

[26] TAYLOR S.Seattle Public Schools bans ChatGPT；district‘requires original thought and work from students[EB/OL].[2023-09-12].https：//www.geekwire.com/2023/seattle-public-schools-bans-chatgpt-district-requires-original-thought-and-work-from-students/.

[27] DAN M.AI race is disrupting education firms-and that is just the start[N].Guardian：2023-05-03.

[28] Teach AI.Empowering educators to teach with AI and about AI[EB/OL].[2023-09-12].https：//teachai.org/.

[29] 方卿，丁靖佳.中国式现代化视域下的出版学自主知识体系构建[J].科技与出版，2023（7）：17-24.

[30] 方卿，张新新.推进出版业高质量发展的几个面向[J].科技与出版，2020（5）：6-13.

中国数字出版

2024年1期

生成式AI浪潮下国际数字出版产业发展态势探析

杂志排行

中国数字出版的其它文章