科技编辑利用AI工具提高工作效率的实践探索
2024-07-15谢婷婷
摘 要:站在通用人工智能时代的前沿,科技编辑面临前所未有的机遇。本文论述人工智能工具在图书生产阶段的关键作用,强调科技编辑应善用人工智能工具来提高出版工作的效率和效益,不断探索和创新,真正掌握出版业的新质生产力。
关键词:科技编辑 人工智能 大模型 智能体
在传统出版流程中,编辑通常依赖项目管理策略及工具实现对各个出版环节的精细化管理,进而提高整体出版效率。随着ChatGPT等人工智能(Artificial Intelligence,以下简称“AI”)工具的普及,编辑工作的效率提升迎来新的曙光。这类创新型工具能够在翻译、编辑加工、文字润色等方面发挥重要作用。目前,AI工具在图书编辑环节的应用尚处于早期探索阶段。本文通过案例分析,探讨科技编辑如何有效地利用AI工具提高出版效率,并给出注意事项及应对之法,以期为科技出版行业提供参考。
一、编辑面临的效率困境与“图书价值洼地”
图书的生命周期可笼统地分为以下阶段:确定选题 → 签订版权合同 → 成稿 → 出版流程(包括“三审三校”) 印制 → 上市销售。因版权合同往往具有时限性,从签订版权合同之日起,图书的生命周期就逐渐衰减。以一本版权时限为五年的引进版计算机图书为例,若成稿(翻译)阶段和出版流程阶段耗费一年,则待该书正式上市销售时,其实际的生命周期只余4年。此外,考虑到计算机技术的更新速度,该书中的技术点可能已经过时。
宏碁集团创办人施振荣于1992年提出“微笑曲线理论”[1],用以说明产品的附加价值在其生命周期各阶段(研发、制造、营销)的分布情况。“微笑曲线”的两端分别为研发阶段和营销阶段,中间的制造阶段则位于曲线的底端。从企业经营角度看,产品的制造阶段处于获利低位。图书作为一种产品,一方面,其制造阶段(泛指成稿阶段和出版流程阶段)的附加价值符合“微笑曲线理论”,因处于获利低位而容易受到忽视;另一方面,该阶段作为保证图书质量的核心环节,又是编辑工作的重中之重。
受“微笑曲线”启发,本文提出“图书价值洼地”模型(图1),即弯曲的“笑脸”实为图书的“价值洼地”,其处于获利低位,却是图书生命力强盛的关键,也是提升图书价值的发力点之一,应得到充分重视。如图1所示,图书A和图书B的选题价值相同,并且二者同时进入“价值洼地”(图中的阴影区)。然而,由于图书A相较于图书B更早上市(图书A的“价值洼地”更窄,生产阶段耗时更短),因此最终价值更高。
图1 “图书价值洼地”模型
根据该模型,要提升图书价值,编辑应当通过综合运用多种手段和技术,在保证内容质量的前提下,有效缩短图书生产阶段的时间长度。在传统的编辑实践中,提高生产效率的手段多限于将串行工作流程转变为并行工作流程,以及将编辑加工形式从以纸质文稿为基础转变为以电子文稿为基础等。为进一步挖掘“图书价值洼地”的潜力,除了采用这些传统手段,AI工具的应用具有颠覆性意义。
二、AI赋能图书生产,助力编辑做到快、准、实
2024年《政府工作报告》中提出,要大力推进现代化产业体系建设,加快发展新质生产力。AI工具在图书生产阶段的应用符合新质生产力的三大特征:高科技、高效能、高质量。对科技编辑而言,践行“AI+”赋能已迫在眉睫。
基于大模型的AI工具能够理解和生成多语种文本,又因其接入了广泛的知识库,所以具备知识解释能力和信息检索能力。在图书生产阶段,科技编辑应利用AI工具的上述优势做到快、准、实。以下分别论述AI工具如何在三个方面助力科技编辑:多语种翻译、修改和润色文字、解释知识和核查事实。
(一)快——迅速开展多语种翻译
在引进版图书的传统出版流程中,试译是必要步骤。为了找到专业背景和语言素养都不错的译者,编辑有时可谓大费周章。尤其是对于小语种引进版科技书,既懂技术又懂外语的译者更是少之又少。引入AI工具后,这些问题迎刃而解。
多语种翻译是AI工具提供的一项核心服务。2017年,谷歌公司的Ashish Vaswani等人在里程碑式论文“Attention Is All You Need”[2]中提出了Transformer架构,并进一步推广了机器学习模型的注意力机制。Transformer架构包括编码器和解码器。ChatGPT正是基于Transformer架构的解码器部分。这类AI工具能够自动学习并掌握源语言与目标语言之间的复杂映射关系,在翻译过程中采用注意力机制逐字预测出现概率最高的下一个词,从而给出高质量、流畅的译文。
与传统翻译软件相比,AI工具在翻译准确性方面展现出显著优势。以“知识图谱”(knowledge graph)一词为例,一些传统翻译软件采取字面译法,将其直接译为“知识图”。相反,AI工具通过利用其语义理解能力,能够识别专业术语,从而避免此类“低级错误”发生。
除了英汉互译,当前流行的AI工具还支持包括法文、德文、西班牙文、意大利文、日文、俄文、阿拉伯文在内的多种语言之间的相互翻译。此外,基于ChatGPT模型,“风声雨声”等第三方工具已经实现了对PDF文件或Word文档的一键式翻译功能。像“沉浸式翻译”(Immersive Translate)这样的浏览器插件能够实时地翻译用户在浏览器中打开的PDF文件,极大地提升了用户体验和工作效率。
在这些AI工具的帮助下,编辑可以大幅压缩一本书的翻译时长,同时节省翻译成本。以一本10万字(100千字)的书为例,如果采用AI工具进行一键式翻译,那么翻译时长可以从三个月缩短为半小时,效率直接提升99.98%;假设人类译者以80元/千字的常规翻译标准收取翻译费用,那么整本书的翻译费用为8000元(100千字×80元/千字);而AI工具“风声雨声”对翻译这本书仅收取55元,即不到人类译者费用的0.7%。
注意事项及应对之法:在采用一键式翻译形式进行长文翻译时,AI工具对长文的理解能力欠佳,无法“记住”一些术语的全局含义,而仅关注该术语在局部上下文中的意思。举例来说,对于“Transformer”一词,若它出现在机器学习书中,应指Transformer架构,常见的处理方法是保留英文而不翻译。笔者在使用AI工具翻译机器学习书时发现,它偶尔会将Transformer译为“变压器”,显然缺乏人类编辑对稿件内容的统一把握能力。因此,编辑不应照搬AI工具提供的译文,而需按照编辑规范对AI译文进行编辑加工,尤其注意统一术语。必要时,可邀请业内专家审读AI译文,从专业角度进一步提高准确性。
(二)准——精准修改和润色文字
基于大模型的AI工具拥有良好的“语感”,能够快速理解文本,识别和修正语法错误,优化句子结构。此外,AI工具还可以根据上下文语境进行智能推荐,提高文本的表达准确性和流畅度。
在用AI工具修改和润色文字时,编辑应采用提示工程(Prompt Engineering)技巧。提示词(prompt)是指人类在与AI工具交互的过程中输入的语言内容,也是AI工具理解和回应的基础。若编辑仅输入“修改以下句子”,AI工具无法准确理解编辑对任务的期望,可能给出不尽如人意的修改结果。相反,若编辑更详细地描述修改需求,如“修改以下句子,使之用词更优美、语言更流畅”,AI工具便能根据具体需求执行修改任务。通过精心设计提示词,编辑能明确需求,引导AI工具准确回答,提升结果的准确性和实用性。
另一种技巧是使用智能体(Agent)。它是一种能够自主学习和决策的程序,可根据编辑给定的任务和场景调整自己的决策和执行路径。[3]
以下举例:
你是文采出众的科技编辑(角色部分)。我给你提供一份关于机器学习技术的书稿(上下文部分)。请帮我润色,使其语言表达更清晰、准确,逻辑更严谨(任务部分)。
下面展示AI工具的润色效果。
原句:浇水是自变量,因为这是我们作为研究人员在实验中控制的。植物的生长是因变量,因为我们假设,在自变量发生变化的情况下,植物的生长会发生变化。自变量通常首先被记录。例如,植物首先被浇水,然后生长。
这段话存在逻辑问题,比如“浇水”是动作,而非自变量。我们先请智谱清言做初步修改。这里注意使用上述提示工程技巧和智能体技巧。
经过智谱清言润色的句子如下:在科学实验中,我们作为研究人员,通过精心控制浇水的环节来观察其对植物生长的影响。植物的生长作为实验结果,受到我们调控的浇水量这一自变量的影响。我们假设,一旦自变量改变,植物的生长也会随之发生变化。在实验过程中,我们通常首先记录自变量的具体变化情况。当植物首次接受浇灌时,它的生长过程便正式启动。
可见,经过AI工具润色后,这段文字的逻辑更加清晰。如有需要,编辑可以进一步让AI工具从文学角度润色。当然,语言风格巨变并不一定符合编辑的需求。但不可否认,AI工具能够从文学角度为编辑提供一些思路。
注意事项及应对之法:AI工具的确能够在用词方面为编辑提供思路,但编辑要注意保持全文的语言风格一致。AI工具在理解人类情感方面存在一定的局限性。因此,在处理一些主观性较强的书稿时,AI工具可能会出现修改不当的情况,也无法替代人类的创造力和判断力。
此外,AI工具目前对出版行业的编校规范尚缺乏充分认识。《ChatGPT在图书编校中的应用测试与分析》[4]一文选取了《图书编校质量差错案例》中的200条典型编校差错案例作为测试文本,与ChatGPT(GPT-3.5)的编校结果进行对比分析。结果显示,ChatGPT能够辅助纠正语法、字词、标点符号和知识性错误,在字词类错误编校处理上表现较好(纠错率为44.0%),但在标点符号类错误处理上表现较差(纠错率为22.0%)。可见,编辑应将AI工具作为辅助工具,而不应完全依赖它。
(三)实——解释知识和核查事实
优秀的编辑应具有广泛的知识储备,面对不同领域的稿件时都能做到游刃有余。然而,每个人都有局限性,难免遇到知识盲点。相比之下,大模型才是真正的“杂家”。以GPT-3为例,它的训练数据集来自五大语料库,其中Common Crawl含有近一万亿个单词。[5]这意味着,如果需要查询一个陌生的知识点,编辑只需用自然语言向大模型询问关键词即可。大模型能够快速搜索其海量的“记忆库”。因为它见多识广,所以有极大概率遇见过这个关键词,并能够用人类语言进行解释。
笔者对这一点深有体会。在编辑一本物理科普书时,笔者遇到“对易子”这个术语。作者仅在书稿中提及“对易子”,而未提供任何解释或背景信息。为了核查后文的正确性,笔者需要首先理解这个概念。于是,笔者请教了文心一言。结果显示,文心一言不仅言简意赅地解释了“对易子”,还提到这个概念主要出现在量子力学中。对于科技编辑而言,能够通过单次查询快速获得关键信息是极为高效的。相比之下,传统搜索引擎提供的结果通常是网页链接列表,这要求编辑进行额外的步骤,即选择网页 → 点击链接 → 阅读网页,才能获取所需信息。这一对比突显了AI工具在提升编辑效率方面的重要优势。
注意事项及应对之法:编辑应警惕AI幻觉问题,即大模型偶尔会“自信”地给出错误信息或误导性信息。在使用AI工具核查涉及数值的事实内容时,应当谨慎对待其输出结果,并寻求额外的信息源进行交叉验证。在这种情况下,传统搜索引擎可以作为有效的辅助工具,用以验证AI工具提供的信息的准确性。通过采用这种多源信息核实策略,编辑可以更有效地识别并纠正潜在的错误,确保书稿内容的准确性和可靠性。
三、结语
不可否认,AI技术正在实实在在地改变出版业。在这个日新月异的时代,闭门造车、埋头看稿已经不能满足行业发展的需求。科技编辑需要以开放的心态和果敢的勇气主动伸出触手,去触摸AI技术的前沿,用慧眼识珠的能力去探索和发现AI技术在出版业的应用场景。唯有如此,科技编辑才能站在时代的前沿,引领出版业的发展潮流,为实现科技强国、出版强国贡献自己的力量。
(作者单位系人民邮电出版社)