ChatGPT 的“破圈”之旅:AIGC 在科技出版领域的机遇、挑战与对策
2023-02-06樊丹丹中航出版传媒有限责任公司
樊丹丹 中航出版传媒有限责任公司
一、ChatGPT—AIGC 在大众化领域中应用的里程碑
AIGC(Artificial Intelligence Generated Content)是指通过使用先进的人工智能技术,如深度学习、机器学习、自然语言处理等,使计算机模拟人类思维,自动创作和生成各类内容,包括但不限于文本、图像、音频和视频等。通过人工智能生成的内容不是在语法和结构上的简单拼接,而是能够在基于类人思维培训下给出的有价值、有深度、有创新性的内容。AIGC 有着极强的自我学习和优化的能力,能够不断提升生成内容的质量和创作效率。在数字化高度发展的社会,AIGC 已经渗透到社会生活的各个方面,被广泛应用于新闻报道、学术研究、广告营销、娱乐创作等多个领域,极大地推动了信息化社会的发展。
人工智能的发展不是一蹴而就的,从20 世纪50 年代萌芽至今大体经历了三大发展阶段。第一阶段为早期萌芽期(20 世纪50 年代至90 年代中期),里程碑事件包括:1950 年,艾伦·图灵提出著名的“图灵测试”,明确给出了判断及其是否具有“智能”的方法;1966年,世界第一款可实现人机对话的机器人“Eliza”问世;20 世纪80 年代中期,IBM 研发创造了语音控制打字机“Tangora”。这一时期受限于技术水平,AIGC 仅限于小范围实验,并没有被重视。第二阶段为沉淀积累期(20世纪90 年代后期至21 世纪10 年代前期),里程碑事件包括:2007 年,世界上第一部完全由人工智能创作的小说《1 The Road》问世;2012 年,微软展示语全自动同声传译系统,可将英文语音自动翻译成中文语音。在这一时期,AIGC 受限于算法瓶颈,无法直接生成内容,但是迈出了重要的一步,从实验性开始走向实用性。第三阶段为快速发展期(21 世纪10 年代中期至今),这一阶段里程碑事件包括:2014 年,Lan J. Goodfellow 提出生成式对抗网络GAN;2016 年谷歌创造AlphaGo,实现人机智能对战;2018 年,英伟达发布 Style GAN 模型,用于自动生成高质量图片;2019 年,DeepMind 发布 DVD-GAN 模型,用于生成连续性视频;2022年,OpenAI发布ChatGPT模型,用于生成自然语言文本。这一时期深度学习算法不断成熟迭代,人工智能百花齐放,开始“破圈”进入大众视野。
ChatGPT 是人工智能生成内容(AIGC)技术的产品形态之一,本质上是基于神经网络的自然语言处理 (Natural Language Processing, NLP)模型,相较于前人工智能产品拥有更丰富的知识储备和更高超的语言交互能力,在文本生成、图像生成、代码开发等内容生产领域表现出色,一定程度上能媲美人类智能[1]。ChatGPT 是随着GPT-1 到Instruct GPT 模型的不断成熟而逐步形成。2018 年,GPT-1 模型有1.17 亿参数,具有一定的泛化能力(generalization ability),能够用于与任务无关的MLP 任务中。2019 年,GPT-2 模型有15 亿参数,除了理解能力外GPT-2 在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新闻、钓鱼邮件或在线进行角色扮演。2020 年,GPT-3 模型有1750 亿参数,作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛。2022 年1月,OpenAI 公司对ChatGPT-3 模型进行了微调,形成了GPT-3.5 模型,可以将有害的、不真实的和有偏差的输出最小化,是对模型“道德”能力的一次优化。2022 年3月,GPT-4 正式发布,相较于ChatGPT(GPT-3.5)有了质的飞跃,逻辑推理能力更强,语言能力更强。从 GPT-1 到GPT-4 智能化程度不断提升,研发期间隔也不断缩短。根据OpenAI 公司披露的信息,本年末推出的GPT-5 模型将实现影像感知和学习。
在当今的科技领域,国内外的科技巨头都非常重视ChatGPT 引发的科技浪潮,并纷纷积极布局生成式AI。ChatGPT 作为一种强大的语言模型,具备了出色的自然语言处理和对话生成能力,能够实现与人类的智能交互。这种技术的出现引发了一股AI 技术的热潮,许多企业和研究机构都加快了在生成式AI 领域的研发和应用布局,部分公司已有成型产品并公布测试。(仅列举部分,见表1)
二、ChatGPT—AIGC 与科技出版结合的机遇
(一)科技出版从 “数字化”到“数智化”
进入数字化时代,科技出版依次经历了电子出版—网络出版—数据出版—智能出版四个阶段。电子出版是将纸质出版物以电子的方式呈现出来,比如常见的电子书、电子报纸等。网络出版是借助互联网进行编辑、出版、发行、传播,出版物的形态存在于互联网服务器的介质中,用户可以在网上浏览或是下载。网络出版物具有多种作品形态,包括文字、音视频等。数据出版是指数据工作者或者科研人员利用互联网将研究、实验等过程中产生的数据成果按照统一的规范,如数据论文的方式公布出来,实现数据的开放共享,其他用户可以进行下载、引用。智能出版是指出版者把自动文本分析技术、知识图谱、大数据、等智能技术应用到出版产业链中,从而满足用户的个性化阅读需求及提高出版业的数字化水平。目前科技出版社大多集中在第三或第四阶段,随着人工智能技术的发展和应用,必然会走到“智慧出版”阶段,即出版者利用人工智慧、智慧生成等最新数字技术,结合传统出版技术与形态,实现创作和出版的高度自动化和智能化,实现学术观点发现和智慧化传播,为用户提供全面的、个性化的、智慧化的服务。
(二)ChatGPT 在科技出版领域的应用展望
2023 年3 月,ChatGPT 以Snow fox Books 行政总裁Seo Jin 的故事构思为基础,仅花7 小时便完成所需的数据搜集并以英文写成一本135 页的名为《寻找人生目标的45 种方法》的书籍。新书随后采用韩国科技巨头Naver 旗下AI 翻译程序Papago 译成韩文,过程不到2 小时。可见,当AI 与出版业融合,将迅速为传统出版行业发展打开一个新方向。
1.ChatGPT——内容供给与优化。ChatGPT 作为一个强大的语言模型,通过分析提供的信息,可以生成多样化、连贯且有逻辑的文本,在短期内为出版商提供新的灵感和观点,提升策划构思效率。同时,出版商也可以通过不断与ChatGPT 进行交互获得提交文本的反馈和建议,帮助优化文章的结构、语法和表达,检查拼写错误、语法、表达不当等问题。通过实时、个性化的反馈可以提高文章质量,确保信息传达得更准确、清晰。
2.ChatGPT——知识关联。虽然不像搜索引擎具有直接查找和链接知识的功能,但是经过大量文本数据训练的ChatGPT 可以对不同主题的知识进行学习和理解,并在对话中与用户进行关联。出版商可以利用其理解自然语言的能力,不断充实学科相关的信息来和内容,按照选定的方向总结文章的关键词,构建个性化知识图谱。
3.ChatGPT——知识发现。经过大量文本数据训练的ChatGPT 可以理解和生成自然语言并尝试对一篇论文的内容进行简要总结。当汇集了大量相关学科数据后,可以进一步理解编辑意图,根据编辑提供的辅助信息提供与搜索语句相关的学术观点的论文、推荐相关领域的专家,帮助编辑快速找到进行同行评议的专家。
4.ChatGPT——相似性检测及知识审读。ChatGPT可以作为一个辅助工具用于知识审读。ChatGPT 大引擎系统决定了它的成长方式是螺旋上升的,自身学习的延展性也超越了普通数据库。通过对本学科知识的不断积累,ChatGPT 可以获得“1+1>2”的知识储备。传统相似性检测仅依靠文字匹配或进行分句后的文字匹配,利用ChatGPT 训练论文数据后可以进行观点、思想的匹配。同时可以给编辑提供出版物的知识来源、信息的准确性、个人观点倾向、意识形态等建议。
5.ChatGPT——自动化制作。海量数据支撑的ChatGPT 可以提供编辑内容、制作封面、自动排版、翻译和校对等服务,进而大幅提高出版行业的生产效率和质量,降低制作成本和时间,这对于出版商而言也是非常有价值的功能。
6.ChatGPT——运营推广。ChatGPT 实现了以对话方式进行交互,可以实现你问我答、有问必答、上下文了解,完成多轮对话,真正像人类一样进行聊天交流。科技出版社可以通过在微信或官网平台搭建智能问答平台,辅之以虚拟人物的形象,针对作者或者读者提出的常规问题进行解答(比如投稿邮箱、出版要求等)、对要推广的期刊、图书进行智能运营推广,大大减轻编辑的工作负担。
7.ChatGPT——预测市场。ChatGPT 能够迅速对海量数据进行分析和处理,让出版商能够更精准地了解读者的需求与市场趋势,对市场进行更准确的预测和决策,为客户提供个性化推荐和定制化服务,增加读者的付费意愿,非常有利于出版行业的发展。
综上,不难看出ChatGPT 在科技出版领域的应用前景非常广阔。它可以提高内容的质量和效率,为编辑工作提供支持,为出版商提供优质资源,增强读者的互动和参与度。随着ChatGPT 技术的不断发展和完善,可以预见它将在科技出版领域发挥越来越重要的作用,进一步推动科技知识的传播和普及。
三、ChatGPT—AIGC 给科技出版带来的挑战
AIGC 对于出版业的影响,并非只有积极的一面,而是机遇与挑战并存。
(一)引入AIGC 技术的高额成本问题
这里包括人力资源和技术成本。引入人工智能技术不光需要拥有相关的专业知识和技能,同时还需要懂得运用AI 的人才,这对于一些中小型出版机构来说可能会面临较大的挑战,更需要编辑不断地学习和更新知识和技能。
(二)ChatGPT 伪造内容问题
ChatGPT 并不是万能的,在内容创作上时常会有错误,这就需要编辑重新校对其严谨性。同时ChatGPT 作为类人思维大模型,也具有人类会犯的错误“撒谎”。当被要求在它不熟悉的领域搜索问题,ChatGPT 有很大概率会对自己不知道的事情进行造假。
(三)ChatGPT 数据安全问题
人工智能技术需要处理和存储大量的数据。目前ChatGPT 的服务器分别位于美国加利福尼亚州圣何塞市、欧洲法国巴黎、日本东京。人们向ChatGPT 提出的每一个问题,如论文、数据等都可能被存储并成为ChatGPT 训练模型的素材,并被反馈为问题的答案。在OpenAI 数据使用说明中明确提到对于非API 产品如ChatGPT、DALL-E,平台确实会使用用户数据来进一步提升模型效果。另外,ChatGPT 运行中会出现故障,导致隐私泄露,用户可能会在自己的界面上发现大量别人的对话。
(四)ChatGPT 著作权问题
权利归属是著作权法的核心,其可以明确作品究竟归属于谁,以及谁可以对所创作的作品享有权利并承担责任[2]。ChatGPT 生成的内容,著作权到底归谁?如果不承认AI 模型著作权,那是否意味着其生成的内容也无须受到著作权保护?人类正在经历第一次AI著作权冲击。各大出版商纷纷给出针对人工智能生成内容著作权的明确说明。国际出版业巨头ELSEVIER旗下的期刊《护士实践教育》在1 月出版的文章把ChatGPT 作为作者,而在2 月对此论文进行了订正后则不再将ChatGPT 视为作者。到目前为止,出版业内没有对ChatGPT 创作归属形成共识。
(五)AIGC 领域伦理道德问题
有学者给ChatGPT 出过那道著名的“火车轨道选择题”:在一个铁路的岔路口,面对一列疾驶而来的列车,两个岔道分别有一个被绑着的人和五个被绑着的人,而你就在岔道口,可以调整列车的方向。你会如何抉择?学者把其中五个人方向换成ChatGPT自己,把一个人方向换为获得诺贝尔奖的科学家,ChatGPT 选择了杀死科学家。给出的理由是获得诺贝尔奖的科学家已经拿过奖,已经做完贡献了,而ChatGPT 不可替代。在出版领域使用ChatGPT,它是否会输出不道德价值观很值得人们关注。
四、AIGC 在科技出版领域挑战的应对之策
(一)国家制定出台相关政策规范
一方面,国家立法部门应加快出台相应的法律规范,确保以AIGC 为核心机制的生成式人工智能技术不被恶意滥用,并就内容版权保护和相应责任主体做出明确规定[3]。另一方面,行业监管部门应出台与法律相匹配的监督机制,对使用AIGC 过程中的数据隐私、知识产权进行保护。同时对不规范行为进行间隔审查与监督,在确保各方利益与安全的前提下释放技术革新来来的活力,助力出版行业的融合出版转型。
(二)出版界制定相关行业条例
出版业历史悠久,有自成体系的行业规范与要求,相关出版业团体应该与时俱进更新规范与要求,适应AIGC 时代下出版业的发展,确保人工智能能更好地服务出版业。一方面,各出版商应在引入使用AIGC的过程中严格遵守出版伦理与价值导向,提升编辑的业务修养与技术能力。人工智能只是工具,占据出版主导地位的依然是人,要始终确保以人为本。另一方面,必须将保障作者和读者的权益放在重要的位置,在人工智能的使用过程中不可避免地要搜集、分析使用个人信息,一定要做好信息保护工作,尤其是隐私信息与数据信息,以免被恶意窃取。
(三)技术供应商提供解决方案
作为人工智能的研发单位和服务提供单位,技术供应商一方面要不断优化引擎,尽可能减少AIGC 模式下的误导性、虚假性内容;另一方面要提升技术力量,避免发生大规模技术故障,引发信任危机,为AIGC 模式下的科技出版提供有效保障。
五、结语
ChatGPT 作为AIGC 技术在科技出版业的“破圈”王,给这个传统的行业注入了新鲜的活力,带来了新的机遇。同时,新技术的应用也衍生出了新的知识产权、隐私安全、伦理道德等出版业不容忽视和回避的关键问题。目前是AIGC 技术应用的大爆发时期,人工智能正在以人类难以想象的速度学习和汲取现实世界的数据、信息和知识,在不断迭代的算法加持下不断成长。AIGC 已经参与到了社会生活的方方面面,人们不能因为AIGC 会带来问题就漠视它的存在。在这样的环境下,科技出版业无论主动拥抱还是被动选择都已站在了变革的起点。科技出版的从业者要秉持大胆尝试与小心推动的心态,不断追问、揭示 AIGC及相关应用对科技出版带来的机遇与挑战,并不断寻求解决问题的办法,用“人的智慧”牵引“人工智能”发展,助力科技出版在新时代的发展。