ChatGPT给学术出版带来的机遇与挑战及应对思路
2023-05-31周青
[摘要]ChatGPT的颠覆式技术革命引发新一轮人工智能技术创新热潮,也引起人们广泛热议。ChatGPT具有对话式、生成式、通用性、知识性的特点。ChatGPT在给学术出版带来机遇的同时也带来了挑战。我们应当坚持开放性探索与合理规制并重、人才培养转型与自主技术开发并举的思路,做好准备迎接新一轮人工智能技术创新的浪潮。
[关键词]ChatGPT;人工智能;学术出版;机遇与挑战;应对
2022年11月,美国的人工智能研究实验室OpenAI发布了一款人工智能工具ChatGPT,引起社会广泛热议,引发新一轮人工智能技术创新热潮。文章分析ChatGPT给学术出版带来的机遇与挑战,并探讨相应的应对思路,以期我们能在未来的竞争中赢得优势,掌握主动。
一、ChatGPT人工智能工具的特点
ChatGPT(Chat Generative Pre-trained Transformer),是一种对话式大型语言模型,能根据预训练的模型、算法学习人类语言,理解人类对话的意图,并根据海量语料自主生成符合逻辑和人类语言习惯的内容。与此前的人工智能工具相比,ChatGPT具有以下特点。
(一)对话式
对话式即ChatGPT以对话的方式实现人机交互。使用者可以直接提问,也可以设定人工智能的角色,如智能客服、聊天机器人、语音助手等,或提出更明确细致的任务要求。ChatGPT对话问答的交互方式操作简单,使用方便。目前,架构在GPT-4基础上的ChatGPT相比GPT-3.5实现了技术的进一步迭代升级。ChatGPT还具有多轮对话能力,能模拟人类对话,不断加深聊天程度。相比此前的人工智能对话工具,ChatGPT的对话能力有了较大提升。
(二)生成式
生成式即ChatGPT具有生成能力,能依据己有的大型语言模型、设定好的算法、海量语料,生成全新的没有常识性和知识性错误的符合逻辑和人类语言习惯、满足用户需要的内容。从ChatGPT用户的使用情况来看,ChatGPT不但能生成多種类的创意性文本,完成诗歌小说创作、广告文案设计、视频脚本写作、软件代码编程等任务,而且能进行需要一定学科知识储备和逻辑推理能力的学术论文写作。
(三)通用性
通用性即ChatGPT具有适用于多种领域和多种任务的能力。因为ChatGPT是一种基于Transformer架构的大型语言模型,拥有海量的语言数据和多达1750亿的模型参数,并经过大量的语料训练,同时拥有基于人类反馈的强化学习能力(RLHF,Reinforcement Learning from Human Feedback),所以其能处理多样化的任务。
(四)知识性
知识性即ChatGPT能回答知识性问题,能辅助甚至替代人类完成简单的知识性工作。这表明ChatGPT包含多学科知识的海量数据,拥有较好的逻辑推理能力。而ChatGPT在一般性的知识问题上回答表现较好,对前沿学科和细分领域的回答则相对较差。当ChatGPT无法领会人类提问意图,或是自身数据库中不包含相关知识时,其就会出现“一本正经地胡说八道”的情况。
二、ChatGPT给学术出版带来的机遇
ChatGPT引发的人工智能技术创新热潮预示人工智能将加速向各行各业渗透,其也给学术出版带来了机遇。
(一)提高学术出版效率
ChatGPT具有很强的逻辑推理能力,且擅长对文本性内容进行分析处理。无论是审稿、编辑还是校对等出版环节,ChatGPT都能大幅提高效率、节省时间。在审稿环节,无论是某个作者的学术研究背景、以往研究成果,还是相关选题的研究情况,ChatGPT都能快速给出结果。ChatGPT也能轻松应对错别字纠正、标点符号统一、敏感词语修改等校对工作,省时高效。此前就有韩国媒体报道,韩国出版商Snowfox Books出版了一本完全由ChatGPT撰写文稿、翻译校对、设计插图的图书。一些知名的传媒业巨头也表示,计划在编辑部大规模部署AI系统。可见,ChatGPT能极大提升学术出版的效率,未来其也会改变出版业的行业生态。
另外,ChatGPT在数字化出版以及新媒体融合上也有亮眼的表现。己升级到GPT-4的最新ChatGPT具备多模态输入功能,既接受文本输入,也接受图片输入。这意味着ChatGPT能实现“图片—文字”的即时输入。这使得学术成果的数字化制作、互联网传播的门槛大大降低。ChatGPT也能轻松承担App、网站网页的开发工作,并根据要求创作宣传视频。ChatGPT界面简单,操作方便,交互方式友好,其在出版行业的应用将大大加快数字化出版及新媒体融合的速度。
(二)激发学术生产和学术创新
学术生产与学术创新是学术出版繁荣发展的直接推动力。ChatGPT的合理应用能够帮助用户快速了解某个领域的最新研究动态和科研成果。同时,ChatGPT海量的多学科知识、丰富的用户交互语料以及算法结构中的随机性设置,使ChatGPT能在与人的对话中,特别是多轮对话中为人们提供不同的信息、知识、视角和逻辑,从而为激发学术生产和学术创新甚至促进学术出版加快发展带来可能。
一方面,ChatGPT的语料数据库涵盖海量的多学科知识和交叉学科知识,使ChatGPT能从不同学科视角发现问题、理解问题,同时ChatGPT算法结构中的随机性设置以及RLHF机制的存在,使ChatGPT回答具有较强的随机性与不确定性。另一方面,ChatGPT在对话中并不总是能生成让人满意的回答,这就需要用户的提问具有相当的精确性和指向性。而与ChatGPT进行多轮对话,也是用户梳理自身想法、理清研究需求、进行信息筛选、判断逻辑对错的过程。这种“提问—反馈—进一步提问—更深入反馈”的“进阶式对话”过程,将推进用户对各种概念、命题、判断、逻辑等的理解,让他们理清思路、挖掘线索、激发灵感,进而带来学术生产和学术创新的繁荣发展。
高质量的学术出版依赖高质量的学术生产和学术创新,反过来,学术生产和学术创新的繁荣发展也会带来学术出版的良性发展。从这个意义上来看,ChatGPT的应用将开拓学术生产和学术创新的新空间,从而推动学术出版的繁荣发展。
三、ChatGPT给学术出版带来的挑战
(一)防范学术抄袭更加困难
当前,学术期刊在对待人工智能生成内容的态度上比较统一,基本认为学术论文若包含人工智能生成内容,且没有在论文恰当位置进行合理说明,则应当被认定为学术抄袭。大部分学术期刊不允许刊发包含人工智能生成内容的论文,少数允许刊发包含人工智能生成内容论文的学术期刊也对人工智能的应用做出了严格的限制,包括不允许人工智能代替作者进行论文主体内容、关键任务的写作,不允许将人工智能列为第二作者,且作者必须在论文中详细说明是如何应用人工智能工具的。
ChatGPT的出现在一定程度上使学术抄袭行为快速增长。针对这种现象,一些机构和研究人员已在尝试开发新的检测技术。斯坦福大学研究人员推出了人工智能检测工具DetectGPT,用以检测基于ChatGPT生成的文本。查重软件Turnitin也在不断提升检测人工智能生成文本的效率。甚至ChatGPT的人工智能研究实验室OpenAI也推出了检测工具GPT-2 Output Detector。然而,DetectGPT是针对GPT-3.5开发的,GPT-2 Output Detector是针对GPT-2开发的,这些工具在面对己将技术升级到GPT-4的ChatGPT时都存在一定的局限性。
由于缺乏有效的技术检测手段,人工审核又难以发现ChatGPT生成的内容,因此当前防范用户应用ChatGPT进行论文抄袭尚无有效办法。
(二)对相关从业人员提出了更高的要求
一方面,随着人工智能在编辑出版行业的逐渐普及,以人机协同方式完成编辑出版工作将是大势所趋。由于学术出版主要面向专业领域的专家学者以及相关人士,侧重展示学术研究的成果,因此学术出版内容具有较强的专业性和知识性。ChatGPT的介入看似可以更轻松地完成编辑出版工作,但人工智能也存在知识盲区和模型缺陷。ChatGPT在审查涉及尖端学科、前沿理论的知识性内容时,也会犯知识性错误、相关性错误、推理错误或是逻辑错误,这就特别需要学术编辑对内容进行人工审核。学术编辑需要在人工审核的过程中对人工智能提出的判断和回答进行二次判断,这就对学术编辑的知识涉猎广度和深度、对学科前沿理论的了解,尤其是对论文观点和论述逻辑的质疑能力和批判能力提出了更高的要求。
另一方面,随着人工智能对编辑出版行业影响的加深,提升人工智能工具的使用技能将是编辑出版行业对从业人员提出的基本要求之一。从长远来看,人工智能工具使用技能,如对数据库的分类整理、提问的方式与技巧、在与人工智能多轮对话中推进话题深度与精确指向的能力等,将成为影响编辑出版行业从业人员职业竞争力以及出版品牌竞争力的重要因素。因此,编辑出版从业人员应当积极学习和了解人工智能,提升自身应用人工智能的水平。
四、未来发展方向与应对思路
加快发展人工智能是国家发展的重大战略。我国在“十四五”规划中明确强调,要瞄准人工智能、量子信息、集成电路、生命健康、脑科学、生物育种、空天科技、深地深海等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。数字技术领先国家对加强人工智能、量子信息、先进通信等战略性数字技术布局形成普遍共识,并将数字技术与先进制造、生物医药、能源环保等领域的交叉融合放在更加突出位置[1]。我们应当加快推进人工智能技术在各个领域的开发应用与迭代升级,才能在未来的国际竞争中赢得主动与先机。
(一)开放性探索与合理规制并重
一方面,我们应当加快推进人工智能在学术出版领域的开放性探索。人工智能正在加速向各行各业渗透,ChatGPT缩小了技术与应用的鸿沟,未来有可能成为人人可用的科技助手。我们应加快国内同类产品的研发应用进度,并尽快促进其与具体行业具体领域的衔接,以实现资源的互联互通与技术的开放共享。特别在当前争议比较多的人工智能生成内容的版权归属与侵权行为界定上,我们应当进行开放性探索,尝试提出一些各方都能接受的通行规则与约定,为人工智能应用打开空间。
另一方面,我们应当合理规制人工智能在学术出版领域的应用。我们既要探索人工智能在学术出版领域的使用边界、适用范围、应用方式和出版规范,从技术、伦理、法律、管理等方面加强合理规制,避免人工智能的不当使用和过度使用,也要加强对人工智能生成内容的真实性、逻辑性、准确性、创新性的人工审核。我们要对人工智能应用保持警醒,防范过度依赖人工智能工具导致信息过载和认知固化,警惕偏见性内容、垃圾信息泛滥以及知识或信息垄断带来的知识生产不足等问题。
(二)人才培养转型与自主技术开发并举
一方面,人才培养面临转型。ChatGPT技术的迭代升级使得单一功能编辑出版软件将逐渐失去市场,如黑马校对软件、方正飞腾排版软件、学术不端检测系统等,编辑出版工作将交由接入人工智能的集成性办公软件统一完成。同时,部分编辑出版岗位的工作重心也将面临重大调整。编辑出版行业从业人员的工作将更多转向对文章思想内容的审核把关。学术编辑将更多关注论文观点的客观合理、思想内容的创新性以及论述的逻辑性。未来我国编辑出版行业从业人员需要增强人工智能工具的使用技能以及对人工智能生成内容的审核把关能力,加强对多学科背景知识的学习,保持对学术前沿问题的持续关注和对热点的实时跟踪,增强学术思辨能力、批判能力和创造能力。
另一方面,我们应加快国内人工智能自主可控技术的研发应用进度。我国在生成式人工智能技术的研发上已经有多年积累。阿里推出了多模态大模型M6及语言大模型PLUG,腾讯近些年也一直在推进“混元助手”项目的相关研究。复旦大学自然语言处理实验室在2023年2月发布了类ChatGPT模型MOSS,百度也在2023年3月推出基于文心大模型的“文心一言”(ERNIE Bot)。“同时,也要清醒地看到,我国人工智能整体发展水平与发达国家相比仍存在差距,缺少重大原创成果”[2]。我们要加快研发应用拥有自主知识产权的人工智能产品,以更多的活跃用户、高频的互动次数、充分的应用场景,给人工智能反馈更多的交互数据,通过RLHF机制,提升人工智能在理解用户意图与指令方面的准确性和可靠性。因为,只有把产品和服务的核心技术掌握在我们自己手里,才能避免在技术上受制于人,并保证国内数据信息安全以及用户隐私安全。
[参考文献]
[1]余晓晖.智能经济助推实体经济高质量发展:二〇二二智能经济高峰论坛发言摘编(一)[N].人民日报,2022-09-07.
[2]国务院关于印发新一代人工智能发展规划的通知[EB/OL].(2017-07-20)[2023-02-12].http://www.gov. cn/zhengce/content/2017-07/20/content_5211996.htm.
[作者简介]周青(1981—),女,湖南岳陽人,《中国特色社会主义研究》杂志社编辑。