APP下载

人工智能在科技期刊中的应用及启示

2023-11-13董文杰

中国科技期刊研究 2023年11期
关键词:科技期刊工具稿件

■董文杰 李 苑

中国科学院文献情报中心,北京市海淀区北四环西路33号 100190

以人工智能(Artificial Intelligence,AI)、大数据(Big Data)、云计算(Cloud Computing)等为代表的新一轮技术革命正推动知识形态和传播媒介的演变,促进出版内容和技术的深度融合并向数智化转型。2022年,中共中央宣传部印发了《关于推动出版深度融合发展的实施意见》,指出要强化前沿技术的探索应用、促进成熟技术应用推广,并健全科技创新应用体系,这为技术赋能科技期刊指明了方向[1]。

人工智能技术作为引领新一轮科技革命和产业变革的核心力量,是全球科技竞争的关键赛道。中国科学技术信息研究所发布的《2022 全球人工智能创新指数报告》[2]指出,中国人工智能发展成效显著,人工智能创新指数近3年一直保持全球第2水平。斯坦福大学以人为本人工智能研究院(HAI)的《2023年人工智能指数报告》[3]进一步证明了中国在人工智能领域的领先地位。报告显示,中国机构在全球人工智能论文发文量排名前10的机构中占据了9个席位,自2010年以来,中国的人工智能论文总量一直位居世界首位。

目前,科技期刊出版领域人工智能研究的视角主要分为相对全面的宏观视角和针对具体细分流程的微观视角。宏观视角研究涉及大语言模型时代学术期刊的机遇和挑战[4-8]、人工智能技术对出版流程和出版模式的创新、融合发展方式[9-11]和实施路径[12]等。目前,针对人工智能融合出版流程的微观视角研究的热点主要为人工智能内容生成[13-15]、同行评议[16-17]等场景中的人工智能应用和伦理[18-19]等。

目前研究未系统梳理科技期刊出版全流程中的人工智能技术应用及实践。鉴于此,本文通过问卷调研和访谈的方法分析了编辑对人工智能的需求,以ChatGPT 4.0为例在科技期刊中进行应用实践,并在此基础上对出版场景中的人工智能工具进行汇总分析,分别从深化应用场景、守护科学边界和聚焦内容建设3个方面展开思考与讨论,以期为推动人工智能技术赋能科技期刊提供参考。

1 人工智能在科技期刊出版流程中的发展现状

2022年底,OpenAI公司发布的大语言模型人工智能聊天机器ChatGPT开启了人工智能的新时代[20],引爆了通用人工智能(Artificial General Intelligence,AGI)技术的新赛道。2023年3月,OpenAI公司发布ChatGPT 4.0,进一步升级大语言模型和拓展下游应用。微软将ChatGPT 4.0融入 Office、Teams Premium、Viva Sales 等应用,提供了一系列人工智能服务场景。2023年5月,Google发布第二代大语言模型PaLM2,并将用于支持其旗下的25项服务和产品[21]。我国10亿级参数规模以上的大语言模型数量已超80个,仅次于美国,例如:华为的盘古大模型[22]致力于深耕行业,打造行业领域大模型和能力集;百度的文心大模型[23]是产业级知识增强大模型;网易有道发布国内首个教育大模型子曰,引领教育个性化[24]。其中,盘古大模型的研究成果《三维神经网络用于精准中期全球天气预报》在Nature上发表,盘古大模型是全球首个精度超过传统数值预报方法的人工智能预测模型[25]。

人工智能的飞速发展促进了科研范式的改变,尤其是在计算机科学、化学、材料科学、数学等学科。Elsevier《研究的未来2.0》[26]对全球1731名科研人员的调研(2020—2021年)显示,64%的计算机科学领域研究人员将人工智能技术广泛应用于研究。通用人工智能的发展进一步推动了其他学科的科研人员探索人工智能与学科融合的可能性,如:Manu等[27]探索了人工智能辅助的核磁共振光谱数据采集方法;Barata等[28]以皮肤癌诊断为例,研究了基于人工智能的决策支持模型;Menczer等[29]探讨了如何应对由人工智能生成的不良内容造成的危害;江俊等[30]基于“机器科学家青年论坛”战略研讨会的成果,讨论了机器化学家的挑战和机遇;张智雄等[31]探讨了以ChatGPT为代表的人工智能技术对文献情报工作的启示和影响并提出发展建议。在此背景下,人工智能技术在科技期刊出版中的应用日趋深入,重塑出版流程,有效提升了科技期刊的出版效率和知识服务水平[32]。

1.1 出版生产

在科技期刊出版流程中,出版生产可以按参与主体分为两个部分。

(1)内容生产过程,即作者作为主体进行稿件准备和撰写的过程。虽然目前人工智能生成内容发展迅速,但是在内容生产环节,研究人员应避免使用人工智能直接生成论文内容,将人工智能用于科研知识的发现与分析、论文辅助阅读、论文可读性提升等方面。一方面,通过先进的数据算法,提升挖掘知识的能力和效率;另一方面,借鉴人工智能提供的语法修改建议等提高写作质量。

(2)以学术编辑为主体的稿件编校和排版过程。杨更修等[33]总结了三代校对系统的特点:第一代通过积累错词库,对稿件进行词汇级的检查;第二代主要针对整句级别的文字检查,识别不合理的词汇搭配;第三代通过深度学习实现语义分析,对稿件内容进行全面分析,判断逻辑等是否合理。

人工智能在编辑校对中的应用主要集中在语法拼写校对、格式校对和智能排版方面,包括对基础的语法、拼写、标点符号、专业名词术语和参考文献等进行检查和修正。随着人工智能技术的发展,这些工具的语义分析能力愈发强大,但是仍需加强对专业名词术语及上下文语境的判断能力,并提高修改公式、表格的准确性。

1.2 选题策划

传统的选题策划依赖于编辑和编委团队自身的工作经验,具有主观性和相对滞后性,受到诸多因素的影响。人工智能技术通过对海量数据库的搜集、关键词提取,自动识别并预测研究热点和趋势,例如AMiner等工具可以反馈领域专家团队列表,辅助编辑制定选题和约稿计划。另外,通过数据挖掘和深度学习,人工智能技术可以对读者阅读习惯和喜好进行量化分析,计算热点词汇的传播频次,预判科研前沿,结合读者需求进行选题智能分析,实现高效的协作模式。目前,人工智能技术在新闻出版领域的应用较为成熟,例如《华盛顿邮报》组建的“人工智能编辑部”可辅助筛选互联网上的热门话题和事件。在学术出版领域,其发展仍处于初级阶段,主要应用于智能学术检索,帮助编辑团队快速发现热点和创新研究内容。目前人工智能囿于学习样本和算法,在选题策划时容易产生同质化产品,缺少一定的深度和前瞻性。

1.3 稿件评审

传统的稿件评审环节可分为科研诚信审查和内容评审。论文科研诚信审查通常位于前端,论文学术不端可以分为剽窃、伪造、篡改、不当署名、一稿多投、重复发表等。目前人工智能技术(如Crossref的Similarity Check)主要检测剽窃、重复发表等学术不端行为,尚无法实现对实验方法和未发表成果的检测。虽然目前用于科研诚信审查的技术已经较为成熟,但是仍需要人工介入。随着ChatGPT等的发展,针对人工智能生成内容的检测也变成了一项重要内容。

稿件的内容评审包括对论文结构、数据的审查及同行评议。论文结构的完整性和数据的合理性是同行评议的前提,已有一些用于辅助论文格式检查的人工智能工具,如UNSILO平台的技术检查功能可以检查论文是否完善并符合期刊的规范。随着交叉学科、热点研究方向的迅速发展,审稿难度陡增,审稿专家和编辑压力增大,这在一定程度上延长了出版时间。人工智能技术可以借助论文元数据匹配审稿专家,快速推荐合适的审稿专家。同时,也能提炼论文内容,帮助编辑和审稿专家快速理解论文的主要内容和创新点,进而提升评审的效率和质量。但需要注意的是,只有不断优化算法和数据库,规范评议流程,才能使人工智能技术有效精准地辅助审稿专家和编辑决策。

1.4 学术传播

随着传播媒介的多元化发展,科技期刊必须拓展学术传播渠道,丰富传播方式和手段,从而实现有效传播,提高知识效能。人工智能技术可以总结论文研究内容的亮点,设计生成宣传海报,还可以通过跟踪分析读者的行为,提供个性化的阅读推荐服务,从而提升期刊的影响力和读者的参与度。例如,ScienceOpen平台通过分析用户阅读历史记录,为读者提供个性化的论文推荐服务,改善了用户的阅读体验。Springer Nature、Elsevier等出版机构基于人工智能个性化推荐系统,根据用户的浏览历史、下载历史记录和搜索行为来推荐相关的论文。

2 研究方法

2.1 问卷调研和访谈

2.1.1 研究对象

为了切实了解国内期刊在出版流程中对人工智能的应用情况和需求,使用问卷星平台对GreenEnergy&Environment、《空间科学学报》《基因组蛋白质组与生物信息学报》《中国听力》《测绘科学》《化学进展》《科技进步与对策》等共47种期刊的编辑进行问卷调研。问卷设计科学、合理,涵盖学科全面。调研中英文期刊数量合理(约3∶1),创刊年份为1950—2020年,处于不同发展阶段,可以在一定程度上体现当前国内科技期刊对于人工智能技术的应用需求和态度。

为了深入了解出版流程中其他参与方对人工智能技术嵌入科技期刊出版的认知,采用半结构化访谈的方式分别对科研人员以及相关技术人员进行了访谈。

2.1.2 问卷及访谈内容

问卷问题包含期刊基本信息、期刊编辑投入时间较多的工作环节、对人工智能技术的了解程度以及对人工智能工具的使用情况、使用频率、需求程度等方面。

在访谈部分重点讨论人工智能技术嵌入科技期刊出版的意义。为了更好地让被访谈者表达自己的观点,围绕以下核心问题开展半结构化访谈:(1)您觉得人工智能技术有必要嵌入科技期刊出版吗?(2)您认为人工智能技术适用于科技期刊出版流程中的哪个环节?(3)您对人工智能技术嵌入科技期刊有哪些顾虑?

2.2 实践研究

为了更加直观客观地感受和理解人工智能技术在出版流程中发挥的作用,采用实践研究的方法,在多个科技期刊出版环节应用热门的大语言模型ChatGPT 4.0进行探索。

2.3 网络调研

为了更深入地了解科技期刊相关的人工智能技术,通过网络调研的方法,全面总结了出版流程可能涉及的人工智能工具。

3 结果与分析

3.1 人工智能技术在国内科技期刊中的需求分析

3.1.1 编校和排版是编辑关注的焦点

在当前科技期刊出版的工作流程中,编校和排版仍是高投入环节,是科技期刊编辑人员关注的焦点。80.00%的编辑表示在编校、排版等环节投入较多时间。通过引入新的技术,如自动校对工具和智能排版软件,可以在一定程度上提高生产效率,减轻编辑的工作负担,聚焦高质量内容产出的关键步骤,提高科技期刊的整体效能。

分别有66.00%和56.00%的编辑表示稿件评审和选题策划也是投入时间和精力较多的环节,如图1所示。相对来说,这两个环节对专业知识的要求很高,同时也需要编辑部、审稿专家和编委团队的配合,涉及学术伦理,因此对于该环节,需要评估技术参与的场景和发挥作用的程度。以稿件评审为例,人工智能技术在稿件查重、基于关键词等元数据推荐审稿专家、稿件的技术和格式检查、图像完整性检查等层面可以有效发挥作用,提高编辑的工作效率。

图1 编辑工作焦点排序

3.1.2 科研诚信审查中人工智能技术较为普及

8.00%的编辑对人工智能技术在期刊出版中的应用非常了解,56.00%的编辑表示一般了解。具体到人工智能工具和功能,科技期刊编辑对中国知网学术不端检测系统等科研诚信方面的应用最为熟悉(86.96%)。

52.17%的编辑对黑马校对等稿件编校工具较为熟悉,50.00%的编辑对方正飞腾等稿件排版应用较为熟悉,其对TrendMD 等学术传播工具(41.30%)、UNSILO等稿件内容评审工具(39.13%)和AMiner 等选题策划工具(39.13%)也有所了解。

84.78%的编辑通过同行交流了解人工智能工具和应用,63.04%的编辑通过学术会议进行了解。这说明人工智能在科技期刊中的研究热度逐步提升,成为业内主流话题之一。另外,有52.17%的编辑通过技术公司推荐获得了解,说明技术公司已经布局期刊出版领域,并逐渐细分垂直应用场景。

3.1.3 编辑对人工智能工具有高需求

如图2所示,中国知网学术不端检测系统等科研诚信审查工具的使用频率最高,这与当前国内外对于科研诚信的重视密不可分,人工智能技术提升了对较为隐蔽的学术不端行为的甄别能力。而在对技术要求较高的其他环节,如选题策划、稿件内容评审等中,人工智能工具应用相对不足。

图2 编辑对不同人工智能工具的使用频率及亟需程度(a)使用频率较高的出版环节;(b)亟需程度较高的出版环节

在对人工智能技术的态度上,82.61%的编辑觉得有必要在出版中使用人工智能技术,84.21%的编辑表示愿意尝试使用人工智能工具,74.19%的编辑认为使用人工智能技术后相关工作效率明显提高。

有趣的是,在亟需程度的调研中发现,学术传播环节成为了最急迫的应用场景,其次是稿件编校和稿件内容评审。这说明虽然在稿件编校环节人工智能工具的使用频率很高,但是国内现有的一些工具仍然未能把编辑从繁芜的工作中解放出来,还存在较大的深度应用空间。不同于使用频率的分布,人工智能工具的亟需程度分布比较均匀,说明人工智能正在科技期刊出版中发挥越来越重要的作用,存在极大的应用潜力。

3.1.4 科研人员对人工智能技术持谨慎积极的态度

分别对学科领域专家、人工智能技术人员和科技期刊技术人员进行访谈,重点讨论人工智能技术嵌入科技期刊出版的必要性及在关键环节中的应用场景。

中国科学院院士、物理化学家江龙先生指出人工智能技术为化学研究带来了深刻的变革,从预测化学反应到分析复杂的化学机理,将化学学科发展推向新的高度。在积极探索智能化发展模式的过程中,高质量的学术内容依然是期刊的发展核心,因此科技期刊应通过算法辅助决策,辅助编辑掇菁撷华,加速优质内容产出。当然,人工智能技术对科研数据的安全性及科研伦理等的威胁是值得重视和思考的方面。科技期刊仍然需要主动思考,结合国家重大发展战略,紧跟需求,寻求合理科学的融合之路。

具体到技术层面,两位技术公司的研发人员认为出版领域高层次的人工智能应用体现为机器阅读和理解。在技术上如果能做到提升文章语义分析的深度,例如实现对研究成果创新性和可信性的分析,那么人工智能技术将会更好地辅助期刊决策,提升期刊的知识服务能力。

3.2 人工智能技术在科技期刊出版流程中的应用实践

结合对人工智能技术在国内科技期刊领域的需求分析和ChatGPT 4.0的特点,选择稿件编校和稿件内容评审环节进行实践测试。

3.2.1 ChatGPT 4.0在语言润色方面表现优秀

对《化学进展》的论文进行应用测试。囿于文章篇幅,选择其中一个应用案例进行展示。图3所示为ChatGPT 4.0的使用界面,在该界面输入原始摘要内容和操作指令,可以得到润色后的文本(Refined Version)。

图3 ChatGPT 4.0的使用界面

ChatGPT 4.0的英文润色具有以下特点:(1)基于对上下文的理解,而不是仅改动单词;(2)减少长难句以及不必要的重复语句;(3)相对于被动语态,倾向主动的表达方式;(4)修改语法、短语以及部分格式。此外,ChatGPT 4.0可以按照要求逐句对修改的地方进行解释说明,为编辑和作者决定是否接受内容修订提供了很好的参考依据。

为了判断ChatGPT 4.0的润色效果,将润色结果与该摘要的人工润色版本和作者确认版本进行对比。对于人工发现的问题,ChatGPT 4.0均发现并指出,例如两者都将原文中的“literatures”修改为“literature”,将“provinces in China”修改为“Chinese provinces”,将“polluted by formaldehyde”修改为“formaldehyde”,将“recommended limit by national standard GB/T 18883—2002”修改为“the national standard GB/T 18883—2002 recommended limit, with……”等。这说明,ChatGPT 4.0在修正语法结构和语言表述方面表现出了专业的水平。此外,ChatGPT 4.0在句子意思的判断和修改方面具有较大潜力。例如,作者对人工润色将“change pattern with year”改为“change pattern within a year”提出了异议,原因在于修改后句子表达的意思发生变化,容易引起混淆:文中提到数据收集的时间范围是2003—2018年,因此涉及多年的变化,而不仅是单年内的变化。而ChatGPT 4.0的表现优于人工润色:将“change pattern with year”改成“annual trends”,这和作者想表述的意思相似。

通过实践测试发现,ChatGPT 4.0在语言润色方面具有高效性和专业性。当然,由于ChatGPT 4.0基于大量训练数据生成结果,编辑需要针对其做出的修改仔细审查,以确保学术内容的准确和严谨性。

3.2.2 ChatGPT 4.0在评审方面具备应用前景

相比ChatGPT 3.5,ChatGPT 4.0借助自然语言处理和自回归模型提升了上下文理解能力和多语言处理能力,因此实践测试其在稿件初审中的应用潜力。

ChatGPT 4.0可以生成论文概要,辅助编辑快速阅读论文,并判断论文写作的深度和全面性。以综述性论文为例,作者是否对已有的研究进展进行总结并提出自己的观点、是否充分讨论了目前存在的问题及未来的发展方向是论文学术水平和质量的重要评价指标。因此,基于ChatGPT 4.0的上下文理解能力,就作者的观点和讨论进行了实践测试。

以《化学进展》两篇经过同行评议的论文为例,将ChatGPT 4.0给出的结论与同行评议结果进行对比,其中,使用期刊审稿系统评价表中的“评述和讨论的深度和广度”和“稿件的学术表达”两个指标来对应比较外审专家的结论。为了保护作者和论文的隐私,隐去了论文的题目及相关信息,分别以论文A和论文B表示,如表1所示。将ChatGPT 4.0对论文A和B的评估分别与论文的外审结果对比,可以看到趋势是一致的。ChatGPT 4.0在稿件初审阶段表现出非常良好的应用前景,关键在于如何利用其技术优势和特点进行任务设计,例如需要给定明确并具体的评估方向,设置合理的问题。ChatGPT 4.0可以辅助编辑快速判断综述的深度,将那些在论述上明显缺乏深度的稿件拒之门外,从而提高送审的效率和质量。

表1 ChatGPT 4.0与外审专家意见结论对比

3.3 人工智能工具汇总

通过网络调研,共梳理了50种与科技期刊出版相关的人工智能工具,见表2。按照出版流程,将应用场景分为出版生产、选题策划、稿件评审、学术传播等。由于有些工具的功能是多样的,为了避免重复,选取工具的主要功能进行总结,以期为编辑探索人工智能工具提供借鉴和参考。

表2 人工智能工具在期刊出版中的应用汇总

4 讨论与思考

4.1 创新生态布局,深化应用场景

2017年,国务院印发《新一代人工智能发展规划》,提出了人工智能的发展目标,并成立了新一代人工智能规划推进办公室。中共中央政治局会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。在国家政策的支持和引导下,人工智能技术加速发展,场景创新成果不断涌现,为我国科技期刊智能化发展提供“沃土”。

人工智能技术赋能科技期刊的关键点在于创新生态布局,深化应用场景,探索场景创新要素,以需求和场景驱动技术创新和出版模式升级。科技期刊的智能化进程是对出版全流程“解构—建构—重构”的过程,需要时间和空间双重维度的不断实践和思考。

4.2 把握技术边界,守护科学生态

中国科学院院士、北京大学国际机器学习研究中心主任鄂维南认为人工智能驱动的科学研究(AI for Science)会带来科研范式的变革,将科研模式从“作坊模式”转为类似“安卓模式”的平台科研。科研领域里的“体力活”可以交给人工智能来完成,而科研人员需要具备创造性思维和设计科研方案的能力。在这个背景下,科技期刊与技术的深度融合是社会发展的结果,也是未来的必然选择。

与此同时,ChatGPT等大语言模型在科研领域的应用在提升科研能力和效率的同时也带来了诸多挑战,尤其是在学术内容生成方面对科研诚信、科学透明度和科研伦理等产生影响。例如,由于人工智能访问数据库有限、模型统计不准确等因素,其会捏造不存在的研究内容、提供虚假信息或剽窃的内容。Springer Nature、Elsevier、国际出版伦理委员会(Committee on Publication Ethics,COPE)等机构纷纷发表相关政策和声明[34-37]:Elsevier在政策中指出人工智能工具只能用于语言润色等,而不能用于生成研究结论等核心内容;Taylor &Francis[38]禁止将人工智能工具列为作者,并规定在使用人工智能工具的地方,作者必须按照要求进行恰当的说明。《图书情报工作》《中国科技期刊研究》[39-40]等国内科技期刊紧随其后,发表人工智能政策声明。当前,业界致力于开发可以用于人工智能生成内容检测的智能工具,以防止人工智能生成内容的滥用。例如,2022 年美国普林斯顿大学的计算机科学研究生 Edward Tian 研发的GPTZero AI检测工具通过“困惑度”和“突发性”两个指标来鉴别人工智能生成内容。然而随着人工智能技术的发展,这些检测工具必须不断迭代以发挥作用。

需要谨慎地运用人工智能技术,把握技术边界,发挥人工智能的辅助作用,将决策权留给人类智慧,完善人机协同的机制。

4.3 围绕内容建设,推动期刊高质量发展

人工智能技术逐步优化了科研模式和学术出版流程。通过智能算法,科研人员和编辑有望摆脱繁重的事务性工作,将注意力聚焦于内容创新,回归科技创新和科学传播的初心。科技期刊作为国家科技原始创新的展示和传播平台,其质量直接关系到国家的科学话语权和软实力。正如中国科学院院士、物理化学家江龙先生所说,人工智能在科技期刊中发挥的作用应该是辅助编辑掇菁撷华,服务高质量学术内容的快速产出。尽管人工智能技术为科技期刊带来了优化升级的机会,但仍然需要明确,科技期刊应始终将优质内容作为核心,围绕国家重大战略策划选题,努力打造一流的学术期刊。

当前,全球人工智能发展进入新一轮跃升期,新的人工智能技术细分应用场景不断涌现。我国科技期刊应积极加强与国际出版商及技术公司的合作,分享研究和实践经验。同时,由于国外人工智能模型在处理中文内容方面存在不足,我国科技期刊还需立足国内需求,联合国内的优质技术公司努力突破技术瓶颈,发展具有中国特色、适合中文期刊的人工智能应用,进而提升内容管理及知识服务能力,为学术出版的新模式赋能。

5 结语

2022年底发布的ChatGPT开启了人工智能技术通用时代,同时也引发了各个领域对人工智能技术应用的研究和探讨。截至2023年9月,已发表的关于ChatGPT的中文论文已有2972篇(篇名含有“ChatGPT”,检索平台为中国知网),涉及的学科领域涵盖自动化技术、计算机、金融、教育、医学、新闻与传媒、出版等。可以想见,未来人工智能技术在各个领域的应用是不可逆转的趋势。

本文通过应用实践案例呈现了人工智能技术在科技期刊出版领域的潜力,但不可否认这些工具和技术仍存在一定的风险。鉴于学术出版的严谨性和可信性,科技期刊既要利用这些技术解决出版领域的难点,切实提升出版效率,也应确保有可行的用于纠偏和反馈的技术或方案。一方面,在科技出版流程中考虑应用人工智能技术,在数字出版基础设施建设和数据标准制定等方面考虑共建共享和互联互通问题;另一方面,考虑技术应用中可能存在的伦理、安全问题,建立健全相关的政策或规则体系,以恪守科技期刊出版学术伦理准则。需要明确的是,无论人工智能技术如何发展,其本质都是服务于科技期刊出版行业的工具,关键在人。应在人工严格审核和控制的基础上使用人工智能技术,以保障科技期刊的交流属性和学术认证属性。

猜你喜欢

科技期刊工具稿件
科技期刊的分类
录用稿件补充说明
科技期刊的分类
科技期刊”
波比的工具
波比的工具
科技期刊的分类
“巧用”工具
Shanxi Agricultural University Visitor Professor Donald Grierson*
本刊欢迎下列稿件