基于人工智能的期刊专家审稿系统编辑策略的优化研究
2023-01-08张文渲
樊 敏,张文渲,李 红
(太原理工大学 期刊中心,山西 太原 030024)
一、引言
人工智能已经成为新一轮科技革命和产业变革的核心驱动力。以人工智能的视角来审视出版业,目前的编辑、审稿、校对、印刷、发行等环节仍然需要依赖人力资源的大量投入,而人工智能可以使很多流程实现自动化,使其变得更为简单、便捷,因此,大量自动化、智能化的系统取代人力资源的投入将会成为出版业的主要趋势。出版界近年来积极探索人工智能赋能传统出版业的路径,张勇等[1]认为人工智能作为一种颠覆性的技术将对学术期刊的编辑出版带来重大影响,学术期刊使用简单的数据收集和搜索已无法应对当前社会对信息高速传播的需求,引入人工智能技术将大大缩短稿件处理时间,提高期刊影响力;刘天祺[2]在人工智能技术与出版业融合的基础上探究出版业各流程、各环节应用人工智能技术进行转型发展的具体着力点、实际应用及未来可能,并分别以“微软小冰”“中知编校系统”“虎彩和河南新华印刷公司”以及“苏州第二图书馆”作为典型案例来具体探讨人工智能助力出版流程运作的优秀成果;付新媛[3]从学术期刊内容生产主体、用户群体、行业秩序三方面综合考虑,探讨人工智能技术的重构作用,分析编辑流程优化的可能性,研究得出的结论是学术期刊应主动利用人工智能技术,不断改善编辑流程结构,优化资源使用,从而实现编辑出版流程智能化管理;周觅[4]认为人工智能介入出版业,对整个行业的发展产生了深远影响,出版结构和工作秩序被重新调整,编辑只有厘清人工智能与编辑之间的关系,探索出更加合适的工作模式,才能适应和驾驭新的技术,并能够接受与技术共生的工作方式和价值提供方式。
国务院于2017年7月发布的《新一代人工智能发展规划》(以下简称《规划》)是中国面向2030年的人工智能发展规划。《规划》明确人工智能进入了新阶段,将人工智能定位为国际竞争的新焦点、经济发展的新引擎和社会建设的新机遇。随着国家对人工智能的广泛布局,基于人工智能的学术期刊出版技术也被陆续开发和应用,协助编辑进行内容检索、重复率检测、同行评议和识别数据捏造等。人工智能不仅可以加速学术传播,同时还可以减少人为偏倚[5-7]。目前,各类学术期刊几乎都是通过在线的专家审稿系统实施同行评议。对于学术期刊而言,同行评议是一个重要的学术属性,是作者信任的核心基石。同行评议的隐性信任可以使期刊的组稿和编辑过程更趋于公平。但是,近年来随着投稿量的逐年增加,同行评议的不足(如稿件评审时间过长)日益凸显。
对于编辑来说,考虑到日益增加的投稿量和有限的审稿专家,获得有效、及时的审稿报告变得越来越具有挑战性。因此根据稿件主题的复杂性、审稿专家的数量和编辑流程的细节所进行的稿件编审过程优化策略,不仅可以吸引高质量的投稿,而且可以提升期刊编辑流程的效率,减少编辑的工作量[8-9]。
二、专家审稿系统编辑策略的优化
编辑审稿工作流程通常包含许多耗时的任务。首先,编辑需要为每篇外审的稿件找到合适的审稿专家。虽然这项工作可以在各种学科数据库的帮助下完成,但仍然是一个非常费时的过程。其次,编辑需向审稿专家发送邀请,与其进行沟通,并评估收到的审稿意见。最后,编辑还必须处理一些特殊的情况,如:审稿专家没有接受邀请拒绝审稿;审稿专家的研究方向与稿件的学科领域不匹配;审稿时间偏长;审稿专家给出了相互矛盾的审稿意见等等[10]。
本文以某学术期刊的专家审稿系统为例进行研究和讨论。使用该期刊的历史数据计算了所有结果的概率,以及中间阶段和这些过渡持续时间之间的转移概率[11]。目前该期刊的专家审稿流程及决策图如图1所示。
图1 专家审稿流程及决策图
编辑从投稿系统中接收到稿件,不仅要对稿件的内容及方向是否符合本刊刊发范围和标准进行审查,还要对稿件的字数、文字表达、基本结构、图表清晰度、参考文献引用格式等进行规范性的审查[12],即初审。稿件初审合格后编辑即向潜在的审稿专家发出邀请(如图1所示的流程图),专家审稿流程开始启动。根据现实实现的行为(即已经产生的实际数据),下一个阶段由数据计算的转移概率决定。大概率事件即最可能的路径是通向“询问”(73%)阶段,其结果有三种情况。第一,对应于被邀请的审稿专家没有回答的情况,这将促使编辑在发送初始邀请后等待7天,再向审稿者发送另一封电子邮件(询问)。如果第二封电子邮件在10天内仍然没有得到答复,那么编辑就可以认为该审稿线程结束了,结果是负面的,这对应于在“没有反应”阶段结束的审稿线程。第二,如果审稿者确实回答了询问(或最初的邀请)并同意撰写审稿报告,那么审稿线程就进入确认阶段。在这种情况下,编辑会等待14天的审稿时间,如果到期没有收到审稿报告,则会再发送催审询问。第三,对应于拒绝审稿的情况,即被邀请的审稿专家虽给予回复,但因研究方向不同或其他方面的原因拒绝撰写审稿意见。换言之,每篇稿件的审稿线程均会以三种状态之一结束——“审稿报告”(这是期望的结果)、“没有反应”和“拒绝审稿”。就某学术期刊而言,一次成功的审稿线程历时28天,周期长、交互频繁,编辑的有效工作率低,工作量大,需要及时改进和优化。
在最初的邀请发出之后,系统使用真实的数据处理编辑与审稿专家的所有交互沟通行为。审稿过程的重点部分是专家对稿件的学术水平进行的评审,其余部分则被称为“编辑策略”。编辑策略是一组规则,它们告诉编辑在过程开始时应该发出多少新邀请,以及在每次稿件审稿线程结束时应该发出多少新邀请。因此在优化编辑策略时需要考虑两种相反的影响编辑策略效率的因素:一方面,文章的作者和编辑都希望尽快收到审稿结果;另一方面,编辑们倾向于尽量减少发送给审稿专家的邀请数量。有研究表明[13],如果审稿过程花费太长时间,作者有可能中途撤回稿件,改投他刊。长此以往,优质稿件会不断流失,期刊的品牌和质量都会受到严重影响。理论上,简单地邀请许多审稿专家来审核稿件可以缩短审稿时间。然而,对期刊来说还要考虑成本核算的问题,因为编辑部对每个审稿专家都需支付审稿费用。由此可见,最好的编辑策略是使用最少的审稿专家来实现最短的审稿时间。因此利用人工智能技术,基于笛卡尔遗传规划(Cartesian Genetic Programming,CGP)开发一种自动化工具可以提供更有效的编辑策略[14],使编辑的审稿流程更科学,指向性更强,缩短审稿时间,从而提高作者对期刊的满意度。
CGP的核心是一种进化算法,它利用进化理论(即自然选择和突变)中的概念,通过优化一些适应度函数来创建计算机程序。就本研究而言,这些程序对应于编辑策略,告诉编辑在任何给定的时间应该启动多少条新的审稿线程。CGP中的编辑策略可以被编码为节点网格,如图2所示。最左边的节点表示策略的输入——编辑器在这里提供描述系统的整数(所需的审稿报告数量、收到的审稿报告数量、运行的审稿线程数量和批处理的大小)。输入节点后面是中间节点——一个n行m列的网格,其中充满了与基本数学函数相对应的节点。每个节点有两个输入,用于计算节点实现的函数值和一个输出。需要强调的是,给定列中节点的输入只能与前面列中节点的输出连接,不允许转发连接,以避免循环。所有函数都只对整数进行操作,并且受到保护,这意味着对于不允许的输入(例如除数为零),它们总是返回数字1。策略中最右边的节点是输出节点,通过连接到前面的一个节点,它告诉策略的用户在哪里查找最终值。
图2 编辑策略的CGP进化算法
由于编辑策略本质上是确定性函数,它将整数分配给系统的状态,即分配给每个可能的输入,因此可以通过从输出到输入跟踪节点并写下节点中遇到的嵌套函数来重新创建与策略对应的数学公式。与图2进化策略对应的函数可以表示为:
(1)
其中,NNRT是应该启动的新的审稿线程数量;NR是收到的回复数量;NEQ是发出的审稿数量;NRQ是所需的审稿报告数量;NRR是收到的审稿报告数量;NART是运行的审稿线程数量;NB是批处理的大小。
针对某学术期刊的审稿系统进行CGP编辑策略优化后,明显缩短了审稿时间。测试时该学术期刊有8名有效审稿专家,一次审稿时间约28天,经计算使用进化策略的审稿时间比原来的编辑策略平均缩短了7天。
三、编辑策略优化的可行性建议
CGP编辑策略优化的目的是缩短稿件外审时间,减轻编辑人员的工作量,节约时间成本,提高工作效率。为进一步优化审稿流程还需编辑对稿件的处理过程实施科学化、精细化的管理。
(1)提高编辑专业素养,细化稿件学科类别。信息化的学术环境给期刊编辑带来两大挑战,一是网络投稿量大,二是多学科交叉稿件逐渐增多。这就需要编辑在确定稿件研究方向时除了参考稿件的题名、摘要、关键词,还要考量作者信息、参考文献等元素,才能对稿件的学科类别做出准确的判断。编辑在工作中要不断积累经验,善于归纳总结,学科类别做得越细化、越精准,编辑发出的审稿邀请回应度越高,审稿流程会更畅通,达到事半功倍的效果。
(2)编辑在审稿流程中要发挥好管理员的角色。其一,审稿专家一般具有两重身份,又是作者,又是专家。编辑在发出审稿邀请前可查询其是否发表过该研究方向的论文或专著,对审稿专家的范围和最佳人选做出准确的判断和选择,谨慎斟酌后再发送审稿邀请。其二,编辑要严格把控审稿专家的审稿期限和作者的修稿期限,及时与双方协调沟通,缩短发文时滞。
(3)定期更新期刊的信息管理系统。编辑应定期对包括作者、审稿专家等的用户信息进行维护、修改和完善,保证信息系统的可靠性、时效性。通过定期更新,编辑可以更熟悉和掌握本刊涵盖的学科领域的专家情况,包括其研究方向的转变、最新的学术成果等,不断提高送审技巧,应对稿件的多元化、层次化和学科交叉化的需求。
四、结语
本文提出的CGP编辑策略优化是基于数据驱动的算法模型。由于测试对象即某学术期刊规模较小,审稿专家较少,所以该优化策略效果明显。针对其他规模较大、审稿专家众多的期刊,也可以借鉴这种方法,只要编辑能够对本期刊的专家审稿过程进行统计分析,并使用结果创建带有人工审稿线程的过程模拟,就可以用来改进其工作流程,进一步缩短专家审稿时间。
另外,需要注意的是,本文研究讨论的优化方法与专家审稿的质量无关。编辑策略只是决定了何时邀请和有多少邀请必须发送给审稿专家,但不干涉审稿专家审查稿件的实际过程。因此,维持期刊审稿工作流程的标准和质量仍然取决于编辑。基于人工智能技术的CGP进化策略应用于期刊的编辑策略优化是一种非常有效的流程改造,这种数据驱动的方法是建立专家审稿模型的关键,可以使编辑对审稿过程有更多的洞察,使其更有效。