人工智能技术在科技期刊出版中的应用
2019-11-29刘新永林玲娜柯文辉
刘新永,林玲娜,柯文辉
1 概述
人工智能(AI),主要是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一种新的技术科学[1],是自然科学进入信息时代的产物,是在解分类认知的基础上生产出一种新型的、以类人智能模式做出反应的智能机器,其本质是对人的思维信息过程的模拟,通过机器人、语言识别、图像识别、自然语言处理和专家系统等具体科学,实现判断、推理、证明、识别、感知、理解、设计、思考、规划、学习和问题求解等思维活动[2]。
随着2016 年“人工智能元年”的到来,人工智能技术更是有了突飞猛进的发展与应用[3]。例如,利用深度学习技术制造的人工智能系统AlphaGo 自2016 年来多次战胜国际围棋界的顶尖选手;利用大数据处理技术,并结合最新的自然语言处理、深度学习和视觉图像处理的技术,通过语法合成与排序学习生成新闻的新闻写作机器人已在各大主流媒体应用[4-5];能够实现自动驾驶的汽车已经上路行驶,能够与人对话并由语音操控的智能音箱已进入千家万户。在出版领域,不少业内同仁在内容的生产、呈现、传播方面与人工智能的融合进行了一系列探讨[6-10]。人工智能技术使机器能够胜任一些通常需要人类智能才能完成的复杂工作,一定程度上减轻了工作强度,提高了工作效率与工作体验,是未来发展的方向。科技期刊出版涉及流程多,且单调重复,从事的编辑工作强度大[11],更应紧紧抓住新技术发展的契机,积极探索期刊出版与人工智能技术的融合应用。利用人工智能的大数据、云计算、自动程序设计、深度学习、图像识别和语音识别等技术在科技期刊的稿件处理、编辑校对、期刊及广告营销等环节展开应用,以优化编辑流程、提升编辑工作效率、促进科技期刊传播。
2 稿件处理流程环节
2.1 投稿
目前科技期刊编辑部的稿件管理软件应用较广泛的是玛格泰克和勤云稿件采编系统,作者注册后即可在线投稿。投稿时除了上传全文,还要填写文章题目、作者单位以及中英文摘要和关键词,如果有基金项目也要填写,这些项目在上传的文章中都有注明,再填写一遍等于给作者增加不少麻烦。利用人工智能的自动识别技术,可从投稿的文章里提取这些内容并自动填写,以提升作者的投稿体验。
2.2 自动化稿件处理流程
文章投稿成功后进入稿件处理第一个环节是查重,采编系统可以做到自动查重,查重通过后经编辑部初审,符合期刊刊登的文章送外审,根据审稿专家的意见决定是否刊用。利用人工智能技术可对稿件处理流程进行自动化处理。对于查重超标的文章自动退稿,对通过专家审稿拟录用文章,自动计算版面费,并生成录用通知后自动发送给作者,收到作者版面费后自动通知作者,期刊出版后自动发送邮寄通知。流程的自动化一方面简化了流程,减少了编辑的手工操作,降低编辑工作量;另一方面及时主动告知作者稿件处理进度,提升期刊的服务水平,有利于获得作者的口碑。
1.3 稿件送审
学术期刊的文章一般都要送外审,确定一篇文章的合适审稿专家是一件重要的事情,对于编辑来说也是一项重要工作。首先要在期刊数据库检索与送审文章研究接近的文章,然后还要进一步分析该论文作者在该领域的研究成果,如果发表相关论文较多且多发表在核心期刊,则可以确定为审稿专家。科技论文由于有学科知识结构和专业语料库的支持,人工智能可以通过关键词搜索、词义距离计算、知识结构树等辅助要素,形成对内容的判断[12]。特别是学术期刊,作者提供的摘要、关键词和参考文献可以对机器学习起到支撑作用,还可以将学术期刊内容作为智能计算结果的对比参照物,从数据库中搜索关联度最高的文章依次排列供编辑筛选,同时提供候选专家的基本情况,包括研究领域、发表文章、研究成果、联系方式。编辑根据列出的文章了解国内外的研究进展,初步判断文章的创新性,对于达到本刊要求的从列出的文章的作者挑选适合的送审专家。目前情况人工智能的语义理解功能还不能替代人类大脑,因此需要编辑对自动筛选出的参考文献及其专家进行判别,但随着技术的进步,人工智能学习能力的不断提高,对文章理解匹配度的不断提高,文章送审完全可以做到智能化。
3 编辑校对环节
3.1 编辑
编辑对文章的处理主要论文格式的统一规范以及内容方面的修改。科技期刊论文的格式相对固定,人工智能在这方面可以大有作为。对论文中的数量单位,很少有作者通读各个期刊的征文要求,期刊间又有所不同,而且有时还涉及不同单位的转换,比如亩转换成公顷,需要同步改变文中及表格的数字,这对编辑来说是相当繁琐。利用人工智能技术,把作者论文中的单位转换为本刊统一的标准单位,相应单位的数据也随之改变,大大降低编辑工作量。各级标题是论文的骨架,比较长的论文可会出现四级或五级标题,而标题序号标错让人防不胜防,在修改过程中编辑需对标题序号一一核对,寻找这个可能出现的大海捞针的错误,对编辑的工作效率影响很大。
参考文献也是编辑修改的一大“重灾区”,关注点一个是参考文献著录格式是否正确规范,一个是参考文献与原文是否一致,还有一个是在文中是否按顺序标注。应该说格式上的修改对论文质量影响不大,但对编辑来说是不能容忍的错误。人工智能学习了期刊的格式要求后完全可以替代这些编辑工作,将编辑从这种僵化、单调的工作中解放出来,把更多精力投入更富有创造性的工作中。
编辑对文章内容的修改需要编辑对该学科专业知识具有一定的熟练程度,但由于目前国内期刊大多是小规模的编辑部办刊模式,少则两三个人,多则十几人,一个人要承担多个学科的稿件,修改稿件过程中难免会由于知识储备不足或者对核实某些数据需要检索文献,而传统的检索方法往往获得的文献较多,需要人工一一筛选,找到需要的文献要花费编辑不少精力。利用人工智能的自然语言处理技术和大数据分析功能则可准确找到需要参考的文献。
3.2 校对
科技期刊实行三校制,有纸质校对和电子版校对,纸质版校对要人工一一核对,编辑部没有专门的校对人员,基本由编辑承担,工作量大。利用人工智能的智能学习功能,饲喂系统校对符号,在学会识别校对符号的基础上利用图像识别技术,实现对纸质校对稿的人工替代。
电子版校对一般采用校对软件,以目前占主流的黑马校对软件为例,该软件可以实现对错别字、语法与语义错误以及英文拼写错误进行校对[13],但误报率比较高。笔者在使用过程中,每期校对显示标红错误的有一百多处甚至几百处,经人工一一核对,真正归于错误的不过几处,徒增不少工作量。经分析,误报的错误经常反复出现,运用人工智能的机器学习技术,对经常出现误报的字词进行设置,不再标红,则可大大降低误报率,从而减少校对工作量。
4 科技期刊服务及广告营销环节
4.1 文章精准推送
随着科技期刊与新媒体的不断融合,期刊纸质发行量不断下降,但期刊的传播方式不断扩展,懂经营的期刊打破时空上的限制,与读者与作者的距离更加接近。不少科技期刊建立网站,并在网站提供全文下载服务,有的建立微信公众号,实现了用手机随时随地下载全文。但这均需要读者主动去网站寻找自己需要的信息,往往导致被读者“遗忘”的风险。利用人工智能技术,将读者按专业进行分类,每期期刊全文上传后台后,根据读者关注的专业分别主动发送相关专业的文章,满足读者的个性化定制,同时培养读者群体,对于科技期刊来说读者就是潜在的作者,有利于拓展稿源。
4.2 与读者沟通
不少科技期刊的网站或者微信公众号都设有读者反馈栏目,但由于编辑没有精力管理成为摆设。另外,编辑工作中重要一项是接听电话,回答作者的稿件处理、版面费、期刊出版进度等问题,不仅占用了编辑大量时间,也经常使工作中断,无法集中精力做好编辑工作。利用智能语音系统与稿件采编系统实现无缝对接,将具有固定回答格式或者采编系统可以查询到的问题设计为自主语音服务模式,减少这些琐事对编辑工作的占用与打扰,从而提高编辑的工作效率。
4.3 征稿
期刊征稿是树立期刊品牌的重要举措,但征稿策略至关重要,策略的制定来源于对行业数据的分析以及趋势的把握,科学的决策能满足生产需求、引领行业发展趋势。仍以农业期刊为例,利用人工智能的大数据分析能力,抓取各地农业网站关注的热点以及生产中存在的问题,有针对性的征稿;根据刊发文章中的试验数据,发现有苗头的作物新品种,向有关专家征集相关品种的栽培技术,提前为这些品种在生产中推广应用提供技术储备。
4.4 精准广告营销
不少技术类期刊有开展广告经营,除了纸质版的彩页进行宣传,也有通过网站或者微信公众号进行展示营销。但目前广告推广无法根据对读者的细化进行差异化显示,广告推广效果不理想[14]。利用人工智能深度学习技术,智能定位读者的性质从而显示不同的广告。仍以农业技术类的期刊为例,当读者在浏览水稻栽培技术文章时,可以判断其大概率从事水稻种植的技术人员或者推广人员,在其阅读界面显示水稻新品种的广告;当读者浏览植物保护方面的文章,则显示新型药剂的广告。也可以在给作者发送全文时推送与读者专业相关的广告,更易引起读者的关注与兴趣,提高广告营销效果。
5 结束语
人工智能技术在出版行业的应用还处于初步阶段,在稿件流程处理、编辑校对以及期刊服务与广告营销方面运用人工智能技术,可以减轻编辑工作量,提高编辑工作效率,提升期刊的营销水平。随着人工智能技术与期刊出版的不断融合,人工智能将深度参与到期刊出版的各个流程,甚至会出现创新的运营模式[15-17]。科技期刊编辑应该充分利用人工智能强大的数据处理和分析能力,在降低工作量的同时把更多时间投入到更富有创造性的工作中去。