如何让AI成为可信赖的工具

2024-01-25李丽

出版人 2024年1期

记者｜李丽

这家被称为技术公司的出版巨头

爱思唯尔的AI 工具都是基于公司自有的可信赖的信息和公开发表的经过同行评审的高质量科研内容所建立起来的。

爱思唯尔全球期刊总裁劳拉·哈辛克（Laura Hassink）

作为全球领先的信息分析和决策工具提供商，励讯集团拥有1 万名技术人员，每年在信息技术上投资12 亿英镑，据称是英国最大的科技公司之一。而作为励讯集团旗下的科学技术和医学出版业务板块，爱思唯尔公司给自己的定位也是一家服务于学术界的信息分析公司，“一家真正的技术公司”，有三分之一的员工从事的是技术类和产品支持方面的工作。爱思唯尔旗下拥有《柳叶刀》和《细胞》等顶级学术期刊，出版2800 多种期刊和43000 多种专业图书。其旗下的期刊几乎都提供开放获取选项，并有超过760 种期刊采用完全开放获取模式，2022 年，爱思唯尔发表了15 万篇开放获取论文，占到了爱思唯尔全年论文总出版量的25%。

爱思唯尔还把生成式AI 技术加入他们的海量数据中，推出了Scopus AI、ClinicalKey AI，以及支持审稿人推荐、文章诚信核查等学术出版环节的人工智能工具。

这家持续投资于高质量科研信息和内容，以技术为驱动，更好地支持客户做出决策的学术出版商，无论是推行开放获取模式，还是积极开发和应用AI 工具，其核心都是帮助科研人员提升科研产出的速度、影响力和质量。比如开放获取的预印本在快速分享信息方面发挥着关键作用，作者投稿后几乎能够立刻发表；免费阅读的开放获取模式极大地扩大了科研论文的传播范围和被引用次数。而爱思唯尔推出的一系列AI 工具，目的也是帮助科研人员、编辑、审稿人更好地利用时间，加快科研创作和出版的速度，提升对科研诚信的核查，从而提高科研产出的质量。

日前到访中国的爱思唯尔全球期刊总裁劳拉·哈辛克（Laura Hassink）接受《出版人》杂志的采访，介绍了爱思唯尔开发和使用人工智能工具的指导原则。特别是针对由于人工智能生成的信息经常出现不准确或误读而导致人们对其生成的内容难以信任的疑惑，劳拉·哈辛克表示，爱思唯尔的AI 工具都是基于公司自有的可信赖的信息，以及公开发表的经过同行评审的高质量科研内容所建立起来的。通过经过同行评审的可信数据集来训练AI 工具，避免出现凭空捏造不实内容的情况。“我们只在可信数据上进行AI 工具建构，我们相信，只有这些建立在可信的信息之上的AI 工具才能真正支持到科学家的科研和创新、提振全社会对科研的信任。这也是为什么我们在AI 工具的开发中需要专家人工审查并做出最终裁定，或对AI 生成的内容进行解读。”

哈辛克认为负责任地使用人工智能非常重要，为此，爱思唯尔制定了负责任地使用人工智能的指导原则。这些指导原则包括透明化、减少偏见、真正为客户体验增值，以及隐私保护。

哈辛克强调：“AI 并不能代替人类工作，我们还是需要编辑完成相关的工作。AI 工具是为了帮助他们提高效率、更好地利用时间。”而且她表示自己的一个工作重点就是要增加来自中国的编辑和审稿人，因为“中国市场非常重要”。以下是劳拉·哈辛克与《出版人》记者关于爱思唯尔是怎样开发和使用AI 工具的对话。

AI 帮助编辑减少工作量但不会替代编辑

《出版人》：我们知道爱思唯尔在创建智能工具以有效应对研究人员面临的挑战方面成绩斐然。能否请您介绍一款爱思唯尔最近开发的AI 工具，也想请您分享未来爱思唯尔在人工智能应用方面有什么发展规划。

劳拉·哈辛克：AI 带来了机遇和挑战，但对我们来说，带来的更多是机会。我们确实拥有AI 解决方案来解决以往客户所面临的一些老问题，其中包括Scopus AI、ClinicalKey AI。Scopus 是我们的科研引文索引数据库，ClinicalKey 则收录了医疗相关的信息，在生成式人工智能的加持下，他们可以更加高效地支持科研人员和临床医生的工作。除了这两个方面外，我们目前也在开发一些AI 解决方案，比如说用户通过向AI 提问能够获得更加确切清晰的信息，更好地帮助他们在浩瀚无边的信息海洋进行信息检索。

爱思唯尔就是一家信息分析公司，是一家真正的技术公司，我们有三分之一的员工从事的是技术类和产品支持方面的工作，这真的是我们工作中非常重要的一部分。

我们还利用人工智能开发了一款帮助编辑找到合适的审稿人的AI 工具。目前我们旗下期刊编辑众多，但在他们自己有限的人际网络内找到相契合的好的审稿人是比较困难的。通过这款AI 工具的算法分析，可以为编辑智能推荐审稿人，让编辑更快捷便利地找到合适的审稿人，真正帮助编辑在他们自己的人脉网络之外为特定文章找到恰当的审稿人，提升整个审稿和发表流程的效率。

我们认为真正重要的是负责任地使用人工智能，为此，爱思唯尔制定了相关的指导原则。这些指导原则包括透明化、减少偏见、真正为客户体验增值，同时还包括非常重要的隐私保护。我们公司的每个技术人员或产品经理在使用人工智能时都需要遵循这些准则。比如，我们内部也有对于寻找审稿人这个工具的讨论，讨论得出我们的目标是要找到最合适的最佳审稿人，同时我们还想减少性别偏见，因为我们可以看到，目前学术产出和同行评审人中，男性仍占绝大比例，尤其是更加资深的研究者中，男性审稿人的比例也是比较高的。我认为我们与产品、技术人员一起，在应用这款AI 工具的过程中，在减少性别等因素带来的偏见、负责任地使用AI方面已经取得了成效。

另外，我们还有一些其他的AI 工具。比如，我们非常重视研究的诚信，对学术不端行为零容忍。以往我们一般是在接收到稿件后进行人工核查，但现在我们也在开发越来越多的AI 工具，能够更加快速地检查论文是否存在学术诚信方面的问题。

《出版人》：AI 能够帮助编辑减轻工作量并提高工作效率，那么未来编辑的功能是否会有所改变？爱思唯尔旗下编辑的人数是否会有所减少？

劳拉·哈辛克：我认为AI 并不能代替人类工作，我们还是需要编辑完成相关的工作。AI 工具是为了帮助他们提高效率，更好地利用时间。AI 工具可以用一种非常透明的方式将运算结果直观地呈现给编辑，推荐可以采取的决策方案，最终是否使用推荐的方案仍取决于编辑自身。AI 能够帮助审稿人更有效地进行时间管理，提供更多信息以帮助他们更好地进行决策，完成审稿工作。

在编辑和同行评审人的工作方面，还要强调一点——同行评审的附加价值，我们非常注重让编辑帮助投稿作者提升论文质量，但是目前编辑们忙于管理投稿和检查文章是否具有研究完整性、学术不端问题。他们没有足够的时间与作者和审稿人共同探讨如何提升论文质量。我们希望编辑在使用这样的AI 工具后，能够帮助他们节省花费在论文学术诚信核查方面的精力，让编辑、审稿人和作者更充分地就科研课题和论文质量展开交流，从而促进整体论文水平的提升，更好地推进科研发展。

如何解决AI 生成结果的可信度问题

《出版人》：说到诚信，实际上AI 也存在幻觉问题，会编造一些不存在的事实，你们是如何避免这个问题的？

劳拉·哈辛克：是的，事实上，很多生成式AI 工具提供了大量不实信息。科研工作是基于严谨和可靠的信息进行的，没有可信来源，基于非可靠数据而生成的不实信息会严重地损害科研之信。这也是我们不会在工作中使用那些人工智能工具的原因。

爱思唯尔有自己的AI 工具，都是基于爱思唯尔可信赖的信息和内容所建立起来的人工智能工具。通过经过同行评议的可信数据集来训练AI 工具，这样生成的内容就不会出现存在不实信息的情况。我们只在可信数据上进行AI工具建构，我们只信任这些建立在可信的信息之上的工具。

这也是为什么我们在AI 工具开发中需要专家人工审查并做出最终裁定，或对AI 生成的内容进行解读。

我们也会利用我们的专家和编辑来进一步改善我们的人工智能成果。比如，我们与编辑合作，通过多次内部测试并结合他们提供的使用反馈，帮助我们提升这些AI 工具的产出结果的准确度，不断调整以提升其效果。我们前面提到的寻找审稿人的AI 工具就经历了这样的不断调整，在最初刚开始使用的时候，我们会问编辑，工具有没有给你提供更广泛的审稿人的人选，最开始反馈的结果并不是那么令人满意，但是根据他们的反馈，我们可以调整工具，之后产出的结果就会越来越好。这也是我们开发产品的方式，我们以敏捷的方式构建产品，与用户一起测试，并在此基础上不断调整。

《出版人》：那么，你们的AI 工具都是内部技术团队自主研发的吗？还是和外部公司合作，或购买一些第三方开发的软件？

劳拉·哈辛克：我们大部分的AI 工具都是内部开发的，如果涉及一些特定技术，我们可能会与第三方公司合作。另外，我想强调一个非常重要的话题——科研诚信问题。围绕这个问题，爱思唯尔除了开发自己的工具，我们还从整个行业的角度出发，与国际科学技术和医学出版商协会（STM）共同合作，投资开发面向整个科学技术和医学出版行业的工具。实际上所有的大型出版商都对此项目做出了贡献。这一款工具能够核验作者在投稿时是否存在一稿多投的情况。因为我们发现越来越多的作者同时向多本期刊投稿。我们提供收到的稿件，通过国际科学技术和医学出版商协会在全行业层面上检查投稿文章是否真实，是否存在重复投稿的情况。

《出版人》：除了一稿多投，还有论文造假和抄袭的问题，爱思唯尔是怎样运用AI 工具来更好地解决这些影响科研诚信问题的？

劳拉·哈辛克：我们目前用两个AI 工具分别解决这些问题。第一个工具能够帮助期刊核查作者是不是存在一稿多投的情况。在规定一段时间内，作者只能向一本期刊投稿，只有在被拒稿后才可以投其他期刊。但是现在的情况是，有些作者同时向多本期刊投稿。那么，通过这样的一个工具，我们就能够快速核验出他是不是向多家期刊投稿。

第二个工具，就是帮助核验这个投稿是不是论文工厂批量生产的论文。通过工具，我们找到论文工厂批量生产的造假论文的相关迹象。如果说反馈结果是怀疑文章为批量生产的虚假论文，我们就可以反馈给相关期刊的出版商并采取相关行动。

说到论文剽窃问题，目前各个期刊出版商之间存在一个共用的工具，能够帮助我们核验论文是否存在剽窃的情况。每年大约有270 万篇投稿稿件，都会经过这个工具进行检查。

期刊出版业的三个趋势

《出版人》：最后，能否请您谈谈对期刊出版业发展趋势的看法？

劳拉·哈辛克：我们看到有这样一些趋势，第一个趋势是通过科技手段提升公众对于科研的信任度。大家有目共睹的是，科技发展得越来越快，我们可以通过一些科技手段来帮助客户解决问题，提供更多的解决方案帮助他们提高效率、节省时间。另外，通过科技手段也可以提升对于科研诚信的核查，实现我们对学术不端的行为零容忍。此外，我们认为通过科技的进步能够进一步提升人们对科研的信任度，可以帮助公众更加信任科研过程。

信任真的很重要，“信任”对我来说是一个关键词，如果谈论未来的趋势，我认为这一切都从信任开始，我们的用户以及公众需要能够信任科学研究。

在新冠疫情大流行之后，我们也发布了名为《科研之信：公众注视下的科研人员》的报告，这一报告也帮助我们更好地了解公众对科研的态度，我们也希望能够找到更好的方式提升大家对科研的信任。我们深知，作为一个科学出版商，我们有义务通过科技手段，提高公众对科研成果的信任度。

第二个趋势，我觉得很重要的就是提升客户体验，包括提升作者和审稿人的体验，我们可以做更多的事情来更好地利用他们的时间，优化出版过程，加快出版速度，提高同行评审的质量。这是我们努力的方向，我认为这是一个重要的趋势。

第三个趋势是在出版过程中将更加注重公平、平等。研究是全球性的，我们必须确保真正做到了公平出版。我们的作者是来自世界各地的研究人员，世界各地的研究人员都有平等的机会发表论文，我们作为出版商必须找到解决方案。例如，来自全球南方国家（发展中国家）的作者并不总是有同等的报酬和出版机会发表文章或获取学术期刊，我们希望未来能够给予他们更多展示研究成果的机会。另外，就是性别平等，爱思唯尔希望能够推动在作者、编辑还有审稿人中实现性别比例的平衡。平等，也是我们作为出版商非常注重的一个原则。■