循证知识服务:学术出版的智慧化升级转型
2023-10-27宋宁远李英群
宋宁远?李英群
【摘要】循证知识服务是在学术信息过载背景下,保证研究人员科学处理、高效利用领域知识的必然途径,也是学术出版智慧化升级转型的方向之一。从循证研究范式入手,基于科学研究过程的视角分析科学发现与循证论证之间的关系,总结归纳循证知识服务的概念内涵、技术路径和使用场景,从知识服务、智慧出版、科学交流系统三个方面揭示循证知识服务对学术出版的影响,可为学术出版朝向智慧化发展、高效合理地开展循证知识服务提供理论基础与实践路径。
【关 键 词】循证知识服务;智慧出版;科学发现;论证结构
【作者单位】宋宁远,南京大学信息管理学院;李英群,南京大学信息管理学院。
【基金项目】国家自然科学基金青年项目“基于科学论文论证结构的可循证领域知识体系构建研究(72304137)”。
【中图分类号】G239.7【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.16.003
随着“AI+科学发现”的不断发展,利用AI技术辅助科学发现已经成为科学研究的发展方向,也逐渐成为一种新型的科学研究范式。科学发现的过程是围绕特定领域的具体命题,利用多种方式方法不断发现证据、使用证据,以验证假设、总结规律、提炼理论的过程。在这一过程中,科学证据起到至关重要的作用。因此,“循证”是科学发现与科学研究的基本逻辑与基础流程。与此同时,随着循证医学的不断发展,以及循证研究范式在诸多学科的广泛应用,对科学证据的提取、分析、整理、挖掘成为循证研究的关键任务,如何高效开展循证知识服务也成为出版学、图书情报等领域关注的重要问题。此外,随着科技文献数量的暴涨,短时间内快速浏览大量科技文献,并有策略地阅读科技文献的部分关键内容,准确定位所需要的关键证据,成为目前科研工作者学术资源利用的主流行为模式。在这些因素的推动下,在学术出版领域开展循证知识服务将是学术出版智慧化发展的未来方向之一。
建设能够支撑循证知识服务过程的内容数据,是保障循证知识服务有效开展的前提与基础,但由于科技文献数量庞大且结构复杂,给科研领域内证据体系挖掘、逻辑关系识别、证据可信度分析等工作带来了巨大挑战,阻碍了循证知识服务的开展。随着人工智能、自然语言处理等技术的不断进步,越来越多的研究与实践开始聚焦于科技文献细粒度内容的挖掘与抽取,同时积累了大量的算法基础、技术体系和高质量数据集,使得基于大规模学术出版物内容挖掘的循证知识服务基础设施构建成为现实,也给学术出版行业开展智能化的循证知识服务提供了可能。在此背景下,厘清循证知识服务的理论基础,探究循证知识服务的技术实现路径,挖掘循证知识服务的潜在应用场景,成为当前需要着力探究的问题。
基于此,本文从循证研究范式入手分析科学发现的过程,进而总结归纳循证知识服务的概念内涵和使用场景,并对循证知识服务对学术出版的影响进行探讨。
一、循证研究范式与科学发现的过程
循证研究,亦称循证实践(Evidence-Based Prac-
tice),本意是“基于证据的实践”。其理念最早始于循证医学,由加拿大学者Gordon Guyatt[1]等提出。随后,循证的概念不断向临近学科渗透,形成循证图书馆学、循证管理学、循证政策分析、循证软件工程等多个新兴领域。循证研究强调对多源科学证据的分析与评估,由此产生了多种不同的证据集成方法和评估框架,如OCEBM证据标准[2]、GRADE证据质量与推荐强度分级[3]、证据金字塔[4]、5S证据模型[5]等。此外,还有研究设计了相应的循证研究范式[6]。
随着语义技术的发展,有研究通过对科学基础设施的建设与开发,实现了高效、简洁、快速的循证知识服务,如Cochrane Library、Epistemonikos数据库、Trip数据库、PubMed Health等,成为下一代知识服务平台的范例。亦有研究通过本体[7]、知识图谱[8]等方式,借助专家系统构建知识库[9],实现对科学证据的关联与评估。由此可以看出,基于大規模的科技文献,设计科学证据的分类、抽取、关联方法,并对其可信度进行分析与监测,是支撑循证研究范式的重点。
对科学发现的一般规律从认识论的层面进行探索,有助于回归科学发现的本源,对于理解循证知识服务的模式及实现路径至关重要。综合以上科学研究的认识论解释可以发现,科学知识的产生和发展过程包括假设、事实、实验、数据、方法、概念等元素,这些不同层次的要素按照一定的修辞规则和逻辑准则关联在一起,形成了支撑科学命题的科学证据,构成了科技文献的主要内容。因此,科学发现的过程就是一种不断“循证”的过程,能够为循证知识服务的开展提供有效的理论依据。
从科学研究过程可以发现,科学研究是不断“循证”并“论证”的过程,论证不仅可以表征科技文献内容的基本结构,也可以表征科学发现的基本逻辑。对科技文献论证结构进行揭示,可以实现对科学证据、命题等的准确描述,也能够给循证知识服务提供内容与数据的准确定义与表征,为循证知识服务的开展奠定工具和方法基础。
二、循证知识服务的内涵与应用场景
1.循证知识服务概念
综合对基础理论的分析不难发现,科学发现的过程是一种循证的过程,是在不断发现新证据、评估已有证据的基础上,提出新命题或评估已有命题的循环。在这一过程中,分析、理解、集成、评估各类证据是开展新的科学发现的基础性工作。与此同时,以特定领域为视角,领域内知识的建构过程也是一种循证的过程。在这一过程中,新的科学证据和命题不断与已有知识进行充分关联、聚合,进而促进学科领域知识体系的逐步完善。这充分说明,循证是科学发现、知识建构的重要逻辑线索,因而理解循证的内涵,明晰循证的过程,并进行循证知识服务设计与实施,是未来知识服务发展的重要方向。
与此同时,在实践方面,经过循证医学数十年的发展,循证研究逐渐得到各领域,尤其是人文社会科学领域的认可,并逐渐成为一种研究范式,这也是循证知识服务开展的基础。此外,前期对科技文献结构、功能、逻辑的分析、揭示、定义与形式化表征等研究,也准确描述了科技文献中存在的不同证据,为循证知识服务提供了先决条件。
基于此,本文将循证知识服务的概念进行如下归纳,即循证知识服务是以多源数据为基础,以论证结构表征、揭示、挖掘为核心,通过概念地图、知识图谱等知识组织系统与工具,实现多维度、多粒度内容数据聚合与集成,进而实现包括核心证据获取与溯源、证据链提取、证据可信度分析等更加贴近用户科研过程,以及更加具有针对性的新型高阶知识服务。实现循证知识服务能够有效满足科研用户快速理解领域知识发展脉络,梳理科学发展过程,满足策略性阅读,快速掌握相关证据、知识的精准获取等需求,进而推动科学研究工作的高效率开展。
2.循证知识服务的应用场景
循证知识服务的开展有赖于完备的科技文献内容数据基础设施建设,需要建设丰富语义、高度关联、动态更新的内容数据基础设施,从而实现循证知识服务。其中的关键在于定义、识别、抽取、挖掘科技文献中广泛存在的科学证据及其相关的命题、断言等,并进行有机的组织与聚合。在整合多源数据的基础上,融合实际应用场景中的领域知识特征与循证需求分析结果,结合领域知识体系中的核心知识、知识结构、知识发展脉络等关键要素,可为用户提供关键的、可供分析与利用的循证知识。目前,循证知识服务策略和实践路径主要包括以下四个方面。
(1)可循证领域知识体系构建
循证研究的开展有赖于对较为分散的科学证据的集成式判定和综合式推断,需要将分布在不同科技文献中的科学证据、关键命题等进行准确表征、规范定义和关联组织。因此,为了使科研工作者在短时间内实现对领域内证据和命题的快速理解,进而推动循证知识服务的开展,首要工作是构建可循证的领域知识体系。
可循证领域知识体系的构建需要借助深度学习和知识图谱技术,实现领域内不同科技文献的论证知识的抽取,随后按照论证逻辑进行重组,构建面向特定领域的知识体系与知识图谱。这种领域知识体系能够将领域知识的发展、演化过程和关键节点以全域式的呈现方式提供给用户,帮助科研工作者实现对领域知识的“遥读”。
(2)关键科学证据获取
帮助用户快速获取关键科学证据,是循证知识服务的主要应用场景。通过对大规模科技文献的分析、挖掘,服务提供方借助可循证领域知识体系,使用复杂网络分析的方法、技术实现对关键知识、知识结构等的分析、挖掘与提取,进而满足科研工作者对快速获取关键证据的需求。例如:通过领域知识宏观结构,帮助用户掌握当前领域的整体发展情况;通过领域知识中观结构,帮助用户掌握当前领域中存在的研究流派;通过领域知识的微观结构,帮助用户获取当前领域中的关键知识与领域关键证据及结论的论证过程;通过领域知识发展脉络,帮助用户获取当前领域关键知识的发展路径与发展轨迹,最终实现学术资源和关键科学证据的智能化获取与语义检索。
(3)科学证据可信度分析
对科学证据进行可信度分析、评估与证据分级,是开展循证知识服务的重要环节,用户需要根据多方因素对证据的可信度等进行分析,最终确定循证研究所使用的科学证据。但由于证据可信度受到来自领域、提出者、证据内容、提出时间等因素的影响,具有较高的动态性、演化性与领域性等特征,需要综合多种来源信息进行判定。因此,单一的、静态的可信度评估不完全适用于科学证据,而富含论证结构语义信息的知识图谱和知识体系,给动态判定科学证据可信度分析提供了基础。服务提供方可以使用如图神经网络等算法与技术,在可信度分析框架的基础上实现对科学证据的动态性、全局性分析,也可以借助科学证据、命题间存在的复杂论证关系,挖掘核心证据的论证过程,揭示证据和命题的论证充分程度,并借此对当前知识和内容的可信度进行分析与研判,为用户提供证据分级等服务。
(4)科学证据链提取与证据溯源
循证知识服务的另一应用场景是通过对论证关系的揭示融合时序信息,发掘知识关联方式,追踪关键证据的源头,为后续的科学研究构建完整、可靠的证据链,并为科研用户提供相应的知识体系,从而支撑用户科研工作的高效率展开。与此同时,以论证知识图谱为依托,用户也可以借助证据溯源,综合判断科学证据的可靠性与有效性。在此基础上,为了进一步提升循证知识服务的精确性与准确度,还需对循证知识服务方式的效果进行验证。开展用户实验,从用户的视角探究循证知识服务的实际使用效果,最终根据实验结果对循证知识服务策略进行分析与优化,可为更有效的循证知识服务提供路径与方案。
三、循证知识服务对学术出版的影响与进路
1.知识服务的未来发展
循证知识服务为出版业知识服务的进一步转型升级提供了一条可供参考与实践的路径。开展知识服务工作是数字出版时代到来之后出版业的共识,随着知识服务概念、内涵的不断深化,知识服务也需进一步升级,实现从简单的资源供给向提供解决方案转变,契合用户的实际需求。
近年来,随着知识服务及相关实践的开展,出版业建设了大量的数据库和知识库,尝试了语义出版、数据出版等新型的出版与服务模式。这些出版模式将粗粒度的篇章转化为细粒度的内容数据,方便用户快速获取知识,并根据实际需求进行内容重组。循证知识服务的开展,将为知识服务的进一步发展提供方向。循证知识服务模式建立在对科学研究与科学发现一般规律的理解基础之上,更加贴近研究流程,能够较为充分地满足科研用户的需求。这也说明,未来知识服务需要深入理解科学交流系统的运作机制、科学研究的一般规律及科学发现的典型过程与范式,设计出更加符合用户行为特点和需求的知识服务模式。
此外,知识服务的开展有赖于对知识资源的深度处理与关联组织。循证知识服务侧重于对知识资源中论证知识的利用,是对多来源科技文献进行有针对性的再次开发,实现了特定目标的价值增值。如SynGo项目中就涉及对不同证据类型的定义,并围绕这些证据设计集成了证据追踪模块(Evidence Tracking Systems),为开展更为丰富的知识服务提供了基础。因此,以循证知识服务为代表的新型知识服务模式,为知识的深度加工与利用提供了发展方向,需要圍绕特定需求和特定目的,多刻面、多层次、多类型地建设知识与内容资源,进而实现有针对性的知识服务。
2.智慧出版的服务形态与进路
循证知识服务的发展为智慧出版的服务形态及发展方向提供了参考。智慧出版是借助人工智能等新技术对出版业务的升级,在这一过程中,如何充分发挥技术优势,实现对出版流程的再造是至关重要的因素。为此,需要着重考虑以下两个方面。
首先,智慧出版需要更细粒度、更具针对性的资源开发与建设。现阶段,学界及业界均认可资源建设对学术出版发展的重要作用,与此同时,细粒度、富语义的资源开发与建设不仅是实现智慧出版的基础,也是开展知识服务的基本前提。此外,语义技术、自然语言处理及人工智能算法能够提升较大规模资源的建设速度,有效应对学术资源结构复杂、种类多样等方面的挑战,进而实现更细粒度、更具针对性的资源开发与聚合。循证知识服务就是在细粒度资源建设的基础之上,综合多种技术方法的产物,囊括深度学习、知识图谱、本体等,为智慧出版的发展提供了可参考的思路。
其次,智慧出版是更贴近消费者群体特征及行为习惯的服务方式。服务于科研工作者的现实需求是学术出版领域智慧化、智能化转型的最终目标,因而在资源开发的基础上,如何更好地服务于消费者,是智慧出版未来发展的关键任务之一。循证知识服务不仅能满足科研工作者对证据获取、证据溯源、可信度判定的需求,也符合现阶段科研工作者策略型阅读的行为模式,这种内容服务方式为智慧出版的服务形态提供了参照。未来,智慧出版需要以理解用户行为模式为先导,以精细化、个性化的服务与应用设计为导向,利用富语义化的数据基础提供更具针对性的内容和知识服务。
3.对科学交流系统的改进
循证知识服务改进了科学交流的普遍方式,形成了以证据为载体的交流形态,对于科学交流系统而言,是一种从载体到方式的提升。具体体现在以下三个方面。
一是对科研工作者资源利用效率的提升。循证知识服务的开展显著提升了科研工作者的资源利用效率,科研工作者借助论证图谱可以较为便捷地获取、检索、定位、溯源相关的知识及内容,快速构建领域的知识体系,了解领域知识的发展脉络。此外,循证知识服务的开展还可以帮助科研工作者快速判断科学证据的可信度,有利于科研工作的开展,对新知识、新发现的产生起到加速作用。
二是对知识传播模式的变革。循证知识服务的开展一定程度上改变了知识传播的方式。现阶段,正式的科学交流系统以论文等为主要载体,需要科研工作者花费大量时间进行论文阅读以获取相关内容。而论证知识图谱的建设及循证知识服务的开展,可使科学交流系统的载体转变为以科学证据等为代表的、更细粒度的知识及内容,这种传播模式的改变将促进知识的传播,极大提升知识的利用效率。
三是对出版物形态的改进。循证知识服务的开展也对建构新形态科学出版物提出了新的要求。从本质上看,循证知识服务是以大规模关联化的细粒度内容数据基础设施为依托而开展的新型知识服务,是借助内容挖掘、语义组织等技术手段进行的科技文献内容的二次开发与利用。这种内容数据同时也是与出版物原文本具有高度互文性的副文本,可为用户的文献资源利用提供如学科概览、观点演化、重要节点文献提供等辅助功能。如国外研究团队开发的证据与结论本体(Evidence&Conclusion Ontology, ECO),不仅规范定义了基因与蛋白质的关系,还通过语义标注的方式关联了相关研究证据,实现对关键知识和证据的互文,帮助用户对关键结果进行判断。除了对出版物内容组织形式的改进,以丰富语义内容为基础,服务提供方还可以设计更贴近用户资源使用方式的功能,开发自动摘要、自动综述、知识溯源、可信度判定等工具,丰富出版物的功能,帮助科研工作者实现对知识的快速获取与理解。
四、结语
本文着重探究学术出版开展循证知识服务的基础理论与服务场景,同时分析了循证知识服务对学术出版发展的影响。随着人工智能、深度学习等技术的不断成熟,以及在学术出版行业的不同运用,智慧出版与智能化的服务和应用必将成为未来学术出版的发展重心。在新形势下,充分发挥技术特点与资源优势,开展符合科学研究一般过程、适应科研工作者资源利用模式的智能化知识服务,是学术出版升级转型的必然之路。
循证知识服不仅更加贴近科学发现的一般规律,也更符合科研工作者的认知习惯,将给学术出版的未来发展提供一条可供参考的思路。但现阶段,开展大规模、智能化的循证知识服务还存在诸多局限,如数据集建设不完备、算法设计难度较大、资源整合程度较低等。未来,需要从研究与实践两方面入手,共同推进循证知识服务的进一步发展。
|参考文献|
[1] GUYATT G,CAIRNS J,CHURCHILL D,et al. Evidence-based medicine: a new approach to teaching the practice of medicine[J]. Jama,1992(17):2420-2425.
[2] HOWICK J,CHALMERS I,GLAXZIOU P,et al. Explanation of the 2011 Oxford Centre for Evidence-Based Medicine (OCEBM) Levels of Evidence [EB/OL]. [2023-08-25]. https://www.cebm.ox.ac.uk/resources/levels-of-evidence/ocebm-levels-of-evidence.
[3] ATKINS D,ECCLES M,FLOTTORP S,et al. Systems for grading the quality of evidence and the strength of recommendations I: critical appraisal of existing approaches The GRADE Working Group[J]. BMC health services research,2004(4):1-7.
[4] 陈耀龙,李幼平,杜亮,等.医学研究中证据分级和推荐强度的演进[J].中国循证医学杂志, 2008(2):127-133.
[5] HAYNES R B. Of studies,syntheses,synopses,summaries,and systems: the “5S” evolution of information services for evidence-based healthcare decisions[J]. BMJ Evidence-Based Medicine,2006(6):162-164.
[6] LUND H,JUHL C B,N?RGAARD B,et al. Evidence-based research series-paper 2: using an evidence-based research approach before a new study is conducted to ensure value[J]. Journal of clinical epidemiology,2021(1):158-166.
[7] GIGLIO M,TAUBER R,NADENDLA S,et al. ECO,the Evidence & Conclusion Ontology: community standard for evidence information[J]. Nucleic acids research,2019(1):1186-1194.
[8] 高峰,熊輝,顾进广.基于知识表示学习的实时语义数据流推理[J].计算机应用与软件, 2022 (2):26-31+94.
[9] KOOPMANS F,VAN NIEROP P,ANDRES-ALONSO M,et al. SynGO: an evidence-based,expert-curated knowledge base for the synapse[J]. Neuron, 2019(2):217-234.