图书馆、博物馆、档案馆合作领域知识重用策略与方法研究
2019-07-11穆向阳南京邮电大学信息产业发展战略研究院中国科学技术信息研究所
穆向阳(1.南京邮电大学信息产业发展战略研究院;2.中国科学技术信息研究所)
图书馆、档案馆、博物馆(Library、Archives、Museum,简称LAM)作为一个国家或社会的重要文化机构,三者拥有的数字资源呈现出很多内容特征上的相似性,如资源的档案性、文化性以及权威性等。资源特征上的相似性以及知识本身所拥有的内在统一性是LAM合作的前提基础,同时也为LAM知识重用提供了最根本的内部动力。知识重用(Knowledge Reuse)是知识管理的重要环节之一,也是节省社会智力资本促进知识高效创新的重要手段。目前,知识重用已经成为众多知识创新领域关注的热点,如产品设计领域等。[1]LAM数字资源作为一种“知识之源”,其蕴含的丰富知识具有极大价值,对其进行系统地知识管理,加强知识重用研究,能够提高LAM知识利用的效率,促进知识创新创造过程,因而具有非常重要的现实意义。智慧时代即将来临,如何从更深层次、更多维度对LAM数字资源进行知识挖掘,并对相关知识进行合理描述和组织,设计知识重用的策略与方法,已经成为未来LAM知识服务的重要前提和基础。
1 LAM知识重用的必要性及意义
1.1 LAM数字资源的特征及其知识重用的必要性分析
由于图书馆、档案馆、博物馆作为文化机构的特殊性,LAM数字资源相对于其他数字资源来说具有一些突出的特征,而LAM数字资源的特征也在客观上决定了LAM合作领域知识重用的必要性。LAM数字资源内涵以及外延上具有如下一些特点。
(1)LAM数字资源的权威性。LAM数字资源是人类历史在岁月的长河中遗留下最直接痕迹的数字化体现,作为人类历史信息的直接证据,LAM数字资源具有极高的权威性,是很多学术、文化以及社会活动的源头资源和根本依据。
(2)LAM数字资源具有很高的知识含量。LAM数字资源是知识分布最为密集的资源形态之一,另外使用这些知识的过程中也会产生许多新的知识,很多专家头脑中的隐性知识就是在使用LAM数字资源的过程中产生的。
(3)LAM数字资源属于高品质的结构化资源。LAM数字资源是经过专业人员进行严格采集、表示、分类以及存储等管理过程所形成的数字化资源形态,从而保障了LAM数字资源极高的资源品质。另外,资源本身所固有的文化及档案性特征也体现了LAM数字资源极高的学术及文化价值。
从以上LAM数字资源所具有的独特性质来看,加强LAM合作领域的知识重用具有很大的必要性。从LAM数字资源的权威性来看,首先,LAM所包含的丰富知识是众多文化及学术领域都需要借鉴和使用的“源知识”,也是面向用户的知识服务过程中反复使用的资源基础;其次,在相关领域知识创造过程中,LAM合作领域的相关知识是专家学者等需要反复大量使用的资源,加强LAM合作领域的知识重用能够极大节省知识创造的智力成本,极大提升知识创新效率;最后,高品质的LAM数字资源为LAM合作领域的知识重用提供了可靠保障,同时资源的品质会产生一种品牌效应,从而进一步促进LAM领域知识重用。
1.2 加强LAM合作领域知识重用的意义
资源与知识共享是LAM合作的根本目的之一,知识重用是知识共享的重要方式,也是LAM的知识管理活动中极为重要的环节,加强LAM合作领域知识重用的研究具有如下意义。① 能够极大提高LAM领域知识的利用效率,减少智力资源的浪费。② 有利于LAM领域知识的深度挖掘与创新,知识重用为新知识的创造提供了良好的机制和框架。知识重用将为隐性知识显性化、知识间深度关联以及创新等提供强劲动力。③ 能够进一步丰富LAM知识服务的种类和内涵,提高知识服务的专业化、多样化以及个性化水平。④ 因为LAM数字资源的特点,需要构建与之相适应的知识重用策略与方法,对于知识重用相关理论与方法的研究来说也是一种丰富和完善。
2 LAM知识管理的过程与框架
LAM知识重用是其合作领域知识管理的环节之一,与LAM知识管理其他过程紧密相关。LAM知识获取、表示、分类、存储等环节在很大程度上影响着LAM知识重用的策略与方法,因而需要了解LAM知识管理的过程与框架,才能够合理构建LAM知识重用的策略。
LAM领域的知识管理遵循知识管理的一般过程包括:知识获取、知识表示、分类、组织、存储、整合以及应用创新等环节。但由于LAM资源的特殊属性又使得其具体知识管理过程跟一般的知识管理存在很多差异,这些差异主要体现在不同环节所采用的方法与机制上的差异,因而为了提升LAM知识共享与重用的水平,构建合理的知识重用策略,需要首先梳理三馆合作领域的整体知识管理框架,本文构建的LAM知识管理框架如图1所示。
图1 LAM知识管理过程框架
图1展示了LAM知识管理的基本过程,但是每一个环节或阶段所包含的丰富细节及不同于一般知识管理过程的差异还需要进一步分析。
(1)知识采集。LAM数字资源属于高质量的结构化信息资源,其知识采集过程主要可以从两个角度入手:元数据、具体的知识内容。首先,基于元数据的LAM知识采集是指以元数据作为主要手段的知识采集过程,如,利用元数据描述中所包含的字段信息以及元数据之间的关联关系进行的知识采集。这类方法的主要特征是操作较为简单,特别是因LAM数字信息资源经过了系统严格的著录过程,而元数据能够提供较为直接准确的信息,便于知识的发现和获取。但是这种方法也存在很大的缺陷,元数据所包含的信息很难反映出其所描述资源包含的丰富知识,如,文献类信息资源以及视频类、图形图像类信息资源等。所以除了从元数据外,还可以直接从具体的知识内容入手,也就是利用机器学习、数据挖掘等手段直接深入到资源内部,直接从内容入手获取所需知识。另外,还可以开发协同性工作机制,以人工的方式对资源内部的知识进行抽取,将专家头脑中的隐性知识显性化并将新获取的知识与已有知识整合到一起,完善已有知识网络,作为对外服务的资源基础。
(2)知识的描述、分类。对采集到的LAM知识要进行描述和分类,主要的知识描述手段包括元数据、本体等。但是元数据和本体存在的共同问题是,它们仅能围绕信息资源的总体特征进行揭示,而无法深入到资源内部所包含的丰富内容,对于博物馆的单个藏品这种描述比较适宜,但是对于图书、档案类视频录音等这类所含内容极为复杂的资源形态来说,存在很大的局限。元数据、本体以及RDF(资源描述框架)无法深入揭示复杂形态资源内部所蕴含的巨量知识,因此,在探索LAM知识重用的过程中必须要寻找一些新的办法,以弥补元数据级描述的缺陷,从而实现知识元级的知识共享与重用。对LAM资源进行知识元级的描述,是更进一层的知识管理活动,这也意味着需要从新的层面重新对知识进行组织与分类,如对知识元进行标签添加,进行主题、时空等多维度的分类等。LAM知识共享还需要关注的是知识与资源不同层面的协同组织问题,需要构建不同层面相互融合的知识共享网络,并能够为用户提供可视化接口以便于其进行与资源间的交互操作。
(3)知识的组织与存储。对于LAM数字资源来说,知识的组织与存储涉及到如下几方面。① 对原始资源本身的组织与存储。这部分内容主要包括对原始LAM资源进行的描述、加工、存储等过程。由于LAM三馆资源所具有的差异,三者有着自身独立的资源描述元数据标准,因此在进行LAM三馆资源统一描述时,需要构建通用的元数据结构,一些比较成功的LAM合作项目都有自己独立开发的元数据、本体等,如,以图像类档案资源共享为主的Zeri&LODE项目。[2]② 对挖掘出的知识元进行的组织与存储。这一部分内容更为复杂,因为知识元广泛而隐性地分布于具体的资源之中,对知识元的识别、分类、描述、存储等都存在很多问题需要解决,需要探索新的模式将机器学习、语义标签、知识地图等技术应用到LAM知识的共享与重用工作之中。另外,如何存储知识元、知识元之间的关系以及已经显性化了的专家头脑中的隐性知识也是LAM知识重用需要探讨的重要内容。③ 动态的组织与存储过程。LAM知识重用也是知识创造过程,资源以及知识间的关联关系会在重用的过程中变得更为密切复杂,新的知识将不断产生,这些新产生的知识也需要不断进行再组织和存储。
(4)知识服务。服务是连接资源和用户的中间环节,它一方面肩负着发挥资源价值责任,另一方面决定了用户的最终体验。同时,服务模式与接口还在很大程度上担负着资源组织的任务,因为用户在使用资源的过程中需要与资源进行交互,需要将用户头脑中的隐性知识显性化,并加入到原有的知识体系之中,从而进一步丰富资源本身。LAM知识重用是建立在一定内在特征的资源基础上的,三馆共享的资源集合所拥有的禀赋在很大程度上决定了服务模式的设计,因而需要构建与资源特征相适应的服务模式才能真正满足用户需求并充分发挥资源的价值。
3 LAM知识重用的策略与方法
3.1 LAM知识重用资源获取
LAM可以用来重用的知识主要来源于以下几个方面。① LAM三者免费提供用于合作共享的数字信息资源,这部分资源属于初始性资源,是LAM知识重用的基础。② 可以从LAM数字资源中抽取出知识元,资源内部所蕴含的丰富知识是LAM知识重用的核心。对于这部分知识可以通过人工的方式获取,也可以通过机器学习等技术获取。③ 专家头脑中的隐性知识。需要提供合理的方式使这部分知识显性化,并作为非常重要的资源加入到已有知识体系之中。④网络上一些公开的LAM数字信息资源。现有的LAM合作项目,如Wikipedia等,这部分资源可以作为LAM重用知识的有益补充。
针对上述四部分知识来源,需要分别探讨知识获取方法。
(1)LAM免费提供的用于共享的数字信息资源属于已有资源,无需获取。但是这部分资源来自于不同的文化机构,既具有特征上的相似性又存在很大差异。因而必须对其进行统一组织才能够作为LAM知识重用的基础。LAM数字资源具有不同的元数据描述标准,这也意味着需要先从统一元数据或本体等开始对资源进行整体描述。[3]现实中很多LAM合作项目都会按照项目的具体目标进行统一的元数据处理,如英国的聚宝盆项目(Cornucopia)、欧洲的光明项目等。将LAM进行统一的元数据或本体描述后,需要进一步构建资源关联网络,包括两个方面的内容:①已有资源之间的关联关系;② LAM资源与其他外部信息资源的关系。可以通过如下渠道寻找关联关系:元数据描述、本体、关联数据、引文关系等。通过这些渠道不仅可以将已有资源紧密连接起来,还可以将资源集扩展到网络上的相关信息资源,从而成为一个具有开放性的资源集合。
(2)对知识元的抽取、描述、存储。LAM知识重用的主要内容就是分布在LAM数字资源中的海量知识元,因而如何从LAM资源中抽取出有价值的知识元是LAM知识重用的核心内容。从LAM数字资源中抽取知识元的方式主要分为两种,即自动抽取和人工抽取。自动抽取方面可以对LAM数字资源进行知识挖掘,并结合神经网络、决策树、机器学习等人工智能技术对知识元进行分类组织,并自动添加语义标签,从而构建可以供重复使用的知识元集合。自动抽取的知识集合虽然效率很高,但是准确性相对较差,因而需要结合人工抽取方式才能够进一步保障知识元的质量。人工抽取方式是指由领域内专门工作人员、专家学者等以手工方式对资源进行知识抽取,并为抽取出的知识元添加语义标签,以供用户重复使用。人工知识抽取的方法有很多,协同编辑关联表方法是LAM其中之一,它利用专家协同编辑的方式抽取LAM资源中的知识元,并旨在将专家头脑中的知识元关联关系显性化,从而形成知识元网络。[4]协同编辑关联表法是一种在资源使用的过程中,不断丰富知识元及知识元之间关联关系的方法,也就意味着知识重用的过程本身也是一种知识再创造过程。LAM知识元的人工抽取效率较低,但是准确率和质量较高,是自动抽取的有效补充。
为进一步丰富可重用的LAM知识集合,需要构建知识元网络,知识元网络是LAM知识重用的核心。介于知识之间的广泛关联性,添加了语义标签的LAM知识元需要进一步形成知识元网络,知识网络是整个LAM知识重用的主要内容。知识元之间关联关系的获取可以通过机器学习等方式自动建立,也可以通过人工方式添加,如协同编辑关联表的方式,通过这种方式知识元之间的关联关系可以添加关联进行说明,也就是关联关系本身所反映的语义,以便于用户获取相关知识内容。
(3)专家头脑中的隐性知识获取与存储。专家头脑中隐性知识是LAM知识元网络非常重要的补充,对于LAM知识元网路的扩展来说具有非常重要的作用。实现隐性知识的重复使用,必须先将隐性知识显性化,将深藏于个人头脑中的隐性知识用明确的语言、文字等方式表达出来。可以在提供服务的过程中,通过不同的具体方式激发隐性知识显性化的过程,如COLLATE项目旨在设计一套以网络为基础的合作系统,领域专家以及普通用户都可以参与相应文化资源的编辑过程。[5]知识显性化以后,需要对其进行存储,存储主要包括知识本身和知识关联关系两方面内容。隐性知识的显性化是已有LAM知识网络的有效补充,供用户重复使用。
(4)知识元网络以及LAM资源网络都可以建立与外围资源之间的关联,从而可以对LAM知识进一步扩展。网络上拥有一些可供免费使用的极为有价值的LAM数字资源,LAM数字资源通过本体、关联数据等渠道,可以和很多网络上的资源建立关联关系,[6]并使LAM可重用知识集合具有一定的开放性,从而进一步扩展LAM可重用知识的外延。
图2 LAM可重用知识的获取
综上所述,LAM可重用知识的获取包括上述几个主要部分,但上述四个部分并不是割裂开的,而是相互交织在一起共同构成LAM可以重用的知识集合(见图 2)。① 核心知识层是指那些能够直接被重用的具体知识元所构成的集合,其来源包括人工或自动从LAM数字资源中抽取的知识元、专家用户头脑中的隐性知识以及一些其他外围知识。这些具体知识可以通过语义标签等方式进行检索和重用,它们本身也构成一个复杂庞大的知识元网络,从而能够让用户进行深度浏览和遍历。② 基础资源层是LAM免费提供用于共享的资源层,是知识元网络的来源。同样基础资源也能够直接提供可重用的知识,但是基础资源层的宏观维度,特别是图书、视频、录音等资源包含的知识量过于庞大,以至于无法直接重用,所以需要对基础资源进行知识抽取,以获得可以重用的具体知识。基础资源层也是一个复杂而庞大的网络,资源之间的关联关
来源于四个途径的LAM可重用知识并不是一个松散的集合,而是由内在的知识关联、外在的结构特征以及用户的使用等连接起来的一个具有体系层次的有机知识体系,所以需要按照相应的体系进行资源组织。
3.2 LAM知识重用的资源组织结构
LAM可重用的知识集合总体上可以分为三层:核心知识层、基础资源层和外围资源扩展层(见图3)。系将来自于LAM三馆的资源紧密连接在一起,形成最初的LAM共享资源集合。基础资源层的网络并非孤立,它与知识元网络也紧密联系在一起,形成极为庞大复杂的整体网络。③ 外围资源层是网络上供免费试用的LAM公开数字资源,这部分资源是上述两层资源的非常有益的补充,如Wikipedia、已经公开的LAM项目资源如world digital library等,通过本体、关联数据等方式可以建立与这些资源之间的关联,从而体现LAM可重用知识体系的开放性和灵活性。
图3 LAM可重用知识的组织结构
三个层次资源的具体特征决定了需要采用不同方式分别对其进行组织。
基础资源层虽然不是供用户重复使用的直接资源,但是它提供了重用知识的来源和基础,对其的管理遵循一般信息资源的管理规律,首先建立统一的元数据标准以及本体结构,将来自于LAM不同形式的资源转换成统一描述的资源,并统一存储,构建基本的资源集合,可以直接向用户提供检索、浏览等服务。需要注意的是,资源之间存在丰富的关联关系需要挖掘,利用这些关系可以突破资源的松散集合形态从而构建资源网络,便于用户进行深度浏览。元数据、本体、引文关系、关联数据等都能够提供资源之间的关联关系。
对于核心的知识元层来说,需要不同的资源组织方式,其管理过程符合知识管理的一般规律。LAM重用知识元的存储主要包括物理存储和逻辑存储两种方式。物理存储是指将抽取出的知识元存储到具体的知识库中,并通过语义标签等方式提供检索等服务。逻辑存储是指只存储知识元与具体资源之间的关系,如知识元分布于哪个资源之中、它与其他知识元之间的关系等。对于LAM知识重用的具体目的来说,合理的知识存储方式将两者有机结合起来,共同构建核心的知识元网络。另外,还应充分利用关联关系将知识元网络和基础资源网络结合起来,形成统一的有机资源体系。
对于外围的可扩展性资源来说,主要提供相应的资源链接即可,如通过关联数据、用户提供的关联关系等将外围的资源引入进来,作为LAM知识重用体系的有益参考。
LAM知识重用所基于的不同层次可以提供不同层次的资源服务,服务模式的设计需要考虑三者的协同问题,以为用户提供更为丰富的知识重用渠道,提供更为全面的具有个性化的服务方式。
3.3 LAM知识重用机制
不同类型知识体系的共享方式也存在很大差异,如,有学者在并行计算方面构建了OpenKFramework方案,[7]施星国等探讨了基于情境的知识重用模式。[8]虽然部分上述成果可以应用于LAM知识重用过程,但由于LAM知识的特征,其重用机制又有很大不同,需要单独分析。LAM重用机制为其重用过程提供了整体逻辑框架,LAM知识重用机制包括检索、使用、创新、添加、再使用等基本环节,这些环节构成一个循环过程,这一循环过程同时也是LAM可共享知识集合不断发展的动态演化过程(见图4)。
图4 LAM知识重用机制
本文主要以协同编辑关联表法为例来探讨LAM的知识重用机制。① 在LAM资源体系基础上形成两层资源网络:知识元网络和基础资源网络。用户首先对整个资源体系进行检索,检索字段被同时送往两个资源层并产生两种检索结果,如图4所示。两种检索结果属于两种形态,一种以资源元数据描述为单位,另一种以知识元为单位。用户可以根据两层网络进行相关资源的扩展浏览。② 用户需要对检索结果进行综合处理,寻找其真正所需要的知识以供使用。在使用的过程中,用户头脑中的隐性知识可以通过协同编辑关联表显性化。协同编辑关联表是一种供多用户协同编辑的表格,该表格能够记录资源之间的关联关系,为用户头脑中隐性知识的显性化提供了一种渠道。用户1在使用某知识的时候,很可能想到了另外一个相关知识,如在图书中阅读一段关于“辽沈战役”的文字,便联想到相关档案资源,于是他可以利用协同编辑关联表建立这段文字和相关档案文物或某段视频影像之间的关联。这些在使用中建立的关联关系被保存下来,可以被下一个用户参照使用。另外,协同编辑关联表还为用户提供了新产生知识的接口,用户可以把头脑中的知识记录下来,并作为相关资源的有效补充。③ 除用户协同编辑关联表的方法之外,还有很多隐性知识显性化的方法和途径,如Walden’s path 机制[9]、Annotation thread 机制。[10]通过上述方法用户在使用知识的过程中实际上也是进行知识的创新活动,这些新产生的知识将被加入到原有资源体系之中,丰富和完善LAM可重用知识,这样构成了LAM知识重用过程的第一次循环。④ 用户2继续用户1的循环,但是其使用过程中所面对的知识资源体系是不同的,因为这时的资源集已经加入了用户1贡献的内容,用户1所产生的知识能够直接被用户2检索重用。同样用户2在使用知识的时候,仍然可以通过协同编辑关联表继续贡献头脑中的隐性知识,进一步完成知识创造,用户2使用重用知识的同时新的知识又被添加到已有资源体系之中。同样用户3、用户4等其他用户会继续这样的循环,使已有资源体系不断丰富,呈现开放性和动态性。另外,利用协同编辑关联表,不同用户之间可以取得联系,从而进一步形成基于知识的社会网络,促进知识创新。
3.4 LAM知识重用的服务模式
服务将资源和用户连接在一起,服务模式的设计在很大程度上决定着资源价值的发挥水平,以及用户的最终满意程度。另外,服务模式本身还承担着资源组织的作用,它同时为用户提供资源组织与处理的窗口。服务模式的设计与具体项目及其拥有的资源集紧密相关,但LAM知识重用系统的服务模式设计具有一些共通之处。① 知识资源体系包括两个核心层次,因此对检索结果也应该从两个层次同时展示。② 不同层次的资源构成各自的网络,因而服务模式应该从两层次提供资源网络的遍历。③ 服务模式需要提供资源系统编辑的窗口和路径。LAM知识的重用,意味着用户在使用资源的过程中,同时在和资源进行交互,服务模式设计要提供这种交互渠道,并保证资源内容本身的质量和品质。④ 资源的多维度展示。检索结果分布在不同的层次,包含在不同的媒体格式之中,因而LAM知识重用过程中需要能够将不同媒体格式的资源灵活地展示出来。⑤ 服务模式也是一种价值再创造过程。在原有知识集合的基础上,可以通过个性化服务方式进一步进行价值创造,丰富用户体验,提升整个LAM知识重用系统的新颖性和友好性。
LAM知识重用的根本价值和动力来源于三者资源的内在禀赋,并通过重用机制将LAM知识的价值源源不断地发挥出来,但是其价值的最终发挥还需要以具体的服务模式作为媒介。另外,服务模式的设计同样也是一种创造价值的过程,能够进一步提升LAM知识重用体系的内涵与价值。
4 结论
本文以LAM资源的特征为基础,按照“资源分析-组织模式-重用机制-服务模式”的逻辑主线,系统详细地探讨了LAM知识的重用问题。LAM资源的内在特征决定了其层次化的知识组织结构,通过三个层次的组织架构能够更好地将LAM资源所深藏的知识组织起来,构建有助于知识重用的包含不同粒度网络的资源体系。文中对不同层次可重用知识分别进行了模式和方法上的探讨,通过具体的模式和方法的设计旨在实现整个LAM知识体系的可重用性、资源的自组织性以及开放性,并且充分关注对专家头脑中隐性知识的挖掘和存储,使整个知识体系在使用的具体过程中不断丰富和完善。最后,LAM知识重用体系的价值必须通过服务模式才能发挥出来,服务模式需要兼顾资源和用户,同样服务过程也是一种价值再创造过程,是LAM知识重用体系的有机组成部分。因此,在LAM知识组织结构的基础上,构建了顾及资源特征,并为用户提供与资源深度交互,能够将隐性知识显性化的服务模式,充分发挥了LAM知识的可重用价值,提高用户满意度。