基于知识单元的知识链接研究❋
2014-12-25文庭孝
文庭孝 李 维
(1.中南大学医药信息系 湖南长沙 410013;2.湘潭大学公共管理学院 湖南湘潭 411105)
引言
随着知识管理在全球范围内的兴起和知识经济时代的到来,知识管理、知识经济正取代信息管理和信息经济成为社会发展的基本趋势。在图书情报领域,信息组织、信息检索、信息服务开始向知识组织、知识检索和知识服务转变。面对海量文献、信息和知识,以文献单元为逻辑起点的知识链接方式和以超文本链接为逻辑起点的参考链接方式已不能满足知识组织、知识检索和知识服务等知识管理活动的需求,基于知识单元的知识链接方式兴起并成为知识管理发展的必然方向和趋势。基于知识单元的知识链接能有效抽取知识单元并对其进行规范化处理,从而根据知识单元之间存在的各种关联关系,构成知识链接网络,形成知识系统,以便有效揭示知识单元间存在的本质联系,使用户能从一个知识单元链接到与之相关的其他知识单元,从而能够更加快速、全面、准确地获取所需知识。
1 知识单元与知识链接概述
随着知识管理的普遍兴起和知识经济的快速发展,知识单元和知识链接已成为图书情报领域研究的热点之一,也是当前知识管理研究的难点。众多学者分别从理论、方法、模型和应用等角度出发对其进行了系统探讨,并把知识单元和知识链接有机联系在一起,为进一步从事基于知识单元的知识链接研究打下了坚实的基础。
1.1 知识单元
知识单元是知识管理过程中知识控制和处理的基本单位,是知识链接的逻辑起点。关于知识单元的概念,目前学术界还没有形成统一的认识,但有两种观点具有代表性,即广义的知识单元和狭义的知识单元。广义上的知识单元是泛指知识的任何一种相对独立的单元内容和形式,〔1〕如一篇文献,一本图书,一本期刊,一张报纸,一张光盘,一套丛书等。广义知识单元的内容容量具有无限性,且知识内容单元与知识载体单元并不一致,只要在知识内容上和知识载体上具有相对独立性的知识单位都可以称之为“知识单元”。狭义上的知识单元是指知识在内容上不能再分解的基本单位,是构成系统知识的最小的、最基本的组成因素,也特指那种在思维中不能再分解的最基本思维形式,即概念思维形式的知识。〔2〕在实际研究和应用中,知识单元还有“思想基因”、“情报基因”、“知识基因”、“知识节点”、“知识元素”、“知识概念”、“知识因子”、“知识元”、“知识点”、“知识项”等不同称谓。
国外对知识单元的概念、类型等直接进行探讨和研究的不多,源于文献组织和知识工程等领域。重点研究知识单元(如文献及其特征单元、概念单元、语义单元等)在知识表达、知识地图、知识发现、知识挖掘、知识组织、知识检索等知识管理活动中的应用,以及知识单元的抽取、知识地图和知识网络的构建等需要的技术支持方面。例如,法国Paul大学的Sabatier项目通过引入精练的词汇语义数据,提高从文本中抽取知识的质量,分析了语义描述粒度的不同层面及对抽取知识质量的影响,并对知识抽取的不同算法进行了比较和评价。〔3〕
知识单元研究在我国还处于起步阶段。文庭孝等从知识单元的概念、特征、类型、应用等方面对当前知识单元的研究现状进行了梳理和总结。〔4〕另外一些学者对知识单元在知识管理活动中的应用进行了探讨,如姜永常、杨宏岩、张丽波阐述了基于知识元的知识组织流程和功能;〔5〕刘晓蔚、任瑞娟对基于知识单元的高校图书馆服务管理进行了思考;〔6〕温有奎等系统研究了知识元标引、导航、挖掘及其应用;〔7〕王子舟等从知识集合论的角度探讨了知识单元及其应用问题。〔8〕
1.2 知识链接
知识链接是指以知识节点(知识单元)的继承性和逻辑性为基础,通过知识关联将具有同一、隶属、相关等关联关系的单元知识,按照一定的需要有序地联系在一起,形成序化或结构化的知识集合,从而形成知识网络的一种行为。〔9〕知识单元之所以需要链接且能够链接是因为知识网络的存在,知识链接是形成知识网络的技术基础和前提条件,知识网络是知识链接的基本目标和最终结果。
国外学者在知识链接的内在机理、学源演变、构建方式、建立规则等方面进行了系统探讨。早在1945年,美国情报学家V·布什就指出,“要确认两个概念相联系的作品之间可操作性的链接的重要性”,布什还提出了一个解决这一问题的办法,即利用所谓的“联想索引”,并设计了一个叫做“memex”的理论性工具,与超文本链接非常相似。〔10〕英国情报学家布鲁克斯提出了“知识地图”概念,试图揭示知识的有机结构,找到人们创造与思考的相互影响及联系的结点。后期有关知识链接的许多尝试,包括文献分类法的参见、SCI的引文链接分析、语义网络关系、网络超链接等,在某种程度上都可以看做是他设计出的理论模型的具体实现。而现代意义关于知识链接的系统研究和社会实践最早可以追溯到1963年的引文分析和SCI数据库,著名文献计量学家加菲尔德为此做出了特殊贡献。美国科学史学家D·普赖斯揭示了科学引文网络及其关系,为文献计量学和科学计量学的诞生奠定了基础。马克思创立的唯物辩证法和米尔格拉姆发现的“小世界现象”为知识链接找到了理论来源和社会基础。2001年,Pentz E.D.通过对合作参考链接服务进行分析后指出,可以通过参考文献追溯,查阅关键词、摘要及正文,及链接访问相关文献等方式,获取更多的知识。〔11〕随着互联网的快速发展和普及,人们迫切需要对异质、异构、异地知识资源进行互联互通和无缝链接,因此,知识链接的研究和应用价值日益凸显。我国学者对知识链接研究起步较晚,源于引文分析和网络超链接研究,曾建勋等系统研究了知识链接的概念和内涵,并分析了知识链接的产生背景、作用、功能和应用。〔12〕
2 基于知识单元的知识链接原理
任何知识单元都不是孤立存在的,相互之间总是存在着某种或明或暗的联系。因此,知识单元之间存在的序化的、结构化的、可理解的、隐藏的联系都是知识链接的基础,知识单元就是通过这些联系相互链接形成知识网络系统。
2.1 知识链接的要素
知识节点(知识单元)和节点之间的联系(知识关联)是构成知识链接的基本要素。知识单元之间以某种关联为基础,并按照一定的规则链接在一起就形成了知识网络。
广义上的知识单元泛指任何一种相对独立的知识内容和形式,包括文献、人脑、实物等知识载体和公式、原理、概念、语词等知识内容。知识单元是具有独立存在意义的知识单位,包含一定单位的知识内容或知识载体,具有不同的表现形式和类型属性。知识单元由文献单元、信息单元演变而来,与文献单元、信息单元有着共同的特征,但也有一定的延伸和拓展。具体到文献载体单元,其外在(形式)特征(如题名、作者、机构、出版社、出版时间、页码等)和内在(内容)特征(如摘要、主题词、关键词、参考文献、表格、图形、分类号等)都可构成知识单元,如主题词知识单元、关键词知识单元、学科知识单元等。知识单元具有独立性、多维性、分合性和链接性等特征,〔13〕这些特征知识单元可以通过多种链接方式构成知识网络,知识单元重组可能产生新的知识,是知识发现和知识创造的一种方式。
知识关联是知识单元间存在的显在或隐含的联系。唯物辩证法认为,世界是普遍联系的,没有孤立存在的事物和现象。知识是人类在实践中认识客观世界(包括人类自身)的成果,具有继承上的遗传性和发展上的变异性,不同知识主体对知识的吸收、利用和创造导致了新知识的产生,知识的不断流动形成聚集和扩散效应。知识的这些特征使得知识单元间存在着各种复杂的联系,构成了知识链接的基础。
提取知识单元并对其进行链接组织就形成了知识要素词典,知识要素词典是知识单元和知识关联或链接的集合。在提取知识单元的基础上,它通过对知识单元的内容和属性进行分析,同时对知识单元进行格式转换、智能标引、查重过滤、分类聚类等过程就构建了知识单元之间可用的人为关联,这些关联就是知识链接的中枢。
2.2 知识链接的方式
知识单元之间的联系是知识链接分析的基础。通常我们把知识单元之间联系的总和称为知识关联,通过判断知识单元之间是否具有关联关系来确定是否建立链接。从不同的角度出发,知识关联可以划分成不同的类型。从知识的继承性和稳定性出发,知识关联有同一性、隶属性和相关性三种类型。〔14〕从知识分类的角度出发,知识关联可分为显性关联和隐性关联两种;从知识单元的具体表现形式出发,知识关联可分为学科关联、主题关联、载体关联和内容关联。〔15〕从知识关联的存在形式出发,知识关联可分为自然关联和人工关联。将同类知识单元按照不同的知识关联序化链接可以形成不同的知识体系,这是知识组织、知识检索、知识服务等知识管理活动的基础。
2.3 知识链接的建立
以知识单元之间的关联关系为基础,利用数据挖掘中的关联规则技术对分类的知识单元建立关联,即可实现具有关联关系的知识单元之间的有效链接。通过获取知识单元所表达的概念、事实或体现知识单元的具体公式、定律、数据、原理,如提取主题词知识单元、关键词知识单元、概念知识单元,并根据用户的需求,与知识要素词典中的知识单元进行语义或语法匹配,将具有同一性、隶属性或相关性的知识单元或属于同一学科、同一主题或同一知识载体、同一知识内容的知识单元链接起来,就构成了知识集合或知识网络。对知识集合或知识网络进行分析,即可从整体上分析它们的网络结构,发现新的知识或重组产生新的知识。目前最成熟的知识载体链接方式就是文献分类系统和引文网络系统,而最成熟的知识内容链接方式就是使用主题图和超文本链接来实现基于知识单元的知识链接,按主题法和超链接对知识单元进行标引组织,将具有关联关系的知识单元链接,并与相关知识资源链接,正确表示知识概念间的相关关系,形成结构化的知识网络。知识单元间常常是多种关系并存交织在一起,形成复杂的网络关系,而且知识关联往往不是直接的、显在的、直观的,而是间接的、隐含的、难以直接和直观表达的。因此,基于知识单元的知识链接尤其是隐性知识单元的链接,以及技术层面上的相关算法,还有很大的探讨空间。
3 基于知识单元的知识链接模型
从整体上看,基于知识单元的知识链接,是一个抽取规范知识单元并建立知识单元库,再通过知识单元之间的关联关系建立知识网络的过程,每个知识网络都有自己独特的知识结构和特征。如图1所示。
3.1 知识链接的流程
根据知识网络的结构和特征以及形成过程,知识链接的整个流程可分为三个步骤完成:第一步是抽取知识单元,构建知识单元库;第二步是判断知识单元间是否有关联关系;第三步是对具有关联关系的知识单元进行链接,构成知识单元链接结构图,并实现知识单元到信息资源的链接转换。这一流程突出了知识单元的整合性和可重组性,知识单元通过知识链接进行整合之后,将知识重组为另一种增值的知识结构,这个过程为实现以知识单元为基础的知识链接、知识组织等知识管理活动奠定了理论基础。基于知识单元的知识链接建立了不同知识单元之间以及知识与文献、信息之间的关系,拓宽了用户获取知识的渠道,扩展和延伸了知识管理与知识服务的空间和范围。
图1 基于知识单元的知识链接流程
3.2 知识单元的抽取与知识库的构建
确定知识单元,通过对知识载体(如文本、网络信息等)进行层次分析和内容分析,获取特征词,并借助特征信息库与知识元库中的知识要素进行匹配,实现导航链接,形成新的、增值的知识库。〔16〕从知识载体层次分析和内容分析到构建知识库的过程,实现了知识单元的规范抽取,为构建基于知识单元的知识链接提供了技术基础。如图2所示。
图2 知识单元的提取与知识库的构建
3.3 知识链接的基本模型
通过知识单元的提取和知识库的构建形成了知识链接的两种基本结构模型,即树状知识链接模型和网状知识链接模型。
树状知识链接模型是通过知识单元间存在的线性、层次、等级关系而构成的结构体系,知识单元由上到下、由整体到部分、层层往下分布,其层次关系是按照知识单元的横向关联与纵向关联对知识划分而得到的,横向关联是指知识单元间的并列或同级关系,纵向关联是指各知识单元间的父子或从属关系。如图3所示。如文献分类体系、概念逻辑体系、网站组织体系等。
图3 树状知识链接模型
网状知识链接模型是通过知识单元间存在的复杂的、多样的、多重的、非线性的关联关系而构成的知识网络体系。每一个知识单元都是知识网络结构中的一个节点,节点之间的链接表示知识单元之间存在的联系,关联关系紧密的知识单元形成小的知识聚类或集合,多个知识聚类或知识集合就构成了整个知识网络。如图4所示。如引文知识网络、语义知识网络、超链接知识网络等。
图4 网状知识链接模型
4 基于知识单元的知识链接应用
基于知识单元的知识链接分析在知识组织、知识检索和知识服务等知识管理活动中具有广泛的应用。
4.1 知识链接在知识组织和知识地图中的应用
知识地图是一个智能化、可视化的知识导航工具,可以为用户提供异地、异质、异构的知识资源,并利用RDF对知识资源进行语义性描述,实现知识的机器可理解。〔17〕布鲁克斯最早提出知识地图的概念,他认为〔18〕:“知识地图是在对逻辑内容信息进行分析的基础上,找寻到人类所创造的知识同人类思想间的联系和影响,从而为用户揭示知识之间的关系和结构。”知识地图是知识组织的一种基本形式。众多学者在此基础上对知识地图进行了系统研究,推动了知识地图理论、方法、技术和应用的快速发展。
从知识地图的结构来看,大多数学者都认为知识地图由知识节点和知识链接构成。基于知识单元的知识链接把具有同一、隶属或者相关关系的知识单元进行关联,从而形成一种结构化的知识集合,知识单元之间通过语义链接形成知识链接网络,从而形成知识地图,为知识的有效组织和可视化检索提供了方便。由此可见,知识链接在知识地图中发挥着桥梁和中介作用,是构建知识地图的关键要素,而且以知识单元和知识链接为基础构成的知识地图和知识网络,实现了知识组织和知识检索系统以知识单元为单位的语义互联推理,消除了知识资源的孤岛状态。知识组织的过程就是知识图的构建过程,而知识检索的过程就是“按图索骥”的过程。
4.2 知识链接在知识发现与知识创新中的应用
人类的知识结构是由具有复杂关联关系的不同知识单元组成的知识网络系统,每个知识单元又由独立的知识元通过知识链接排列组合而成。因此,知识发现就是从知识集合或知识网络中识别出有效的、新颖的、潜在的、有用的知识单元(知识元)和知识关联以及最终可理解的非凡过程。知识发现将信息变为知识,从数据信息矿山中找到蕴藏的知识金块,并找出知识间存在的隐含联系,为知识创新作出贡献。
基于知识单元的知识链接,实现了对知识单元的抽取、分类、聚类、标引等处理,再通过知识关联,在各知识单元之间或知识单元内部建立网络化知识链和语义链,体现了知识引用与被引用的关系,这本身也是一个发现和创造新知识的过程。用户利用知识链接原理,在知识单元库中获取所需的知识单元,还能发现更多密切相关的知识单元,并通过知识单元的组合实现知识的聚变和裂变,进而产生新的知识单元,同时通过知识单元之间的链接发现更多与之相关的知识单元,由已知知识链接到未知知识,为用户发现知识和重组知识提供了既直接又有力的帮助,从而更有效地满足了用户的知识需求,这本身也是知识管理的一种创新。
4.3 知识链接在知识检索与知识评价中的应用
在图书情报领域,众多学者认为知识检索是指在信息检索机制中引入语义本体技术,使检索系统能对查询请求和信息源进行语义分析,知识检索的原理为:建立领域本体→数据分类入知识库(元数据库)→检索请求规范化→检索请求语义匹配→定制处理结果返回用户。这一过程实质上也是知识单元的抽取、知识链接和知识网络的构建过程,可以说知识链接为知识检索、知识服务和知识评价的实现提供了理论、方法和技术基础。知识检索过程包含着用户所需知识单元与知识库中知识单元的匹配与评价,知识服务过程包含用户对知识检索结果的评价,同时对知识单元和知识链接本身的数量特征和结构特征进行研究也是知识评价的重要内容。
知识检索和知识评价的实现主要是采用分类法、主题词法对知识单元进行标引后,建立知识单元库,通过知识关联检索,以文献的知识特征单元为检索词,如主题词、关键词、作者、机构等,把知识单元链接构成的语义网络和知识网络形象描述出来,并由知识单元检索出更多不同的文献资料,可以实现跨领域、跨学科、跨专业、跨数据库的检索,使用户的检索手段更加多样,检索结果更加全面,从不同层次上满足了用户的检索需求。同时,以知识单元为知识评价要素,借助基于知识单元的知识链接网络,从地区、时间段、机构、人员等不同的角度对知识单元进行统计分析,可以实现知识评价。
5 结语
知识链接是实现信息服务向知识服务转变的关键。基于知识单元的知识链接在知识组织和知识地图构建、知识发现和知识创新、知识检索和知识评价等知识管理活动中发挥着重要作用,有利于异质、异构、异地知识资源无缝链接的实现,有着重大的理论意义和现实价值。但目前学术界对基于知识单元的知识链接研究大多还停留在理论和方法层面上,需要加强技术实现和实际应用研究。
1,2.徐荣生.知识单元初论.理论与工作研究,2001(7):2-5
3-5.化柏林.国内外知识抽取研究进展综述.情报杂志,2008(2):60-62
6.文庭孝,罗贤春,刘晓英等.知识单元研究述评.中国图书馆学报,2011(5):75-86
7.姜永常,杨宏岩,张丽波.基于知识元的知识组织及其系统服务功能研究.情报理论与实践,2007(1):37-40
8.刘晓蔚,任瑞娟.基于知识单元的高校图书馆服务管理再思考.图书馆理论与实践,2007(5):82-85
9.温有奎.知识元挖掘.西安:西安电子科技大学出版社,2004
10.王子舟.图书馆学基础教程.武汉:武汉大学出版社,2003
11.曾建勋,赵捷,吴雯娜等.基于引文的知识链接服务体系研究.情报理论与实践,2009(5):1-5
12.陈兰杰.知识链接理论与实践的三次擅变探究.图书情报工作,2010(12):46-49
13.付旭雄.基于关联数据的知识地图中知识链接构建研究.武汉:华中师范大学硕士学位论文,2012:34-35
14.曾建勋.知识链接的研究现状与发展趋势.情报理论与实践,2011(2):119-123
15.刘晓英.知识关联及其应用研究.湘潭:湘潭大学硕士学位论文,2010:14-15
16.杨曦宇.知识地图研究综述.图书馆学刊,2007(3):133-136
17.知识发现.百度百科.〔2013 -12 -16〕.http://baike.baidu.com/view/77853.htm
18.程慧平,陈永超.国内知识检索研究进展.图书情报工作,2011(10):126-129