我国“五计学”知识融合的思考
2019-03-18宋艳辉邱均平
宋艳辉 邱均平
摘要:[目的/意义]在当今数字网络、知识经济和大数据背景下,“五计学”学科群表现出一些新的发展特征和发展趋势,“五计学”领域出现了新现象和新问题,需要采用新思维和新方法来研究和解决“五计学”研究成果,整合“五计学”研究方法,为“五计学”的融合发展指明方向。[方法/过程]本文运用内容分析法与归纳演绎法对相关研究进行分析。[结果/结论]尝试性地提出了6种“五计学”知识融合实现模式:基于语义规则的知识融合,基于贝叶斯网络的知识融合,基于D-S理论的知识融合,基于知识挖掘的知识融合,面向网格环境的知识融合以及面向近似知识的知识融合;提出了2种“五计学”知识融合过程控制手段分别是知识融合评价和知识融合系统。
关键词:五计学;知识融合;语义网络
DOI:10.3969/j.issn.1008-0821.2019.02.001
〔中图分类号〕G250252〔文献标识码〕A〔文章編号〕1008-0821(2019)02-0004-04
“五计学”是以“文献计量学”为起点的。1969年,学术文献中相继出现了两个类似的英文术语:Bibliometrics(译为文献计量学)和Scientometrics(由俄文转译成英文),译为科学计量学。随着社会的进步和科学技术的发展,人类社会先后出现了信息化、网络化、知识化的新趋势。这些新的社会环境和技术条件的变化,深深地影响着计量学科的发展,于是“信息计量学”、“网络计量学”和“知识计量学”便相继应运而生。“五计学”的诞生和发展不仅具有科学意义,更是量化分析方法的主要来源。目前,我国人文社会科学创新主要有方法创新、理论创新(学术观点)和学科创新(分支学科)。而“五计学”的融合,特别是方法融合更有利于科学研究的方法创新,大大提高“五计学”的应用价值和方法论意义,从而有力地促进整个人文社会科学的快速和健康发展。知识融合,是从知识整体的角度,依据一定的目的需要、理念设计,把不同实践要素按照合理的活动程序、配置比例,将各种知识片断或分散的对象元素或单元再建构,使之具有可以发挥功能的总体性能。知识融合对于更新组织的知识非常关键,其体系结构是一个开放式结构,与外界存在广泛的交流和接触。知识融合有着多种类型、多种层次、多种方式,并有着与创新规律一致的融合机制,可以分为形式融合、分类融合、立体融合和用途融合等。知识融合是知识管理的一个重要环节,融合把各部分的功能组合成一种新的功能,把各部分的效用结合成一种新的效用,通过融合产生了系统创新的功效。
1相关研究
2010年,刘则渊等提出了“SIBW”计量学科群[1]。2015年6月,在第九届全国科学计量学与科教评价研讨会上作了题为“我国“五计学”的进展与趋势”的大会报告,再一次详细论述了“五计学”问题,得到与会学者的普遍认同。2015年,侯剑华等提出了“泛知识计量学科群”[2]。2017年10月,第十六届国际科学计量学和信息计量学研讨会(16thISSI)和第十届全国科学计量学与科教评价研讨会都将“五计学”研究作为大会的重要议题。武汉大学研究团队先后出版了“五计学”研究系列丛书[3-7]。
杨小华等认为,随着信息化、网络化和知识化的推进,“五计学”相互融通,呈现出“计量学”学科群相互促进、共同发展的态势[8]。“五计学”之间在研究对象、研究内容、研究方法、数据来源、计量指标等方面呈现出交叉关联、互为引用、相互融合的发展特征和趋势[9]。计量学科在“五计学”的基础上,形成了泛知识计量学科群,具有明显的交叉性和协同性,表现为以基础理论、研究对象和研究方法与工具等为核心要素的协同演进。
2“五计学”知识融合实现模式
2.1基于语义规则的知识融合
基于语义规则的“五计学”知识融合能实现深入的信息集成,提供更加集成的答案,对知识源数量较多的情况以及对时间较为敏感的任务来说,尤其彰显价值。知识与信息的主要区别之一,在于知识具备推理属性,构建本体是实现知识推理的重要手段,因此,基于语义规则实现知识融合可以成为“五计学”融合的主要实现模式。
第一种做法是建立语义规则,实现知识融合。可以开发一种基于语义规则的融合算法,将知识映射到本体库,并转换成元知识集,本体和元知识集共同构成知识对象。为了融合知识对象,接着正式地描述了一组比较规则,来明确融合条件,同时通过结构格式和语义规则过滤知识对象,能够实现:①将知识对象分成不同粒度层级;②指导融合过程,以规避不合逻辑的结果。例如,Xie等人[10]就曾针对网络信息中的农业知识,研究了基于语义规则的农业知识融合,不仅涉及通过链接向用户传递结果信息,还涉及通过解决结果一致性、去除重复项等方法融合来自农业信息资源的知识,并实际设计了基于知识融合的信息获取界面。
第二种做法是结合图论与本体,实现知识融合。既有关系图,也有主题图,进而实现语义可视化。
第三种做法是基于知识空间理论的新型知识融合方法,将知识空间中的对象结点,在不同粒度的结构中表示,每个知识对象有相应的本体对象和元知识集,知识对象之间的距离由结构和语义关系来定量化。这种知识聚类方法调整了空间结构,能够提高知识搜索的策略,优化知识融合过程。
2.2基于贝叶斯网络的知识融合
综合贝叶斯网络(Bayesian Networks,BNs)是实现“五计学”知识融合中非常有潜力的技术。笔者认为,一个有效的贝叶斯网络综合方法不应在底层贝叶斯网络上添加任何特别的约束条件,以便该方法可以应用于这5种知识工程情境。总的来说,可靠的贝叶斯网络综合知识融合方法,应当满足3个基本标准,即避免循环、保持贝叶斯结构条件的独立性和保留个体贝叶斯参数的特征。为了实现多个贝叶斯知识源的融合,解决在不确定环境下的“五计学”知识融合问题,可以将概率模型表示成贝叶斯知识基础,并提出贝叶斯知识融合的算法,该算法允许将多个贝叶斯知识基础融合成单个贝叶斯知识基础,同时保留所有输入源中的知识。这就实现了通过提供一个框架,对多个知识源进行简易聚合和逆向聚合,同时框架中的所有意见都得到保留和推理。可以进一步设计和开发的新型贝叶斯组合方法,主要关注两个方面:①用于组织贝叶斯网络的基因算法,不对底层贝叶斯网络施加任何特别的约束条件;②一种有效方法保持贝叶斯结构条件独立性和保留个体贝叶斯参数特征。
2.3基于D-S理论的知识融合
D-S(Dempster-Shafer)证据组合理论作为融合方法,首先构建不同观测结果的信任函数,利用Dempster证据组合规则将之组合,再根据一定的规则对组合后的信任函数进行判断,最终实现融合和决策选择。在许多应用情境中,有大量的知识需要融合,例如,涉及计量数据样本的理论与方法等,基于D-S理论的知识融合就有了用武之地,其包含了研究了3个组合规则,即原始的D-S规则、墨菲规则和基于非精确狄利克雷模型的规则,D-S规则和墨菲规则有汇聚行为,这种汇聚行为并不与新需求相一致。当许多计量理论与方法被融合的时候,只有基于非精确狄利克雷模型的规则呈现出了所需求的行为,所以基于非精确狄利克雷模型的规则,具备用于合作知识发现与数据挖掘或者生物计算领域的潜力。
2.4基于知识挖掘的知识融合
近十年来,知识挖掘技术得到长足发展,能够从数据中抽取分类模型,但是结果通常不是非常直观,或者缺少对于领域专家来说符合逻辑的模式。具体实现如下:通过扩展蚁群挖掘分类技术来包含领域知识,通过改变环境和影响启发值,分别将蚁群搜索限制和引导向专家认为符合逻辑的、直观的解空间区域,从而实现“五计学”的知识融合。因此,基于知识挖掘的“五计学”知识融合,较为适用于非专家知识与专家知识的融合。
2.5面向网格环境的知识融合
以往网络关注信息的交流,现在网络开始强调知识重用,以形成大型分布式知识基础。语义网格将信息和服务进行了良好定义,扩展了现有网格来支持软件代理、用户和项目合作。在上述过程中,要将各种计量知识源有效地组合,来辅助研究者进行高效推理或者促进研究者合作,“五计学”知识融合在网格环境中的应用因而受到重视。
2.6面向近似知识的知识融合
针对各种计量知识资源中的近似知识,集中精力定义知识融合的整体机制,继而开发了有利于保障融合知识的技术,融合的知识可被表达成命题动态逻辑的Horn子集。另一方面,命题逻辑可视为第一顺序逻辑的子集,第一顺序逻辑是在描述性逻辑精神(Spirit of Description Logics)中定义概念的天然工具,其定义的概念可以进一步用于定义各种本体,例如那些在语义网中可用的本体。使用模糊集和关系的一般式,研究分布异构信息源中知识的融合,该一般式依赖任意相似关系的存在。在多代理系统中引入了知识融合框架,代理的个体感知能力由相似关系表示,再进一步聚合形成团队的联合能力,该聚合已经通过动态逻辑被正规化,允许从个体层次向社会层次转移。建立了基于规则的分层结构,在提出的框架中,将动态逻辑的Horn子集与推理数据库技术结合,获得的知识融合规则在现实数据中成功地得到应用。
3“五计学”知识融合的过程控制
3.1知识融合评价
“五计学”知识融合的评价机制有利于更好的发现潜在知识,融合知识的语义相关性和准确性也能得到提高,所以应更加重视知识融合的评价问题。为了控制融合知识的规模,以及避免非逻辑的知识,可以构建具备属性值的融合知识测度,为知识融合算法提供指导:首先,分析知识元素与基于本体的语义相关性之间的关系强度;然后,利用最大熵值模型定义和分析了融合知识(Fusion-knowledge)的语义熵。在此基础上,通过融合知识测度构建了加速适应度方程,通过提高人群选择和基因操作将基因仿真退火算法应用到知识融合。根据知识熵平衡方程的分析,基于信息扩散理论的评价机制被用来提高融合知识的准确度。笔者认为,“五计学”知识融合的过程需要评价、反馈和控制,以提高融合的效率。针对融合进行的评价研究,有助于用户选取最合适的融合算法和融合步骤。
3.2知识融合系统研究
在知识融合实现模式和知识融合评价的研究基础上,需要设计和开发实际的知识融合系统,一方面检验提出的融合算法和评价方法;另一方面为投入实际应用奠定基础。總的来说,知识融合系统的开发,在技术架构和设计细节上,知识融合研究者需要逐渐认识到,需要根据应用需求,在通用知识融合系统基础上,进行个性化定制,来实现多层次、个性化、创新性的知识服务。知识融合系统应用问题解决方法技术(Problem-solving Methods Technology),允许综合面向融合过程子任务的方法,也允许选择最佳的方法,这取决于领域以及任务的具体内容。系统应为一种自适应知识融合系统,展示具有反馈和自适应机制的知识融合方法,所提出的反馈机制基于知识空间和应用服务之间的消息交流,还能评价融合结果和优化融合过程以适应需求。
4结语
本文从两个方面探讨我国“五计学”的知识融合发展问题,一是“五计学”知识融合实现模式;二是“五计学”知识融合的过程控制。最后,笔者认为,随着大数据时代的到来,大数据环境下“五计学”的知识融合,还需要重点解决大数据分析问题。“五计学”侧重于对不同的计量对象,不同的文献、信息、知识、数据类型的整合与分析。唯有做到这一点,注重量化分析的“五计学”才能达到本质上的融合。因此,需要我们针对大数据时代面向5种知识源的知识融合过程模型进行详细分析与设计,针对典型的大数据知识源,进行知识融合实现模式的设计,为大数据时代“五计学”知识融合的实现提供解决方案。拟解决的主要问题包括:①大数据知识融合过程模型的构建。结合大数据的特点和知识源类型,设计大数据知识融合的流程步骤,分析各功能模块之间的关系及所需的关键技术,探讨融合知识服务的应用模式及实现方案,定义大数据知识融合过程模型。②基于分布式知识库的大数据知识融合实现模式设计。分析大数据时代分布式知识库的构成特征和知识抽取方法,研究大数据时代元知识抽取和元知识库构建方法,设计知识融合算法和融合规则库构建过程,通过知识抽取、知识转化、知识清理、知识集成,形成知识仓库,实现知识融合。③基于网络知识源的大数据知识融合实现模式设计。分析大数据时代网络数据迁徙的途径和方法,研究通过Web服务实现对异构网络知识源进行知识发布、知识表示的过程和方法,研究大数据时代知识检索和知识网络构建流程与方法。
参考文献
[1]刘则渊,朱晓宇.国际科学计量学及其姊妹学科的计量与图谱[C]//第七届中国科技政策与管理学术年会论文集,南京:第七届中国科技政策与管理学术年会,2011.
[2]侯剑华,都佳妮.泛知识计量学科协同演进初探[J].情报科学,2015,33(7):7-10.
[3]邱均平,等.知识计量学[M].北京:科学出版社,2014.
[4]邱均平,等.网络计量学[M].北京:科学出版社,2010.
[5]邱均平,等.科学计量学[M].北京:科学出版社,2016.
[6]邱均平,等.信息计量学[M].武汉:武汉大学出版社,2007.
[7]邱均平.文献计量学(第2版)[M].北京:科学出版社,2018.
[8]钟积奎,杨小华.学习过程的知识转化模式新探——以“文献观”学习过程为例[J].现代情报,2010,30(5):28-33.
[9]赵蓉英,魏明坤.“五计学”在我国的发展演进分析[J].现代情报,2017,37(6):155-167.
[10]Xie Nengfu,Wang Wensheng,Yang Xiaorong,et al.Rule-based Agricultural Knowledge Fusion in Web Information Integration[J].Sensor Letters,2012,10(1):635-638.
(责任编辑:马卓)