图书情报领域知识融合研究现状分析
2020-05-15张蓉张澜
张 蓉 张 澜
(华中师范大学,湖北 武汉 430070)
0 引言
大数据时代下,庞杂多样的数据从各种不同的渠道产生,对比单一数据源的研究,对这些多源、异构的数据进行分析和研究,可以更好地把握问题的整体性, 因而多源数据融合就成了研究的一大难点和重点。知识融合是在数据融合的基础上发展而来的,数据融合最初应用于军事方面综合多个数据来辅助分析[1],之后数据融合的概念和研究又扩展到了信息融合,其处理对象还包括了多源信息,范围要更加广泛[2]。而如今研究范畴又扩展到了知识融合,不仅局限于数据和信息,更将知识库或者已有信息库中的知识纳入到各种方法、专家经验等[3]。
然而,目前学者对于知识融合的概念并没有统一的认识,同时知识融合的相近概念又很多,如知识整合、知识聚合等,知识融合的基础理论研究仍需完善。知识融合的研究还处于起步阶段,目前的研究并不算很多,已有研究纷繁杂乱,为了更好的了解目前图书情报领域知识融合研究现状,本文采用共现分析、聚类分析等对近年来知识融合的相关文献进行分析,把握知识融合现状,分析目前研究的热点以及未来可以继续研究的方向,以期更好地在这个领域进行研究。
1 数据来源与方法
本文选择中国知网数据库进行文献分析与研究。中国知网数据库是中国第一个连续的大规模多功能、集成化学术期刊全文检索系统,收录范围涵盖各个领域[4]。在中国知网数据库中,限定领域为图书情报学,以“知识融合”作为关键词进行检索(检索截止到2019年11月),共检索到469篇文献,剔除无关文献之后剩余418篇。
本研究获取相关数据后,首先得到知识融合相关研究的时间和空间特征,然后对知识融合研究主体分布进行分析,之后采用SATI、UCINET等工具挖掘出研究的关键词,并进行高频关键词共现分析以揭示研究内容特征,然后采用SPSS做聚类分析,把握研究的集团化特征,最后总结目前知识融合研究的热点及不足,针对这些问题提出若干建议。
2 结果分析
2.1 知识融合研究的时间、空间分布特征
2.1.1 知识融合年度发文量分析
通过对年度知识融合文献产量进行统计分析,可以直观的看出知识融合领域整体发展态势。从图1可以看出,目前知识融合研究仍然还有很多的发展前景,自从2002年我国首次发表知识融合的论文以来,知识融合相关研究都不是很多,说明很长一段时间学者的关注度都不够,处于起步阶段。从2015至今知识融合研究逐渐引起关注,文献产量开始增加,但还未到达高峰期,说明知识融合研究逐渐进入学者的视野,未来拥有广阔的可能。
图1 知识融合研究年度产量分布
2.1.2 知识融合研究的期刊分布特征
期刊分布可以了解知识融合研究的核心期刊特征。经过分析知识融合相关文献发布于240种期刊,有194种期刊只发表了一篇文献。在剩余的46种期刊中,又有14种期刊发文量大于2篇,如图2所示。从图2可以看出,《情报理论与实践》发表的知识融合文献最多,为10篇,其次为《图书情报工作》《图书馆学研究》,同时可以看出,除图书情报学之外,还有一部分学科处于交叉状态,如教育学、工程学。
图2 知识融合期刊发文量
2.2 知识融合研究主体分布特征
对领域内学者分布特征进行分析,可以有效发现目前知识融合领域内核心力量和学者之间的合作关系。经统计,知识融合相关文献的学者共有814位,其中绝大多数学者只发表了一篇论文,发表两篇及以上的作者仅有64位,邱均平发表数量最多为6篇,其次邹湘军发表了5篇。
对这些学者之间的合著关系进行研究,结果如图3所示,图中的节点为作者,节点之间的连线代表相关学者之间的合作关系,如果学者之间的连线形成网状,代表本领域学者间的联系紧密,交流频繁。而图3所示知识融合领域内学者的联系多为小团体,这些小团体各自分散,形成一个个“孤岛”,表明知识融合领域目前学者之间的关联很小,大部分都是独自研究或者与本机构同事合作,联系松散。
图3 知识融合领域著者合作关系网
2.3 知识融合领域研究热点分析
2.3.1 关键词分布特征
关键词是一篇文献研究内容最为简洁、凝练的概括,通过对关键词的统计和分析,可以发现目前领域内学者研究的主要方向。本文统计了目前知识融合领域内关键词频次,共有1136个关键词,其中167个关键词出现了两次及两次以上,出现频次最高的为知识图谱,共计22次,如图4所示。图4展示了频次为3及3以上的关键词,除知识融合外,知识图谱、本体出现最为频繁,与知识融合的关系最为密切。
图4 知识融合领域高频关键词
2.3.2 关键词共现分析
对出现频次最高的57个关键词(频次>=3)做关键词共现分析,得到关键词共现网络,并进行点度中心性计算,形成点度中心性网络,网络中节点越大,其中心性越高,节点越重要,节点间线条粗细则反映了关键词之间联系的紧密度。如图5可得出结论:目前知识融合领域内,知识图谱研究、知识库、知识推理、大数据、知识推理等节点与知识融合的连线较粗,处在网络的中心位置,与另外的关键词之间的联系较多,在知识融合中处于重要地位,这些也是目前知识融合领域内研究热点,与知识融合未来的发展方向息息相关。
图5 高频关键词点度中心共现网络
2.3.3 关键词聚类分析
将关键词共词矩阵转化为相异矩阵,在SPSS软件中进行聚类分析。具体方法是用SATI得到关键词相异矩阵之后,将数据导入SPSS,采用组内连接得到冰柱图和聚类树状图如图6、图7所示。
图6 关键词聚类冰柱
图7 关键词聚类树状图
对比图6、图7展示的知识融合相关关键词聚类结果,可以将关键词划分为表1所示的5个类团。前三类都只含有两个关键词,第5类包含最多的关键词,而可以看出在类团5众多的关键词中,既有理论研究,又有相关应用研究,同时知识融合领域本身就容易与其他领域实现交叉,因而本文根据表1结果结合实际对知识融合研究内容进行归类。
表1 关键词聚类
(1)知识融合支撑技术、方法研究。由于知识融合起源于传感器信息的融合,因而知识融合过程离不开计算机、信息技术领域的渗透。近年来语义网、XML、RDFS、多Agent系统等跨学科领域技术方法已经应用于知识融合领域[5],成为支撑知识融合研究重要的技术手段。知识融合方法更是广泛借鉴了信息融合算法如贝叶斯网络等[6]。与此同时,基于知识区别信息和数据具有延伸性,可以通过推理来获得新知识,因而知识推理的方法同样适用于知识融合,如基于语义规则的方法[7]与本体论的方法[8]。
(2)知识融合体系、系统研究。知识融合系统的体系架构是指实施知识融合时系统所采用的一般性原理和形式,包括实施知识融合的组成要素及其相互作用等[9]。依照不同的体系架构,融合过程的技术、选择方法、组成部分都会有不同,进而造成融合结果的不同。关于知识融合框架在研究内容中占据重要位置,周利琴等以知识服务需求为导向,构建了面向物化知识仓库、面向虚拟知识网络和面向混合模式的知识融合过程模型,知识融合过程与应用结合起来,促进用户需求的最大化满足[10];朱娟等构建了集数据层、模型层以及应用层为一体的个性化推荐模型,融合用户、商品、情境信息等多源知识融合[11]。
(3)领域应用研究。知识融合最终是面向服务,面向用户的,因而最终都会落脚于实证以解决实际需求。类团中出现了“政府网站”和“信息资源”以及“军民融合”、“竞争情报”这种关键词团体,在军事、政治、教育各种领域内多源知识的融合对决策的准确性、全面性至关重要。如教育学中通过理论与实践的多源知识融合,丰富和拓展教学内容, 激发学习兴趣和创新能力, 促进教学进步[12];化工领域将系统故障数据与专家知识系统通过权重D-S证据理论融合,提高不确定性故障诊断的正确率[13]。
3 结语
本文通过使用SATI、UCINET、Netdraw等工具,对CNKI上获取的知识融合文献进行分析,在目前研究现状进行梳理的同时发现所存在的问题和不足,旨在促进知识融合的进一步发展。
结果表明现阶段知识融合研究虽然已有一定成果,但是存在以下问题:①整体研究仍未达到峰值,后续仍有发展潜力;②目前知识融合研究多为技术、方法、实证研究,基础理论研究还未完善;③学者、机构之间各自为政,交流、合作较少,不易于知识共享和创新;④研究内容广泛、分散,尚未形成整体的、系统的领域体系架构与稳定的研究主题。
以上的分析结论对于知识融合的未来发展具有重要意义:①知识融合研究要紧跟国内外研究态势,跟随时代发展的需要和变化,做到与时代要求紧密关联。在广泛研究发展的同时,要注意形成本领域稳定的研究主题与整体的体系架构,形成本领域区别于其他领域的核心竞争力;②学者、机构之间要加强交流和知识共享,由于知识融合包含计算机、信息技术等各种领域的交叉渗透,因而各个领域人员之间的交流合作对本领域发展有促进作用;③科研人员在立足于实际需求的同时,要注意基础理论的完善,在理论指导下进行发挥领域优势,改善知识服务实际需求。