图书馆学知识图谱的应用
2018-08-06杨海波
杨海波
摘要:知识图谱是自传统的图书馆衍生变革而来的,是图书馆学知识与先进科学理论与方法的融合。文章从知识图谱的内容出发,首先介绍了知识图谱的数据来源与研究路径,然后机构知识图谱、作者知识图谱以及热点知识图谱等三个方面具体举例分析,希望对我国知识图谱的应用有所帮助。
关键词:图书馆学;知识图谱;思考
一、知识图谱概述
知识图谱理论是基于美国学者研发的CiteSpaceII来进行学科领域前沿发展动态分析和规律总结的重要工具。CiteSpaceII是一款可视化软件,可以以某关键词为主题,将当前阶段主题相关学科的研究热点、知识流动以及研究动态等信息以可视化图谱的形式展现出来,一方面是为了正确展示我国图书馆学研究的发展趋势,另一方面也方便了研究学者发掘出不同时间段我国图书馆学研究的核心作者、学术机构、重要文献节点,进而揭示我国图书情报领域的研究热点和前沿以及图书馆学知识的流动特点,具有一定的理论意义与实践价值。
二、知识图谱的数据来源与研究路径
(一)知识图谱的数据来源
知识图谱的数据来源是通过GiteSpaceII软件,在某文献数据库内,如中国知网学术资源总库、中文社会科学英文索引数据库等,以某关键词为主题进行检索,同时拟定检索时间。举例来说,以中国知网学术资源总库为数据来源,以“图书馆学”为“主题”进行检索,通过对检索文献的分析,国内图书馆学的研究文献历史已有十几年,因此,研究的时间范围限定为2010-2017年,检索结果为15万条,利用中國知网的“导出/参考文献”功能导出所选文献,经查重去噪后,去除与本研究关联性不大的文献,得到样本文献92万篇。需要注意的是,在中文社会科学英文索引数据库(CSSCI)下,由于数据格式不支持CSSCI形式,在应用GiteSpaceII进行检索时首先利用Java程序进行格式转换。
(二)知识图谱研究路径
科学知识图谱是信息技术下的发展产物,在图书馆学中,其先进的可视化技术统领了图书馆学的知识范畴,使多层次涵盖下的文献变成了可视图谱。同时,知识图谱可以直观的突显学科的总体倾向、架构内的变更趋势以及传播趋势中相互关联的成分,彰显其相关性。通过知识图谱进行检索,能快速地检索我们所需要的相关文献,方便我们理解它的结构框架和知识体系。
三、知識图谱分析
(一)机构知识图谱
GiteSpaceII软件的应用,可以将某主题下,各组织机构的中论文的发表数目和发表时段进行整理、归纳,并形成一种由不同形式、不同色彩的知识图谱模式。在进行初始运行时,研究人员首先要给数据设置基准参数,才可对机构知识图谱进行解析。如图1所示,其中,最上层表示调研时间,然后依据时间次序,拟定色彩变化的趋势发展。同时在图1中中心圆点代表着某一机构,中心点越大,表明该组织结构被采纳的频次越高。经过解析可知,组织机构分成四层级的差异梯队。引用频次大于等于400的被称为第一层级梯队;图1中包含武汉大学管理学院;引用频次在200-400之间的被称为第二层级梯队;图1中包含北京大学图书馆、中国科学院文献情报中心等;引用频次在100-200之间的被称为第三层级梯队,它涵盖着中山大学资讯管理系、上海市图书馆、国家图书馆、南京大学信息管理系;而引用频次在50-100之间的被称为第四个层级。
通过图1的机构知识图谱,研究人员可以清晰地看到高校相关研究的增长趋势。其中,表征最为突出的是武汉大学信息管理学院,其研究在文献学科中的地位最为明显;接下来是中山大学管理学院,中科院图书馆,中国科学院,文献信息中心和深圳大学图书馆等机构,这些机构的表征颜色都比较深,表明这些机构都在某段时间内,有过十分突出的研究成果;同时,公共图书馆,上海图书馆,天津图书馆也进入了二级阶梯。
(二)作者知识图谱
作者知识图谱是对作者调研的描绘,其获取与机构知识图谱类似。作者知识图谱不仅能直观的表现出作者的影响力,还能从侧面体现出作者对相关学科的贡献。通过以“图书馆学”为主题进行检索得到的作者知识图谱,研究人员通过对作者知识图谱进行分析,可以很容易的发现,在图书馆学的研究中,影响力最大的是张晓林教授,他发表在《中国图书馆学报》的《走向知识服务——寻找新世纪图书情报工作的生长点》这篇文章,有利于拓宽我们的科技视野。其次是吴慰慈教授,他编纂的《图书馆学概论》是图书馆学研究的著作,对于图书馆的理论教学工作具有重要的指导意义。武汉大学的黄宗忠教授和上海的吴建中教授分别在作者知识图谱中排在第三位和第四位,而后还有范并思教授和蒋永福教授,除此之外,还有于良芝教授、李国新教授和王子舟教授等都曾出现过突性影响力。
(三)热点知识图谱
热点知识图谱是对学科相关关键词检索频率体现,知识图谱的表现形式为:图谱中正方形的边框为一个研究热点,内部的结点代表着检索的关键词出现的频率。通过检索可以发现,图书馆学的研究热点主要涉及5个领域,分别包括技术、服务、资源、管理以及综合。其中数字图书馆、图书馆自动化等技术领域,是位于研究热点的榜首。从数字领域分析,研究及实践已经取得了较为突出的成绩;从服务领域分析,频次出现的第二位是信息服务类,主要包括参考咨询等。从管理领域分析,位居第三是图书馆管理,排在其后的是资源领域。
(四)科目根基简介
科目根基是一种双层级的架构,一般可以分为两个层次,其一是早期时段的根本文献,其二是整合频次高、中心关联度也高的文献,这种架构不仅能有效拓展科目学习的知识层面,还对研究根基进行了巩固。其中,研究根基包括科目必备的根基与若干中心节点,前者是图书馆学的重要研究领域,分类依据是按照时间把它们排列同一基准之上。而后者采取惯用的量化途径,通过量化分析进行框架内的节点描画,表征它的必要性。
四、结束语
随着现代可视化电子信息技术的发展,知识图谱的应用可以有效帮助研究人员进行对知识的系统管理、检索以及分析,并且通过CiteSpaceII明确三者之间的内在联系,进而能够有效推动图书馆学科的不断发展。同时,知识图谱的应用,不仅可以帮助研究人员对相关知识进行直观的管理,还为研究人员提供了一个新的检索思路。通过对定量数据的定性分析,知识图谱可以很好的为研究人员指明发展方向。