美国蒙大拿州立大学图书馆知识图谱服务研究与启示
2020-07-14党洪莉谭海兵
党洪莉 谭海兵
摘 要 文章通过梳理蒙大拿州立大学图书馆知识图谱服务内容与形式,为我国高校图书馆知识服务提供了借鉴。文章概述了蒙大拿州立大学图书馆及其知识图谱项目,重点介绍其构建理念和特点。我国图书馆界在学习蒙大拿州立大学图书馆的先进经验中,应利用知识图谱改善搜索引擎,挖掘知识链,完成“新编目”,以知识图谱助力智慧服务。
关键词 图书馆 知识图谱 智慧服务
分类号 G259
DOI 10.16810/j.cnki.1672-514X.2020.05.014
Abstract This paper analyzes the contents and forms of knowledge map service in the Library of Montana State University, aiming to provide reference for Chinese college libraries in knowledge service development. It briefly introduces the development of the knowledge map project of the Library of Montana State University and its history, highlights the concept and characteristics of its library knowledge map construction. In learning the advanced experience of the Library of Montana State University, domestic libraries should use knowledge map to improve search engine, excavate knowledge chain, complete “new catalogue”, and use knowledge map to help intelligent service.
Keywords Library. Knowledge map. Smart service.
0 引言
伴隨着互联网技术的飞速发展和数据的爆炸式增长,大量知识隐藏于网页中的非结构化文本和半结构化表格内,需要以更智能化的方式组织揭示,以便人们更加快速、准确、智能地获取信息。为了满足这种需求,知识图谱应运而生[1]。自刘则渊等引入“知识图谱”以来,其在我国的图书情报、信息科技等领域迅速发展。关于知识图谱的概念,国内专家给出了多种释义,却并未形成统一定义。大部分学者普遍认为知识图谱的学科定位本质上属于计量学,旨在借助知识可视化手段实现科学知识结构、关系、演化趋势等方面的可视化呈现[2]。在这一方面,笔者认为美国的蒙大拿州大学在知识图谱运用方面做出了很好的示范。
蒙大拿州立大学(Montana State University,简称MSU),始建于1893年,是全美排名领先的大学之一。卡内基基金会(The Carnegie Foundation)甚至将蒙大拿州立大学列为顶尖的研究型大学,与哈佛大学、耶鲁大学等名校齐名。蒙大拿州立大学图书馆在为该校的学生和教师提供研究和信息资源,并为蒙大拿州公民和该州的商业社区提供服务时,构建了图书馆服务知识图谱[3]系统,使用链接和结构化数据、语义关联技术实现了集图书馆人员、资源和服务于一体的图书馆知识服务网络规模发现,极大的提高了MSU图书馆的影响力。本文拟通过对MSU图书馆知识图谱内容及特点的分析,意在为我国研究型大学图书馆更加有效地开展知识服务提供借鉴。
1 MSU图书馆知识图谱构建内容与形式
MSU图书馆位于校园中心,为学生和教师提供全方位的图书馆收藏和服务,包括140多个公共计算机工作站、打印机、扫描仪、技术丰富的小组学习室和安静的学习区。馆藏藏书支持蒙大拿州立大学各学科尤其是农业、科学、健康和技术领域的教学和研究。图书馆还收藏了蒙大拿州农业和牧场、黄石国家公园及其生态系统、蒙大拿州历史、鳟鱼和鲑鱼等领域的特殊藏品。图书馆专业图书馆员和工作人员为个人和团体使用馆藏、获取在线信息资源和指导提供帮助。
1.1 链接资源
知识图谱的主要任务在于揭示知识领域随时间演化的动力机制,目的是探查并检测某一知识领域的发展[7]。图书馆知识图谱的数据来源及适用对像是图书馆知识域,其载体大多是研究主题相关的各类科学文献资源,所展现的知识结构关联多为知识载体元素关联。可以说,充分展示呈现资源是图书馆知识图谱的关键。MSU图书馆主要从以下两个方面进行了充分揭示。
首先是对网站进行重新架构。使用schema.org中collectionpage、itempage和aboutpage的is part of和web page实体类型对页面之间的关系进行编码。使用schema.org中的产品类型,将库数据库或资源的每个项目页建立为产品实体。将主题和主题词汇编码到人类和机器的所有相关页面中,允许在HTML页中对外部词汇表进行编码和引用的扩展。建立URL模式,设置标识符,并设置规范的URL模式及用于索引的XML站点地图。在使用链接数据重塑库数据库列表时,现在的MSU图书馆目录分为题名、作者、主题、数据库、课程导航几个入口。数据库又以A-Z 26个首字母顺序分类列出,也可以以数据库名称进行检索。用户以主题、格式、站点地图的方式进行浏览。具体网页视窗如图1所示。
其次,MSU图书馆还在查询页面中嵌入搜索引擎,并对搜索引擎进行了优化。在搜索引擎设置方面,注重相同馆藏分阶段优化应用,重视随时间变化的分析结果。以W3C标准全网域呈现图书馆各类数据,注重描述的细粒度,以便能更加清晰帮助搜索引擎定位,提高图书资源的搜索引擎可见度,辩识网页中的“知识”。通过整合融合和与其它数据的互操作,使书目数据及其相关模型更有用。通过以上的改进措施,MSU图书馆的总点击量和搜索量明显增长。