资源发现系统在图书馆知识服务中的应用
2017-06-30俞力��
俞力��
关键词:知识服务;知识发现;超星发现系统;知识关联
摘 要:知识发现通过深度的知识挖掘技术来实现全方位的知识关联,是图书馆知识服务的基础。文章通过理论分析和实证研究知识服务,探讨了超星发现系统在图书馆知识服务中的作用与局限性,并提出了发现系统的语义化、移动化及协同化的发展思路。
中图分类号:G250.73文献标识码:A文章编号:1003-1588(2017)06-0110-03
大数据背景下,简单的信息发现与获取服务已不能满足用户的需求。用户信息需求的实质不是获取足够多的信息量,而是能够解决用户特定问题的知识求解。因此,用户信息服务必然向为用户提供知识产品的知识服务方式转变。传统上图书馆信息资源系统以发现和获取信息资源为主,已不能满足知识服务的需要。2009年,网络级资源Summon外文发现系统问世以来,越来越多的发现系统被推出,并在知识服务中得到了广泛的应用。
1 知识服务介绍
1.1 知识服务的概念
知识服务是针对用户专业需求,以解决问题为目标,对相关知识进行搜索、筛选、研究分析并支持应用的一种较为深层次的智力服务。它要对查询到的知识信息进行智力开发,通过分析、比较,不仅要提炼出用户需要的知识,还要根据读者的现实需求,将精炼出来的知识形成一个或多个方案提供给用户,使用户能够直接将知识的潜在价值转化为现实效益[1]。知识服务是以服务人员的知识和能力为基础,利用现代技术搜寻、组织、分析和重组各种信息资源,为用户提供知识产品或问题解决方案的个性化、专业化服务,体现了目前对知识服务的理解和定位[2]。
1.2 知识服务的基本特征
知识服务作为传统信息服务的高级形式,具有层次性、过程性、集成性、知识密集增值性等基本特征[3]。层次性表现在系统所提供的知识产品和服务由于所含知识量的不同而存在不同的层次;过程性表现在知识服务贯穿从用户知识需求分析到深度的知识数据挖掘,最终把知识产品提供给用户的反复迭代的整个过程;集成性表现在通过内容挖掘手段、信息抽取方法等,将海量分散的异构信息资源进行整合,形成了动态的网状关联知识体系;知识密集性表现在提供的知识产品和服务包涵丰富的知识量;知识增值性表现在知识服务可为用户提炼出尚未意识到的、潜在的信息需求,更好地提升用户的知识获取、知识利用和知识创新能力。
2 超星发现系统在图书馆知识服务中的应用
知识发現是知识服务的基础,知识发现过程可解释为:首先是数据准备阶段,对各种电子资源、网络资源、实体资源和查询、借阅记录等进行清洗或预处理;其次通过聚类、关联、时间序列预测等挖掘用户感兴趣的模式、规则等,之后形成知识库;最后通过知识服务平台将特定知识产品或服务进行可视化展示和提供[4]。超星发现系统能够实现深入的知识挖掘与数据分析,在知识服务中起着举足轻重的作用。笔者通过理论分析和实证研究,分析超星发现系统在知识服务中的应用。
2.1 在图书馆知识服务中“用户信息检索分析”的应用
2.1.1 超星发现的信息资源覆盖。图书馆的海量文献是发现系统的基础。笔者于 2016年5月19日通过对超星发现进行空检索,获取到633,046,363条记录。聚类内容系统包括中文资源3.0亿条记录,外文3.3亿条记录,图书0.267亿册、期刊3.04亿篇、报纸1.45亿篇、学位论文670万篇等,还有数量可观的会议论文、标准、专利、视频、科技成果等。超星发现基于元数据索引仓储,有良好的检索速度和检索质量。超星发现系统还内置了40万主题词表、600万作者库、30万机构库、8万同义词表、3,500条学科分类表、20万刊名表、600个数据收录来源表、2,500万学术专业词库[5]。这些专业规范知识库的建立可以辅助实现智能检索、规范标引等功能,能够更全面、更精准地命中检索结果。
2.1.2 智能信息检索。超星发现系统具有辅助智能搜索功能,依托系统内置的规范知识库,通过分析用户的历史检索行为,系统可以自动判别并切换到用户近期关注的领域和热点,并同步显示与用户检索主题相应的解释。通过智能检索功能,超星发现能有效地把握检索主题的内涵,精确地定位用户需要的文献,最大限度地满足用户的知识需求。
2.1.3 文献原文获取。超星发现系统也提供基础的信息获取服务,有多种文献原文获取途径。超星发现系统集成了馆藏纸本和电子资源,可直接下载图书馆馆藏资源的电子全文,对于本馆无馆藏的资源可通过文献传递方式快速获取全文。系统可将检索结果收藏到个人学习空间或分享到社交空间,也可将检索结果保存,并以文本、参考文献、EXCEL、EndNote等多种格式输出。
2.2 在图书馆知识服务中“知识发现与处理”的应用
超星发现通过对图书馆的海量资源进行纵横结合、深达知识内在关系的知识挖掘和数据分析,揭示出知识之间复杂的交叉、支撑关系,可对特定年代、特定领域、特定人及机构的学术成果进行大尺度、多维度的对比性分析和研究,并且知识关联能够以可视化方式予以展示。目前,超星发现主要通过以下方式来实现知识关联:①多维分面聚类。超星发现依托高厚度的元数据资源,采用分面分析法,可将搜索结果按各类文献的语言维度、类型维度、时间维度、主题维度、学科维度、重要期刊维度、作者维度、作者机构维度、刊种维度、地区维度以及基金维度等多种方式进行聚类。用户可根据实际需要进行任意维度的组配检索,实现文献的精准化搜索和精炼聚类,将有价值的核心资源按相关度、被引频次、影响因子等方式予以展现。②参考引证分析。各类文献之间的相互参考、相互引证关系是文献之间的知识关联的重要方式。超星发现具有立体的文献引证分析功能,可列表参考文献、引证文献、相关主题文献和相同作者文献等,并提供文献的引证趋势图,能完整地反映文献被引用的生命曲线图。借助文献间的相互引证逻辑关系和引用频率分析,超星发现能有效测定与评价相关文献、作者或机构的学术影响力,也能分析获得相关学术思想的历史渊源、演变规律和发展趋势。③知识概念关联。超星发现可按照不同知识概念之间、知识概念和作者之间、知识概念与机构之间关联的相关性重要程度构成网状的知识关联图谱。通过知识关联图谱,可直观揭示某一学科领域的知识点、作者、机构之间的关联关系,反映出某一学科领域关联知识的相互交叉支持强度,也反映出不同学者、不同机构对某一学科领域的研究强度与贡献大小,为研究者从宏观角度把握学科发展方向、拓展学科研究提供思路。④关联规则扩展。超星发现可对每一检索结果的条目按照关联规则进行扩展。具体来说,可按检索结果的相关文献、相同作者文献、相同单位文献、相同导师指导的其他学位论文、研究者的导师、师兄弟关系图等方式呈现更多相关的文献。通过这种关联规则扩展,可以实现更多角度的知识发现。⑤学术趋势揭示。超星发现具有对检索结果进行年代分布规律分析的功能,研究者可在长时间维度和全面数据分析的高度来洞察该领域研究的起点、成长、起伏和走向,从整体上把握学科研究发展的完整过程,揭示出学术的发展趋势。⑥检索结果相关度排序。从用户信息需求角度来看,除了要求检索准、检索全外,还要求检索结果的文献资源具有新颖度、应用价值高等特征。超星发现系统提供有默认排序、馆藏优先、出版日期降序、出版日期升序、学术性、相关性和引文量等多种检索结果排序方式,满足用户不同的信息需求特点。⑦多主题对比。超星发现具有多主题对比功能,系统提供的可视化图谱包括各频道检索量统计、图书、期刊、学位论文、会议论文、报纸等文献的学术发展趋势,通过揭示和比较不同主题的学术发展趋势,可进行单位学术产出、作者影响力、研究相关领域等多主题对比。
2.3 在图书馆知识服务中“动态跟踪”的应用
将研究主题、作者或机构名称作为检索表达式,并将检索表达式进行RSS订阅或电子邮件跟踪,当资源发现系统中出现和检索表达式相关的新资源时,系统可及时地自动推送到RSS阅读器或电子邮件中。但是,超星发现并未设置该功能,主要是通过系统资源的及时更新来实现对知识最新的动态跟踪。科技查新是了解科研最新动态的基本方法,目前,超星发现无法完全取代查新时通用的国际联机检索系统,其主要作用还是在使用国际联机检索系统前做预检或作为其他信息资源系统的补充。要实现知识的“动态跟踪”,在善用超星发现的基础上,必须要根据研究领域选择和协同利用其他专业数据库。
3 超星发现在图书馆知识服务中的实证研究
3.1 基于研究主题的关联知识网络
以研究主题作为检索点,可形成以研究主题为核心的相关知识点、相关作者、相关机构的关联知识网络。笔者用“信息语义整合”为检索条件,检索到1,977条结果,总被引频次为4,420次,可形成以“信息语义整合”为中心主题的相关知识点网络图谱。与该主题相关的有三组颜色的知识点“气泡”,不同颜色“气泡”代表着与检索主题相关程度的大小,这种知识网络图谱反映了“信息语义整合”研究的主要范畴,具体主要有“本体”、元数据、语义网等内容。对其中的知识点“本体”做同样的扩展,发现与“本体”研究相关的有“本体映射”、语义Web等相关知识点。这种知识点可以继续扩展相关范畴,从而可以形成“主题—知识点”的关联知识网络。
3.2 基于作者的关联知识网络
以作者作为检索点,可形成以作者为核心的相关知识点、相关合作者、相关机构的关联知识网络,从而可以展现作者主要的研究领域、合作者和合作机构。例如:笔者以“钱庆”为作者,以“中国医学科学院医学信息研究所”为作者机构,检索到115条结果,总被引频次462次,发现该作者的研究涉及的领域主要有本体、语义网、知識组织等多个领域;对每个知识点“气泡”做层层扩展,呈现出相关知识点“气泡”组,从而形成该作者的研究领域网络,也能展现与该作者相关的合作者及合作机构的关联网络。
3.3 基于机构的关联知识网络
以机构作为检索点,可以发现某一机构主要研究主题的相关知识点、相关作者、相关机构的关联知识网络,从而可以对该研究机构的研究领域和研究成果进行全面分析。例如:笔者以“中国医学科学院医学信息研究所”为机构,检索到1,571条结果,总被引频次5,606次,发现该机构的主要研究领域有生物医学、医学文献、文献计量学等内容;对每一知识点“气泡”做层层扩展,可呈现出相关知识点“气泡”组,从而形成该机构的研究领域网络,也能展现与该机构相关的合作者及合作机构的关联网络。
4 超星发现系统在图书馆知识服务中的思考
4.1 实现信息语义化以提升图书馆知识服务能力
超星发现建立了一系列关联规则,像基于文献结构中的相同点产生的关联关系,如:相同作者、机构,关键词共现,主题词的上下位、同位、相关等逻辑层次关系,学科分类层次体系,参考与引证关系等[6]。超星发现基于元数据索引仓储,通过元数据聚合、抽取、映射等方法,整合了众多的异构信息系统。超星发现也具备一定的智能搜索功能,诸如同义词自动扩展检索、推荐检索词等,这些功能的完善和提高依赖于信息语义化技术的发展。语义层面的信息整合也可有效克服异构信息系统之间的语义异构,实现信息资源的深度聚合。语义检索技术可以实现检索词的语义推理,建立用户需求和资源之间以及信息资源之间更全面、更精确的语义关联拓展,能更有效地构建出面向用户需求的知识求解。
4.2 增强移动化功能以实现图书馆知识服务泛在化
泛在图书馆已成为图书馆发展及服务的重要理念。泛在图书馆是真正以用户为中心,从用户的需求出发,满足用户实际需要的图书馆。泛在服务的重要特征是网络化、全天候、开放性、多格式、多语种和全球化的服务[7]。泛在环境下,知识服务发展趋势就是要构建开放、有序、动态、高效的泛在化知识服务体系。移动图书馆作为泛在化知识服务的终端,能将服务嵌入知识发现的整个全程,实现泛在知识环境下的“知识发现”。发现系统应充分利用智能终端,为用户提供即时、无障碍、无处不在的泛在化的知识服务。
4.3 通过协同化以实现图书馆知识服务创新
要提升超星发现的图书馆知识服务能力,必须要协同利用其他信息资源系统。图书馆在充分了解学科的相关核心资源及超星发现对相关核心资源的覆盖程度的基础上,要根据学科特点选择专业数据库。在大数据时代背景下,协同化不仅表现在资源系统的协同,还要包含图书馆组织内部的协作、图书馆之间的协作以及和馆外相关机构的协作,通过深度联合、协同与共享可有效地实现图书馆知识服务创新。
参考文献:
[1] 戚建林.论图书情报机构的信息服务与知识服务[J].河南图书馆学刊,2003(2):37-38.
[2][3] 张红丽,吴新年.知识服务及其特征分析[J].图书情报工作,2010(3):23-27.
[4] 邵慧丽,张帆.基于知识发现数字图书馆知识服务研究[J].图书馆,2016(2):70-73.
[5]王伟.发现系统到底能让我们干什么[EB/OL].[2016-05-23].http://www.docin.com/p-713169394.html.
[6] 洪坚.网络级资源发现系统与图书馆信息服务:基于超星中文发现系统的思考[J].图书馆工作与研究,2014(6):42-45.
[7] Building the ubiquitous library in the 21st century[EB/OL].[2016-05-17].http://archive.ifla.org/IV/ifla72/papers/140-Li-en.pdf.
(编校:崔 萌)