数字图书馆资源聚合质量影响因素分析
2019-09-10聂梦迪
摘 要:近几年来,数字图书馆资源的聚合逐渐成为国内外学者研究的重点内容,国外主要对语义互联和框架构建方面进行集中研究,而我国主要是对理论探讨方面进行深入研究。基于此,本文通过对馆藏资源聚合质量的影响因素进行分析,从运用关联数据聚合数字资源、运用语义网环境聚合数字资源、运用大数据技术聚合数字资源论述了数字图书馆资源聚合质量的控制策略。
关键词:数字图书馆;资源聚合质量;关联数据
中图分类号:G250.76 文献标识码:A 文章编号:2096-4706(2019)23-0134-02
Analysis of Influencing Factors on the Quality
of Resource Aggregation in Digital Library
NIE Mengdi
(Anhui Provincial Library,Hefei 230001,China)
Abstract:In recent years,the aggregation of digital library resources has gradually become the focus of domestic and foreign scholars’research. Foreign countries mainly focus on semantic interconnection and framework construction,while China mainly focuses on theoretical research. Based on this,this paper analyses the influencing factors of the aggregation quality of Library resources,and discusses the control strategies of the aggregation quality of digital library resources from the aspects of using related data to aggregate digital resources,using semantic web environment to aggregate digital resources,and using big data technology to aggregate digital resources.
Keywords:digital library;quality of resource aggregation;associated data
0 引 言
隨着社会经济的不断发展,我国数字图书馆也得以飞速发展,使得馆藏资源数量日益庞大且复杂,如何对这些资源进行高效的利用成为学者们面临的主要问题。为了更好地解决馆藏资源聚合质量所受的影响,我国很多学者深入地探索馆藏资源聚合模式,并应用到实际工作中,在深度聚合之后,数字图书馆中的各类资源可实现更好的服务,同时也提高了数字图书馆的资源利用率。
1 数字图书馆资源聚合质量的影响因素
1.1 资源聚合度和共享的影响
现阶段,随着信息技术发展得越来越快,网络教育资源得到了丰富,这种情况促使着数字图书馆知识服务和资源聚合向着更好的方向发展,为建设数字图书馆提供了有力保障。然而,当前馆藏资源共享有着很大的问题,致使数字图书馆中的资源聚合和共享达不到预想的效果。具体表现在如下方面。
(1)图书馆中资源分布式管理机制对馆中的知识、信息、数据的相互关联产生了严重的影响,阻碍了馆内资源更深层次、更广范围的聚合。
(2)分类管理的单一形式和部门明确的分工虽然提高了服务质量和工作效率,但是却严重忽视了各个部门之间相互合作、交流与沟通的重要性,对形成知识整体服务体系造成了巨大的影响,致使资源深度聚合效率降低。
除此之外,各部门之间不能有效沟通,使得信息传递效率降低的同时,也影响着数据资源的共享。另外在现有资源分布式管理机制的作用下,用户在对信息进行检索时,不能够完整、全面地获取数字资源。
1.2 资源应用与建设的影响
网络资源应用和建设是数字图书馆进行资源聚合过程时最为重要的内容,必须有较高的资源利用率和完善的建设体系才能使资源聚合质量得到保障。现阶段,数字图书馆在进行资源建设过程中,只是将馆内开放网络资源与自身拥有的资源进行简单的聚合,严重忽视了数据集间深层次与馆内部门交流合作对资源聚合的相关影响。主要体现在如下方面。
(1)在资源聚合过程中,只是将知识、信息、数据之间的表层进行链接,而没有深入挖掘数据集间的关系互联。这种情况下,不仅对资源聚合质量产生了影响,同时还对知识服务效果产生了影响。
(2)在资源聚合过程中,知识集成主要是指对信息资源相关内容进行语义聚合。但是就目前工作的实际情况来看,数字图书馆中对关联知识挖掘力度不够,同时也不能挖掘出其中所蕴含的隐性知识。
除此之外,数字图书馆在运行过程中,异构分布式知识库不能得到有效的应用,导致无法实现可视化管理,对资源聚合质量产生了一定影响。
1.3 交互机制的影响
现阶段,数字图书馆中的交互机制比较单一,这种影响因素对资源聚合质量最为直接的影响便是难以实现个性化服务和资源共享。目前,在数字图书馆中,交互机制的交互形式主要是用户与系统、用户与资源之间的交互,但是没有考虑用户与用户之间的交互,而用户在与系统进行交互时,只限于用户检索信息对资源进行分析和统计。资源聚合的个性化服务主要体现在分析与统计用户信息之后,可以对用户比较感兴趣的知识、信息以及数据进行推送,同时根据不同类型的用户提供不同的服务,在此过程中,不仅可以将有潜力的数字资源推荐给用户,同时也可以为有共同需求的用户提供相互沟通的平台,从而满足其个性化需求。
2 数字图书馆资源聚合质量控制策略
2.1 运用关联数据聚合数字资源
针对资源聚合度和共享影响因素,数字图书馆要运用关联数据方法来控制资源聚合的质量。运用关联数据聚合数字资源的步骤如下。
(1)创建关联数据。创建关联数据是数据关联实现的第一步,首先利用RDF来表述知识、信息、数据的语义和内部结构。这种表述是利用数据转换和元数据实现的。其次,利用系统机制储存RDF表述信息,并且支持用户使用公共方法对存储信息进行检索。最后,利用RDF对馆藏数据资源进行存储。前端利用Puppy作为数据关联服务的服务器,以此来实时更新馆藏的数据资源。同时,利用映射关联和非映射关联两种方法对数据进行关联。
(2)发布关联数据。将新生成的或者是现有的数据以RDF三元组的方式进行发布,使发布对象形成统一的URI。具体发布方法有两种,其一是利用描述框架将数据结构化进行发布;其二是利用RDF连接统一发布不同数据集。
(3)浏览关联数据。在进行数据关联的过程中,主要目的是为用户提供分布式和多样化的网络资源,对不同数据源的资源聚合。浏览关联数据需要利用专门的插件或者是浏览器。如Disco Low-level Data Browser、Tabulator Browser、Marbles等瀏览器。这类浏览器在服务器端运行,为用户提供检索接口和浏览界面,其中只有为数不多的服务是利用插件进行的。
2.2 运用语义网环境聚合数字资源
针对资源应用与建设的影响,可以运用语义网环境对资源聚合质量进行控制。在运用语义网环境进行资源聚合时,需要从以下几方面进行。
(1)主题模型的应用。在语义网环境中,主题模型的应用主要体现在两方面,一方面是图形图像;另一方面是处理文本知识。生成文献的模拟过程需要主题模型的支持,词项中很多主题集合存于共现信息中,需要从共现信息中抽取与语义匹配的主题集合,并估计参数,同时挖掘其中的文本。随后利用主题模型使其形成一个新的主题。
(2)信息整合。在异质和异构资源中利用相关技术或者是标准进行逻辑和物理上的互通互联,实现多种资源的一站式搜索便是信息整合。基于信息整合方法对数字资源进行深度聚合,可以有效地组织和揭示各种数据之间存在的关系。同时用户关联资源获取时,能够一步到位,实现资源的一站式搜索。信息整合共分为四层,其一数据源层要制定元数据标准;其二信息组织和描述层使用关键技术为RDF技术;其三语义整合层在检测本体一致性和实现语义推理时,运用的规则是语义规则;其四用户交换层的主要作用是接收整合的信息,以此为用户提供相应的服务。
2.3 运用大数据技术聚合数字资源
随着新时代的来临,大数据技术的应用趋势势不可挡。数字图书馆中的各类资源数量非常庞大,在聚合数字资源过程中,如果不应用现代科技技术,是无法对数据背后的隐性知识进行充分挖掘的,这种情况导致难以实现个性化服务和资源共享。运用大数据对资源聚合质量进行控制时,可以利用大数据中的计量分析技术对馆藏数据资源之间的语义联系进行构建,结合信息资源转换和语义知识替换现有数字资源关系,使图书馆中数据资源的表达形成一个与元数据相关联的网络。在此过程中,对资源所处的中间环境进行构建,可以使信息体在与环境相适应的同时,还能够实现语义互相操作的功能。大数据技术挖掘出的资源聚合语义关系非常深,而且计算机处理的数据量也非常大。同时利用大数据在分析数字资源语义化时,舍弃了部分领域关系,计算机处理效率在一定程度上得以提高。这样可以有效地实现资源的深度聚合,并为用户提供良好的个性化服务。
3 结 论
综上所述,数字图书馆资源聚合质量受到多方面的影响。经过上文分析可得,实现数据关联,对更好地利用知识体的联系有非常大的帮助,同时还可实时更新馆藏的数据资源。而在语义网环境下,运用相关技术对资源聚合进行分层次处理,可以有效解决其应用和建设问题。大数据技术的应用,可以对资源数据进行深层次挖掘,实现个性化服务,从而提高资源聚合的质量。
参考文献:
[1] 毕强,闫晶,李洁,等.基于扎根理论的数字图书馆资源聚合质量影响因素研究 [J].情报理论与实践,2018,41(5):61-66+38.
[2] 赵颖星.数字图书馆信息资源质量的影响因素分析 [J].中国管理信息化,2018,21(6):166-167.
[3] 王福.数字图书馆资源聚合质量影响因素研究 [J].情报理论与实践,2016,39(12):86-90+113.
作者简介:聂梦迪(1985.02-),女,汉族,安徽合肥人,中级职称,馆员,硕士研究生,研究方向:图书馆管理。