APP下载

基于大数据的数字图书馆信息服务资源整合系统研究

2017-02-07叶翔

河南图书馆学刊 2017年1期
关键词:信息服务数字图书馆资源整合

叶翔

关键词:大数据;数字图书馆;信息服务;资源整合

摘要:文章分析了基于大数据的数字图书馆资源整合需求,阐述了图书馆数字资源整合的方式,提出了图书馆大数据资源整合方案和策略。

中图分类号:G250文献标识码:A文章编号:1003-1588(2017)01-0123-03

近年来,我国数字图书馆的发展规模不断扩大,各种形式的信息数据聚集到数字图书馆的数据库中,这对于图书馆平台的检索、查询以及整理等工作提出了更高的要求。需要注意的是,由于数字图书馆平台的资源异构性,很多信息资源都存在着内容重复的现象,而且数字资源之间相互交叉的情况也比较多,这些特性都让用户在使用图书馆平台时需要花费更多的时间学习各个平台的检索技巧才能够获得所需的信息资源[1]。显然,数字图书馆检索功能的不兼容已经增加了用户使用软件的难度,严重影响了软件的使用效率。因此,为了提高检索效率,我国很多数字图书馆平台都在积极地整理数字资源,解决软件之间的不兼容问题。

1基于大数据的数字图书馆资源整合需求分析

1.1大数据整合是信息组织自动化、动态性、多模式的要求

传统图书馆整理资料的方式是以人工的检索方式对各类书籍资料进行标注、分类和整理,而且检索的关键词(字)都是需要烦琐的手工劳动进行整理和录入。如今,互联网上的很多数字资源都具有很强的时效性,如果仍利用人工的方式进行整理,必然会影响到资料使用的效果。因此,实现数字资源的自动化处理已经成为数字图书馆的发展趋势,如:数字资源的自动标注、自动分类和整理,资源关键字的编制以及自动化管理等方面都是图书馆的重点研究内容[2]。数字资源的种类繁多、构造成分较为复杂,信息化比重越来越大都让以传统手工整理方式为基础的图书馆的使用优势不再明显,而且数字资源的非结构化也使自动化提取资源特征的难度加大。

1.2数据整合是信息组织的标准化、易用性的需求

因特网是一种将多个网络进行整合的互联网结构,而且网络中的数字资源都是以杂乱无序的方式分布。信息网络是以信息为处理的基本单元并针对信息进行存储、添加以及整理的合作型的网络结构,且网络之间的数据交流同样需要各方面的支持,因此,整合网络资源的前提就是制定相关的信息整理和加工标准[3]。在互联网环境下,任何用户都可以轻松地利用手机、平板电脑及个人计算机等终端访问数字图书馆平台并进行操作。图书馆考虑到用户的软件操作水平参差不齐,在设计平台功能时要尽量做到简洁实用,使普通用户都可以检索到所需的数字资源,提高平台的使用效率。

2图书馆数字资源整合的方式

2.1基于OPAC系统的数字资源整合

OPAC(Online Public Access Catalogue)称为联机公共检索目录,是一种基于互联网模式的数字资源检索工具,该工具也是用户查询和检索数字资源的重要工具[4]。具体来说,基于OPAC的资源整合系统是一种基于数字资源传统模式的整合方式,其同样也是图书馆针对数字资源进行整合的最基本的模式。值得强调的是,OPAC的检索工具得到大部分用户的认可,因此,以OPAC检索技术为基础构建数字图书馆平台并整合多种平台资源的成本相对较小。基于OPAC检索技术的图书馆平台可以让用户以较为熟悉的检索方式获取平台的资源服务,且无须进行额外的技术培训,该检索方法将大大提高检索效率和用户的使用体验。

2.2基于导航系统的数字资源整合

基于导航系统的数字资源整合模式是将数字资源的检索方式进行整合,以此建立导航系统的数字资源库,使用户可以利用资源的名称、重要标识以及关键字来检索所需的信息。基于导航系统的数字资源

整合模式的目的是提供统一的检索入口,提供高效的检索效率以及提高用户的使用体验。该模式按照资源的类型可将数字资源分为数据库资源、期刊资源、会议资源以及电子图书类资源等,可针对不同类型的资源设计不同的导航系统模式。现阶段,数字图书馆的检索模式仍是以基于数据库的导航模式和基于数字期刊资源的导航模式这两种方式。需要注意的是,不同类型的数字资源信息需要相对应的导航模式,如:基于数字期刊资源的导航模式需要明确资源内容的期刊关键字、期刊名称、出版单位、ISSN编号以及期刊和出版社的URL等内容。基于数字期刊的导航模式具有以下三个基本功能:期刊关键字检索功能、期刊内容分类检索功能及顺序检索功能,以上这些功能都可以帮助用户方便地检索到所需的数字资源,并以超文本链接的方式实现。

2.3基于链接系统的数字资源整合

基于链接系统的数字资源整合模式利用超文本链接技术将相关的数字资源进行链接和整合,让全部的数字资源形成一个整体,从而为用户提供更好的数字资源检索服务。目前,较为成熟的链接模式主要有封闭式的静态链接模式、开放式动态链接模式及开放式静态链接模式,其中使用频率最高的是开放式动态链接模式。具体来说,开放式动态链接模式就是根据用户的具体需求动态地参照规定好的链接方式对于用户的使用给予链接,其中还可以在链接过程中嵌入选择型链接模式(比如DOI、CrossRef、SFX及Open URL等链接模式)[5]。现阶段链接技术最为先进的是SFX模式,SFX模式能够简化复杂数字资源的相互关联性,还可以提供期刊全文到全文,或者摘要到摘要的链接服务,使链接服务更加具体。利用SFX模式整合数字图书馆的信息资源的同时,还能扩展资源服务类别,比如扩展期刊查询、馆际互查和互借及期刊资源的传送服务。

3图书馆大数据资源整合方案和策略

3.1图书馆大数据资源整合整体方案

笔者设计的基于大数据的数字图书馆信息服务资源整合的具体方案主要分为:数据整合系统反馈控制模块、数据整合模块、数据过滤和解析模块及大数据资源模块等内容(见图1)。其中,大数据资源模块主要负责存储和管理服务监控方面的数据、系统管理方面数据以及客户管理方面的数据,而且该模块还会参照数据的存储特点、数据的来源、数据的应用方向以及数据的使用频率等特点,将收集到的数据按照规则存储到相应的管理数据库中,为整个信息服务资源整合系统提供信息数据的基础管理服务。数据过滤与解析模块是大数据资源模块的上层,接受下层的大数据资源模块提供的服务,该模块主要担负着大数据特征的提取、类型和格式的判别、数据的清洗(即筛选)及数据的解析等工作。其目的在于它不仅要过滤掉大数据存在的不利噪音,还要规范数据的格式和类型,而且需要进一步提高数据的存储密度和使用价值。数据整合模块的主要职责是利用大数据的读取和转换准则将过滤后的数据进行转换并最终存储在主数据库中。数据整合系统反馈控制模块通过数据处理以及分析技术针对大数据进行评估,并利用系统反馈技术实现数据整合、资源调整及反馈系统优化,从而提高数据的操作管理水平,提高数据的有效性和可控性。另外,数字图书馆还会全程监管数据的整合过程,并在整合过程中及时地发现问题、纠正错误、完善管理,为用户提供安全、可靠及便捷的数据服务。

3.2实现数据在采集终端的过滤与整合

数字图书馆在提供优质数据服务的同时还积极收集和整合用户数据,如:利用终端的传感器、监控仪器、服务器日志监控系统以及终端数据收集器等设备,收集和整理系统运行信息和用户使用的信息。需要强调的是这些收集数据的设备构建比较复杂,而且数量较多,对此在收集数据时要把握系统所需收集数据量和网络传输的负载量之间的平衡,也就是在不影响硬件设备正常运行的基础上尽可能多地收集所需的信息数据[6]。因此,在数据收集方面采用何种的收集、整理以及过滤策略,对于整个信息服务资源整合系统的构建起到了至关重要的作用,先进的收集技术将会大大减少硬件设备的运载负荷,从而提高数据的整理和分析效率。综上所述,数字图书馆应该注重针对大量原始数据的过滤和整合技术的研究,降低大数据的噪音,有效去除数据的冗余信息,将有价值的信息数据过滤出来进行存储,从整体上提高数据的时效性和使用价值。

3.3实现大数据的安全、高效整合

实现大数据的安全、高效整合是保障用户账户信息、信息服务系统数据以及第三方共享数据安全的关键所在。①数字图书馆应该按照国家规定的相关法律法规制订大数据的过滤和整合规则,并在保持数据能够支持二次挖掘和整合的前提下保障用户的账户信息和使用信息的安全性。数字图书馆还要在第三方平台数据的兼容性、开放性以及有效性的基础上对各个网络系统的信息资源进行整合。②数字图书馆还十分重视基于IT系统框架的安全保障。图书馆应根据大数据的过滤和整合规律做好大数据平台的数据安全和存储工作,尽可能地降低数据过滤和整合带来的风险,从而保证大数据的整合措施不会影响到数字图书馆的正常运行。③数字图书馆还应重视大数据的整合和存储、整合系统的可扩展性、整合过程中的数据安全性以及整合过程中的经济成本等方面的内容[7]。

3.4重点关注与第三方大数据平台数据的整合

大数据时代,用户的个性化信息需求需要数字图书馆、云计算服务商、通信和网络运营商及相关政府部门通力合作才能够完成。数字图书馆只有全面高效地整合各个系统的数据,才能提升数字图书馆信息资源的使用价值,才能准确定位用户的信息需求,才能保证数字图书馆的可持续发展。数字图书馆与第三方的数据平台还需要相互兼容,其不仅需要兼容各个平台的数据存储标准、数据的存储格式及数据接口模式,还需要从长远的角度看待与第三方数据平台的合作关系,着重加强对数据共享系统构建、数据过滤及整合技术等方面的研究。

4结语

基于大数据的数字图书馆信息服务资源整合系统重视大数据资源的过滤和整合技术,该技术同时也是对于大数据进行二次挖掘的基础。图书馆只有科学地研究大数据过滤和整合技术才能提高数字图书馆信息资源的使用价值,才能提升用户的信息体验效果。

参考文献:

[1]何毅.资源发现知识导航:大数据时代图书馆的数字资源建设与服务[J].中国索引,2012(6):23-27.

[2]张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012(6):15-21.

[3]樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-71.

[4]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.

[5]温浩宇,李京京.大数据时代的数字图书馆异构数据集成研究[J].图书馆杂志,2012(9):138-141.

[6]史久根,张加广.基于压缩感知的无线传感器网络数据融合算法[J].计算机系统应用,2014(10):178-182.

[7]吴珺,谢树泉,王春枝.基于语义的隧联网数据整合方法[J].智能系统学报,2014(6):209-213.

(编校:马怀云)

猜你喜欢

信息服务数字图书馆资源整合
国有企业发展养老产业的模式创新研究
基于MDX数据库的译者参考资源整合对翻译工具能力培养的意义
少先队活动与校外资源整合的实践与探索
京津冀一体化视角下河北省大数据产业发展现状分析
公共图书馆科技创新服务探析
农业高校图书馆专利信息服务研究
基于云计算的数字图书馆建设与服务模式研究
基于价值共创共享的信息服务生态系统协同机制研究
微信公众平台在高校图书馆信息服务中的应用研究
刍议数字图书馆计算机网络的安全技术及其防护策略