大数据背景下高校图书馆数字资源服务创新
2017-06-30张辉��
张辉��
关键词:大数据;高校图书馆;数字资源服务
摘 要:文章对大数据背景下高校图书馆数字资源服务中存在的问题进行了详细介绍,并对其服务创新提出了相应的策略,旨在为高校图书馆相关工作的开展提供参考。
中图分类号:G258.6文献标识码:A文章编号:1003-1588(2017)06-0077-03
1 大数据的概念和特点
2013年3月14日,全球知名咨询公司麦肯锡最早提出“大数据”这一概念。大数据是指超常规数据范畴的数据群,这种数据群十分庞大且难以使用常规软件对数据进行收集存储。之后,IBM公司对大数据进行了研究,并总结了数据群的特点,主要包括:数量庞大、形式复杂多样、生成速度快以及具有较大的价值等[1]。大数据是个庞大的数据群,其特点主要体现在数据存储单位的变更上,过去GB已经可以作为常用数据的最大单位,而在大数据这个概念出现之后GB很快升级为TB,甚至更高级别。目前,大数据持续演变并快速渗透到各个领域,且得到了广泛使用。在此背景下,图书馆要积极组织相关人员学习大数据的理论,并对数据群进行收集、整理和研究,以提升其应用价值[2]。
2 数字资源服务现有的不足
2.1 数字资源的整体聚合有待改善
目前,高校图书馆数字资源由自有资源、购买服务资源、用户兴趣资源组合而成。①自有资源。自有资源就是通过己方加工或由特色资源库所产生的数字资源,其中包括报纸、期刊、图书、论文以及科技报告等。其不足之处是资源库所收集到的数据信息不完整,而且不同的数据信息分类标准也不相同。②购买服务资源。购买服务资源就是图书馆从中国知网、万方、维普、超星以及中国高等教育文献保证系统(CALIS)等平台购买数据库资源。其不足是数字资源之间的通用与关联不够紧密,而且不同的数据库中出现不少资源重复,资源的整体聚合是以信息的表层链接为基础,缺乏数字资源之间的关联与交流。③用户兴趣资源。用户兴趣资源就是用户使用网络上与数据库有关的平台所产生的痕迹资源。其不足是数据的聚合度不高,用户在平台上产生的痕迹信息较为零散,且不能确定其真实性及用户之间不能进行实时交流的弊端[3]。
数字资源的聚合既包括将不同数据库的资源聚集到统一的处理平台,还包括对数字资源的整体聚合。严格来说数字资源聚合就是利用多种集成方法与网络技术将不同的数字资源紧密地聚合在一起,并且构建一个统一的检索系统,达到对数字资源进行跨库检索和集中管理的目的,让用户体验到全面的数字资源服务。
2.2 数字资源服务的满意度有待提高
目前,高校图书馆的数字资源服务比较被动,仅是当用户需要时图书馆才会对其提供数字资源服务,不能主动对用户的行为信息做出判断,使得高校图书馆数字资源的利用率较低,而且用户获取到的信息资源缺乏全面性,准确度不高,未能真正满足用户的需求[4]。用户从图书馆获取到的信息虽然数量很大,但实际有用的信息较少,也较为散乱,不能满足用户的实际需求,这种情况使得用户对图书馆的信任度逐渐下降,转而向其他网络平台获取所需的信息资源。尽管其他网络资源也与用户的实际需求相差一定的距离,但会让用户感到自我满足,同时也能减少搜集信息的时间。对此,笔者认为,高校图书馆数字资源服务可根据用户在搜索时的行为习惯,判断用户所需的信息数据,并对信息数据进行相应的调整和优化,从众多的数据中帮助用户找到更贴合心意的信息,从而提升用户的满意度。
2.3 对用户服务还停留在参考咨询的层面
目前,高校图书馆对用户的服务还停留在参考咨询的层面。尽管其网站中有参考咨询的栏目,但在实际运用中会受到咨询人员的主观条件影响,不能很好地了解用户的需求,尤其是当用户在对学科知识信息进行咨询时,咨询人员由于受专业知识限制和服务态度的影响对用户的服务做得并不到位,不能满足用户的信息需求。因此,高校图书馆应培养一批具有数据搜集整理及对所服务学科内容的理解和评估、人际沟通等能力的高素质馆员[5],其能通过科学的应用信息技术和工具,更好地为用户提供个性化与知识化的服务。
3 高校图书馆服务的改革
3.1 有效整合用户兴趣信息数据
在数据背景下,用户的基本信息、社交网络、信息咨询记录、流通历史数据、视频、图片和语音等由许多信息系统所产生的多源数据,也就是高校图书馆的用户兴趣信息资源。用户兴趣信息数据类型包括非结构化、半结构化和结构化数据,从客观的角度表现出人和事物之间的信息关系,高校图书馆应对其做相关的分析和处理,全面地反映事物间的关系,以期开创新的信息模式。所以,高校图书馆除在存储与整理用户数据记录中的结构化数据以外,还应对用户行为信息进行存储和整理。其内容包括在线咨询、搜索方式、浏览记录与行为痕迹等数据,这些半结构化、非结构化的数据是图书馆信息服务中的一部分,也表明了用户对该信息的需求。因此,高校图书馆只有充分利用这些多源信息,才能有效获得对事物客观、本质的认知。另外,高校图书馆还应主动搜集用户意见,分析不同用户所关注的领域和使用偏好等信息,减少用户认知与图书馆服务之间的距离,有效提升用户对数字资源的利用率和满意度。
3.2 数字资源的有机聚合
高校图书馆可以利用技术工具和现有资源,改变传统的思维模式,构建语义关联的系统,将收集到的数字资源汇集到数字图书馆资源中,进行数字资源聚合。数字资源聚合是让用户根据需求进行全面的信息资源搜集和整理,利用跨库检索平台对其他数据库的数据进行检索,并将各类有关的资源进行有效整合和聚合,以及对以此產生相应领域需求的深层次认知。在知识发现过程中,高校图书馆要根据用户反馈的数据结果,不断完善数据类型的转换和采用,挖掘数据的质量和数量,提高数据挖掘技术,确保用户需求信息的质量[6]。当前主流的大数据处理领域的热门技术包括MapReduce、Hadoop、云计算、NO-SQL、关系型数据库等,这些技术都是在大数据背景下应运而生的。笔者认为,高校图书馆可将上述数据挖掘技术应用于信息服务工作中,以提高其信息服务质量。
3.3 资源发现系统在信息增值下的利用
用户利用资源发现系统进行操作的全部功能与服务就是知识发现。知识增值是图书馆数字信息服务的主要目的,知识在发现、实践和创新的过程中会创造一定的价值。用户在运用图书馆的数据信息时,会对原有的知识进行整理分析并实践,在此过程中又会创造出新的价值,最终达到知识增值的目的。2009年,Serials Solution公司的Summon资源发现系统问世后,高校图书馆就相继有了Worldcat Local、Primo与Encore资源发现系统,这些系统具有简单、便捷、高效发现和获取全部资源的优点。2011年5月,北京大学图书馆开始逐渐引入资源发现系统Summon——未名学术搜索,之后西安交通大学图书馆、浙江大学图书馆、东南大学图书馆、北京师范大学图书馆、中国科学院文献情报中心等19家单位先后引进了该资源发现系统。清华大学图书馆、上海交通大学图书馆、中国科学院高能物理研究所图书馆、中国社会科学院图书馆则引进了Primo统一资源发现系统[7]。根据目前我国高校图书馆的系统升级和配套情况,推出以发现服务为主的多样化服务是图书馆系统发展的关键。由于图书馆应用资源发现系统采用的时间较短,在使用过程中会出现一些比如系统全文链接出现失败问题、数据缺失和元数据不规范等问题。对此,图书馆信息服务人员需要对这些问题进行准确判断,并及时主动地将故障内容告知相关系统提供商以及图书馆相关部门帮助解决。另外,资源发现系统作为高校图书馆学术搜索引擎和知识发现的平台,在资源发现系统向语义化、关联化、可视化以及智能化方向发展的今天,图书馆员自身的数据分析和资源运用能力也要不断提高,进而提高图书馆信息服务的精准知识增值服务。
3.4 大数据背景下信息服务应加强智能化的应用技术
在大数据背景下,科学技术的支撑让数据技术得到进一步发展,高校图书馆各种信息资源可以通过不同的方式进行储存,如图片、声音等,而这些数据往往蕴含着丰富的含义。高校图书馆利用智能化技术可以自动辨别信息资源,可以去除各类复杂烦乱的信息,也可以进行信息归类和整理。智能化技术的优点:①智能化技术不仅节省了人力、物力,更能将信息中的深层价值挖掘出来。②智能化技术能随时随地感知互联网的变化,能够获取快速更换交叠的信息资源,利用其自身功能将这些更新的信息资源分析、识别、整理和存储。由此可知,在大数据背景下,图书馆离不开智能化技术,信息资源的管理整合更离不开智能化技术。③智能化技术借助计算机将潜在的、隐含的信息资源挖掘处理,高校图书馆应结合用户信息需求为其提供个性化的信息资源。但智能化技术在使用过程中也存在着一些缺点,如部分资源的呈现还需要相关专业人员进行整理、加工。
3.5 大数据背景下高校图书馆可将专业资源配置人才融入图书馆项目团队中
随着科学技术的进一步发展,当代图书馆智能化技术得到全面提高,各种各样的自动化技术运用为用户提供了更为全面和个性化的信息服务,但由于受相关技术和专业技术人员水平的制约,部分专业性信息的提供不能很好地让用户满意。针对这一问题,高校图书馆可将专业资源配置人才融入图书馆项目团队中,将用户需求反馈给专业人才,最终为用户提供专业性的信息资源。
3.6 注重数字资源网络安全,防止用户和重要资源流失
3.6.1 注重数字资源网络安全。在大数据背景下,图书馆主要是利用自动化技术来获取、采集以及分析用户信息,以便为用户提供个性化信息服务。大数据技术为用户信息提供了储存平台,但黑客可以通过破解图书馆防护墙来获取用户的信息资源,导致用户信息资源被泄露。因此,大数据技术在采集、分析以及储存用户信息过程中,需要进一步加强安全防护和监管。为了维护用户对图书馆的忠诚度,图书馆应建立用户平台,允许用户查看自己的信息资源,同时,允许用户删除隐私资源。
3.6.2 构建大数据平台。高校图书馆在构建大数据平台时,必须使用技术成熟且兼容性较强的数据包与分析工具,以尽快完成用户信息的采集和收录,保证用户在信息采集、收录过程中的安全性,减少黑客非法攻击网站的频次。
3.6.3 大数据平台应当做好加密、备份工作,防止重要信息资源的丢失。数据备份是图书馆恢复数据的重要手段,图书馆可以将用户隐私、服务信息等数据采用不同的方式进行备份储存,并设计相应的加密码,当用户数据丢失时,即可立即启用另一份用户数据。
4 结语
在大数据背景下,高校图书馆的信息资源管理环境和管理方法发生了很大变化,对当前数据资源的管理和提供提出了更高的要求。高校图书馆要善于利用各种自动化技术,加强对信息资源的管理,要转变服务理念,利用大数据技术和智能化技术为用户提供个性化、全面化以及更深层次的信息资源服务,以促进高校图书馆更快、更好地向智能化发展。
参考文献:
[1] 苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015(6):4-12.
[2] 王显燕.大数据环境下高校图书馆信息资源建设与服务[J].农业图书情报学刊,2015(10):26-28.
[3] 于爱华.MOOC时代背景下的图书馆服务模式创新研究[J].图书馆学研究,2014(21):81-85.
[4] 许伍霞,刘敏,戴述霞.大数据时代图书馆发展的应对之道[J].农业图书情报学刊,2016(2):19-24.
[5] 段瑞梅.大數据环境下高校图书馆服务模式浅析[J].图书馆工作与研究,2016(9):107-109.
[6] 余子佳.新媒体时代高校图书馆创新阅读推广服务策略[J].闽南师范大学学报(哲学社会科学版),2015(1):161-165.
[7] 牟燕.大数据时代图书馆的服务创新与发展探析[J].人才资源开发,2015(22):132-133.
(编校:马怀云)