APP下载

大数据环境下图书馆服务的新发展

2018-08-11方梅青

课程教育研究·学法教法研究 2018年22期
关键词:新发展图书馆服务大数据

【摘 要】本文通过梳理大数据的内涵与理念,分析了大数据环境下图书馆服务面临的挑战、大数据环境下图书馆应用大数据技术促进服务的新发展。

【关键词】大数据;图书馆服务;新发展

【中图分类号】G252 【文献标识码】A

【文章编号】2095-3089(2018)22-0005-02

《大数据:创新、竞争和生产力的下一个前沿领域》报告中首次提出了“大数据”的概念,还对大数据的分析技术与工具进行了列举,如目前已为广大图书情报研究者所熟知的聚类分析、数据挖掘、网络分析、可视化分析、数据融合与数据集成等。

一、大数据内涵及理念

1.大数据内涵。

关于大数据,目前学界尚未形成统一的定义,但是存在一些共识: 大数据是一个动态概念,是一个用来描述海量的结构化、半结构化和非结构化数据的流行短语,大数据的容量非常巨大以至于很难用传统的数据库和软件技术进行存储、管理和处理。但是,人们没有明确提出数据量必须达到TB级或PB级才算是大数据,数据量随着信息技术的发展而改变,过去或目前的大数据,在未来可能不再是大数据。

大数据具有 4V 特征,即种类( Variety) 多、速度( Velocity) 快、容量(Volume) 大、价值(Value) 大,其中价值大是其首要特征。建立数据驱动的关于大数据相关关系的分析以及建立在相关关系分析法基础上的预测是大数据的价值所在。

2.大数据理念。

大数据基本理念是通过包括互联网在内的多种渠道收集研究对象的多维度数据,通过对海量数据的关联分析和数据挖掘,发现被研究对象的潜在行为模式或规律。

(1)大数据的价值提纯。

大数据时代,重要的不是数据,而是如何使用数据。企业要想创新发展立于不败之地,必须改变它们的经营方式,学会从数据中洞察事实并做出反应,否则数据整理得再有条理,也没有什么价值。美国麻省理工学院管理评论在一个研究报告中指出: “顶尖绩效的公司使用正确分析挖掘方法和工具的使用率,与绩效低的公司相比,高出5倍。”可见,挖掘数据价值在企业中非常重要,是人们利用大数据进行决策、发现事物规律的前提。

(2)大数据的分析与未来预知。

美国学者艾伯特拉斯洛·巴拉巴西认为,93% 的人类行为均可以通过数据分析予以预测。因此,图书馆要把用户访问图书馆网站、利用资源习惯、用户网络行为等数据搜集起来,进行分析挖掘,去发现用户利用资源的规律及信息需求特点。

(3)大数据的服务精准与个性化。

大数据能够收集来自电子商务、企业网站、博客、微信、移动应用等不同渠道的用户访问、交易和反馈数据,通过这些数据能够了解用户的全方面信息,通过分析数据可以针对不同的用户提供更加精确、更加贴心的服务; 对信息服务机构来说,通过收集、分析用户信息,可以提供个性化服务或一对一服务。

二、大数据环境下图书馆服务面临的挑战

大数据对图书馆服务造成的挑战主要有: 一是数据量庞大。过去图书馆没有关心或没有能力关心的数据,如: 社交媒体、智能设备、传感器计量、消费痕迹等复杂业务数据,也成为收藏对象。另外,随着资源共享、图书馆联盟建立,有的数字馆藏量已达TB级,甚至PB级。二是随着图书馆越来越重视服务层次的提高特别是个性化服务,图书馆系统与网络日志、监控与服务视频、音频、图片、网络行为及增值服务信息等非结构化数据将大大超越了以数字文本为主的结构化信息资源的数据量。三是图书馆庞大数据量与非结构化数据使数据的价值密度极大降低,而图书馆收藏及提供的信息资源是要经过筛选的高质量知识信息。因此,图书馆需要利用大数据技术处理海量数据来提高数据的价值可用性。

大数据环境下,图书馆除图书、期刊、报纸、全文数据库、媒体数据库和自建数据库等资源大数据及采访、编目、借阅、文献传递、参考咨询等业务大数据和用户大数据外,还包括行业数据、相关 Web 站点数据、社交网络数据及其他外部数据来源,这些數据每天都在呈爆炸式增长,总量大,类型复杂多样,以半结构化数据和非结构化异构数据为主。如何收集有价值的数据成为一大难题,云计算为这些数据的有效整合提供了基础和便利。图书馆可将数据资源存储到云服务器上,形成多个地区多个类型图书馆资源的聚合中心,图书馆员只需通过网络获取和管理云中资源,在使用过程中不断丰富和完善,解决图书馆大数据带来的数据杂、垃圾数据多、资源分散分布及存储成本高等问题。

大数据时代,图书馆服务质量的提升需要大数据的支持,图书馆对读者数据进行分析、处理和预测,能够给读者提供更好的服务模式。读者信息需求更加个性化与多样化,为满足其需求图书馆需要分析图书馆与读者之间、不同服务数据之间、读者与服务数据之间的关系数据,预测读者需求、提供个性化定制服务与针对性服务。因此,从海量数据中提炼价值、分析读者行为和需求,并通过个性化服务来满足读者获取信息的效率、准确性和便捷性,成为影响图书馆服务发展及质量提升的关键。

三、大数据在数字图书馆中的运用

随着数字图书馆的迅速发展, 大数据工作也有了较大的应用价值。 将图书馆数据进行挖掘的主要工作包括:

1.在数据处理方面的应用。

由于图书馆对于数据有自身处理方式, 例如:高借阅类的书籍,今后可以多采购一些, 以便应付更多的读者进行浏览。 但是由于大数据工作在这些细微的方面需要进行大量的工作, 因此图书管理中实现大数据应当进行更多地数据处理和分析。

2.在用户管理挖掘上的应用。

用户资源管理是现代图书馆实现个性化服务的重要基础。 大数据可以从大量的用户数据中挖掘出反映用户属性特征和信息行为特征的信息和规律, 从而为图书馆用户资源管理提供帮助。从数字图书馆的大量访问信息中挖掘用户的访问模式,也可从用户访问文档的超链接来预测用户的兴趣,采用关联性法则和聚类方法发现不同的用户群体,然后对这些不同的群体提供信息定制服务,帮助群体成员搜索、处理知识。

3.在用户和图书推荐上的应用。

为了实现推荐系统的功能, 考虑到读者、 图书以及出版社的特点, 需要应用不同的推荐方法, 大致分为以下几类:

(1)非个性化推荐 (Non-Personalized Recommen-dation):所有的读者得到的推荐都是相同的, 是非个性化的推荐。 例如在高校数字图书馆中,可以向所有访问系统的读者推荐月度最畅销的书,借阅的杂志等。

(2)基于图书的推荐:推荐系统根据读者兴趣推荐相关的图书, 这种方式需要了解读者当前选择的图书。 例如某位读者选择借阅了有关复杂网络的书籍,推荐系统就可以向其推荐其它关于复杂网络的图书、杂志、论文等。

(3)相关性读者推荐:推荐系统根据目前读者与阅读了该图书的其它读者之间的相关性进行推荐。例如高校数字图书馆可以对某读者推荐其它与其相类似(相同爱好、 研究方向等) 的读者共同研究。

(4)基于知识的推荐:通过推断读者的需要进行推测,系统要具有 “特定图书能够满足特定读者需要”的知识,来推导出读者需要与某一图书的相互关系。推荐系统可以根据某读者的历史借阅数据和文献数据之间的分析, 获得读者的潜在知识需求, 对读者进行建议。事实上,在推荐系统中综合运用以上技术和方法,以达到更好的推荐效果。

四、大数据环境下图书馆服务的新发展

1.数据分析与数据挖掘是图书馆服务基础。

大数据时代,图书馆间的竞争不仅是对文献信息的拥有与组织的竞争,更多的是对多类型数据的拥有、融合、挖掘与利用能力的竞争,即大数据推动图书馆服务体系从以资源为中心向以数据为中心的方向发展,并且数据分析与数据挖掘成为图书馆提供服务与开展工作的基础。图书馆要想提升服务水平,需要对用户数据进行分析、处理和预测,以便提供更好的服务和更多的服务方式。图书馆通过对用户借阅记录、数字资源使用下载行为、网站浏览等记录进行分析,建立用户数据库,再进行用户行为模式相似性比对,提供准确的信息资源推荐及推送服务; 通过对图书借阅率、借阅排行、借阅次数、访问数字资源类型及时间、学习行为、利用资源模式等记录进行分析,图书馆能有针对性地采购用户需要的信息资源; 通过对读者阅读习惯、学习方式、获取资源方式等数据进行分析,图书馆能科学合理地完善图书馆工作流程与服务模式。

2.大数据环境下图书馆服务走向个性化。

大数据环境下,图书馆的服务策略建立在对大规模复杂数据搜集、组织、整理、分析和挖掘的基础之上,因而大数据时代的图书馆服务项目更具有针对性和操作性。所以图书馆在解决用户问题时,可以完全抛弃传统的解决流程,而采用大数据策略的解决方案,即搜集解决用户问题的相关数据,量化分析,再找出相互关系,给出最优解决方案。图书馆对数据的挖掘、分析,不仅要分析 MARC、电子论文、电子图书等结构化数据,还要分析用户的借阅行为、阅读习惯等非结构化数据以及用户的网络交流等网络行为数据,这样图书馆才能实现“一对一”的个性化服务。如: 美国国会图书馆通过分析馆内布局与藏书流通率的关系,来量化并预测用户的借阅行为,进而提供针对性服务。目前支持图书馆网上个性化信息服务所需的web数据库技术、网页动态生成技术、数据跟踪技术、数据加密技术等都在不断发展并应用,大数据的发展,可以促使服务时空的个性化、服务对象的个性化、服务内容与方式的个性化,甚至服务支撑技术的个性化。

3.大数据环境下图书馆服务趋向智慧性。

大数据是数据世界的智慧基因,分析和应用大数据是获得智慧的关键。传统分析数据的思路基本上都是抽取样本,事先确定收集什么样的数据,然后寻找“已知的未知( Known unknows) ”,即证实某一结论正确。而大数据分析则是以全部数据为对象,发现未知的未知,即找到一些未曾想到的結果。大数据这种发现未知的未知功能为图书馆服务创新、实现智能化开辟了途径,图书馆服务开始趋向智慧化发展: 第一,大数据技术不仅能够利用数据了解用户、信息行为、意愿、业务需求、知识应用能力及服务需求等,还能够利用数据分析和预测用户科研创新将要发生什么,从而提供智慧服务。第二,对图书馆已有信息资源进行挖掘,抓取有价值的知识、关系、模式等,对网络免费信息资源利用蜘蛛爬行器、自动跟踪等技术完成对其搜集、处理和保存等,以便构建智慧型知识服务引擎。第三,大数据时代,智慧服务的三个基本要素是智慧馆员、数据( 知识) 和用户,其中智慧馆员是核心和主体。智慧馆员不仅要具备掌握分析和预测大数据的范畴、价值、状态和周期的能力,还要具备灵活运用信息技术、人工智能、自然语言理解、数学算法等多学科先进成果的能力。

4.大数据使图书馆提供更深层次的知识创新服务。

大数据环境下,图书馆提供面向创新的知识服务,该服务以解决用户问题为核心,深入解决问题的各个环节,拥有解决问题的探索、构建和测试等服务机制。此服务建立用户数据库,及应用前景。为适应用户学习研究模式的变化,促进知识的创新发展,图书馆应主动参与创客教育,正确认识图书馆在学习与创新过程中扮演的服务和支持角色,根据用户实际需求提供更为深层次的服务。

参考文献

[1]阎迪.图书馆大数据服务的发展对策.图书馆学刊,2017,2.

[2]程结晶.大数据时代图书馆服务创新的内容及其策略研究.情报理论与实 践,2016,3.

[3]杨海燕.大数据时代图书馆服务浅析.图书与情报,2012,4.

[4]晋照丽.大数据技术在高校图书馆服务中的应用.农业图书情报学刊,2014,11.

作者简介:方梅青(1979-),女,硕士, 馆员,研究方向:图书馆学。

猜你喜欢

新发展图书馆服务大数据
移动互联网时代背景下职业教育管理信息化的发展趋向
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践
房建工程节能技术新进展