APP下载

以大数据为驱动的智慧图书馆构建与服务模式

2022-02-17

图书馆学刊 2022年1期
关键词:数据挖掘智慧图书馆

赵 楠

[辽宁省图书馆(辽宁省古籍保护中心),辽宁 沈阳 110167]

随着电子信息技术和网络技术的不断发展,利用计算机进行大数据分析和数据挖掘可以发现从前未知且具有潜在应用价值的规则,大数据在现代城市发展和建设中正发挥着越来越大的作用,这预示着大数据时代已经来临。图书馆作为城市文化建设的重要组成部分,完全可以将互联网思维运用到其资源建设和服务工作中,这样读者在传统意义的图书馆中可以避免需求感知差的问题,这是一种以读者需求为驱动的文献资源构建与服务的新模式。

1 大数据与智慧图书馆概述

1.1 大数据

大数据技术主要是通过大量数据的对比,对相同类型、不同方面的数据进行分析计算,归集数据的相关点,发现不同数据之间的关联性,从而实现对事物发展的科学预测,可为事物或社会的发展决策提供参考方向。大数据技术有以下优点:具有数据收集能力,并保证相关推算的准确性。由于数据有种类多、大而全的特点,能够实现对多个不同方面事物的科学推理运算;具有强大的数据处理能力,与普通算法相比,大数据可大幅度提升相关推算工作的效率;大数据推算结果准确度高,错误问题较少出现。

1.2 智慧图书馆

智慧图书馆是图书馆发展的高级阶层,它集物联网、云计算、智能设备的应用于一体,并且不受时间和空间的限制,能让读者感到更加贴心、便捷的服务。智慧图书馆有以下特点:①具有知识共享性,智慧图书馆具有网络化、数字化的特征,可以为读者提供共享的知识服务;②具有服务高效性,智慧图书馆运用了智能技术,可将图书馆的软件与硬件、前台与服务后台、书与人都紧密相连,可以更加快捷地处理各类事物,因此在管理和服务上更加灵活高效;③具有使用便利性,智慧图书馆的数据在全面立体感知的基础上形成,任何方式获取的信息都能做到互通,利用智能设备使图书馆的服务成为随时、随地、随意的服务。

智慧图书馆的共享性、高效性和便利性是相互联系的。共享性是基础,高效性是核心,便利性是智慧图书馆的宗旨,是共享性和高效性的落脚点。

1.3 大数据与智慧图书馆

2017 年5 月互联网数据中心(IDC)的《数据时代2025》报告指出,2025 年全球数据总量将达163ZB[1],这预示着数据时代已经到来。大数据的应用遍地开花,而图书馆作为社会中文化的载体,也必然离不开大数据的应用。图书馆数字资源总量本身就是一个超级庞大的数据库,国内很多省级图书馆都实行了24 小时网络服务,读者的服务信息每时每刻都在递增,对这些数据的分析和挖掘都需要基于大数据才能实现。

在智慧图书馆建设中,可运用大数据对图书馆相关数据信息进行智能化处理。通过对大数据的应用,能够为相关领域的决策提供充足的支撑。因此,在确保数据真实性的基础上,收集大量数据,建立完备的大数据库,并保证大数据分析结果的准确性,不仅可为图书馆文献采购提供有针对性、即时性的决策参考,还可以全面提升图书馆采购资金的使用效率。同时,在推进图书馆管理服务变革、文献资源评价、读者的借阅预测、个性化推送等方面都能提供决策支持。

2 大数据在智慧图书馆中的作用

2.1 数据处理时效性得以提升

我国处于社会发展的快速变革期,人们的生活节奏不断加快,所以在图书馆层面上,只有提高数据处理速度,才能满足广大读者的需求。图书馆作为知识的集散中心,储备着海量的文献数据和借阅信息,传统的处理方式内容繁杂,效率低下。如今大数据技术可以圆满地解决这个难题,它可以对数据进行高速地分析处理,满足各类读者的需要,让服务有一定的精准性,以私人订制式的高品质服务满足时代发展的需要。

2.2 融合异构数据

信息化社会必将发展到更高维度的社会形态,图书馆不应固步自封,而是要跟上时代发展的步伐,充分运用最新的技术手段,建成大数据知识共享体,将单一的、传统的实体图书馆的服务,转变成不受时间和空间限制的线上智慧图书馆为广大读者服务。

目前,图书馆中存贮的不仅有纸质图书,还有音频、视频、图片、文本甚至实物等多元化的文献资料,这些数据间的相互关联便形成了复杂的异构形态。为避免产生信息孤岛,我们可以采用大数据管理的方式将异构数据进行融合,充分地整合信息资源,使图书馆数据资源形成一个有机体,并对其进行分析,挖掘出潜在的交叉价值,实现智能化管理,创新图书服务模式,提升图书馆读者用户的阅读体验。

2.3 拓宽图书馆的功能

图书馆的服务对象是读者,传统的服务内容包括文献借阅、阅读推广(展览、报告会、讲座)、参考咨询等。随着个性化、学科化等越来越专业的服务出现,读者的服务需求也越来越高,图书馆必须根据读者的服务需求做出相应的服务策略转变。大数据可对读者产生的数据进行深度挖掘与分析,分析的结果可满足读者之所想,供读者之所需,因此对大量数据的分析与潜在价值的挖掘变得极为迫切。以大数据为驱动的智慧图书馆可提供层次更深、范围更广的服务。不仅能够深化巩固图书馆原有的传统服务,还可以根据分析结果有针对性地为读者定制、推送其感兴趣的内容资源,逐步实现图书馆的知识咨询、个性化推荐、阅读推广、信息检索等全领域、全要素的全面智能化。因此,大数据在智慧图书馆中的应用大大拓宽了图书馆的服务功能,提升了读者的服务体验。

3 大数据下智慧图书馆的体系架构与实现

3.1 大数据下智慧图书馆的体系架构

为了满足广大读者的服务需求,笔者从建设智慧图书馆的实际出发,设计了基于大数据的图书馆智能服务体系框架,如图1所示。

图1 大数据下智慧图书馆体系架构

该体系架构由4 部分组成,分别是物理层、处理层、分析层和应用层。

(1)物理层是由视频与图像采集设备、系统监控设备、传感器、RFID 设备等硬件设备、互联网设备以及网络监控器等可以收集有关图书馆、图书、读者数据的设备组成。通过比较成熟的无线传输信道或者计算机通信网络将物理层采集的数据传输到数据处理层。

(2)处理层的作用是将物理层所采集的数据转变成有特定含义的、符合需求的数据。它不仅可以对读者阅读行为和服务所产生的有效性信息进行数字化处理,还可以对读者个性化服务过程中产生的数据,如资料类别、阅读偏好、阅读周期、阅读反馈等数据进行标准化处理。

(3)分析层由三部分组成,分别是数据中心基础设施平台、大数据管理与应用平台以及读者个性化智能服务平台。它位于图书馆的数据中心,主要任务是根据读者不同的需求完成大数据分析,预测读者个性化服务需求并进行定制化数据推送服务,以满足读者的个性化需求。

(4)应用层以平台层提供的数据为基础来实现图书馆的大数据分析与决策、系统智能化管理、用户关系管理和个性化需求以及读者个性化智能服务等功能[2]。

3.2 大数据下智慧图书馆的实现

3.2.1 采用混合型协同过滤算法实现个性化推荐

传统图书馆不是资源不够丰富,而是大量资源处于闲置零散状态,没有进行整合分析,因而不能被有需求的读者所发现。个性化推荐指的是挖掘出读者需求,实现“为书找人”,从而提高图书馆资源的利用率。混合型协同过滤算法即基于读者和项目的协同过滤算法来实现“为书找人”。

(1)基于读者的协同过滤算法

该算法通过读者之间的行为相似度找到匹配的资源推荐。例如读者甲、乙都阅读了《水浒传》一书,说明两位读者的阅读行为有相似性,那么智慧图书馆便会向读者乙推荐读者甲阅读过的其他书籍,同理读者甲也会收到类似的推荐。此种算法虽然可以帮助读者发现新的感兴趣的资源,但是通过读者行为相似度来推荐具有不准确性和不确定性。

(2)基于项目的协同过滤算法

该算法和基于读者的协同过滤算法比较相似,依靠资源相似度来进行推荐。例如,某位读者阅读了《水浒传》一书,那么智慧图书馆便会向读者推荐与《水浒传》相关的资源。此种算法的缺点是无法挖掘读者隐藏的兴趣点,只能被动推荐。

因此,为了最大程度地满足读者阅读需求,在个性化推荐模式中,我们采用两种算法混合的形式,实现图书馆与读者之间良性互动,提高个性化推荐的准确度。

3.2.2 采用数据挖掘方式实现采购决策

如何利用有效的资金满足读者多维度的需求是智慧图书馆重点研究的方向。在这方面,我们采用数据挖掘方式实现采购决策。

所谓数据挖掘,指的是从大量的数据中通过算法来搜索隐藏的信息。我们通过数据挖掘不但可以对过去数据进行遍历,还能对未来趋势进行预测,为图书馆提供高价值的参考依据,从而提高图书馆的决策效率。

如图2所示,通过数据挖掘进行的图书采购计划分为原始数据收集、数据预处理、数据挖掘、结果分析、制定采购计划几个步骤。

图2 图书采购计划过程

(1)原始数据收集的主要作用是为数据挖掘提供可靠的数据源。在图书馆的业务系统中原始数据包括:读者基本信息数据、流通借阅数据、文件检索数据、馆藏数据以及采访、编目等业务数据。

(2)数据预处理主要是对原始数据进行处理的过程。在数据预处理的过程中首先检查数据完整性和一致性,对不规范的数据进行处理纠正,再根据属性对数据进行泛化改造,例如将年龄属性映射成老年、中年、青年。最后对数据进行统计汇总构造新属性。数据预处理为数据挖掘提供良好的数据基础。

(3)数据挖掘是通过关联分析、聚类分析等分析法找出大量数据内在的关系规则,例如发现图书和某类读者之间的关联度等信息。

(4)结果分析是对数据挖掘形成的数据关联关系进行再分析,最终得出读者阅读倾向性和缺书比例,为采购文献提供科学合理的决策依据。

制定采购计划的关键一环在于图书馆的馆员,数据挖掘只是起到辅助作用,真正起到决策作用的是人,因此为了保证决策的正确性,高水平专业人才队伍的培养必不可少。

4 大数据下智慧图书馆的服务模式

4.1 实现基础设施互联、融合和共享

智慧图书馆的一大特点便是智能、协同的服务,要实现这一目标,首先就要通过技术方法将馆藏资料、互联网、物联网、数据库、实体图书以及广大读者统一整合到一个大的智联网中,在此基础上进行有效的挖掘。打造互联、融合和共享智慧信息交流平台是智慧图书馆建设的基本内容之一。

大数据由大量的读者数据、电子资源以及物联网的传感数据等组成。大数据分析使基于物联网的图书馆增强感知化和智慧化,也可为图书馆业务重组、资源数据扩展、决策方式转变提供新的发展机遇,对图书馆中迅猛增长的海量数据进行异构消除,加强学科数据关联与共享以及数据质量分析,智能提炼出其规律。在数据挖掘中提升图书馆的服务品质,将推动图书馆进入一个数据管理、数据服务和数据创新的时代。

4.2 提供个性化智慧服务

大数据的核心就是预测,它把数学算法模型运用到海量的数据上,用来预测事情发生的可能性。此外,随着系统接收到的数据越来越多,它们可以自动搜索最好的信号和模式,并进行自我优化[3]。大数据技术根据读者在图书馆内留下的基本属性信息,如行走路径、检索痕迹、借阅信息、下载内容等行为信息进行分析,预测读者的需求,从而进行有针对性的服务。

大数据时代,计算机处理信息的速度越来越快,在智慧图书馆中,大数据让检索更加方便,通过浏览记忆功能为读者的书籍选择提供参考推荐。对于科研类图书馆读者,大数据可为其提供高度相关的参考文献、学术资源;对于手机、平板电脑等移动端读者,通过大数据的介入处理,可根据读者的喜好进行书籍推送,不断优化和完善服务功能,为读者利用碎片化时间学习提供更便捷的服务。

另外,智慧图书馆还可以提供前瞻性服务,例如利用大数据对读者的科研创新合作过程及合作交互型知识服务过程进行分析预测等。

4.3 构建高效的智能管理体系

图书馆和企业有所不同,它有着自己的特殊需求和构建资源的方式,以大数据为驱动的智能图书馆管理体系要具有高度的可扩展性和灵活性,支持PB 级甚至更高规模数据的获取、存储、组织、分析以及决策。在存储和计算能力上要以云计算为基础,有效地解决结构化、半结构化和非结构化数据的需求[4]。在满足以上条件的前提下,图书馆的智能管理体系首先可以实现各类知识服务及业务建设的风险模型的建立。利用分析、预测和智能辅助决策技术建立具有自身机构特色的、科学的、实用的风险模型,如数字图书馆数据安全风险评估模型、出版的收益与风险模型、数据资源采购及应用评估风险模型、知识产权风险评估模型等。其次,可以通过分析图书数据资源以及软硬件的状况来预测可能出现的故障,对于突然出现的波动可以主动、及时地制定相应的策略,如资源故障、网络攻击、服务需求障碍、垃圾资源过滤、资源波动等。最后,图书馆不仅要对所在馆的数据资源进行整合和分析,而且要对产生的实时数据如微博、短信等大量数据流、网络数据以及所产生的关联数据等新型数据进行整合分析,及时发现有价值的知识和模式,洞察图书馆的读者需求和发展环境,以智能管理助推图书馆的智慧服务。

4.4 实现馆藏资源的优化

图书馆的服务对象是读者。在数字化时代,广大读者已习惯利用碎片时间进行网上阅读,这表明读者在资源获取上已经从物理空间走向不受时间和空间限制的开放的虚拟电子信息空间。因此,以大数据为依托的图书馆要对馆藏资源体系进行变革,才能适应时代的要求。图书馆要加强数据分析员的培养,加深数据挖掘,根据大数据运算分析的结果来了解读者的喜好需求并完善馆藏资源,确定下一步图书馆工作的重点,在整体上重新规划馆藏资源建设,科学调整馆藏资源构成,将有限的资金向读者关注度高且需求旺盛的资源倾斜,提高馆藏资源的使用率。以大数据为驱动的智慧图书馆可以做到馆藏资源的科学管理,实现对资源的有效优化整合,符合“以读者为本”的服务理念。

5 大数据下智慧图书馆中存在的问题及解决方案

大数据时代的智慧图书馆是未来图书馆发展建设的一个大方向,它在节省资源的同时能够高效率地满足读者需求,提高图书馆管理决策的科学性、准确性。但是任何新技术在从产生到发展成熟的过程中必然会有各种各样的问题需要进一步的解决与完善,现阶段存在的问题主要表现在以下几个方面。

5.1 信息安全问题

随着技术的快速进步,图书馆中的数据量级越来越大,读者可以全天候地从各类终端设备访问数据资源,但是由于行业间缺乏统一的数据标准以及安全管理体系,致使信息容易泄露,因此保障广大读者的个人信息和数据安全尤为重要[5]。图书馆在应用大数据推进智慧图书馆建设的同时,必须制定一个通用的数据安全管理制度,对数据采集、分析、存储等做出程序规定。采取先进的安全技术手段,加强大数据访问控制机制,分层级、分权限管理,采用数据加密的方式确保数据信息的安全无虞。在网络管理方面,规范读者上网行为,对使用者进行审核并做好使用记录。同时,配备技术管控软件,如上网时间的自动限定、恶意访问的自动退出、上网流量限定等[6]。

5.2 分析能力问题

在大数据时代,如何对图书馆里的信息进行有效地整合和分析,为图书馆提供更好的决策是未来发展的方向之一。因此在大数据领域数据分析能力成为了重中之重。在数据分析中,为了挖掘出所需要的信息,要准确提取各种结构的有效数据并进行深度分析,取得的结果供图书馆的馆员进行决策。提高分析能力我们可以从数据分析工具和培养大数据人才两方面入手。目前常见的大数据工具都基于成熟的分析结构、视觉化的数据管理系统,迅速地改变着原有分析方式,使大数据分析变得更加准确与快捷。在人才培养方面,不仅要对馆员进行有针对性的相关知识的培训以使其具备获取大数据的能力,还要培养其分析大数据的能力,对于经过预处理的各类数据,能够根据具体的需求,进行选择、转换、加载,采用有效方法和模型对数据进行分析,并形成分析报告,为解决实际问题提供决策依据[7]。只有不断地提高大数据分析能力,才能实现智慧图书馆的转型和更好地发挥信息服务职能。

5.3 新旧管理方式磨合问题

大数据背景下的智慧图书馆的管理与工作方式与传统图书馆是截然不同的。大数据的应用大大减轻了图书馆员的工作负担,将他们从繁复的图书信息存储、筛选、编辑工作中解放出来,使他们有更多的时间与精力去解决读者的问题,提升读者服务体验。

但是对于长期习惯于传统图书馆管理方式的馆员们来说,大数据是一项全新的技术,对他们的专业技能提出了更高的要求,因此要对馆内现有馆员进行系统、专业的培训,使其尽快从思想意识、专业技术、服务方法上由传统管理模式转轨到大数据管理模式上来,新老模式的磨合需要一个过程。

6 结语

笔者梳理了以大数据为驱动的智慧图书馆构建与服务模式,它可以实现科学有效的信息处理,并通过数据挖掘生成决策信息,辅助支持图书馆馆员做出及时科学准确的决策,实现从传统意义下部门条块分割管理到系统整合协作运行的智慧图书馆服务架构的跨越式发展。因此,在大数据驱动下智慧图书馆的宗旨是更好地提升图书馆的服务水平,想要实现这个目标,需要图书馆自身做出变革与努力的同时,还需要全社会给予资金、技术上的支持。

猜你喜欢

数据挖掘智慧图书馆
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
图书馆
有智慧的羊
去图书馆
智慧派
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议
智慧决定成败
智慧往前冲,统计百分百(1)