基于信息服务的智慧图书馆数据管理框架设计研究
2018-02-22伍舜璎
伍舜璎
(广东省立中山图书馆,广东 广州 510110)
1 智慧图书馆与信息服务
1.1 智慧图书馆理论
随着科技的发展和用户需求的不断变化,智慧图书馆在传统图书馆的基础上重新审视了图书馆的功能需求和服务基础,构建出了全新的以用户为主导的信息化服务[1]。智慧图书馆通过集成建筑、信息资源和智能硬件设备与技术,为不同的用户提供信息推荐、共享和知识挖掘等各项服务。智慧图书馆的“智慧”体现在软智慧和硬智慧两个方面,软智慧则包括在物理服务基础上的管理服务、知识服务等内在服务[2],硬智慧包括了硬件设备、空间和技术等物理服务。智慧图书馆软智慧和硬智慧相辅相成、相互依赖、包容统一,来为用户提供智慧化解决方案,提升图书馆的服务水平。
智能技术的飞速发展为智慧图书馆在分析资源数据信息和用户行为信息方面打下了基础。物联网构建出智慧图书馆的跨空间服务,提升图书馆的资源利用率,智慧图书馆的信息化科技馆员,要能够为用户提供各种信息和空间资源,获取和组建硬智慧资源,并在硬智慧资源的基础上构建出软智慧,从而为用户提供更为完善的智慧化信息服务。智慧图书馆主要包括人工智能信息技术的应用和图书馆知识服务的延伸拓展,这两个关键点是智慧图书馆信息化服务的基础。
1.2 智慧图书馆研究现状
欧美国家图书馆率先提出了智慧图书馆的概念,并经过长期的发展应用至各类图书馆和博物馆中[3]。悉尼科技大学最早采用了机器人作为图书馆的管理员,代替人工进行密集的图书管理工作;慕尼黑大学的资源传送机器人,可以将图书馆各分馆中的书籍资源快速传递到另一端;新加坡智能中心的智能机器人则可以在下班时间段进行书架扫描,并描绘出图书馆整体书架的图书馆堆放情况,让工作人员能够快速地整理图书馆的书架,提升图书馆的书籍整理效率。
在国内,智慧图书馆尚处于起步阶段,大多数图书馆智慧服务还处于探索过程中。但是,受近年来科技的发展和政策的影响,我国智慧图书馆的建设开始得到重视,许多图书馆开始了智慧图书馆的尝试[4]。其中,一些图书馆利用GPS定位技术来获取图书馆的软硬件资源,将这些资源通过手机APP或微信公众号推送给用户,提升了用户获取资源的效率。另外,还有一些图书馆采用智能温控技术,通过传感器自动调节图书馆的温度和湿度,让读者的体验更为舒适。总体来看,我国的智慧图书馆还处于初级建设阶段,仅仅只是某个方向上的智能化,远远达不到真正意义上的智慧,还需进行更多的尝试和努力。
1.3 智慧图书馆的信息服务模式
智慧图书馆信息服务的目的是为用户提供更便捷的数字资源服务,并提升图书馆各项服务的规模和水平,满足用户日益增长的各项需求[5],主要包括构建先进的服务平台,创建智能信息服务以及实现智慧个性化服务系统。其中,先进的信息服务平台能够通过智能软硬件设施提供快速检索和资源传递服务,代替传统图书馆以文献检索和查找为基础的服务,信息服务平台能够统筹各种平台和资源,快速为用户查询到各种形式的资源,并给予快速反馈;智能信息服务则是建立在大数据分析、RFID电子标签等新兴技术之上,通过对图书馆中的资源数据进行广泛分析和挖掘,提取出具有统计意义的资源列表,用户通过资源列表能够更快速地定位需求资源,从而进一步提升资源利用率;智慧个性化服务系统要求智慧图书馆能够主动满足不同用户的个性化需求,通过收集用户的各项行为数据,从数据中挖掘出用户的真实需求并预测用户对新信息变化的反应,提供针对性的信息资源服务。智慧个性化服务系统有很强的针对性、指向性,并且主动为用户提供当前兴趣范围内的服务,能够有效提升用户对智慧图书馆的满意程度。
2 基于信息服务数据管理的智慧图书馆功能框架
智慧图书馆信息服务数据管理功能框架包括环境数据、用户数据和资源数据3个方面。
2.1 智慧图书馆的数据管理总体框架
图1 智慧图书馆的数据管理总体框架
数据是智慧图书馆中最重要的内容之一,以数据管理为基础,构建智慧图书馆的信息服务,能够解决智慧图书馆的最根本问题,从而形成各类创新和特色服务(见图1)。智慧图书馆中的数据流包括3个重要部分,分别是环境数据的管理、用户数据的管理和资源数据的管理。在环境数据中,主要包括图书馆中的各项监控数据、人口密集程度数据、场馆内外温度、湿度和空气参数等基础数据;用户数据则包括用户的各项行为数据、兴趣和偏好数据;资源数据代表的是整体图书馆中电子书籍、影像、期刊、图片和音频等各种形式的数字化资源。针对上述的3种不同形式的数据流动,构建出3种不同的功能应用框架:在环境方面,主导的是环境调剂和安全保护;在用户方面,主导的是资源检索、导航和借还服务;在资源方面,主导的则是馆藏资源采购、管理和业务管理等。实际上,在构建各项功能应用时,其背后是各种数据的流动,每种功能的实现实际上是各项数据流动综合完成的结果。因此,在智慧图书馆的资源功能应用下,需要优化图书馆馆藏、用户和数据收集的结构,在数据管理的生命周期中形成更多、更高效的信息服务。
2.2 环境数据在智慧图书馆中的功能应用
智慧图书馆中的环境数据包括各种监控设备、传感器设备提供的数据,这些数据能够构建出各类功能应用[6]。首先,基于监控设备提供的监控数据,可以采用多点关联分析的方法从半结构化的监控数据中进行识别,再对识别结果进行协同过滤和关联分析,从监控视频流中挖掘出异常行为数据,以其作为样本,构建出突发事件预警系统,预防图书馆突发事件。其次,在监控设备中,智慧图书馆还能够提取人口流动数据,从中分析出图书馆中的人流轨迹、数据量和密集情况。通过监控中的人口流动数据再辅以传感器进行人口轨迹行为特征分析,能够有效地获得人工密集度较大的区域和人口行为异常的区域,从而构建出风险预警系统。最后,针对智慧图书馆中的各项传感器,构建出图书馆中的流量实时监控系统,在监控图书馆水电使用情况的同时,还能够保证智慧图书馆中的水电安全。另外,针对温度、湿度和空气传感器的反馈数据,能够构建出智慧图书馆中的自适应环境调节系统,通过该系统的中央调控,控制图书馆的整体温度、湿度和空气在可适应范围内,自动为用户提供舒适的场馆环境。物联网的快速发展,能够让智慧图书馆与用户之间的交互和感知变得更为密切,在不断满足用户需求的基础上,实现人与图书馆的互联。
2.3 用户数据在智慧图书馆中的功能应用
在智慧图书馆中,一旦用户获取了服务,将会产生各种类型的用户数据,主要包括导航数据、检索数据和行为数据。智慧图书馆通过GPS和蓝牙等技术为用户提供的室内定位和导航服务,能够清楚地记录用户在场馆中的行动轨迹,通过分析大量用户的行动轨迹数据,可以挖掘出最优路径,然后反馈给导航系统,导航系统能够更精准地为用户提供服务[7]。用户的行动轨迹数据结合馆藏资源分布数据还能够用于优化图书馆馆藏资源,调整资源分布让馆藏更容易查找。另外,用户在检索图书和阅读图书过程中,会产生各种行为数据,检索系统能够收集到用户的检索、下载内容,检索过程和关键词,以及访问日志和借还信息,再配合导航系统的室内定位,确定用户在图书馆中各个区域的停留时间。针对这些用户行为数据,通过关联分析方法、聚类分析方法等数据挖掘算法,挖掘出用户、资源和空间位置之间的深度关系,构建用户画像模型。用户画像模型可以用于协同推荐,针对不同用户推荐不同的检索功能、方法和技巧的指导,还能统计馆藏下载数量,为馆藏的采购和资源管理提供有力的指导,优化图书馆的资源结构。另外,智慧图书馆的用户统计数据还能够构建出知识中转站,链接外部资源,通过分析和整理外部资源,并将新的资源推荐给不同画像的用户,提升检索关键词的命中率。
2.4 资源数据在智慧图书馆中的功能应用
智慧图书馆的资源服务不应仅限于传统图书馆提供的书籍和文献层面,还应该深入到知识提供层面,利用各种信息分析和知识挖掘工具提升数字资源的知识获取和分享[8]。在资源的数据挖掘进程中,针对同一个专业方向的内容可以进行数据关联关系的挖掘,再结合资源基本数据和用户兴趣与偏好数据进行协同分析和挖掘,挖掘结果能够用于馆藏资源采购和管理的指导,在不同发展时期合理地优化馆藏。此外,针对资源使用情况和用户行为数据还能够统计分析出用户的阅读习惯模型,通过对不同用户在场馆区域、时间和阅读持续时间的分析,能够为同种类型的用户优化出阅读推荐方案,提升阅读的效率。另外,资源数据中的科学数据是智慧图书馆赖以生存的重要数据形式之一,针对科学数据的分析和挖掘,可以为用户提供各学科研究热点的最新进展和研究方向,并提供有效、合理的决策参考。智慧图书馆应该以科学知识为起点,以研究学者为中心,构建出各个学科研究方向上的知识关联网络,提供科研资讯和协助。依靠智慧图书馆的强力后盾和知识挖掘技术,科学研究工作将变得更方便、有效。
3 基于信息数据管理的智慧图书馆创新服务模式
智慧图书馆应大力发展云计算、数据挖掘、人工智能和知识发现与决策等新兴技术,从一站式资源服务、知识发现服务、决策支持服务和智能分析服务等方面构建创新服务模式。
3.1 基于云计算的一站式资源服务
智慧图书馆集成各种数据、技术和软硬件一体化,其运营中的数据包括系统化的结构性数据,以及学科中的非结构化数据,还包括与用户相关的各种半结构化数据。为了让智慧图书馆能够提供一站式的资源服务,需要针对不同类型的数据构建出统一的数据处理和分析平台。首先,从各种渠道收集需要的数据,然后利用云存储平台对数据进行清洗,清洗数据主要针对半结构化的数据,将其中的结构化数据分离出来,剩下的非结构化数据进行统一处理。数据收集并清洗完成后,再将预处理完的数据输入云计算系统中进行数据挖掘和分析,最后推送所挖掘到的信息和数据来解决智慧图书馆的各种需求。为了解决一站式资源服务,需要对所有的数据进行跟踪,并将整理好的数据和存储融为一体,最终完成基于云计算的一站式资源服务。在实践过程中,一方面智慧图书馆可以快速获取用户画像、用户偏好模型以及馆藏资源分布模型,通过这些模型的协同分析,为用户提供个性化的检索服务,针对用户所在的学科和行业,推送其所需的资料;还可以根据用户提供的关键词,结合用户背景和知识方向,推荐用户所需要的资源,帮助用户快速切入资源主体,提升资源阅读效率;另一方面,智慧图书馆还为用户提供定位、导航、环境等服务,真正做到一站式的资源服务,增强用户的满意度,提升智慧图书馆的用户黏性。
3.2 基于数据挖掘的知识发现服务
智慧图书馆数据管理框架的基础为数据,因此构建数据挖掘和知识发现系统是必不可少的功能之一,通过数据关联和协同分析等技术,从海量的图书馆数据信息中挖掘出有意义的知识,筛选出潜在的有价值信息,智慧图书馆将能够为不同用户提供个性化的信息,帮助用户挖掘和提炼知识,提供具有优势的知识发现服务。在挖掘知识信息方面,智慧图书馆可以将收集到的数据之间的隐性知识和关联性知识挖掘出来,不但能够为科研工作者提供深层次的数据支持,还能够为普通用户提供知识服务。在知识提炼过程中,智慧图书馆将科学研究、图书馆教学和活动中隐藏的知识提炼出来。一般来说,图书馆教学和活动有众多参与者,每个参与者在活动中会产生大量的行为数据和兴趣偏好数据。针对活动参与者产生的这些数据,再结合活动的主题资源数据和参与者在图书馆数据库中的历史数据,挖掘出活动参与者一些兴趣偏好的变化,以及通过教学和活动产生的用户行为轨迹的变化。通过对这些隐藏数据的提炼,将其转化为与用户高度相关的显性知识,不但可为用户所用,还能够为改进、改善智慧图书馆的信息服务所用。不难看出,在数据管理框架基础上构建的数据挖掘技术,不但拥有海量的图书馆相关数据作为支撑,还能够通过各项数据之间的相互关联和影响,反过来为图书馆提供知识发现和信息提炼服务。
3.3 基于人工智能的决策支持服务
决策支持服务是智慧图书馆必不可少的服务内容之一,建立在数据挖掘基础之上,通过人工智能技术构建出的决策智能服务,能够满足绝大多数的决策需求,为不同用户提供个性化的决策支持服务。实际上,智慧图书馆的数据管理框架中存在海量的数据,而这些数据是构建决策的基础之一。智慧图书馆提供的决策支持服务包括两个方面,一方面是针对图书馆平台的知识图谱型决策服务,另一方面是针对用户的专家学者型决策服务。在数据挖掘的基础上,通过人工智能算法构建决策系统,为图书馆提供解决方案,是图书馆产生的行为数据最好的反馈方式之一。例如,智慧图书馆在不断运营过程中产生的海量用户行为数据和馆藏变化数据之间的关联关系挖掘出来后,通过人工智能算法针对这些关系拟合出知识图谱模型。随后,通过改变不同的用户行为数据,即可从知识图谱模型中决策出馆藏优化的最好方案。另外,针对用户的专家学者系统的构建,则是通过针对某个学科的相关研究热点资源的挖掘,再通过人工智能算法完成的决策系统。在用户使用专家系统进行决策的时候,首先需要输入待解决问题,专家系统首先进行问题匹配,一般采用隐马尔可夫模型进行关键词的匹配,匹配完成后专家系统调用人工智能算法选择匹配度最高的决策结果,并反馈给用户。一般情况下,专家系统提供的决策仅仅只有支持和参考的价值,并不能完全为用户提供决策,需要在此基础上进行更优的决策分析。
3.4 基于用户数据的智能分析服务
用户是图书馆的主体,在智慧图书馆中,基于用户数据的智能分析服务是一项重要的信息服务功能。在智慧图书馆的数据管理框架中,基于用户数据的智能分析服务包括分析用户需求、构建用户信息相关的管理服务,以及为用户提供信息跟踪和评估服务。21世纪的用户需求逐渐朝着信息化、智能化和个性化方向发展,智能图书馆通过用户历史需求数据、用户行为数据和用户阅读数据进行联合分析,从中挖掘出用户真正需求和潜在需求,并以此为基础为用户构建定制化、专业化的信息服务。在用户信息管理服务中,智能图书馆依托于强大的云计算和云存储功能,为用户构建专门的档案,从挖掘出的需求信息和行为数据中构建相关性模型,获取与该用户个体相关的人才培养方案和学科研究方案,并将方案反馈给用户。在用户信息跟踪和评估服务上,智慧图书馆通过专门的档案追踪用户不断变化的需求,并根据具体的需求推送信息参考、前沿技术以及专业技术等信息服务。在追踪阅读行为的过程中,为用户提供信息评估服务,让用户更了解自己。
4 结语
智慧图书馆的发展离不开数据的管理和信息服务的创新。在数据管理框架下,从云计算和数据挖掘入手,构建基于云计算的一站式资源服务、基于数据挖掘的知识发现服务、基于人工智能的决策支持服务以及基于用户数据的智能分析服务,通过智慧图书馆的创新型服务,给读者带来更具个性化的便捷体验,增强用户对智慧图书馆的黏性,使得图书馆在用户工作和学习中不可或缺。今后的研究主要应从人工智能的方向入手,在信息服务和数据挖掘的基础上,通过人工智能强大的分析和决策能力,促进智慧图书馆的不断发展完善。