基于大数据挖掘与知识发现的智慧图书馆构建
2017-08-30陈臣
陈臣
〔摘 要〕 [目的/意义]为从大数据中发现潜在规律和提取有用的知识,并有效解决图书馆在个性化智慧服务中存在的问题。[方法/过程]面对读者的智慧阅读需求,本文研究了图书馆在个性化智慧服务中应注意的问题,构建了基于大数据挖掘与知识发现的图书馆智慧服务体系,并论述了智慧图书馆各服务层的功能。[结果/结论]该体系可实现资源和服务的高度融合,显著减少系统资源的占用,能够依据读者需求智慧化地定制服务,并为读者提供个性化智慧阅读服务。
〔关键词〕大数据挖掘;知识发现;智慧图书馆
DOI:10.3969/j.issn.1008-0821.2017.08.012
〔中图分类号〕 G250.76 〔文献标识码〕 A 〔文章编号〕1008-0821(2017)08-0085-08
〔Abstract〕Purpose/significance] In order to discover underlying rules and extract useful knowledge from big data,and effectively solve the problems in the library personalized smart service. [Method/process] In the face of readerswisdom reading demand,in this paper,the matters needing attention were studied for personalized smart service in library,and the smart library service system was constructed based on the big data mining and knowledge discovery, the functions of each service layer of smart library were described. [Result/conclusion] The system could make its resources and services highly integrated,significantly reduce the use of system resources,according to the requirements of readers to intelligently customize the service content,and provide personalized smart reading services for readers.
〔Key words〕big data mining;knowledge discovery;smart library
2008年11月,IBM总裁兼首席执行官彭明盛(Samuel J.Palmisano)首次提出了“智慧地球”这一概念[1]。“智慧地球”是人类历史上第一次实现了几乎可将所有东西进行数字化和网络互联,并通过低成本的高新技术和网络服务,在未来所有的物品上安装并应用智能技术,对物体进行更透彻的感应和度量、更全面的互联互通、更深入的智能洞察,来向整个社会提供更加智能化的服务,最终为社会的发展和经济进步提出了一条全新的发展思路。“智慧图书馆”作为“智慧地球”的重要组成部分,也引起了世界学者们的广泛关注。从图书馆的服务角度看,智慧图书馆就是图书馆、物联网、云计算和智能化设备等技术的结合,是一个具有智慧化管理、个性化服务、高效知识共享和读者需求智慧感知的自动化图书馆。从数字图书馆服务的角度看,智慧图书馆就是利用ICT (Information Communications Technology,信息通信技术) ,实现图书馆知识资源的智慧化搜索、个性化定制和智慧化推送。从服务感知的角度看,智慧图书馆就是要实现读者阅读需求、图书馆服务环境、读者阅读收益和服务满意度等的智慧感知与预测。基于对智慧图书馆认知角度的不同,智慧图书馆通常借助云计算、认知计算、传感器、高速无线传输、射频技术、大数据等技术来构建,其管理与应用平台的建设也可划分为信息的收集、协同感知以及泛在聚合这3个阶段,以实现读者与读者、读者与设备、设备与设备的互通。近年来,随着大数据技术和云计算技术的发展,图书馆的数据采集、传输、计算、分析与决策能力快速增长,大数据海量(Volume)、多样(Variety)、高价值(Value)、处理快速(Velocity)的4“V”特点已不再是阻碍图书馆大数据应用的主要问题,而大数据本身所特有的高价值、真实性、快速增长和动态变化等优势,已成为当今智慧图书馆构建和读者智慧服务质量保障的重要决策依据。
世界领先的全球管理咨询公司麦肯锡最早预测大数据时代的到来,指出:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” IDC的研究表明,包含结构化和非结构化的大数据正在以每年60% 的增长率持续增长,到了 2020 年全球数据总量将增长 44 倍,达到 35.2ZB[2]。目前,伴随大数据时代的发展和大数据技术的提升,图书馆大数据的价值总量、价值密度、可用性和可控性也呈现快速增长态势,大数据已成为图书馆智慧服务体系构建、智慧服务管理、读者服务需求感知、智慧服务定制与推送、CRM(客户关系管理)、个性化智慧阅读QOS(Quality of Service,服务质量)保证的重要决策依据。因此,图书馆必须以读者阅读需求和图书馆服务模式变革为中心,将大数据的预测、感知、分析和决策优势运用到图书馆的建設与读者服务中,才能增强图书馆的物联化、互连化和智能化水平,才能构建真正意义上的智慧图书馆,实现图书馆的构建、管理和服务从“管理员经验治理”向 “大数据智慧决策”的转变。
1 智慧图书馆的研究与应用现状
欧美等国家的图书馆研究学者最早提出“智慧图书馆”一词,如 M.Aittola等认为,“智慧图书馆是一个不受空间限制的、可被感知的移动图书馆,它可以帮助用户找到所需图书和相关资料” [3]。2001年起,在加拿大首都渥太华率先建立了一个名为“Smart Library”的图书馆联盟,包括公共图书馆、高校图书馆、专业图书馆、博物馆等在内的12所相关机构加入了该联盟,利用同一个搜索引擎为联盟图书馆的读者提供一站式服务,这是国外关于智慧图书馆的最早实践[4]。在2003年的人机交互移动设备国际研讨会上,来自芬兰奥卢大学图书馆的艾托拉发表了名为《智慧图书馆: 基于位置感知的移动图书馆服务》的研究论文,指出“智慧图书馆”(Smart Library)是一個不局限于图书馆内终端、可随时随地访问图书馆资源并能实现移动终端到资源位置的定位和指引[5]。从2003年开始,芬兰奥卢大学图书馆开始尝试为读者提供“智慧图书馆”这种新型服务方式。2004 年,米勒等学者在国际会议上发表了题为《智慧图书馆:强调科学计算的图书馆的SQE最佳实践》研究报告,认为智慧图书馆是指运用大量软件质量工程的实践,力图使用户和开发人员避免犯各类错误,包括使用、配置、安装中的错误,以及因应用程度的变化而导致的绩效下降或死锁等方面的错误[6]。自2005年起,我国上海图书馆开展了基于手机图书馆的读者移动服务,台北市立图书馆也运用无线射频技术建成了无人值守的智慧图书馆。直到2008年11月,IBM首席执行官彭明盛提出了“智慧地球”的概念,引起了美国各行业的巨大反响[7]。2009年8月,IBM又发布了《智慧地球赢在中国》计划书,正式揭开 IBM“智慧地球”中国战略的序幕。从此,“智慧图书馆”作为“智慧地球”的重要组成部分,引起了世界各国学者更加广泛、深入的研究[8]。
芬兰奥卢大学图书馆的Aittola M等学者认为,在智慧图书馆中读者可通过手持PDA设备获取位置感知服务,并在移动设备上得到有关书籍的地图向导,继而帮助读者迅速找到所需的图书等[9]。英国学者伊安·约翰逊指出,任何“智慧图书馆”都需要“智慧的图书馆员”的存在,智慧馆员不但应具备高水平的技能素养和职业信念,还必须帮助读者充分认识到图书馆确实发挥出了与众不同的积极作用[10]。近年来,随着云计算与大数据技术的快速发展,基于大数据技术构建智慧图书馆和为读者提供智慧阅读服务已成为当今图书馆学研究的一个重点。祝森生对大数据时代关于智慧图书馆的几个研究问题进行了探讨,认为大数据时代的来临,将为智慧图书馆的实践建设提出了挑战,但也为智慧图书馆的学术研究提供了增长点,如何在大数据时代满足用户与社会发展需求、保证智慧图书馆的互联、高效与便利三大特点,将会是大数据时代智慧图书馆研究的主要问题[11]。马晓亭对大数据时代图书馆的个性化智慧服务QOS保障进行了研究,认为如何从海量、不完全、高噪声、模糊和随机的大数据库中发现大数据的价值和相互关联,是科学构建智慧图书馆和为读者提供个性化智慧阅读服务的关键[12]。黄辉对基于物联网标识体系的智慧图书馆建设进行了研究,文章从物联网标识的完整概念与核心技术出发,论述了智慧图书馆的建设现状,分析了物联网标识技术在智慧图书馆应用中存在的问题,探讨了基于物联网标识技术的智慧图书馆建设对策[13]。刘喜球对基于可穿戴技术构建智慧图书馆进行了研究,认为可穿戴技术作为具有强烈“人类感知”能力的新技术,有助于移动图书馆转变为智慧图书馆[14]。储节旺对智慧图书馆的建设及其对技术和馆员的要求进行了研究,认为智慧图书馆的建设是一项系统工程,其最核心的要素就是智慧科技和智慧馆员。因此,未来智慧图书馆科技体系的建设和馆员队伍的培养更应结合图书馆实际情况[15]。
2 大数据在智慧图书馆构建中的决策优势与挑战
2.1 智慧图书馆的定义
智慧图书馆是指以读者需求和QOS(服务质量)保证为中心,利用物联网、云计算和其它相关智慧化的设备,通过对传统图书馆进行升级、优化和改造,以及对图书馆所有知识的科学发现和有机地整合,使图书馆能够深刻感知外部服务环境、读者需求和服务模式的变化趋势,并在此基础上实现智慧管理和智慧服务的图书馆。从智慧图书馆的形成过程看,智慧图书馆的形成可划分为两个阶段:第一个阶段是图书馆信息的数字化,包括图书馆相关的管理与服务信息的采集、传输、存储、处理、计算、控制和数字化处理;第二个阶段是通过对图书馆数据的收集、挖掘、分析和知识发现,发现大数据中蕴藏的数据价值和智慧,为图书馆的构建、管理和用户服务提供智慧的决策支持。数字化图书馆向智慧图书馆变革主要有4个标志性的区别,分别是智慧图书馆可实现数据价值的深度挖掘、知识的全面发现、定律的科学定义和决策的实时生成。从智慧图书馆的系统功能划分,智慧图书馆可划分为智慧环境、智慧读者、智慧管理、智慧服务、智慧阅读、智慧移动和智慧交流7个部分,同时,智慧图书馆的构建应实现对外部环境的全面感知、内部服务要素与读者的广泛互联、高新技术与图书馆业务的深度融合、服务开放和多模式的原则。
2.2 大数据的决策优势
大数据具有数据体量巨大(Volume)、类型繁多 (Variety)、低价值密度 (Value)、 处理快速 (Velocity)和复杂(Complexity)的“4V+1C”特点[16]。大数据权威研究专家维克托·迈尔-舍恩伯格在其名著《大数据时代》中认为,大据时代有三个重大转变:“第一是我们可以分析更多海量的数据,甚至可以处理和某个特别现象相关的全体数据,而不是依赖于对数据的随机采样,更多精确的数据可以使我们发现更多的细节。第二是我们研究数据的总体量巨大,使我们放弃了传统追求数据精确度的做法,转而从对海量大数据的分析中获得洞察力。第三是我们不再热衷于寻找事物的因果关系,而是热衷于探索事物之间的相关性” [17]。因此,基于大数据自身特有的价值属性和决策优势,以及智慧图书馆的运营与服务数据指数级快速递增、高价值总量、读者强相关性和高可用性的特点,使大数据在智慧图书馆的系统构建、运营管理、用户服务和服务风险规避中具有较强的科学决策优势。
首先,图书馆可利用服务器监控设备、视频监控器、传感器网络、可穿戴阅读设备和第三方运营商共享的数据,对图书馆相关的系统运营、用户服务和读者阅读行为等,进行全方位、不间断的采集、处理、挖掘、融合、分析和价值提取。此外,通过对大数据相关性的发现,可以科学构建与图书馆服务和用户阅读活动相关的动态感知与监控模型,实现对图书馆系统运营有效性、读者阅读需求、服务外部环境变化和服务竞争市场的智慧感知,可保证图书馆发展宏观策略的定制、管理与运营制度、读者个性化服务内容的定制与推送、服务的安全性与可信度保证等,能够依据图书馆大数据新价值的发现而动态调控、优化和完善。其次,图书馆通过对服务系统的配置参数、运营和维护大数据的采集,科学构建图书馆客户管理、服务系统运行效率、运营风险的实时评估系统模型,实现对图书馆客户管理系统、数据中心运营效率和服务安全风险的感知、预测、评估、预警和智能化管理。第三,大数据具有海量、多样、高价值、处理快速的4“V”特点,大幅增加了大数据采集、处理、存储和决策的复杂性与难度。图书馆可通过对大数据在采集、清洗、过滤、存储、分析和决策过程的数据生命周期质量管理,以及将位于不同系统、不同数据存储模式和不同所属对象的大数据进行融合与共享,可增强大数据决策的价值量、可用性和可控性。
2.3 ICT技术增加了图书馆大数据采集的复杂度
近年来,随着ICT技术和云计算技术的快速发展,以及相关技术在图书馆服务中的广泛应用,图书馆的移动网络呈现出高带宽、低误码率、低延时和传输成本经济的优点,读者可以在任何时间、任何地点和任何距离享受图书馆的个性化定制服务。此外,集成电路制造与新材料技术的发展,也使用户阅读终端设计与制造过程遵循摩尔定律的规则,每隔18-24个月其性能将翻1倍以上,而制造成本则下降为原来的一半,导致图书馆服务模式向多样化、个性化定制、经济性和实时推送方向转变,在大幅提升图书馆服务科学性、安全性、时效性和经济性的同时,也使图书馆数据中心服务系统、传输网络和阅读终端的数据总量快速递增,其数据环境呈现海量、多样化、高价值和处理快速的大数据4“V”特点,使图书馆服务模式从“业务驱动型”向“数据驱动型”转变[18]。其次,ICT技术在保证图书馆服务模式、对象和内容多样性的同时,也使其数据具有海量、指数递增、多类型和复杂的特点,大幅增加了图书馆大数据采集、传输、存储、分析、决策的难度和成本。此外,大数据无规则地分布存储于图书馆的子信息系统、网络传输节点和用户终端,图书馆难以实时、全面地对位于不同业务部门和信息节点的大数据进行采集、标准化处理、整合、分析和推送。第三,大数据应用的投资收益率是关系智慧图书馆建设有效性和智慧服务经济性的关键问题,因此,图书馆在保证服务系统智能需求和大数据决策科学性的前提下,如何利用ICT技术有效提升大数据采集、存储、融合、管理、处理、分析和决策的科学性与标准化水平,也是关系图书馆大数据决策有效性的关键。
2.4 可穿戴设备与物联网络增加了大数据价值提取的难度
对服务器运行参数、服务环境、读者阅读行为、阅读社会关系、阅读终端设备等大数据的全面、准确和实时采集,是图书馆科学、准确、实时、快速地从大数据分析中获取知识,全面、精准地描述图书馆的服务效率、读者阅读需求、服务环境变化和读者阅读模式变化趋势的前提。因此,科学、规范地从数据中心服务器、数据传输网络、RFID设备、无线传感器、移动阅读终端、读者可穿戴设备上采集数据,是确保图书馆大数据决策的科学性和可用性的前提[19]。
当前,高新技术的发展正推动着图书馆服务模式和读者阅读方式快速变革,从可穿戴设备中全面、动态和不间断地采集读者的阅读行为、生理特征、心理变化等数据,已成为图书馆获取读者相关大数据的主要方式。可穿戴设备产生的数据具有海量、快速递增、多类型、实时性和保密性的特点,因此,要求图书馆大数据平台安全、可靠和经济,以及具备大数据处理性能高和系统兼容性强的优点,可为读者个体阅读活动的精准数字画像提供科学的大数据决策支持。其次,图书馆从数据中心服务器、数据传输网络、RFID、无线传感器、移动阅读终端、可穿戴设备上采集的数据,具有海量、多样、高价值和处理快速的大数据4“V”特点,而云计算技术恰恰是科学、高效地传输、存储、处理、融合、查询、检索、分析和挖掘这些大数据的关键支撑技术。因此,图书馆如何依据自身业务特点和读者阅读需求构建云服务平台,是图书馆实现基于云计算技术的超大规模计算和海量存储的前提。第三,随着物联网技术的发展与应用,图书馆可通过GPS(全球定位系统)、射频识别、红外感应器、激光扫描仪、气体感应器等信息传感设备采集相关大数据,并按照约定的通信协议利用互联网络将图书馆的感应器、服务设备、控制器、阅读终端等设备与读者连接起来,实现了对读者、设备、服务的智能化识别、定位、跟踪、监控和管理。物联网络采集的大数据具有海量、高价值、持续和动态的特点,因此,如何依据图书馆的业务流程与读者个性化服务需求的动态变化,有效降低大数据中的噪声信号和增强大数据的决策相关性,是图书馆大数据分析面临的又一个难题[20]。
2.5 大数据的质量及其开放程度是智慧图书馆构建的关键
随着图书馆服务模式与读者阅读方式多样化的发展,图书馆大数据的数据总量与数据环境的复杂度也快速增長。因此,如何有效过滤数据噪声与完全提取大数据中的价值,增强大数据分析、决策的相关性与可用性,已成为全面挖掘大数据中蕴藏的知识和科学构建智慧图书馆的关键。
首先,图书馆通常依靠视频监控设备、读者管理信息系统、服务监控设备、传感器网络、网络管理服务器、可穿戴设备和阅读终端等采集相关大数据,大数据的采集过程具有多数据源、多模式、持续和多噪声干扰的特点,部分大数据不能满足数据量化、处理和分析的质量需求,这些高噪声数据和假数据的存在,会大幅降低大数据在智慧图书馆构建中的决策科学性和可用性。其次,图书馆各部门的业务具有一定的独立性和不相关性,会导致各部门的业务数据存在信息孤岛的现象。因此,如何在图书馆内部以及与第三方之间实现业务数据的公开、共享、融合和二次挖掘,全面消除图书馆不同业务部门之间的数据壁垒,是图书馆实现以大数据决策为依据的智慧图书馆顶层设计,增强图书馆不同业务部门与系统平台数据联动和智慧管理能力的关键。此外,如何确保所采集大数据完整、精确和高价值密度,以及对多类型大数据进行标准化处理的科学性,也是关系图书馆大数据开放性的重要问题。第三,图书馆在大数据采集、传输、共享、处理、分析和决策中,具有监控数据节点多、管理成本高、安全技术复杂和业务持续性的特点。因此,如何依据大数据应用和安全性的需求,对大数据管理员、普通图书馆员、设备供应商、第三方共享人员设定不同的大数据访问权限,并对各种非法访问、恶意操作、误操作和越权访问行为进行跟踪、定位和追溯,直接关系图书馆大数据价值发掘的有效性和数据开放过程的安全性。
3 智慧图书馆构建与智慧服务的相关问题
3.1 图书馆智慧管理与服务系统构建
当前,随着图书馆服务模式与读者阅读方式的快速变革,图书馆大数据的数据总量、价值属性、可用性和可靠性快速增长。此外,伴随大数据技术与云计算技术的快速发展,以及在图书馆管理与服务中的广泛应用,图书馆大数据的海量、多类型、低价值密度和不相关性等特点,已不再是决定图书馆大数据决策科学性与应用有效性的关键因素,基于大数据决策的科学支持,图书馆的管理与服务正在从传统的“馆员经验治理”模式向大数据时代的“数据科学决策”模式转变。
对智慧图书馆的构建、功能、服务和管理等方面分析,智慧图书馆主要由智慧馆员、智慧管理、智慧服务、智慧环境、智慧阅读、智慧读者等6个方面的组成内容。对智慧图书馆的系统功能结构与大数据智慧决策的原理分析,智慧图书馆应依据大数据的生命周期发展规律,将图书馆采集的原始大数据按照数据——信息——知识——智慧的过程有效转变,并依据大数据在不同转换阶段的价值属性与可用性特点,通过智慧决策结果来分层构造和管理图书馆。此外,基于大数据的智慧图书馆决策系统的构建,应重点加强系统的大数据采集能力、数据的信息转化能力、数据价值的感知能力、大数据知识库的构建能力、多类型数据的关联分析能力、智慧的解答与可视化展示能力的建设,才能保证图书馆智慧决策结果安全、科学、高效、经济和可用。本文设计的基于大数据的智慧图书馆系统分层结构框架如图1所示。
该系统结构主要分为数据感知层、数据传输层、数据分析层、智慧服务层4个部分。数据感知层是智慧图书馆构建的基础设施层,由视频监控设备、网络监控设备、阅读终端、传感器、移动阅读终端、二维码扫描设备、管理信息系统、可穿戴设备等组成,主要完成图书馆服务环境、读者阅读情境、服务器运行参数、服务系统效率、读者阅读收益等数据的采集,是图书馆采用统一的标准或协议,将读者、服务设备和其它相关设施通过互联网络相连接起来,以实现对图书馆服务环境、读者、服务设备等要素的感知、识别、数据采集和量化,并将所采集的大数据进行存储和预处理,是大数据处理、查询和网络传输的最底层基础平台。数据传输层由光纤网络、无线局域网络、RFID网络、传感器网络、蓝牙网络、红外线和网络管理设备等组成,负责将数据感知层采集的大数据安全、快速、经济和实时地传输到图书馆数据中心大数据存储库,并将隐匿有高价值数据的大数据转换为信息,能够保证繁杂、多结构和低价值密度的大数据可被图书馆业务部门高度共享、处理和挖掘。数据分析层由大数据质量管理模块、大数据挖掘模块、语义引擎、数据噪声过滤模块、数据标准化处理模块、大数据整合模块、可视化分析模块和数据挖掘算法等部分组成,主要对由数据传输层传输来的高噪声、低价值密度和低相关性数据,进行数据噪声过滤、标准化处理、数据挖掘和数据价值可视化分析等操作,并将从大数据中发现、挖掘的智慧与知识存储在大数据库中,为图书馆的系统管理、用户服务和读者满意度保证等提供科学的大数据智慧决策服务。智慧服务层是智慧图书馆系统结构的最高层,基于大数据分析层的智慧化分析支持,可为图书馆的管理与服务提供智能环境感知、服务智慧管理、智慧阅读推送、服务安全管理、用户需求预测、个性化服务智慧定制、智慧读者、系统智慧评估与优化等支持,并有效保障图书馆大数据决策的科学与读者QOS(服务质量)。
3.2 智慧图书馆构建与智慧服务涉及的关键问题
3.2.1 必须增强图书馆大数据的开放性与标准化程度
图书馆服务系统对读者、设备、环境、物品、信息的自动智慧感知、互联、挖掘、分析、学习、决策和执行,是图书馆从大数据中发现知识和将数据转换为智慧的重要流程,而大数据的开放性与标准化程度,则是关系图书馆大数据决策有效性、科学性、智慧化和个性化水平的关键因素。因此,图书馆必须不断提升大数据的开放性与标准化程度,来增强大数据的价值密度、可用性和数据融合后的价值增量。
为了增强大数据的开放性,图书馆必须统一各业务部门、系统设备、数据传输接口、数据采集终端和安全管理系统的数据标准,特别要严格规范大数据在采集、传输、处理、整合和应用等环节的质量管理,依据图书馆各业务部门在管理、运营和服务过程中对大数据的精确性、流通性、完整性的需求,对大数据的精确度、属性、逻辑一致性、数据完整性和层次关系等进行规范[21]。其次,图书馆大数据的海量、多类型特点是制约大数据开放性的主要因素。图书馆可利用云计算平台的虚拟化存储和智能数据压缩技术,通过噪声过滤、冗余數据删除和数据二次重组,大幅度降低大数据的数据总量和提升大数据的价值密度、可控性,确保大数据开放过程科学、高效、经济、可用和可控。第三,大数据在图书馆多个管理与服务系统之间的交换、共享,以及将在不同终端感知设备中采集的强相关大数据进行整合与集成,是图书馆大数据价值挖掘和知识发现的前提。图书馆在加强内部业务部门大数据开放、共享的前提下,还应将大数据应用和图书馆的真实业务场景相结合,将图书馆大数据和第三方共享大数据相融合,通过大数据的二次挖掘实现大数据的增值。
3.2.2 对读者阅读行为进行全面、连续的感知
利用视频监控设备、网络监控设备、阅读终端、传感器、移动阅读终端、二维码扫描设备、管理信息系统、可穿戴设备和GPS(全球定位系统)等,图书馆实现了对外部服务环境、读者阅读行为和用户生理特征数据等,进行全面、自动、不间断的感知与采集,完成了图书馆与读者之间、读者与读者之间、服务内容与读者需求之间的大数据关联。在图书馆采集的读者相关数据中,数据的多源性、完整性、价值总量和价值密度等是关系大数据决策科学性、可用性和可控性的关键因素,此外,为了增强读者服务推送的实时性、精确度和个性化水平,图书馆在大数据的采集、处理、整合和分析过程中,必须融合读者相关大数据的阅读情境、用户需求和阅读方式等内容[22]。
读者阅读情境数据可划分为静态情境数据和动态情境数据两类。静态情境数据主要由读者的性别、年龄、专业、阅读长期兴趣等长期稳定的数据组成,动态情境数据主要由阅读环境、读者地理位置、阅读心情、阅读时间、阅读短期兴趣等数据组成,易受外界环境及数据之间的相互作用而变化。在基于读者阅读情境数据的个性化服务决策与推送决策中,图书馆应重点关注情景大数据的噪声过滤、数据标准化处理和情境建模过程,依据实时情境数据和历史情景数据与读者个性化服务的相关性,赋予每个情境数据不同的权重因子,并依据图书馆在读者个性化服务过程中的总体服务收益和读者阅读满意度的变化,对情境数据的权重因子进行动态调整,才能确保图书馆个性化服务定制内容精准、实时、经济和可用。此外,图书馆大数据中心应实现对情境数据的实时处理、存储、匹配、计算和分析,在情景数据的决策中融合读者的文化水平、阅读兴趣、浏览记录、阅读关系和情景数据相关性等参数,实现情景数据分析平台对读者个性化服务系统的控制与反馈优化,确保服务内容具有较高的用户个性化相关性与推送精准性。
3.2.3 对图书馆用户服务系统的运维环境与风险进行动态监控
通过对用户服务、网络传输、信息管理等系统大数据的采集、分析与决策,图书馆可以预测、捕获、监控和评估服务环境与服务系统面临的风险,并制定科学、高效、经济和动态安全管理策略,可有效降低图书馆系统的运行风险和提升服务的可信度。
图书馆在对相关服务系统、传输设备和信息管理系统进行大数据采集、处理、分析与决策活动时,应坚持实时、快速和动态的原则,并具备对安全事件精确、高效的响应和事后追溯能力。监控系统应支持对所有主流文件类型与传输协议数据的监控,监控对象应覆盖主机服务器、网络设备、安全管理设备、数据库和阅读终端等,当有安全触发事件发生时,图书馆安全管理与防御系统可依据大数据决策结果智能、自动地做出安全响应,并对结果进行评估、可视化展示和反馈优化。其次,为了增强图书馆安全事件发现、分析、决策的灵敏度和时效性,应增强安全大数据采集的广泛性和降低大数据的细粒度,将安全大数据实时决策结果,动态地运用到图书馆安全防御系统构建、IT服务系统风险控制、安全对象扫描、安全性审计和安全结果的可视化展示中,确保当多个安全事件同时突发时,安全管理系统可依据图书馆服务系统运行和安全威胁的程度,按照安全事件的威胁级别、服务内容等级和读者优先级,在满足图书馆安全管理事件对系统资源需求的前提下,保证读者具有较高的阅读收益率和愉悦感[23]。第三,通过对安全大數据的分析与决策,图书馆可发现安全管理系统自身存在的弱口令、抗攻击性、自身防御性、安全管理有效性、数据安全性等问题,有助于安全管理员利用大数据决策结果,科学提升安全管理系统的智慧管理水平和运维风险控制能力。
3.2.4 大数据决策应覆盖智慧图书馆构建、管理与服务全程
智慧图书馆的构建是一个涉及服务环境的智慧感知、读者与服务系统资源的智慧管理、读者个性化服务的定制与推送、智慧馆员与智慧读者培育等内容的复杂课题。因此,图书馆大数据决策应覆盖智慧图书馆的构建、管理与服务全程,才能确保智慧图书馆构建和读者服务保障过程科学、智慧和自动化。
服务环境的智慧感知主要体现在图书馆对读者阅读需求、服务系统资源和QOS(服务质量)的智慧化感知、管理、分配和优化上。管理员在分析传感器采集到的读者群体行为数据、服务请求负载总量、服务系统能耗、室内环境温度、系统运行效率、火灾事故监控等数据的前提下,结合图书馆实际的服务系统资源总量、读者的阅读需求、读者阅读模式、阅读环境温度与湿度变化趋势等数据,制定科学、高效、经济和可控的智慧环境管理策略,可以实时、动态地对图书馆的服务系统资源、系统能耗、服务环境安全性、环境温度与湿度等,进行智慧和自动化的监控、调度、管理、控制与优化。其次,多媒体阅读已成为当前大数据环境下读者阅读的主要方式,多媒体阅读方式在提升读者知识收益率和愉悦感的同时,也导致图书馆的服务、管理大数据呈现海量和指数递增特点。因此,图书馆应通过大数据技术,将图书馆、读者、IT服务系统和网络传输系统紧密联为一体,将读者阅读需求、服务系统资源和海量多类型大数据等,进行协同预测、处理 、分析、调度、分配和优化,才能实现图书馆系统管理与用户服务投资收益的整体最优化。第三,智慧的图书馆员是智慧图书馆组成的核心因素,在智慧馆员的培养中,图书馆应注重对馆员大数据素养和大数据应用能力的培养,特别应加强图书馆员自身的大数据价值发现、强相关数据的融合、大数据的管理、数据知识的获取等能力培养,才能提升图书馆员的智慧管理与智慧服务能力,真正实现图书馆员、大数据技术、图书馆业务三者的完美结合[24]。
4 结语
当前,随着云计算技术、分布式处理技术、大数据存储技术和感知技术的快速发展,以及在图书馆管理与服务中的广泛应用,图书馆的服务模式和读者阅读方式已发生深刻变革,图书馆数据环境日趋复杂并具有大数据的4个“V”特征,图书馆已进入大数据时代。大数据时代,图书馆对读者阅读行为、IT服务器运行、视频监控、阅读终端等进行广泛、持续的数据采集,使图书馆数据环境呈现出海量、复杂和异构特点。因此,如何在复杂的大数据中发现数据中蕴藏的价值和知识,并将大数据中的价值和知识转换成智慧,是科学构建智慧图书馆和智慧服务模式面临的严峻挑战[25]。
在智慧图书馆的构建中,图书馆首先应加强大数据在采集、噪声过滤、处理、存储和分析等过程的质量管理,努力提升大数据的价值总量、密度、可用性和可控性,确保数据转化为信息、信息转化为知识、知识转化为智慧的过程科学、高效、准确和可控,能够为智慧图书馆构建提供科学的大数据决策依据。其次,大数据决策应与图书馆的智慧服务能力建设和读者的智慧阅读需求相结合,将大数据决策结果广泛运用到图书馆的智慧决策系统、智慧管理系统、智慧服务系统和智慧安全保障等子系统的建设中,才能提升服务子系统的综合智慧服务能力。第三,图书馆还应基于大数据决策结果努力构建智慧的服务环境、智慧的图书馆员、智慧的读者,才能提升图书馆的智慧决策、智慧感知、智慧服务和智慧阅读能力,才能为读者提供真正意义上的智慧化阅读服务。
参 考 文 献
[ 1 ] Repanovici A,Turcanu M. Smart Library:RFID implementation in Libraries[M]. Artificial Intelligence Series-WSEAS,2009:523-526.
[ 2 ]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:35-37.
[ 3 ] Aittola M,Ryhanen T,Ojala T.Smart library:Location Aware Mobile Library Service[C]//Proceedings of the 5th International Symposium on Human-Computer Interaction with Mobile Devices and Services(Mobile HCI).Udine:Springer,2003:411-415.
[ 4 ]王世伟.论智慧图书馆的三大特点[J].中国图书馆学报,2012,(6):22-28.
[ 5 ] AITTOLA M,RYHANEN T,OJALA T.Smart Library:Location-Aware Mobile Library Service[J].International Symposium on Human Computer Interaction with Mobile Devices and Services,2003,(5):411-415.
[ 6 ] Miller M C,Reus J F,Matzke R P,et al.Smart libraries:Best SQE practices for libraries with an emphasis on scientific computing[EB/OL].[2017-03-08].https://e-reports-ext.llnl.gov/pdf/3149.
[ 7 ] The Royal Society.Knowledge,Networks and Nations:Global Scientific Collaboration in the 21st Century[EB/OL].[2017-03-13]
[ 8 ] IBM公司.智慧地球赢在中国[EB/OL].白皮书,2009-02[EB/OL].[2017-03-15]https://wenku.baidu.com/view/1ac69bf8c8d376eeaeaa31fd.html
[ 9 ] Aittola M,Ryhanen T,Ojala T. Smart Library:Location Aware Mobile Library Service[C]//Proceedings of the 5th International Symposium on Human Computer Interaction with Mobile Devices and Services(Mobile HCI)[J]:Springer,2003:411-415.
[ 10 ](英)伊安·约翰逊 .智慧城市、智慧图书馆与智慧图书馆员[J].陈旭炎,译.图书馆杂志,2013,(1):41-47.
[ 11 ] 祝森生.大数据时代关于智慧图书馆的几个研究问题探讨[J].图书与情報,2013,(5):126-128.
[ 12 ] 马晓亭.大数据时代图书馆个性化智慧服务QOS保障研究[J].现代情报,2014,34(12):69-73.
[ 13 ] 黄辉. 基于物联网标识体系的智慧图书馆建设研究[J].图书馆工作与研究,2014,(8):41-44.
[ 14 ] 刘喜球,王灿荣.可穿戴技术:构建智慧图书馆的助推器[J].图书馆论坛,2015,(6):105-108.
[ 15 ] 储节旺,李安. 智慧图书馆的建设及其对技术和馆员的要求[J].图书情报工作,2015,59(15):27-34.
[ 16 ] 田梅.基于关联主义学习理论的智慧图书馆服务模式构建[J].图书馆学研究,2014,(19):64-67,46.
[ 17 ] 李小涛,邱均平,余厚强,等.论智慧图书馆与知识可视化[J].情报资料工作,2014,(1):6-11.
[ 18 ]曾子明,陈贝贝.融合情境的智慧图书馆个性化服务研究[J].图书馆论坛,2016,(2):75-63.
[ 19 ]吴吉玲.数字图书馆与智慧图书馆比较研究[J].情报资料工作,2015,(2):43-45.
[ 20 ]秦殿启.智慧图书馆的语境、要素和发展路径[J].图书馆,2016,(6):35-38,91.
[ 21 ] 郎玉林.智慧图书馆发展策略研究[J].图书馆,2015,(4):77-79,84.
[ 22 ]陈卫静.智慧图书馆在大数据环境下的智慧分析[J].图书情报工作,2015,59(12):49-52.
[ 23 ]Executive Office of the President.Obama Administration Unveils“Big Data”Initiative:Announces $ 200 Million in New R&D investments[EB/OL].[2017-03-15].https://www.white-house.gov/sites/default/files/microsites/ostp/big_data_press_re-lease_final_2.pdf.
[ 24 ]约翰逊,陈旭炎.智慧城市、智慧图书馆与智慧图书馆员[J].图书馆论坛,2013,32(1):113-114.
[ 25 ]李后卿,董富国. 智慧图书馆服务实现策略探析[J].图书馆,2016,(5):80-84.
(本文责任编辑:孙国雷)