APP下载

智慧图书馆建设背景下边缘计算技术的应用探析
——以深圳大学图书馆为例

2022-01-15张文新

图书馆研究与工作 2022年1期
关键词:边缘监控智慧

张文新

(深圳大学图书馆 广东深圳 518060)

1 引言

近年来,大数据、物联网、人工智能等新一代信息技术在图书馆的广泛使用,加速了图书馆的转型升级,推动了可穿戴设备、AI机器人、BIM(Building Information Modeling,建筑信息模型)、VR/AR等智能设备的大规模部署,也带来了终端数据快速增长和数据结构类型高度复杂化的问题,使得线性增长的计算能力和传输带宽无法匹配指数级增长的终端数据,导致云计算技术无法满足海量数据的实时处理需求,阻碍了图书馆的创新与发展。面向边缘侧数据计算的新计算模型——边缘计算(Edge Computing,EC)[1-2]应运而生,为这一问题的解决提供了新的技术手段,为智慧图书馆的发展起到了积极的推进作用。智慧图书馆是在信息技术基础上的整合集群与协同管理,是以绿色发展和数字惠民为本质追求,以推动用户的智慧活动过程为目的,以引导用户知识转化能力为核心的现代化图书馆[3-4]。通过部署在图书馆侧的边缘计算节点对智能设备产生的数据进行存储与计算,可以提升图书馆智慧服务的响应实时性。因此,本文分析了边缘计算在图书馆中的应用价值和可行性,并以深圳大学图书馆的应用实践为例,阐述了边缘计算对图书馆业务自动化、智能化水平的提升作用,为智慧图书馆的建设发展提供参考与借鉴。

2 边缘计算的应用价值和可行性分析

2.1 应用价值

边缘计算所具备的低时延、高效数据处理、情景融合等特点[5]能够很好地满足智慧图书馆的发展需求,具有广泛的应用价值。

2.1.1 完善服务体系

(1)提高服务响应速度。随着生活节奏的不断加快,用户对服务的响应速度变得更加敏感。云计算较高的响应时延和网络带宽要求无法对强实时性服务做出及时响应,服务效果大打折扣。边缘计算为用户提供毫秒级的端到端时延,能够及时响应用户请求并做出实时判断,有效提高用户体验满意度和用户黏度。

(2)提升服务品质。随着国家对创新的重视,服务创新正成为图书馆界发展的重点[6]。新服务新业态层出不穷,但较高的资金、技术、人力和设备要求,令部分创新型服务或疏于管理、或内容疏于更新、或流于形式,反而降低了图书馆的服务品质。如果将边缘计算融合进智慧图书馆服务中,那么通过边缘设备实时采集和分析用户在馆行为、线上交互数据(如图书馆服务平台、微信公众号、图书馆APP等线上系统的操作日志),可以增进图书馆对用户的了解,形成长效反馈机制,从而持续迭代服务内容、提升服务质量,使服务始终切合用户的当前需求。

(3)促进业务规模化发展。刘炜等人[7]认为智慧图书馆的“智慧”表现在具有大量的“无人”或“自助”服务,和能够自动感知用户需求的精准服务。实际上,图书馆并非没有支撑这些智慧服务的技术,但碍于网络条件、环境因素、服务可靠性等限制,未能形成规模化发展。边缘计算能够利用无处不在但物理上分散的边缘设备,将服务源和网络性能提高几个数量级,从而在网络连接受限的情况下持续提供高质量服务,实现过去难以实现的智慧应用场景。

2.1.2 提高管理水平

边缘计算的引入为馆内多元异构资源协同提供新的技术支撑,实现更精细化的管理。

(1)提高馆舍管理水平。随着图书馆服务功能的拓展,娱乐休闲正逐渐成为图书馆又一标签属性,用户对馆舍空间资源服务智能化的需求与日俱增。遗憾的是,当前馆舍普遍存在着重建设轻管理的现象,影响着馆舍资源的使用和功能的发挥。边缘节点可以对馆内温湿度、照明系统进行实时智能监控,能够根据馆内外环境变化自动调节室内温湿度和照明强度,为用户创造更舒适的体验环境。

(2)提高监控能力。智能安防监控是场馆管理的重要组成部分,包含摄像头联网、人脸识别、人流监测、风险预警、应急疏导等功能,其中视频监控是实现智能安防监控的主要方式。然而由于视频本身的非结构化数据特性和爆炸式增长的视频数量,导致基于云计算的视频监控技术无法同时满足视频实时传输、目标实时识别和视频无损压缩的监控需求,同样需要边缘计算技术的支持。基于边缘计算的视频预处理技术[8]可以对视频图像进行预处理,去除视频冗余信息,减少网络带宽的需求和无效视频的存储,提升视频分析的效率,从而实现远程实时控制和提前预警,更有效地保障读者、图书馆和馆员的安全。

2.1.3 降低数据泄露造成的损失

边缘计算将隐私数据的操作限制在防火墙内,提升数据的安全性[9],不但可以减少数据泄露风险,还能够降低数据泄露造成的损失,这是因为边缘计算可以对上传数据进行脱敏处理,减少信息暴露度,从而降低云数据泄露造成的损失。此外,如果是边缘设备的数据被泄露,由于边缘设备仅“关注”本地的、临时的数据,因此设备的存储资源相对有限,数据保留时间较短,在一定程度上可以降低数据泄露造成的信息损失。

2.2 可行性分析

2.2.1 现实基础

资源获取方式的进步与信息服务竞争的加剧促进了新一代信息技术在图书馆的长足发展,也为边缘算力在图书馆的成功部署提供了现实基础,主要表现在:一方面,新一代信息技术的广泛使用促使图书馆非结构化数据迅速增加,数据结构类型复杂度日益加大,现有技术的数据处理效率难以提高,图书馆面临着技术升级换代的客观需求;另一方面,新一代信息技术的广泛使用有助于减少边缘计算应用落地所投入的成本,进而增强边缘计算对图书馆的吸引力。

2.2.2 历史机遇

近年来,中央密集部署与新型基础设施建设(以下简称“新基建”)相关的任务,强调要丰富新基建应用场景,加强新基建投资支持政策,为此各省市纷纷将新基建纳入今后的投资重点,出台配套政策措施。新基建时代的到来为智慧图书馆的建设发展带来新的机遇,也为边缘计算——新基建的一项重要技术支撑,在图书馆智慧服务中的部署提供良好的契机。

2.2.3 边缘产品大规模使用趋势明显

2014年,欧洲电信标准化协会(European Telecommunications Standards Institute,ETSI)率先发布了移动边缘计算白皮书[10],内容涵盖边缘计算的概念、应用场景、平台架构和部署方案等方面,拉开了边缘计算产业化序幕;2017年亚马逊推出了首个商用边缘产品AWS IoT Greengrass[11],使亚马逊云服务无缝扩展到边缘设备;2018年谷歌推出了两款边缘计算产品,即硬件芯片Edge TPU和软件工具Cloud IoT Edge,意在帮助客户开发和部署边缘设备;英伟达、英特尔、高通等硬件厂商也先后推出边缘AI芯片并在多重场景中落地。

我国的边缘计算商业应用紧跟世界步伐,云服务商纷纷布局。2016年10月华为发起成立了边缘计算产业联盟(Edge Computing Consortium,ECC)[12],2017年发布了基于边缘计算的物联网EC-IoT(Edge Computing IoT)解决方案,2018年又推出了智能边缘平台(Intelligent EdgeFabric,IEF)和昇腾310芯片,是国内边缘计算行业的引领者;BAT也不甘落后,2018年百度云发布了智能边缘计算产品BIE(Baidu Intelligent Edge)[13]和开源边缘计算平台OpenEdge,是我国首个同时实现商业化和开源的边缘计算产品的云服务商;同年,阿里云推出了IoT边缘计算产品Link IoT Edge[14],凭借着阿里云强大的技术实力和极高的市场占有率,在互动直播、在线教育领域应用广泛;2019年腾讯云公开了边缘计算网络平台(Tencent Smart Edge Connector, TSEC),致力打造成为5G/IoT网络、移动用户和业务之间的连接器。

由此可见,目前国内外边缘计算产业蓬勃发展,应用加速落地,相信不久的将来,边缘服务会像今天的云服务一样无处不在,而这样的前景将有助于消除图书馆对边缘计算的疑虑。

3 深圳大学图书馆的应用实践

边缘计算的应用优势引起了深圳大学图书馆(以下简称“深大馆”)的注意,深大馆以设备监控为切入点,积极探索基于边缘计算的图书馆应用体系架构,设计和实现了基于边缘计算的设备监控平台。平台已于2019年12月上线试运行,在战“疫”期间充分发挥出远程智能运维的价值,验证了边缘计算在图书馆中应用的有效性。

3.1 系统架构设计

如图1所示,监控平台由数据采集层、数据处理层和应用层三个模块组成。

图1 系统架构

3.1.1 数据采集层

数据采集层由各类型传感器、摄像头以及数据采集插件和旧监控系统组成,主要用于数据实时采集与上传。为了更平滑地整合已有监控资源,以及减少对被监测软件系统的程序改动,数据采集层采用了非侵入式数据采集方法,提取第三方系统的监控数据,不间断地向边缘计算层发送监控数据,既满足了软硬件设备运行状态数据采集的需求,又节省了平台建设经费,还降低了程序实现难度。

3.1.2 数据处理层

数据处理层可划分为边缘计算和云计算中心两部分。云计算中心主要用于重要数据统计与持久化、异常数据分析、模型训练,以及更新边缘服务器的业务模型;边缘计算则由网络边缘设备、网关和边缘服务器组成,通过网络链接和协议转换联接终端设备和数字世界,执行前端数据计算和异常数据上传任务。

3.1.3 数据应用层

数据应用层所提供的监控程序基本覆盖运维人员的日常监控工作,强化图书馆对设备资源的掌控和管理,缩短故障响应时间。不同于传统的单向服务响应流系统,基于边缘计算和微服务架构的设备监控平台能提供更快速高效的多元化服务。

3.2 核心功能

3.2.1 机房监控

早在2009年深大馆已采用机房监控系统,该系统提供了B/S和ActiveX两种监控途径,但由于浏览器兼容性、设备老旧、无监控历史数据和后续升级服务等问题,达不到无人值守的效果,进而添购了UPS监控和温湿度监控两款监控子系统。但这些系统仅采集各自的传感数据,彼此数据互不共享,反而增加了工作人员的监控复杂度。为了控制研发成本,监控平台利用图像识别、网页爬取、日志分析等技术手段,实现了动力系统、回路开关、温湿度、消防、水浸等参数跨系统联查联控,并运用机器学习技术,从历史数据中挖掘各类参数之间的联系,从而更及时准确地发现设备故障和隐患。

3.2.2 网络及自助设备监控

①利用多种网络协议对图书馆业务网站、路由、无线AP和存包柜的工作状态、网络可用率等数据进行采集分析;②在自助借还书机中嵌入监控插件,通过监听借还系统状态信息,获取程序进程、内存/CPU使用率等信息,还提供了自助借还系统启动关闭功能,缩短了故障诊断与维护时间。

3.2.3 网页篡改检测

根据服务器部署位置的不同,本文将被检测网站划分成部署在图书馆内的本地网站和部署在云端的外部网站两类。文件哈希值是文件的“指纹”,随文件内容的变化而变化,因此哈希值校验是判断本地网站是否被篡改的最有效方法。通过文件采集模块采集本地网站文件的哈希值,再将数据集上传到附近的边缘服务器进行计算分析,即可立即发现网站异常,然后执行恢复措施,构筑网站安全的最后一道防线。对于外部网站则采用关键标签校验加敏感词检测的监控方法,定期爬取网站的重要页面,校验网页布局、文字内容、JS/CSS文件(见图2),不符合校验规则的页面将反馈给运维人员处理。

图2 校验流程示例图

3.3 效果评估

3.3.1 功能评估

图书馆设备监控的主要职责是监控本馆网络设备、服务器和业务系统,保障图书馆业务的正常开展。表1对比了新旧监控模式下的监控情况,可以发现新监控模式整合了各类监控资源,提高了监控自动化、智能化水平,解决了过去值守时间不足和整体监控耗时过长的问题,让运维从被动应对变主动作为。

表1 新旧模式比较

3.3.2 数据整合

原监控模式下,监控系统之间、运维人员之间“各自为政”,监控信息分散在不同的监控系统和运维人员中,图书馆对监控数据的掌控与使用程度有限,信息孤岛现象严重。依靠边缘算力,监控平台完成了多源异构监控数据的整合,打破数据烟囱与碎片化应用,为后续应用协同提供数据支撑。

3.3.3 性能分析

(1)篡改检测性能分析。为验证规则检测算法的准确率,本实验抓取了37个巡检网站的首页,随机修改网页结构、链接、文字内容或图片,形成篡改数据集,进行检测测试,平均检测耗时47ms,统计结果如表2所示。实验结果表明,平台检测速度快,反馈信息直观明了,整体检出率均处于较高水平,可以有效发现页面劫持、木马挂载等网络危害。

表2 篡改检测结果统计

(2)数据处理性能分析。在边缘计算技术支持下,实现了数据去中心化计算,所有监控数据的处理任务均迁移到边缘服务器执行,边缘服务器日均处理数据量超60万,仅将约1 600条重要数据上传至云端,数据流量由过去的日均约700MB下降到现在的不足300KB,极大地减轻了云计算中心的计算压力和存储压力。此外,极低的网络时延让监控平台能够在2秒内完成数万份本地网站文件的篡改检测操作,为图书馆提供几乎无感知的网站保护服务。

3.3.4 效益评估

边缘计算充分利用已有边缘设备的计算资源,降低了场地、供电、制冷、消防、网络等基础设施投入和冗余设备要求。同时,监控平台中的每个边缘计算服务都是独立部署、互不影响,因此容错率更高、可扩展性更好、技术选型更灵活,能够轻松满足未来功能拓展需求,具有很高的成本效益比。

综上所述,云边协同的监控平台在功能、数据整合、性能、效益方面都比传统云计算监控系统更具优势,有效解决了长期困扰图书馆的设备(尤其是软件设备)监控成效差、耗时耗力等问题。

4 结语

边缘计算拥有应用于诸多行业领域的巨大潜力,并对智慧图书馆的建设发展起到积极推动作用。虽然当前边缘计算在图书馆中的应用研究还处于初级阶段,但新基建的加速落地为边缘计算在图书馆的成功部署提供了良好契机,此外中国在边缘计算领域处于领先地位[15],也给国内图书馆开展智慧边缘服务开启先行之利。图书馆应抓住此次机遇,积极探讨基于边缘计算的智慧图书馆服务模式,加速边缘计算与图书馆各项业务的深度融合,早日全面实现智慧图书馆。

猜你喜欢

边缘监控智慧
The Great Barrier Reef shows coral comeback
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
看监控摄像机的4K之道
一张图看懂边缘计算
有智慧的羊
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)
在边缘寻找自我