无人服务智慧数字图书馆研究
2019-04-17吴峰梅
吴峰梅
2017年7月1日上海第一家无人超市落地,24小时营业,无营业员。据媒体报道,马云的首家无人超市7月7日正式落户杭州,东西拿了就走,无需等待排队付款。打开淘宝,扫门口二维码入店。一旦进店全程无需再掏手机,选好商品出门时屏幕会自动显示“商品正在识别中”,识别后再显示“商品正在支付中”,支付自动完成,闸门开启即可出店。无人超市对客人逛超市最喜欢走哪条路线,哪个货架客流量最密集,哪个货架客人停留时间最长等信息都会进行详细的数据收集和分析,无人超市的到来,将让大数据行业继续爆发。
在大数据时代背景下,高校数字图书馆该怎样发展?高校数字图书馆能否也和无人超市一样,出现无人数字图书馆用户只用借书卡或学生证扫描入馆,后续的借阅还书就可以自动完成。在当今以物联网、云计算、大数据和移动互联网为代表的新IT时代,这些功能的实现,从技术上讲已经完全没有问题,无人超市的落地就是最好的证明。
一、无人值守数字图书馆
(一)无人服务智慧图书馆
2016年6月,随着广州打造“图书馆之城”,图书馆数量增多,专业管理人才成为一个瓶颈。越秀区首批两家无人值守图书馆,分别在梅花街和黄花岗街面向社会开放,采用RFID自助服务,办证、借还书均由读者自助完成。走进梅花街分馆,门禁刷读者卡或手机二维码,自动玻璃门即打开,馆内藏有两万册图书,有一台图书自助借还机,具有借书、还书、查询、续借等功能。读者办理二维码电子读者卡后,用手机关注越秀区图书馆微信公众号,即可在自助借还机上实现扫码借书。
图1 无人服务智慧图书馆的典型组成
智慧图书馆采用无人值守的方式,通过RFID防盗系统实现智慧图书馆的智能化管理[1]陈鸿鹄. 智能图书馆设计思想及结构初探[J]. 现代情报,2006,26(1):116-118.[2]严栋. 基于物联网的智慧图书馆[J].图书馆学刊,2010(7):8-10.。若读者忘记办理借书手续便带书离开,RFID门禁会报警,并自动锁上门禁一段时间,提醒读者办理借书手续方可离开。无人服务智慧图书馆 的典型组成如图1所示[3]智能图书馆改变了大学图书馆的风景[EB/OL].[2010-12-01]. http://chinese.joins.com/gb/article.do?method=detai&lart_id =43056&category=002002.。
传统图书馆是被动地等待读者来借书。而智慧图书馆讲求“书往读者手上送”的新图书馆概念,要让一般民众有更多的机会接触到图书馆的图书。在这样的理念下,广设图书服务网点与服务网点便利性便成为重要的指标,服务网点越多越便利,民众越有可能因为方便而更多地利用图书馆,从而提升阅读量及借书率。智慧图书馆的设立应遵循以下策略:
(1)于人潮众多的地点,设置无人服务图书馆,提供书籍让民众随处可借还书。
(2)为忙碌而无法到图书馆或无阅读习惯的民众提供便利的机会。
(3)满足市民广设图书馆的需求。
(4)图书资料能快速周转,提高图书的可利用性,增加馆藏使用率。
(5)非开馆时间,仍可受理还书,并即时反映读者借阅状况。
使用条码作为资料辨识图书馆系统,因RFID技术的导入应用,将原本无法实现的无人服务图书馆变成可行,有两个关键问题需要解决:
(1)自助借还书操作简便性和借阅资料正确性 。虽然过去使用条码系统时就有自助借还书系统,但受限于条码读取须特定角度和范围,使用起来很不方便,不经馆员在旁协助说明,一般读者通常不会扫描条码,有时候处理一本书得花上1~2分钟,或者借阅多本图书只扫描部分图书亦是常发生之事,凡此皆须有人在场即时作处理。
(2)借阅读者身份认证的可信赖度。过去使用的条码式借阅证,系统使用证件上的条码作为账号资料,证件认证则靠人的眼晴来辨识真伪,这在无人服务图书馆会产生很大的认证风险,任何人只要随意印任一已知账号条码,便可通过系统借书,因为机器认不出假冒的借阅证。采用RFID技术可克服这个问题,由于RFID卡片制作成本相对较高,又可加入编码机制作为认证,因此无形中也增加了造伪门槛,同时也提供了无人服务图书馆所需的认证信赖。
(二)无人服务智慧数字图书馆
在大数据时代背景下,数字图书馆该怎样发展?数字图书馆能否也和无人服务智慧图书馆或者无人超市一样,用户只需用借书卡、学生证和二维码扫描入馆,后续的借还书就可以自动完成。无人数字图书馆不同于无人服务智慧图书馆。无人服务智慧图书馆需要设立场馆和书架,而数字图书馆则不需要场馆,不需要书架,资源的管理更方便。目前,学术资源数据库发展迅猛,中国最大的学术资源数据库——中国知网( CNKI)的资源已由中国期刊论文逐步拓展到国内外期刊论文、会议论文、学位论文、重要报纸文章、专利、标准等,同时还收录大量图书,不仅提供年鉴、工具书的查询服务,还建立了教辅平台。另一重要学术资源服务平台——万方数据知识服务平台,也提供了国内期刊论文、学位论文、会议论文、专利、标准、地方志、法规文献、科技成果、图书、行业机构、专家学者等学术资源。还有其他的资源数据库,如维普期刊服务平台等在学术资源收录方面取得了许多成绩。目前,这些数据库所拥有的非图书资源是国内绝大多数图书馆所无法比拟的。我国大多数高校图书馆已经离不开这些数据库提供的学术资源服务。作为以图书资源为主的“超星数字图书馆”,包括文学、经济、计算机等五十余大类,拥有数百万册电子图书,500多万篇学术论文,全文总量超13 亿页,已经达到一个大型图书馆的藏书规模,假以时日,将超过目前我国绝大多数图书馆的藏书。另外,该数字图书馆还收录了近20万集学术视频,这些数字资源对我国传统图书馆形成了很大的冲击。
除了以上以文献资源为主的数据库,一些网络资源服务商也开始涉足文献资源。例如,百度已进入学术资源领域,除了百度文库、百度百科等学术资源,还提供数十万种图书,2014 年上线的百度学术搜索更是提供了传统数字图书馆不能提供的学术信息。百度学术搜索是提供海量中英文文献检索的学术资源搜索平台,可以一站式检索到收费和免费的学术文献,是学术研究的好帮手。据测算,目前百度拥有的信息总量超过1 000PB,相当于国家图书馆藏书数字化后数据量的5 万倍,每天增加的数据量10TB,相当于半个国家图书馆的藏书数字化后的数据量[4]盘点中国2013行业数据量[EB/OL].[2015-07-01]. http: / /developer. 51cto. com/art /201402 /430185. htm.。当然,用百度的数据量和国家图书馆的藏书数据相比较也许不一定合适,因为在数据质量和规范上,国家图书馆拥有更大优势,而且现在国家图书馆也收藏了许多数字资源、图像视频资料以及互联网上的信息。本文在数据量上的对比,主要是为了引起图书馆人的重视,并对图书馆界产生警示。
由此可见,网络资源服务商在学术、教育、文化资源的建设上发展十分迅速,不论是资源规模还是种类,数字图书馆已无法比拟。这些资源服务商对资源的开发还在深入和拓展,服务的形式将会更加多样化,如此发展下去,数字图书馆将面临很大的威胁,未来发展会受到严峻挑战。数字图书馆将如何生存,如何发展,是否会被取代? 这是图书馆必须要重视的问题。当然,这种挑战也可能成为图书馆发展的机遇。图书馆必须借助大数据时代这一机遇,转变原有对资源内容、资源组织、技术、服务以及职能等方面的认识,重新架构数字图书馆,把挑战变为再一次腾飞的机遇。
二、无人数字图书馆的关键技术
无人数字图书馆的关键技术是以物联网、云计算、大数据和移动互联网为代表的现代新型IT技术。智慧图书馆的关键技术是以电子射频标签RFID为代表的物联网技术。无人数字图书馆的关键技术是以大数据处理技术为背景的新型IT综合技术[5][6][7][8]。
(1)物联网技术。物联网是互联网的延伸,负责全面感知世界,主要以RFID和各种传感器获得用户和资源的识别和定位。各种传感器获得的数据是海量数据,即大数据;其数据存储处理的有效工具是云计算。
(2)云计算(Cloud Computing)。云计算是一种虚拟化资源池,是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。云计算的核心思想,是将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池,向用户提供按需服务,提供超大容量存储和分布式并行计算。云计算是以提供基础设施服务(Infrastructure-as-a-Service, IaaS)、平台服务(Platform-as- a-Service, PaaS)和软件服务(Software-as-a-Service, SaaS)三种服务为主的基础设施。
基础设施服务(IaaS):基础设施服务是最基础的,它是云的一个服务端,用户可以通过互联网从计算机基础设施获得服务。IaaS的大多数用户是科技公司,他们通常有很强的IT专长,想要利用计算机强大的计算功能,但是又不想负责安装和维护。
平台服务(PaaS):是一个以云计算为基础的软件研发平台服务,公司可以利用这个平台在已有软件的基础上进一步发展或研发软件。PaaS环境能够和一些软件开发工具结合,例如Java,NET,Python等,更方便用户进行编码以及在网络上共享他们的程序编码。目前PaaS在云计算的市场份额在三个部分中最小,主要被一些公司用来外包他们的基础设施。
软件服务(SaaS):是目前云计算中利用最多且发展最成熟的一部分。利用互联网提供软件服务,而不需要被下载到用户端或者存储在一个数据中心。很多数据处理和文本处理软件如word等,开始逐渐转向一些云计算的软件服务,比如Google Apps,Microsoft Of fi ce 365等。
(3)大数据(Big Data)。大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据处理的有效工具是云计算。大数据具有4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。其中,Volume是指数据体量巨大,Velocity是数据快速增长,Variety是数据类型繁多,Value是价值密度低。
物联网、云计算和大数据三者间的关系是物联网产生大数据,云计算为大数据处理提供运算和处理平台,大数据为云计算提供用武之地。
三、无人数字图书馆服务
图书馆作为信息的集散地,很多学者围绕“自由获取知识是人类的权利”这一图书馆社会使命,提出了图书馆的社会价值是作为知识中心、学习中心和文化中心,肩负着社会大学的作用。目前,图书馆所采集的都是结构化数据。 结构化数据是指行数据,存储在数据库里,可以用二维表结构来逻辑表达,例如书目数据、目次数据、期刊报纸数据、网络导航数据等,是现在图书馆主要采集的数据。来源是外购数据库商数据或者图书馆自建数据库数据,其主要特征是由元数据和对象数据构成,用结构化数据库进行存储,用SQL 语言进行查询。这种数据的主要特征是时效较长、专指性强、有固定的结构和格式、易于整理等。基于结构化数据的处理方案已经趋于成熟,例如艾利贝斯有限公司开发的Aleph500 自动化系统、国家图书馆开发的文津搜索系统、深圳图书馆开发的ILAS 系等,结构化数据处理和开发已经形成基本固定的模式和方法,大大推动了图书馆的资源揭示。但在大数据时代,大部分是非结构化数据,这种数据不能用数据库二维逻辑来表示,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/ 视频信息。对于图书馆而言,还包括各类读者使用数据、数据库使用统计数据、书籍借阅数据、网站点击数据等。数据零散, 格式多样, 使用率较低,因此图书馆服务模式一直以提供结构化数据为主,包括图书馆书目检索服务、参考咨询服务、定题服务等。而大数据时代的图书馆服务可能更具挑战性,服务手段、方式等也会随着大数据的特点而变化。笔者认为,以大数据处理与服务为优势的图书馆的服务水平将会进一步提升,其服务范围及领域将会得到更大的扩展,为社会、政府、企业做大数据分析的服务将成为图书馆的主要工作之一。
(1)准确的数据推送服务。数据推送服务是指图书馆根据读者需求,主动将读者所需要的信息内容推送到读者端。读者端的含义多样,包括读者访问网页、读者电脑的应用程序、读者的移动设备等。目前,图书馆的推送服务往往没有考虑到读者需求,而是根据图书馆所提供的服务进行推送,或者只在某些领域考虑了读者需求,在相关方面做了部分推送,并不能满足读者的全部要求,同时也缺乏预测性。大数据环境下,对于读者的各类行为,如查阅资料或者浏览网页等,可以细化到某一篇文章,甚至某一个词,将读者各类微行为都汇集到数据库中,然后根据不同层次人群的兴趣爱好进行详细分析,分层次进行准确地推送服务。另外,根据读者的行为热点分析,大数据能够告诉图书馆读者的兴趣变化曲线,以预测读者需求,从而为图书馆的资源采集、资源更新提供依据,最终达到超前读者需求、引导读者需求行为的效果,大大提高图书馆的社会效益。
(2)智能信息推送服务。大数据的应用之一是对用户行为进行分析和进行个性化推送服务。而分析的关键在于搞清三个问题:什么是用户行为分析;为什么分析用户行为;如何分析用户行为。基于用户行为分析并进行个性化推送服务成功的案例已经有很多,如亚马逊、谷歌、农夫山泉等。基于大数据的用户阅读浏览行为分析,并进行个性化推送服务是数字图书馆大数据应用的必然结果。
(3)细粒度个性化服务。个性化服务是图书馆为读者量身定制的服务,目前,图书馆主要依靠读者调查问卷、读者基本信息、读者的研究领域、读者检索集等方式来对个人定制服务策略,个性化服务的依据单一、固定、不灵活,无法满足读者更细粒度的个性化需求。大数据时代,图书馆将利用大数据技术,参考目前盛行的“ 猿题库”模式,捕捉读者的动态操作行为, 细化到读者的每一次点击,结合学科分析和行业分析,为读者建立灵活的个性化档案。灵活性表现在大数据技术能够自动监控读者行为的变化情况并进行分析,自动调用不同层次、类别的数据智能式推送给读者,为图书馆实现细粒度个性化服务提供了可能。
(4)深度的参考咨询服务。传统的参考咨询服务主要是利用图书馆现有的参考工具书、检索工具书、外购数据库和自建数据库,由有一定专业知识且熟悉检索工具的专职参考馆员来开展此项工作。在大数据时代,咨询馆员可以将符合大数据特征的咨询课题融入大数据系统,系统将根据咨询主题,利用数据分析技术、可视化技术,瞬时以图形展示查询结果,从而缩短咨询馆员获取资源的时间,扩大咨询馆员对资源的获取面,从而最大限度地满足读者(特别是企业方面的读者)需求, 提高参考咨询的效率,并使图书馆深度参考咨询服务成为可能。
四、结语
大数据开启了数字图书馆的一次重大时代转型,将拓展数字图书馆的数据资源,提升数字图书馆的能力,增强数字图书馆的服务功能,丰富数字图书馆的服务,一个崭新的数字图书馆将会出现在我们面前。从大数据中去捕捉、分析,向读者推送有潜在价值的数据, 将成为大数据时代图书馆的一大主要业务,并且这些业务开展的水平也将决定着大数据时代图书馆的发展水平及方向。因此,图书馆要把握住这次机遇,找准切入点,坚定为政府、企业、科研院所、社区服务的宗旨,扩大服务面,提高服务质量,开创新的服务方式,以更开放的服务进一步提升图书馆的社会价值,真正成为社会的知识中心、学习中心和文化中心。