APP下载

高校图书馆建立实验室的实践与探索

2019-09-10颜喜军

兰台内外 2019年28期
关键词:数字资源大数据分析智慧校园

颜喜军

摘 要:高校图书馆是高校师生活动的核心场所,尤其在如今的大数据爆发时代,高校师生的活动数据大部分都跟图书馆有关联,除了日常的进、出图书馆门禁数据;读者OPAC书目信息检索数据;图书荐购、图书借阅数据;读者在线选座管理系统、在馆电子存包数据信息;科技论文查收查引,知识产权服务系统,还有大量的读者访问电子文献及数据库系统;对这些海量数据库数据信息的挖掘分析,具有非常有意义的分析价值,可以深层次激发创造的灵感,产生新知识,为各个学院促进学科合作,推进智慧校园建设中开放获取知识途径,同时利用大数据分析采购使用效力高的电子期刊资源,更好地服务于建设高水平大学工作。

关键词:大数据分析;实验室;智慧校园;数字资源;电子期刊

引言

近年数据作为信息时代的象征,互联网的高速发展,信息量呈现爆炸式增长。根据IDC检测,全球数据量大约每两年翻一番,这就意味着人类在最近两年产生的数据量相当于之前的全部数据量。因此,在高校图书馆电子资源采购数据量也是跨越式增长,图书馆已经成为高校内数字资源的核心。网络技术飞速发展的现在,图书馆购买电子期刊数据库或存储大量教育数据资源,比如,MOOC在线课程、学习文摘、新东方英语在线视频数据库、知识视界视频数据库、环球英语视频数据库、名师讲坛视频数据库、广益多媒体外语学习平台、电子图书、电子工具书、国内外论文数据库、随书光盘、中国科学引文数据库等等。因此图书馆建立相关的大数据分析实验室,为智慧校园建设开源节流,提供可持续发展的保障服务。

一、深圳大学图书馆大数据分析平台搭建思路与过程

1.深圳大学图书馆大数据分析平台搭建思路

在深圳大学图书馆搭建大数据分析平台,对图书馆活动用户数据(读者查询、图书荐购、图书预约借还、借阅历史数据记录、借阅书目到期电子邮件提醒及到期催还信息等等)。所用读者方面数据:借阅图书证号、读者单位、读者联系信息、读者证号建档日期及失效日期书名、索引号、借阅次数、续借次数、借阅时间、读者对图书的预约情况、图书荐购等情况。图书方面的数据:图书ISBN/ISSN号、图书书名、著者号、图书索取号、图书简介。

2.使用的算法

使用基于读者的协同过滤的推荐为主,基于图书内容的算法为辅,并综合使用热书推荐和新书推荐。

针对基于读者的协同过滤推荐中缺失读者评分数据情况,拟采将读者对图书的借阅次数、续借次数、预约次数、借还时长转化为评分来解决。

3. 深圳大学图书馆大数据分析平台搭建过程

深圳大学图书采用现有的KVM虚拟化系统搭建3台Centos 6.2虚机(每台虚机配置24CPU、32G内存、500G存储空间),如(图2-1)。

在KVM虚机上面分别部署HADOOP:基于X86部署Apache开源项目,适用于PB数据库存储及运行计算,开源可扩展性高,以多数据库副本实现高可用性。深圳大学图书馆新一代图书馆服务平台LAS4,也是采用開源的MySQL集群数据库,Redis数据集群,3台zookeeper集群服务,2台Las4数据库服务,2台Las4应用服务;后端数据全部存储与IBM V7000高性能存储磁盘上面。各虚拟化服务器之间采用万兆虚拟网卡进行数据互联。图书馆核心交换机与服务器硬件设备之间也是采用万兆互联。能高效率对接大数据分析数据库。并且采用Kettle(纯Java开发,可以跨平台运行)工具,实现数据库同步。

再通过对读者的借阅行为轨迹进行分析,特别是借阅行为中的预约、续借行为,挖掘出读者想读但图书量不够的某些或某类图书。此外,通过分析各类图书的借阅比,挖掘出哪些种类的图书是最为紧缺的。

对于读者推荐的图书,首先,利用基于图书书名与图书简介(联网爬取)的方法计算出其与本馆已有藏书的相似度,找出图书馆是否已有与其内容相似的图书。其次,尝试编写一个大型爬虫网络,获取读者推荐图书的评分与评价来为购书提供参考。如下图(图2-2)

通过实施大数据分析对接图书馆借阅系统,可以定期推送借阅书籍排行榜。也可以在读者毕业时,为毕业生打印读者大学期间借阅书籍目录,留作毕业纪念。其次,通过大数据分析对接机构知识系统,为全校师生提供论文或专利技术收入通知、论文认领邮件、个人成果导出、使资源统一发现,科研成果在线展示等服务。分析潜在优势学科发现,为高水平大学学科发展找出突破口,学科绩效分析及计算ESI优势学科贡献分数,为学校决策提供有效的数据。

三、高校图书馆建立大数据库分析平台实验室趋势

1.在图书馆建立应用实验室的趋势

对高校师生来说,图书馆、教室及实验室是经常去的地方,高校图书馆与实验室数字资源的服务模式包括云服务模式、用户驱动服务模式、资助服务模式、导航服务模式以及交互服务模式,这些大数据汇聚在一起通过数据挖掘、分析,从而促进智慧校园服务提升。在环球网的公益栏目看到一篇“美国图书馆转型手工实验室 坦然面对互联网冲击)”的报道,具体内容是说Chattanooga公共图书馆开辟整个4楼作为制造实验室,在那里,读者可以做许多读书之外的事情,譬如设计、编程、写作、视频剪辑及网站开放建设等等。

在高校实验室(Laboratory,简称Lab),并不是只能做科学实验,譬如化学实验室的地方才称为实验室。一间摆放微机的教室或计算机机房也可以称为实验室,在高速云计算发展的今天,图书馆提供一个相对独立的空间,营造创新学习的气氛,配备最新、最前沿的高科技产品及技术,如,大数据分析实验室,开设数据挖掘技术学习讨论小组,读者带上自己的笔记本电脑也可以作为计算机实验室(Computer Lab);若图书馆条件允许,有自己搭建的虚拟化系统,提供给用户分析用资源,那就可以成立大数据分析实验室(Large Data Analysis Lab)。若相对技术比较弱的高校图书馆技术团队,也可以申请阿里等公共云资源空间。

2.在图书馆建立应用实验室对智慧校园的影响

浙江大学在其“十二五”规划中,就提出了“智慧校园”。从此,智慧校园也逐步成为人们关注与研究的焦点。不同学者立足自身研究领域,提出了智慧校园的内涵。物联网专家突出其智能感知功能,认为智慧校园是以物联网为基础、以感知挖掘信息相关性为核心信息化应用模式;教育信息化专家,提出重点关注智慧学习环境与智慧课堂等教学方式改革,是基于新型通讯网络技术构建资源共享、智慧灵活的教育教学环境;而学校信息化专家则提出,智慧校园应侧重校园的物联网技术应用和服务提升。图书馆是智慧校园建设资源的宝库,不仅仅支持师生的日常学习活动,更需要为师生提供更好的创新活动资源,提升创新服务空间。在高校良好的网络环境,深圳大学是首批实施IPV6地址池全校覆盖的高校,包括有线跟无线终端设备,都能自动获取IPV6地址,海量数据及可靠的网络技术保证了科研团队,快捷便利地进行科研的基本条件。所以,在高校图书馆开创实验室可以打破传统图书馆的静态模式,利用动静结合,增强创新灵感,产生新的知识,促进各个学院跨学科合作,提升智慧校园开放知识获取途径。因此,在高校图书馆建立大数据分析实验室平台不仅仅是图书馆创新服务的提升,也为智慧校园服务提供有效的数据保障价值,为建设高水平综合性大学添砖加瓦。

参考文献:

[1]李慧芳.大数据在在线教育领域的应用[J].电子技术与软件工程,2017(11):175.

[2]翟世东.高校MOOC教育浅析[J].科教文汇,2018(30):21-22,31.

[3]夏 敏.大数据时代背景下数据库的应用分析[J].大数据·云计算,2018(11):105.

[4]吴 玲.高校图书馆与实验室之数字资源集成分析[J].管理与信息化,2017(19):172-173.

[5]胡俊杰.我国智慧型校园研究热点探析[J].软件导刊,2018(9):215-218.

[6]高晓晶.高校图书馆创新空间服务的实践与探索[J].图书情报工作, 2016 (6): 63-65.

猜你喜欢

数字资源大数据分析智慧校园
面向大数据远程开放实验平台构建研究
面向大数据分析的信息管理实践教学体系构建
传媒变局中的人口电视栏目困境与创新
图书馆员新角色
基于B/S结构的学生公寓管理信息系统的设计与实现
“智慧校园”浪潮下大学课堂教学改革与设计
智慧校园关键技术分析与研究
高校数字资源云服务平台的建设研究
智能云教学系统在计算机专业教学中的运用
图书馆与出版企业数字资源共享的环境因素分析