高校图书馆数据管理的优化路径
2021-02-21张双双
【摘要】 本文采用文献调查法,利用中国知网学术期刊数据库,对主题词“大数据”“高校图书馆”等进行简单检索和布尔逻辑检索,研究目前大数据环境对高校图书馆发展的研究情况,分析高校图书馆大数据环境中的各种类型数据,为了更好地发挥这些数据优势来服务用户,对高校图书馆的数据管理进行优化路径分析。
【关键词】 大数据;高校图书馆;数据管理;路径
【DOI编码】 10.3969/j.issn.1674-4977.2021.01.038
Abstract: In this paper,using the method of literature survey and CNKI academic journal database,the subject words "big data" and "University Library" are simply searched and Boolean logic searched. The current research situation of University Library Development in big data environment is studied,and various types of data in University Library big data environment are analyzed,in order to better play the advantages of these data to serve This paper analyzes the optimization path of university library data management.
Key words: big data;university library;data management;path
最早提出大數据时代到来的是全球知名咨询公司麦肯锡在2011年5月发表了一篇报告《大数据:创新、竞争和生产力的下一个前沿》,从这一刻起,大数据开始备受各行各业的关注。图书馆作为保存传递人类文化知识的机构,其具有各种丰富的数据资源,高校图书馆作为图书馆中的一种,在承载着图书馆属性的基础上,自然具有更强的大数据环境,高校图书馆如何能利用这种大数据环境进行高效的数据管理,从而为全校教学、科研乃至社会机构或者国家所服务是值得思考的问题。
1 大数据定义
麦肯锡公司给出的定义:大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。
目前对于大数据没有统一的定义,笔者认为大数据定义可以简要概括为海量数据+处理办法,实际上就是利用先进的处理数据的办法,将海量数据挖掘出有价值的数据,并将这些有利用价值的数据进行可视化,还能利用一定的技术方法存储这些海量数据,对数据安全做好防护等一系列的问题。
2 研究概况
通过检索中国知网数据库,采用简单检索模式,检索时间为2020年7月20日,对主题词“大数据”进行检索,得到检索结果214130条(其中由于2020年仅过去半年多,目前发文量为18201条,中国知网预测2020年整年发文量可达到46891条,可以看出仍是持续走高的趋势,这里按照知网预测发文量进行计算),可以看出以“大数据”为主题的发文量是从2011年开始增多,直到2016年是持续增长,在2016到2018年增长速度有所回落,但从2019年又出现迅猛增长的趋势。通过主题分布,可以得到以主题“大数据”为检索词进行检索,热度最高的分别为:大数据、大数据时代、大数据技术、crop selection、大数据背景下、big data、云计算、大数据分析、数据挖掘、人工智能、大数据环境、Hadoop、互联网金融、大数据平台、物联网。
在上述检索结果中输入主题词“图书馆”,得到5370条结果,笔者又进行扩检,采用高级检索模式,将主题词设为“数据”并含“图书馆”进行检索,得到34487条,其中关于高校图书馆有6730条,占19.51%。可见高校图书馆在大数据环境下,关于数据方面的论文也占有一席之地,具有研究价值,其中研究热度从高到低为:高校图书馆、图书馆、大数据、academic libraries,大数据时代、数据挖掘、大数据环境、new data、数据库、数据挖掘技术、大数据背景下等。
3 高校图书馆中数据资源
3.1 资源数据
高校图书馆的馆藏体系中包含大量的专业性的纸质资源数据,这些纸质资源数据随着时间的推移,数量会越来越多。随着信息技术的不断发展,数字图书馆已经成为了图书馆中很重要的一个部分,智慧图书馆也在不断发展中,目前的高校图书馆中的资源数据不仅包括纸质资源数据,还有大量的数字数据,而且数字资源较纸质资源相比更新速度快,远程可获取,可以满足多人同时使用,因此用户更加青睐使用数字化资源。
3.2 环境数据
目前大多数高校图书馆都具有监控设备,很多图书馆已经做到了360度无死角全程监控,在这些监控设备中存在大量的监控数据;图书馆保存文献,其空间需要一定条件的温度和湿度,读者在自修室学习的时候,对其室内的温度,照明度都有一定的要求,这些都会产生大量的数据;当读者进出图书馆时,刷卡通过门禁系统,每时每刻会产生海量数据,高校图书馆如果能将这些环境数据管理好,会为智慧图书馆做出很人性化的数据支撑。
3.3 用户数据
高校图书馆中的用户多为师生,可以说受众群体比较稳定,图书馆的宗旨是全心全意为用户服务,用户在享受图书馆提供的服务过程中会产生大量的行为数据,这对于大数据环境起到至关重要的作用。用户在图书馆注册制卡的过程中,图书馆可以掌握用户的身份数据;当用户发生图书借阅行为时,会产生大量的借阅行为数据;当用户浏览高校图书馆网站,查看推荐书目时会产生用户偏好数据等。这些用户数据足以构成用户行为大数据环境,高校图书馆如果能将这些用户数据有效挖掘利用,在大量数据的基础上,通过建立数学模型,建立用户画像,预测用户行为,从而更有针对性地为用户提供精准化服务。
3.4 业务数据
高校图书馆的工作人员在提供服务的过程中,也会产生大量的业务数据。采访部门在采购纸质图书或者电子图书时的数据;编目部门在加工图书时产生的MARC数据,有条件的图书馆还需要转换成RFID数据;图书馆服务器中存在大量的数据;参考咨询过程中产生的价值量很高的数据;流通部门在流通过程中产生的大量的借还、续借等数据;阅读推广过程中产生的用户喜好数据等等,这些都是高校图书馆中的数据资源,为大数据环境做好了充足准备。
4 高校图书馆数据管理优化路径探析
4.1 馆内数据
4.1.1 建立机构知识库
针对以上梳理出的高校图书馆中存在的大数据环境,可见建立机构知识库的重要性,机构知识库可以针对每个高校不同的特点进行有针对性的建设,宗旨就是将一切高校图书馆中产生的有利用价值的数据全部收录,当用户需要某项数据时,通过检索该校图书馆的机构知识库,可以快捷、方便的查找到所需数据的过程。高校图书馆在建立机构知识库时需要考虑的问题很多,其难点在于怎么样对这些数据进行保护,为不同人群提供更有针对性的数据,这些是值得各个高校图书馆深思的问题。
4.1.2 可视化屏幕
对于大数据的有效管理方式就是数据的可視化,可视化会更直观的看出发展趋势以及问题所在。目前很多高校图书馆针对用户的基础数据等方面做了大数据可视化展示,但对于真正意义上的大数据管理还有一定差距,例如通过用户的进出馆数据分析,可以在可视化屏幕上清楚的统计出实时数据,通过这个数据也能推测出相同情况下用户的人数等数据,通过用户借阅图书信息,也能够很轻松地预测出哪类用户在什么时间范围内会借这类图书,这些都是高校图书馆通过大数据分析,建模成功预测的数据信息,高校图书馆应善于将这些挖掘出的大数据体现在可视化屏幕上。
4.2 馆外数据
高校图书馆隶属于所在高校,有很多平行部门,要多与其他相关部门合作,协助其他部门提供数据服务,既让其他相关部门了解到高校图书馆提供数据服务的能力,又能提升图书馆在高校中的地位,从而为高校图书馆赢得更多话语权。
4.2.1 与科研处合作
高校图书馆可以与科研处合作管理全校教师的科研数据,将全校教师科研成果管理好,也可以将这些科研数据放到图书馆的机构知识库中,这样不仅可以使全校教师快速查找、利用所需数据,还能便于高校分析哪些科研成果可以成为一项特色项目,在大数据的环境下可以敏锐的发现研究热点。另外,在日后教育部门填报数据时也能快速起到数据支撑作用。
4.2.2 与教务处合作
今年的疫情来势汹汹,全国上下齐心协力抗战病毒,各个高校都采取了线上教学模式,从这次疫情可以看到,学生们的教材出现很大的问题。众所周知高校图书馆属于教辅部门,不仅收录纸质版资源,还收录电子版资源,如果高校图书馆能够建立电子版教材库,这将为教学提供莫大的帮助。就能在疫情期间为师生提供充足的教材保障。对于各个专业电子教材的收集,这些数据也是海量的,需要高校图书馆能够承载这些大数据。
4.2.3 与人事处合作
人事处的职责是统筹全校教职工情况,每年需要进行教师职称评定情况,高校图书馆可以与人事处合作,建立教师档案数据库,将教师的相关数据录入,通过大数据分析,也能选班出更适合晋级的教师,更优秀的教师,还通过统筹全校教师数据信息,也能为人事处招聘人才提供更精准的数据。
5 结语
高校图书馆拥有得天独厚的数据优势,在大数据环境下系统性地管理好产生的数据资源, 这些海量数据会让高校图书馆服务锦上添花,通过这些数据能够更精准的定位用户,帮助预测用户的行为等,还能通过与其他部门合作共同提供数据,帮助高校图书馆提升自己的地位,高校图书馆在数据管理方面还有很远的一段路要走,但是目前已经可以看见曙光就在前面,让我们图书馆人砥砺前行。
【参考文献】
[1] 百度百科.大数据[EB/OL].[2020-07-23].https://baike.baidu.com/item/大数据/1356941.
[2] 蔡翠红.国际关系中的大数据变革及其挑战[J].世界经济与政治,2014(5):124-160.
[3] 魏来.基于数据管理的智慧图书馆功能框架研究[J].数字图书馆论坛,2018(4):2-7.
[4] 吴秀明,刘云,高凡.大数据背景下图书馆阅读推广研究综述[J].四川图书馆学报,2020(3):97-100.
【作者简介】
张双双(1988-),女,硕士,研究方向为图书情报及相关。