公共图书馆基于读者行为大数据的采集与利用
2017-07-31何欢
何欢
摘 要: 大数据时代的到来给图书馆的服务和发展带来新的机遇与挑战,如何有效利用大数据为公共图书馆的服务做支撑,是当前各个公共图书馆迫切需要研究的课题。本文主要对读者基本信息与借阅信息等进行研究与分析,并介绍了如何运用各种渠道去采集这些信息,形成公共图书馆的读者行为大数据。通过充分利用读者行为大数据,可提高公共图书馆的服务质量,使得图书馆的资源配置更为合理,充分发挥公共图书馆的社会作用。
关键词:读者行为大数据 公共图书馆服务 信息采集
Abstract: The big data brings new opportunities and challenges to libraries.Republic libraries urgent demand for how to use big data to brace service.The paper reserches and analyzes the informations of readers,and introduces how to collect them to form readersbig data. According to make the best use of big data of readersbehaviors,it can improve the service quality ,make resource distribution more reasonable and give full play to social fuctions of republic libraries.
Key words: Big data of reader behavior Republic library service Imformation collection
中图分类号:G252.0 文献标识码:A 文章编号:1003-9082(2017)07-0030-01
引言
大数据时代背景下,对公共图书馆的服务提出了新的要求,如何能够顺应时代潮流、与时俱进、开拓创新成为了摆在公共图书馆面前的一项重要工作。国家“十三五规划纲要”中提出:实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。由此,必将对公共图书馆的服务创新提出更高的要求。
一、读者行为大数据的成因
大数据是在信息科技进步的基础上,随着互联网和移动互联网的发展而诞生,并在不断完善的信息基础设施的支持下持续提升,同时经过智能终端设备每时每刻产生的多种类型数据的填充,形成的庞大数据集。移动互联网时代数据的爆炸性增长、网络带宽的升级、存储设备性价比的提高、云计算关于数据集中管理和分布式访问的模式,以及物联网技术突破性进展后引起的相关硬件设备成本的下降,都为大数据的产生做出了突出的贡献。[1]
公共图书馆服务的最直接最重要的对象就是读者群体。面向读者的服务创新,包含服务形式、服务内容、服务手段、服务理念等方面的创新。区别于传统的文献借阅、阅读推广、参考咨询、论坛讲座、馆际互借等服务内容,服务创新就是使用户感受到不同于从前的崭新的内容或形式,而这所有的一切都需要读者行为大数据的支撑,只有掌握了精准的、有效的读者行为信息,并使这些信息可视化,才能使新的设想、新的技术可行可用,并产生其应有的价值。
结合公共图书馆本身的性质特征,这里对读者行为大数据进行如下定义:在大数据时代背景下,由读者属性特征数据、公共图书馆服务与信息资源数据,以及由读者行为导致两者之间通过各种方式和渠道因交集而产生的关联路径及相关数据,称之为公共图书馆的读者行为大数据。
基于读者行为的大数据,首先要有大量的数据来源,这些数据有些是存在且已经采集,也有些是存在的但并没有进行有效采集。下面对读者行为大数据的采集进行阐述。
二、读者行为大数据的采集内容
读者行为大数据包含读者本身的特征信息、读者来馆要获取的服务或信息资源,以及读者如何找到他们所需要的服务或信息资源的过程。具体如下:
1.读者本身的属性特征
马克思在人性观中指出人的两种属性,一种是人的自然属性,另一种是人的社会属性。人的自然属性指的是肉体存在以及其客观存在的特性,社会属性指的是在社会实践活动的过程中人扮演的角色和人与人之间发生的各种联系。[2]
根据以上理论,结合公共图书馆的特性以及读者行为大数据的需要,对读者本身的属性,即性别、年龄、地域,和讀者的行为偏好进行信息采集。
1.1读者基本属性特征
考虑到现阶段公共图书馆对读者信息采集的可行性与便利性,我们只对基本的性别、年龄、归属区域等进行统计,对于较高级的学历、职业、收入水平等特征,只有待条件更为成熟、技术更佳完善之后,再做大数据的采集。
1.1.1来访读者的性别比例分布。统计来馆借阅图书的读者性别,不只是简单的统计出到馆男性读者人数是多少,女性读者人数是多少,最重要的是能够通过这些数据发现该地区性别对于阅读的影响。
1.1.2来访读者的年龄段比例分布。国际上通常将人口按不等距的方法进行分组,分别为少年人口0-14岁, 壮年人口15-64岁, 老年人口65岁以上,也有观点指出,应该将15-24岁这一年龄段的人口单独成组,称为青年人口。[3]公共图书馆在对来访读者的年龄进行分组时,可参考以上方法,同时结合当地实际情况,对读者的年龄进行划分。
1.1.3来访读者归属区域分布。统计来馆借阅图书读者的住址信息,并将其分为常驻人口和流动人口;如果是常驻人口,则按照当地所属行政区域进行进一步的分类。通过统计读者的归属区域,可以对公共图书馆的服务覆盖面等信息进行大致的了解。