APP下载

基于小数据的高校图书馆个性化学科服务研究

2019-11-04李丹浓

河南图书馆学刊 2019年9期
关键词:学科服务高校图书馆个性化

李丹浓

关键词:小数据;高校图书馆;个性化;学科服务

摘 要:文章介绍了高校图书馆小数据的内涵及其特征,分析了高校图书馆收集小数据的可操作性,构建了基于小数据的高校图书馆个性化学科服务模式,提出了基于小数据的高校图书馆个性化学科服务应注意的问题。

中图分类号:G258.6文献标识码:A文章编号:1003-1588(2019)09-0026-03

随着通信技术的快速发展,数据的产生、存储、传输和利用过程都发生了变化,随之产生的大数据技术也逐渐融入经济、安全等领域。大数据注重数据的相互关系,不注重数据的因果关系;注重数据的混杂性,不注重数据的精准性,因此无法满足高校图书馆开展个性化、精准化学科服务的需求。小数据是针对目标用户形成的行为模式和情景感知的数据集合,具有低噪声和有效性高等特点,已逐步被应用于医疗、销售等行业。如何利用小数据的存储、处理、推送和决策管理技术,为用户提供个性化的学科服务,已成为高校图书馆亟须研究的课题。

1 高校图书馆小数据的内涵及其特征

1.1 高校图书馆小数据的内涵

美国康奈尔大学的德波哈尔·艾斯汀教授观察父亲生前的变化,成为最早关注“小数据”的学者。他全面记录了父亲生前几个月的起居、运动轨迹等个体数据信息,这些数据信息的变化规律揭示了老人生命衰弱的过程,但传统医疗监测所提供的信息却没有检测到老人身体的变化趋势。因此,他指出医疗小数据能为疾病诊断和治疗决策提供直接、精准的科学依据。同样,高校图书馆小数据是以用户个体为唯一研究对象,围绕其在学习、教学、科研和管理过程中所产生的全部数据集合。

1.2 高校图书馆小数据的构成及特点

高校图书馆学科服务的对象涵盖学生、教师、科研人员和管理人员等,区分不同类别的用户有助于学科馆员有针对性地开展分析和决策工作。高校图书馆小数据主要包括元数据、图书馆活动数据、其他活动数据及外延数据等,具体内容如表1所示。

高校图书馆小数据的特点有以下四个:①容量(Volume)小。高校图书馆小数据来源于属性数据、管理数据、操作数据和外延数据,这些数据源对用户、场景和类型都有一定的限制,因此,与大数据相比,高校图书馆小数据的总量是有限的。②类型(Variety)少。大数据包括大量结构化数据和非结构化数据,且数据格式和标准多样,而高校图书馆小数据以结构化数据为主,格式和标准相对单一,这也为高校图书馆储存和分析数据带来了极大的便利。③变化(Velocity)慢。高校图书馆小数据以相对固定的用户信息和管理信息为主,数据值相对稳定,变化缓慢,如学生和教师的个人信息在在校期间几乎不会变化,这些数据的变化量较少、变化速度较慢。④价值(Value)高。高校图书馆小数据的内涵和类型决定了其具有噪声小、冗余率低、价值高等特点。

2 可操作性分析

随着信息技术的发展,高校图书馆采集小数据可利用的设备和软件系统也越来越多。数据化的填报系统、可穿戴设备、音视频系统、搜索引擎等为高校图书馆采集结构化数据提供了便利,数据分析和预测推荐技术为高校图书馆分析小数据中蕴含的因果关系及获取用户的真正需求提供了便利,隐私安全技术、拟态防御的广泛应用为高校图书馆保护用户的隐私提供了强有力的保障。高校图书馆可利用这些新设备、新理念和新技术采集相关的小数据,获取用户的实际需求,进而为用户提供个性化的学科服务。

3 高校图书馆个性化学科服务模式

基于小数据的高校图书馆个性化学科服务模式包括智能化采集与预处理层、个性化学科信息需求分析与预测层、个性化智能决策推荐管理层、数据存储层和个性化学科服务评估层等,其处理过程模型如图1所示。

3.1 智能化采集与预处理层

高校图书馆一般以用户为中心,根据用户的学习、教学、科研和管理需求,通过不同方式采集小数据。高校图书馆可通过学生管理、教学管理和科研管理等系统自动提取元数据、用户活动数据;通过馆内闸机、集成管理系统、网页平台等采集用户在图书馆的活動数据,并对所采集的小数据进行隐私化处理;通过数据挖掘技术、搜索引擎等采集用户的科研项目、学术论文等外延数据。此外,高校图书馆也可通过开发网页和社交网络的网络代理器采集小数据。

高校图书馆对小数据进行预处理不仅能有效消除数据噪声,还保证了数据的隐秘性和可用性。由于初始采集的数据通常含有噪声较大和不一致的数据,因此,高校图书馆可采用分箱法、回归法和聚类法等平滑处理技术对小数据的噪声进行预处理,对不一致的数据进行检测和清理,也可基于已知属性间的依赖关系对不一致的数据进行推断。

3.2 个性化学科信息需求分析与预测层

高校图书馆学科服务应以用户需求为出发点,基于过程管理的方法把握里程碑式关键节点的需求,关键节点包括教学过程中的课堂难点讲解和课程期中考试,这些关键节点能充分展示学习、教学、科研和管理的效果。因此,高校图书馆应梳理短周期节点与长周期节点的关系,为用户提供能覆盖整个周期的教学进展控制、科研动态分析等学科服务。

高校图书馆在充分了解用户需求后,可利用推荐系统等工具对用户的每个关键节点进行预测。目前,比较成熟的推荐系统算法有基于流行度的算法、协同过滤算法、基于内容的算法、基于模型的算法及混合算法等。基于小数据的高校图书馆预测关键节点能保证用户学习、教学、科研和管理的可持续性和多样性。在可持续性方面,高校图书馆应根据用户的历史数据,挖掘他们的潜在需求,以保证预测的准确和稳定。在多样性方面,高校图书馆可将用户的社会关系组成网络视图,利用网络视图的大连接特征为预测提供多种选择,以保证预测的多样性和新颖性。从图2可以看出,网络视图中的节点为各层级的用户,视图中的边连接各网络节点,表示用户间的各类关系,高校图书馆可采用随机游走策略选择最具代表性的采样数据,利用深度学习方法得到各类关键节点的预测值,将预测的多样结果按照预测概率大小进行排序,进而形成推荐备选集合。

3.3 个性化智能决策推荐管理层

由于在实际推荐决策过程中存在影响预测结果的具有突发性和不可预知的其他变量,如教师生病、学校突发事件等,这些变量将影响高校图书馆的分析和预测,因此,学科馆员可将预测备选集作为基础,综合考虑突发变量和新增知识等外部信息,利用具备的知识完成智能推荐管理工作。学科馆员也可通过设定目标函数的方式,明确最终所处状态的最优值,并根据实际情况将决策结果推送给用户。

3.4 个性化学科服务评估层

基于小数据的高校图书馆学科服务评估层主要包含两类指标,即客观指标和主观指标。客观指标源于智能推荐算法和决策算法,包括准确率、召回率和推演的F1值。其中,准确率P是指预测和推荐给用户备选集的比值,比例越高,准确率就越高;召回率R是指推荐给用户的项目数量占用户备选集的比例;F1值为准确率和召回率的加权F1=(1+β2)P·Rβ2P+R。主观因素包括用户满意度评价C及用户的建议和意见。学科馆员可将主观指标与客观指标结合起来形成评价意见,获取评估值,即V=λC+(1-λ)·F1,0≤λ≤1。

学科馆员可将评价意见等内容反馈到数据采集和预处理层,把返回意见作为预测输入,使模型的预测准确率得到不断提高。另外,学科馆员也可将评估值反馈到智能推荐层,调整学习目标函数,完善奖惩机制,使决策的精准性得到不断提升。

4 基于小数据的高校图书馆个性化学科服务应注意的问题

基于小数据的高校图书馆开展个性化学科服务应注意以下三点:①梳理好学科馆员与用户的关系。高校图书馆可通过分析小数据的方式获取用户的个性化需求,并在学科馆员、用户、馆藏资源与服务内容之间建立一种因果关联,进而提升个性化服务的质量。②梳理好学科馆员与辅助工具的关系。由于在实际推荐过程中不可控的意外因素可导致推荐决策发生根本性变化,因此,学科馆员只有认真负责,结合智能决策辅助系统的推荐备选集及实际情况,才能做出最优决策。③重视用户数据的安全和应用权限等问题。为了保障用户数据安全及用户隐私不受侵犯,高校图书馆应设定各类人员的数据访问和使用权限,通过区分层级、区分使用区域等方式,达到灵活控制小数据的读取、传输和应用的目的。

5 结语

與大数据相比,小数据更能满足高校图书馆的个性化学科服务需求。在数据采集和预处理的基础上,高校图书馆可将深度学习与网络视图结合起来,采用推荐算法,以智能推荐决策为依据,结合实际情况做出最优推荐选择,为学生、教师、科研人员和科研管理人员提供精准的学科服务,满足他们的个性化需求。

参考文献:

[1] 中国信息通信研究院.大数据白皮书(2018年)[EB/OL].[2019-07-23].http://www.cac.gov.cn/2018-04/25/c_1122741894.htm.

[2] 刁羽.基于创客小数据的图书馆个性化创客服务研究[J].图书馆工作与研究,2019(2):55-61.

[3] 吕晓莉.大数据时代高校图书馆小数据的应用价值与路径[J].四川图书馆学报,2016(4):7-10.

[4] 邬江兴.网络空间拟态防御研究[J].信息安全学报,2016(4):1-10.

(编校:孙新梅)

猜你喜欢

学科服务高校图书馆个性化
为小学英语个性化合作学习单做加法
论新教育科研范式下高校图书馆学科服务
高校图书馆学科服务工作中的“马太效应”现象
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆学科服务在慕课发展过程中的价值与服务的自我创新研究
高校图书馆阅读推广实践探讨
基于SCIE和ESI的燃料电池Pt基核壳结构催化剂研究进展
高校图书馆电子资源的宣传与推广
同桌宝贝