APP下载

基于用户数据挖掘的图书馆文献采访决策模式研究

2018-03-28徐杰

中国中医药图书情报杂志 2018年2期
关键词:群组数据挖掘检索

徐杰



基于用户数据挖掘的图书馆文献采访决策模式研究

徐杰

山东省泰安市中心医院,山东 泰安 271000

对用户数据进行挖掘可以优化图书馆文献采访,利用用户借阅数据可以指导采购资金分配,利用用户检索数据可以获知读者需求文献,利用用户预约数据可以补充馆藏文献。基于用户数据挖掘的图书馆文献采访决策模式有3种,分别为应用决策树的分类分析、应用数据群组的聚类分析和应用数据挖掘的关联分析,来指导图书馆文献采访决策。提出基于用户数据挖掘的图书馆文献采访决策模式实现思路为,采用点面结合方式、定位文献采访方向,应用数据挖掘技术、输出文献采访重点,多维度挖掘用户数据、提高文献采访有效性。

读者用户;数据挖掘;公共图书馆;文献采访;决策模式

图书馆文献采访是公共图书馆馆藏建设的首要内容,也是为广大读者用户提供良好服务的资源基础。图书馆文献采访,是指图书馆在综合考虑已有的资金经费、读者需求、馆建性质等因素的前提下,不断补充与完善馆藏资源的过程。图书馆文献采访不仅包括纸质版的中外文图书文献与报刊资料,在数字信息化普及的当今,也包括数字资源和信息资源的采访。公共图书馆文献资源的采访质量在很大程度上决定着图书馆的服务水平,直接影响着读者的阅读效果和公共图书馆的工作任务完成效率,因此图书馆文献采访工作要最大化契合读者用户的阅读需求,在图书馆进行文献采访工作之前,要对读者用户的数据进行挖掘,通过大数据分析方法得到读者阅读喜好的客观数据,进而开展有针对性、有目的性的文献采访,在图书经费有限的情况下,最大化满足读者用户的阅读要求[1]。

1 用户数据挖掘在图书馆文献采访中的应用

对于图书馆而言,读者用户的数据可以分为三类:用户借阅数据、用户检索数据和用户预约数据,图书馆通过对这三类数据的跟踪统计及挖掘分析,可以指导文献采访的资金分配、购买倾向、资源配置优化等工作。

1.1 利用用户借阅数据指导采购资金分配

首先,图书馆可以利用管理系统集成的统计功能对读者用户的借阅数据进行跟踪统计,再利用数据挖掘技术和分类聚类方法对收集到的数据进行分析,可以清晰地看出读者用户借阅各大类文献资源的情况和趋势变化,了解读者用户阅读喜好与阅读倾向,把握读者对各大类别文献资源的需求量,进而预测新一轮的图书馆文献采访工作的侧重点,并将有限的经费有计划地投入到各类文献的采买预算中。对于借阅量较大的资源文献,可以适当增加购买比例,对于零借阅量的图书或资源,则可适当减少购买数量或停止采访。总之,以读者借阅数据为基础,合理分配采访资金,可以有效避免图书馆采访工作中出现的主观性和片面性错误,有利于提高馆藏资源利用效率。表1是安徽蚌埠禹会区图书馆近两年来用户借阅统计表[2],由表可知,利用用户借阅数据指导采购资金的分配,有利于提高图书馆采访工作的时效性,对优化图书馆文献采访工作具有重要作用。

表1 2015-2016年安徽蚌埠禹会区图书馆部分图书流通借阅数量及占当年采访经费百分比统计

1.2 利用用户检索数据获知读者需求文献

基于用户数据挖掘的内容还包括用户在检索文献过程中产生的记录数据,图书馆自动服务系统利用数据挖掘关联技术,对读者用户的检索数据进行全面捕捉、关联、采集和整理,排除冗余的、无规律的随机干扰性信息,整合成为具有一定规律性的用户文献检索数据,并将读者关注度较高的检索关键词和主题词进行使用次数的降序排列,再从中分析出读者用户喜爱度较高的热门文献与图书。图书馆经过挖掘用户检索数据获知的热门阅读文献和图书可以看做是读者用户迫切需要的资源,是读者阅读需求的直观体现[3],因此,基于用户数据挖掘的检索数据分析结果可以指导图书馆采访决策方向,图书馆在用于文献采访工作有限的经费基础上,优先采购读者检索频率高、需求量大的资源文献。

1.3 利用用户预约数据补充馆藏文献

读者用户预约服务是指读者借阅某种借出状态或空缺状态的图书时,读者可以选择预约,当图书处于在架状态,预约读者享有优先借阅的权利。一般来说,读者预约借阅图书的原因有二,一为馆藏复本量不足,二为馆藏文献欠缺。用户数据中的预约数据真实反映了读者对某类图书的阅读需求,因此,图书馆对读者预约数据进行统计,根据读者预约次数,形成预约热点的文献书目表,增加预约频率较高的文献的复本量,并制定符合实际的采访计划,确定复本的采购数量,同时,通过监控用户预约数据的实时变化,图书馆可以灵活调整文献采访措施,从而加强图书馆的文献资源保障能力[4]。

2 基于用户数据挖掘的图书馆文献采访决策模式

图书馆的文献采访系统是一种决策的过程,因此基于用户数据挖掘的图书馆文献采访决策模式设计可以结合决策树分类分析、数据群组聚类分析、数据挖掘关联分析等决策模型。

2.1 用决策树分类分析指导图书馆文献采访决策

决策树是一种常用的数据分析方法,可以对数据进行精准的分类和趋势预测。图书馆通过对用户数据的收集,制作用户数据的流程图树结构,每一个内部节点表示一个属性的数据,分支则代表测试输出,用户数据的决策树节点则代表数据类别[5]。以用户借阅数据为例,图书馆使用决策树方法将读者借阅图书的数据按照活跃程度进行分类,当图书馆需要新书文献采访时,则可以通过决策树对新书文献进行借阅程度的预测而得到采访决策的结果。应用决策树的分类分析指导文献采访,具有计算规则简便、能够同时处理不同类型数据的优势。然而,由于读者数据的多样性和复杂性,在应用决策树分类分析进行预测和指导文献采访时,容易出现计算错误增加和较难预测连续数据的缺点。

2.2 用数据群组聚类分析指导图书馆文献采访决策

在对用户数据收集过程中,图书馆可以通过数据群组的方式首先对读者数据进行聚类划分,如借阅数据、检索数据和预约数据,对聚类群组内的数据出现的频段进行降次排序,得到热门流通文献图书的结果。其次,综合不同聚类数据群组,若干个群组交集的文献图书则为最受读者欢迎或最热门的文献资源,进而采用数据关联技术,定位与高频率借阅图书具有相似主题的资源,并作出下一阶段的图书馆文献采访决策计划。这种聚类分析指导下的图书馆文献采访具有较高精准性,可以将图书馆已有的借阅表、图书表等数据考虑在内,增强了图书馆采访计划的全面性。此外,也兼顾到读者检索阅读的个体性,即在聚类分析过程中,从群组的角度出发,设定了一定的数据取值,只有相关的同类数据才能更好地、更准确地衡量此维度的价值,因而应用群组聚类分析指导的图书馆文献采访决策对图书馆个性化服务也具有一定作用[6]。

2.3 用数据挖掘关联分析指导图书馆文献采访决策

数据关联是指对2个或2个以上的多个变量进行整合,发现取值之间的某种规律,进而关联起来的一种数据处理手段。用户数据被纳入图书馆数据分析库中,则可以对数据进行预测性组合,这种数据挖掘的关联分析主要目的在于探寻读者与图书馆文献之间存在的潜在关系,例如在进行新书采访或评估之前,可以把新书简介发给部分读者,收集这一部分的读者反馈,筛选兴趣度较高的读者,再通过数据挖掘技术,发现与该类读者存在隐藏关联的B类读者,将同样的图书文献发送给B类读者,获取B类读者兴趣值,经过不断地对用户数据关联分析,可以综合评价采访图书的利用率和实际效用,从而知道图书馆做出合理的图书文献采访决策。

3 基于用户数据挖掘的图书馆文献采访决策模式实现思路

结合上述关于用户数据与图书馆文献采访决策机制的分析,笔者从操作层面提出点面结合分析用户数据,定位文献采访方向;应用数据挖掘技术,输出文献采访重点;多维度挖掘用户数据,提高文献采访有效性3个实现思路,以完善基于用户数据挖掘的图书馆文献采访决策模式构建。

3.1 采用点面结合方式,定位文献采访方向

图书馆在文献采访决策过程中可以采用点面结合的方法对图书文献进行科学的筛选。在点的层面上,图书馆可以抽样分析个体用户数据,调取个体用户一段时间内的借阅、检索活动产生的数据,分析数据变化趋势,掌握个体用户的阅读偏好与习惯。在面的层次上,图书馆则可以以群组或某一类读者为研究对象,通过对用户数据的分类分析,结合图书馆馆藏图书分布情况,对图书的读者需求进行排序,对读者阅读度较高的图书归类,再结合图书馆的采访经费情况,筛选出急需购买的文献优先采购。总之,图书馆在基于用户数据挖掘进行文献采访决策时,可以采用点面结合的方式全面分析读者的阅读需求,将读者的阅读数据与图书馆的采访机制有机地结合起来[7]。

3.2 应用数据挖掘技术,输出文献采访重点

数据挖掘技术普遍应用于分析数据库中的数据来解决实际问题,针对图书馆文献采访决策工作,图书馆可以按照数据挖掘的方式对用户数据进行分析。具体来说,图书馆可以通过自动化管理系统获取一段时间内的借阅数据、书目数据、检索数据以及数据来源,分析各类数据中出现频率较高的关键词或主题等,产生量化的分析数据,然后再将图书馆文献资源采访的需求进行量化输出,计算图书文献采访权重系数,用此来表示下一阶段图书馆采访工作的重点,更精准地开展图书采访工作。

3.3 多维度挖掘用户数据,提高文献采访有效性

图书馆可以根据个案调查对比的定性研究和大数据调查的定量研究两方面入手,从多角度和多维度去分析用户数据,深刻理解读者的阅读需求和潜在兴趣点,形成可供图书馆文献采访决策使用的信息情报源,从而为优化图书馆文献采访工作提供科学依据。此外,图书馆可以结合本馆馆藏结构、特色资源等情况,合理分配有限的资金经费,综合考虑用户数据中的因子分析,广泛将数学建模等科学方法融合到图书馆文献采访决策过程中,并以具体的图书馆为案例,在实践中不断完善基于用户数据挖掘的图书馆文献采访决策模式的可行性与有效性,形成一套具有实际操作效用的图书文献采访模式,并加以推广和扩大宣传[8]。

4 小结

用户数据挖掘就是从大量的、不规律的、有噪声的随机数据中提取隐含其中的规律,这些规律为图书馆的文献采访决策工作提供潜在的、有用的信息指导。通过对用户数据的挖掘计算,可以指导图书馆指导采购资金分配、使图书馆获知读者需求文献以及及时补充馆藏资源。随着图书馆网络化和信息化的发展,越来越多图书馆开通了网络主页,读者可以自行登录账号进行借阅、预约等操作,因此,图书馆可以利用自动化管理系统对读者操作痕迹进行记录,储存到用户数据库中。为了充分应用读者用户在流通借还、书目检索、网络访问过程中产生的数据,图书馆在进行文献采访决策时,可以应用决策树的分类分析方法、数据群组的聚类分析方法和数据挖掘的关联分析方法对用户数据有序筛选和排列,指导图书馆文献采访的方向与重点,为图书馆文献采访的资金分配和文献配置提供科学的量化依据。

目前,我国公共图书馆在文献采访决策方面尚存在不足,只有从读者需求出发,充分做好读者阅读意愿调查,才能够真正做到“每位读者都有书”和“每本书都有读者”的统一。基于用户数据挖掘的图书馆文献采访决策模式建设,既能够充分满足读者的阅读要求,又能够在最大程度避免资源文献的浪费与闲置,提高馆藏利用率。因此,图书馆要在实践中不断丰富自身的文献采访决策模式构建思路,提高文献采访有效性,将成功的图书馆文献采访决策模式推广出去。

[1]时海燕.数据挖掘在公共图书馆管理工作中的作用分析[J].办公室业务,2016(21):189-190.

[2]尹斌.数据挖掘技术在图书馆创新服务中的应用探讨[J].电子技术与软件工程,2016(2):195.

[3]袁芳.大数据环境下图书馆文献资源建设模式的变革[J].图书情报工作,2015,59(18):91-94.

[4]张宏伟,史惠媛.数据挖掘在高校图书馆文献采购决策中的应用——以黑龙江中医药大学图书馆为例[J].中国中医药图书情报杂志,2016, 40(2):22-24.

[5]李硕,石丽红,呼忠权,等.序列模式挖掘技术在数字图书馆中的应用[J].农业图书情报学刊,2015,27(7):40-43.

[6]俞锦梅.数据挖掘在国内图书馆应用领域研究综述[J].图书与情报,2015(2):137-141.

[7]杨杰.大数据环境下的公共图书馆采访策略[J].图书馆学刊,2015(3):44-46.

[8]赵研科.基于数据挖掘的高校图书采访决策系统设计与实现[D].长沙:湖南大学,2012.

Study on Decision-making Modes of Literature Acquisition of Libraries Based on User Data Mining

XU Jie

(Shandong Tai'an Central Hospital, Tai'an 271000, China)

Mining user data can optimize literature acquisition of libraries. Using user lending data can guide the allocation of procurement funds. Using user search data can retrieve reader-required literature. Using user booking data can supplement the collection of literature. Based on user data mining, there are three kinds of decision-making modes in literature acquisition of libraries: classification analysis of applied decision tree, the cluster analysis of applied data groups and the association analysis of applied data mining, ,which can guide the decision-making in literature acquisitioning of libraries. The realization ideas of decision-making modes of literature acquisition of libraries based on user data mining are using point-by-surface approach to position literature interview direction, applying data mining technology to output literature acquisition focus, and multi-dimensionally mining user data to improve the effectiveness of the literature acquisition.

reader users; data mining; public libraries; literature acquisition; decision modes

徐杰.基于用户数据挖掘的图书馆文献采访决策模式研究[J].中国中医药图书情报杂志,2018,42(2):28-31.

10.3969/j.issn.2095-5707.2018.02.007

G253

A

2095-5707(2018)02-0028-04

(2017-11-03)

(2017-11-17;编辑:魏民)

徐杰,E-mail: vo9000@126.com

猜你喜欢

群组数据挖掘检索
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
Boids算法在Unity3D开发平台中模拟生物群组行为中的应用研究
专利检索中“语义”的表现
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议