基于读者阅读数据挖掘的精准推荐服务模式研究
2019-07-10黄伟
黄伟
关键词:读者阅读;数据挖掘;精准化;推荐服务;模式构建
摘 要:文章阐述了图书馆推荐服务应用数据挖掘技术的必要性,介绍了读者阅读数据挖掘技术应用于图书馆文献资源推荐服务、文献资源检索服务、文献资源管理服务等工作中的现状,分析了基于读者阅读数据挖掘技术下精准推荐服务模式构建的三个影响要素,即数据库建设、精准推荐计算方法与面向读者的操作流程,在此基础上从前端应用、算法实现、角色建模、数据搜集四个方面提出具体的实施方案。
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2019)06-0087-03
数据挖掘技术是指从数据库中挖掘读者需要的资源,匹配读者的信息需求。随着读者阅读多样化和个性化的发展,图书馆越来越重视数据挖掘技术在精准推荐服务中的应用,这就需要图书馆从海量数据资源中进行分析与建模,最大限度地将匹配读者需求的目标资源筛查出来,并推荐给读者[1]。实际工作中,这种精准推荐正是图书馆主动式服务理念的具体表现,精准推荐能够为读者提供针对性强、个性化鲜明的信息服务,充分体现了图书馆以读者为中心的服务思想。此外,应该用读者阅读痕迹数据,发现读者的阅读规律与偏好,有利于图书馆满足读者对信息资源的多样化、动态化需求。
1 基于读者阅读数据挖掘的精准推荐服务的必要性
应用数据挖掘技术能够满足图书馆资源建设丰富化的需要,同時也能满足读者资源需求多样化的需要,因此具有现实必要性。
1.1 能够满足图书馆资源建设丰富化的需要
伴随信息技术和互联网技术的飞速发展,数据呈现出爆炸式增长的态势,图书馆作为文献资源的构建与交流中心,越来越重视数据库的建设与完善。在此背景下,各级各类图书馆纷纷依托自身馆藏资源和地方特色建立起多种类的数据库,如地方文献数据库、学科专业数据库、文史资料数据库、特色信息资源库等[2]。然而,丰富的数据资源给图书馆构建完善的检索系统带来了诸多困难,纸质资源的数字化转换更是增加了检索结果全面与准确输出的难度。此外,大量的资源集合易导致数据重复、无效数据等问题的出现,不利于图书馆开展数据维护工作,严重阻碍了图书馆资源建设工作的开展。数据挖掘技术的应用实现了图书馆资源构建过程的可视化,能够使数据间的关系更加清晰,并对庞大的数据库进行梳理,清除数据库中的无效资源,因此能够促进图书馆资源建设的丰富与完善。
1.2 能够满足读者资源需求多样化的需要
在图书馆服务中,读者的阅读需求呈现出多样化、个性化和特色化的特点。一方面,读者的主体越来越趋向于多元化,图书馆完善数字服务之后突破了空间和时间的制约,读者数量不断增加。而读者受生活环境、教育背景等因素的影响,其信息需求也具有特色化和个性化的特点[3]。另一方面,读者获取资源的方式更加多样化,图书馆需要创新信息资源的推荐方式,积极开发依托互联网平台的精准推荐服务。总之,读者对图书馆服务的要求越来越高,应用数据挖掘技术可以更好地掌握读者的需求,提高图书馆推荐服务的精准度。
2 读者阅读数据挖掘技术在图书馆精准推荐服务中的应用
2.1 在文献资源推荐服务中的应用
图书馆需要对读者阅读数据(包括检索频率、阅读次数、文献领域等[4])进行分析和研究,从中能够发现数据之间的隐含关系与语义规则,这也是图书馆进行精准推荐服务的物质基础,读者数据的分析结果为图书馆精准推荐服务提供了客观的科学数据支持。而事实上,读者的数据信息不是一成不变的,会随着读者阅读倾向、喜好的不同而发生动态变化,这就需要图书馆具体问题具体分析。数据的挖掘与关联也要具备即时性,通过计算读者的阅读历史数据,挖掘读者数据与信息资源的关联与规律,结合置信度等参考值,预测读者的信息阅读行为,进而对其提供精准的推荐服务。
2.2 在文献资源检索服务中的应用
信息资源检索结果是图书馆为读者提供精准推荐服务的重要内容,也是获取读者阅读数据的主要途径。在传统的图书馆信息检索系统中,检索结果往往是相关文献的罗列与堆砌,对文献资源间的关系没有进一步的阐述与说明,这就会产生检索结果的关联性等级排序不够突出的问题。数据挖掘技术在文献资源检索服务中的应用,可以结合读者阅读需求,将检索的目标资源按照匹配度数值依次排序,从资源检索的环节精准文献的输出结果,提高图书馆资源推荐的质量和效率[5]。
2.3 在文献资源管理服务中的应用
图书馆的信息资源具有数量丰富、涉及领域广泛、格式种类繁多等特点,图书馆只有加强对文献资源的管理,才能从根本上优化资源推荐工作,切实满足读者的个性化、多样化阅读需求。数据挖掘技术在文献资源管理服务中的应用,能够使图书馆根据读者检索痕迹大数据分析哪些资源是热门读物,这些资源有何共同点和特殊之处,从而预测文献的流通与借阅趋势,一方面对“潜力股”资源进行群体定位推荐,加强受欢迎资源的建设;另一方面可以将旧资源进行清理和转移,节省图书馆的资源储存空间,避免资源配置空间的浪费,为图书馆的信息资源精准推荐服务提供充足的环境保障[6]。
3 基于读者阅读数据挖掘的精准推荐服务模式构建
基于读者阅读数据挖掘的精准推荐服务模式构建有三个影响要素:数据库、精准推荐计算方法、面向读者的操作流程。其中,数据库建设是物质基础,精准推荐计算方法是技术保障及操作流程的成果展示。
3.1 数据库建设
数据库建设是基于读者阅读数据挖掘的精准推荐服务模式构建的,这里所说的数据库包括文献资源数据库和读者阅读数据库两类。读者信息表(见表1)除记录读者的个人基本信息外,还增加了对读者阅读兴趣及阅读需求等数据的记录汇总,通过了解读者需求偏好与馆藏资源的种类的关联与规律,加快资源与读者需求匹配的速度[7],帮助图书馆在资源建设中有的放矢,精准推荐,缩短了服务时间,优化了服务路径。读者服务部可依据读者阅读数据库的信息采集情况开展讲座、读者沙龙等活动,提高读者满意度。
3.2 精准推荐计算方法
精准推荐计算方法是提高图书馆推荐服务效率的技术保障,图书馆可以根据读者的实际阅读情况选用适宜的推荐计算方法,常见的方法有以下三种:第一,以数据内容为核心的算法,这种推荐计算方法的侧重点在于分别分析馆藏文献与读者阅读数据,挖掘相似资源,确定资源推荐的基数,完成资源推荐服务。这种计算方法的好处是保证了资源推荐的客观性与科学性,完全以读者的實际阅读行为为立足点,最大限度地避免了人工的干预和介入。第二,以最近邻居为核心的分类计算法,这也是目前图书馆最常用的精准推荐计算方法。该方法将有共同阅读需求的读者进行分类,对群体内读者阅读数据进行关联,以其中一个读者的阅读情况作为参照依据,评估其对某一类资源的阅读加权评价值,推算距离该读者由近至远的其他读者对此资源的感兴趣程度,依据距离的排序生成推荐列表,指导图书馆有针对性地对群体内读者进行信息推送。第三,依据关联规则的推荐计算法,这种方法是将读者阅读数据和文献数据比作商品,探寻两类数据中的关联性,并按照一定的关联规则进行排序和成果输出,进而产生以关联规则为纽带的资源推荐列表[8]。
3.3 操作流程
基于读者阅读数据挖掘的精准推荐服务模式构建最终需要呈现出完整的操作流程。读者需要登录图书馆的资源推荐系统,如果读者是新用户,图书馆需要做好用户数据收集、整理和储存工作,将读者个人信息数据转入推荐引擎,进一步结合读者个性化标注的工作情况、受教育背景、专业领域等已知信息,进行文献数据库资源的匹配与检索,实现精准化资源推荐。如果读者已经有历史阅读数据,那么图书馆可以调取以往的数据,以此为基础进行聚类计算和数据挖掘计算,向读者精准推荐新资源。
4 基于读者阅读数据挖掘的精准推荐服务模式实现方案
笔者通过对读者阅读数据挖掘技术与图书馆精准推荐服务的分析,从前端应用、算法实现、角色建模与数据搜集四个方面提出具体的服务模式实现方案。
4.1 优化面向读者的前端应用,实现图书馆与读者的实时性推荐互动
在前端应用部分,图书馆系统接收来自移动设备的推荐请求,对请求数据进行初步分析与处理后,再将结果反馈给用户,完成资源推荐的整体流程。需要注意的是,由于移动设备传送过来的推荐请求语义有可能是不规范的,图书馆需要结合实际情况应用数据的关联技术,构建数字资源的本体与语义网知识库,为读者提供精准的、个性化的推荐服务。
4.2 选取精准化算法,充分采用大数据挖掘技术
图书馆要想实现对读者的资源精准推荐,精准化的算法是重要的技术保障。一方面,图书馆要选取适当的基础算法,保证资源文献的构建质量;另一方面,图书馆还要充分应用大数据挖掘算法,提高读者检索需求目标文献与图书馆系统推荐文献的匹配度,充分采用大数据挖掘技术分析读者的阅读规律,探寻隐藏在数据之间的内在联系。总之,图书馆应该做到基于不同用户的实际情况推荐多样化、个性化的信息资源,保证图书馆精准推荐的高效性和稳定性。
4.3 完善角色建模,协调读者与文献本体的关系
如图1所示,读者阅读数据挖掘技术下图书馆精准推荐服务模式的构建,需要以读者阅读产生的动态数据为研究本体,图书馆资源推荐系统不仅强调文献资源的建模,还重视用户数据的建模。具体来说,图书馆可以依据读者的阅读偏好和阅读规律构建读者画像,从中刻画出读者长期或短期的阅读兴趣,从而发现读者的阅读需求,进一步应用数据挖掘技术从文献资源建模库中进行相关性数据的匹配与筛选。这种双向角色建模的方式可以使数据的关联更加直观,协调用户与文献本体的关系,使数据资源的分布更加全面。
4.4 全面收集数据,突出数据特征
事实上,无论是读者数据还是文献数据的本体建模,关键都在于选取数据的特征,提炼数据自身的关键节点。图书馆构建基于读者阅读数据挖掘的精准推荐服务模式,其目的正是为读者提供个性化、特色化的推送体验,建立在读者阅读数据特征基础上进行的数据挖掘与关联分析,则更能凸显出这种个性化和特色化。因此,在数据收集层面,图书馆要充分考虑读者历史浏览记录、读者行为、专业储备等方面的情况,从而推荐对于读者来说价值更高的信息资源,提高读者的体验满意度。
5 结语
综上所述,基于读者阅读数据挖掘的精准推荐服务是大爆炸数据时代下图书馆服务转型的必经之路。通过应用读者阅读数据挖掘技术,图书馆可以从读者层面探寻隐藏的数据规律和关联。有规律可循的用户数据能为图书馆的精准推荐服务奠定良好的基础,有利于图书馆在大量的文献数据中精准检索到读者的目标资源,从而实现减少资源获取时间、简化资源检索途径、优化资源推荐效率、提高读者满意度的服务目标。
参考文献:
[1] 王大壮.基于用户行为和大数据分析的图书馆个性化服务探究[J].图书馆学刊,2017(12):111-115.
[2] 谢康.基于读者个性化特征数据挖掘的图书馆书目推荐[J].现代电子技术,2018(6):34-36.
[3] 王正林.基于数据挖掘的图书馆书目推荐套餐化服务研究[J].河南图书馆学刊,2017(11):126-127.
[4] 柳益君,何胜,熊太纯,等.大数据挖掘视角下的图书馆智慧服务:模型、技术和服务[J].现代情报,2017(11):81-86.
[5] 韩璐.基于数据挖掘的图书馆书目推荐服务的研究[D].唐山:华北理工大学,2017.
[6] 聂飞霞.基于数据挖掘技术的移动图书馆个性化图书推荐服务[J].图书馆学刊,2014(5):104-106.
[7] 王燕红.基于数据挖掘的图书馆个性化服务系统的设计与研究[D].厦门:华侨大学,2012.
[8] 孔功胜.个性化推荐在图书馆信息服务系统中的应用[J].图书馆学刊,2011(10):120-122.
(编校:马怀云)