基于大数据的数字图书馆个性化服务发展研究
2021-07-21黄绣坤
黄绣坤
摘 要:数字图书馆作为人们获取信息的重要渠道之一,在帮助用户找到所需要信息方面不断进行着探索,将大数据应用于数字图书馆个性化服务建设是新时代数字图书馆的发展的必然趋势,它能为用户提供更便捷、更全面、更个性化的服务。本文从数字图书馆和数字图书馆的个性化服务发展的现状展开研究,主要介绍了数字图书馆个性化服务的概念、数据挖掘的相关技术、大数据在数字图书馆个性化服务建设的应用以及发现数字图书馆个性化服务建设中存在的问题并提出了解决对策。
关键词:大数据;数字图书馆;个性化;服务建设
Research on the Development of Digital Library Personalized Service Based on Big Data
HUANG Xiukun
(Shache County Library, Kashgar Region, Xinjiang Uygur Autonomous Region, 844700 China)
Abstract: Digital library, as one of the important channels of access to information, to help users find the information you need on exploring, in a big data applied to the construction of digital library personalized service is inevitable trend in the development of a new era of digital library, it can provide users with more convenient, more comprehensive, more personalized service. This article from the digital library and digital library personalized service development present situation launches the research, mainly introduces the concept of digital library personalized service, the related technology of data mining, data in the application of the construction of digital library personalized service, and find the problems existing in the construction of digital library personalized service and solutions are put forward.
Key Words: Big data; Digital library; Personalized; Service construction
0 前言
數字图书馆是以实体图书馆为基础,运用计算机技术和互联网技术来实现图书资源的收录、传播[1]。但随着数字图书馆的快速发展,大量问题也逐渐涌现出来。数据库数据过于冗杂,使用户无法在最短的时间内获取对自己有用的信息,信息检索上同样缺乏个性化服务,不能满足用户的多样化需求。这些问题的出现,要求数字图书馆加强个性化服务建设[2]。
大数据、大数据技术的发展,为数字图书馆的个性化建设提供了技术支持。随着互联网技术的不断发展,人们进入了信息时代[3]。信息源的不断扩大,信息也变的多种多样。数量巨大的信息给人们生活带来了巨大的改变[4],他方便我们的同时,另一方面数量巨大且冗杂的信息也为人们带来了搜寻上的不便。与此同时,数字图书馆的使用者也不断增加[5],人们对数字图书馆的个性化服务的需求也随之增加。大数据在数字图书馆中的应用,能够有效提高数字图书馆的信息筛选效率。在数字图书馆的基础上丰富个性化服务,更能满足用户的信息检索和图书阅读的需求,提高用户的阅读效率[6]。
1 大数据在数字图书馆上个性化服务的应用
1.1信息定制与信息推送
数字图书馆的个性化服务就是数字图书馆针对不同用户在不同的时间、不同的地点,为其提供量身定制的服务。其主要体现在用户的个性化信息定制、信息推送服务两个方面[7]。
(1)个性化信息定制服务不再向用户提供相同的信息服务,而是根据不同用户不同需求为其提供满足需求的个性化服务。用户通过注册个人信息、操作网页在用户数据库中形成交互记录,这些记录信息会通过数据处理、数据挖掘等技术实现的用户需求的挖掘[8]。了解了用户的需求,就能为用户提供个性化服务了。
(2)信息推送服务则是利用大数据通过个性化服务系统实现个性化推荐的目的,即由用户主动搜寻转为图书馆主动提供信息服务。在这种模式下,用户不需要在搜索引擎上操作就能够获得自己想要的信息[9]。
不论是信息定制服务还是信息推送服务,其工作原理都是利用用户的注册信息以及用户的网页访问行为形成用户个人数据库,然后系统利用大数据及其他信息处理技术挖掘用户关注的信息,将用这些被挖掘出来的信息发送给用户[10]。另外根据数字图书馆可更新性原则,系统会在未来的工作中实时更新用户个人数据库,以满足用户实时的信息获取需求。具体的个性化信息制、信息推送流程如图1所示:
1.2优化信息检索服务
信息检索是用户与数字信息建立联系的纽带,在数字图书馆中应用大数据,能够利用聚类算法将搜寻到的结果聚类分析,将大大提高信息检索的效率。大数据根据用户的注册信息、行为活动数据,分析出用户的数据需求,然后搜索引擎将用户检索的相关信息呈现给用户[11]。
如今,在搜索引擎上使用关键词法进行信息检索,往往会得到几百、几千条与检索关键词相关的信息,在短时间内找到真正感兴趣的信息很困难。如果将大量信息收集整理在一起,并把这些信息聚类分类成多组不同的类,每组类归纳出一个主题 ,这将排除一些用户不感兴趣的信息。比如,输入关键词“数字图书馆”,搜索引擎可能找到几千条与“数字图书馆”相关的信息,用户很难找到符合自己要求的信息。如果运用分类、聚类、关联等技术对检索到的信息分类,会帮助用户快速的找到所需的信息。
1.3拓展服务形式,优化个性化服务系统
数据挖掘在数字图书馆中的应用,不仅拓展了数字图书馆的业务类型,还极大地提供了数字图书馆的信息服务质量。数字图书馆依靠先进的大数据,转变了传统的服务空间和媒体类型,主要的是利用数据挖掘,为网络用户提供了信息分析服务、查新和定题服务以及信息检索服务,有效地提升了其服务水平和服务结构。
挖掘
用户进入数字图书馆首先进行用户信息注册、登录,这些与用户的检索记录共同构成用户数据库。用户登录完成进入数字图书馆信息首页。系统对用户数据库进行数据挖掘,构建“我的数字图书馆”。具体个性化服务系统流程如图2所示:
1.4促进信息资源的管理
数字图书馆中,文献资源主要是电子图书、电子期刊,现如今随着数字化的高速发展,数字资源成爆炸性的增长,信息资源的膨胀式发展要求数字图书馆对各类信息的自动化管理则愈显重要。
(1)图书分类聚集。利用聚类、关联技术将数字图书馆的图书划分为多组不同的类中,同一类中的图书资料具有较高的相似性,不同类别的类图书具有一定的差异性,用户在查阅图书时,可以重点关注和图书处在相同类的其他图书,这样能大大提高检索效率。
(2)提取文本关键词。分析并归纳文献资料里的最能概括文献的关键词及关键句, 并将其引用作为文献检索的检索词,这样可以快速检索到同类别的文献资料。这一做法的优点是可以准确的进行信息的查找。
(3)文本摘要。是把文献贴合主题的文本进行提取,用来做文献的摘要。这样用户就可以通过摘要了解文章,无需查看全文,为用户节约时间。
2 数字图书馆个性化服务存在的问题及对策
数字图书馆近年来虽然得到较快的发展,但仍存在着个性化信息的获取来源少、信息资源整合利用力度不足、检索复杂等问题。下面具体分析现阶段数字图书馆存在的几个主要问题并提出对应的解决方法。
2.1个性化信息的获取来源少
个性化服务的基础就是个性化信息的获取,对搜集到的信息进行分析、挖掘,最终实现个性化服务。目前的数字图书馆还不可以做到具体问题具体分析,不能深入的满足用户需求。造成这一问题的根本原因就是对用户信息了解不足。目前主要的信息来源有:用户的注册信息表、搜索时的关键词、浏览、服务器日志信息、下载的信息等。信息获取来源太少,为用户提供的个性化服务程度低。
个性化信息获取方法分为隐式获取和显示获取。显示获取是指在需要用户主动配合、参与信息收集的信息收集方式,这种信息收集方法具有信息收集简单高效,用户建模精准度高的特点,但需要用户主动参与;隐式获取不需要用户直接参与,他会自动获取用户感兴趣的信息,但是存在着准确性低的风险。隐式获取和显示获取的综合应用能够比较全面的收集用户信息。除此之外,还应创造的活动环境,建立完善的用户评估及信息反馈机制。
2.2用户信息研究不深入
用户信息研究指的是对用户信息进行挖掘、分析,然后归纳用户所需信息,从而进一步为用户服务。用户信息是个性化服务的基础,要想提供个性化服務,首先需要收集用户的背景资料以及信息需求,然后对这些信息进行全面的分析,才能真正促进数字图书馆的个性化服务建设。充分的用户信息研究对数字图书馆的个性化服务研究具有重要意义,能够拉近与用户的距离,提升用户满意度。信息分析过于浅,不利于提升个性化服务程度的提升。
信息资源整合力度不足指的是信息资源处于无序状态,不能进行高效的信息结构建设。数字图书馆的个性化服务体系的建设需要以用户为中心,针对用户数据需求和用户注册信息来进行馆内资源建设。所以,一定要整理用户所有信息,相互之间有联系的,没有联系的都集合起来使它成为一个整体,从而提高信息资源的利用率。
2.3信息安全存在隐患
互联网的飞速发展是两面性的,他在便利人们生活的同时也带来了网络信息泄露等隐患。鉴于这些考虑,用户可能会担心自己的注册信息、浏览记录被泄露从而给自己带来麻烦,以致不愿透露过多的个人信息,这就会使得数字图书馆无法获得全面、精确的用户信息,从而无法为其提供更全面的个性化服务。
加强用户隐私及网络信息安全的建设,提升用户对数字图书馆的信任度,使用户提交更多的个人信息在平台上,为数字图书馆数据库提供更多的数据,以至于为用户提供更全面、更精确的个性化服务。数字图书馆的研究人员一定要时刻关注用户隐私和信息安全问题,加强数字图书馆的网络安全建设。
2.4不断创新信息检索方式
信息检索是指对信息进行筛选和查找,它是数字图书馆的基本功能之一,其服务质量是展示数字化图书馆服务质量的一个重要指标。传统的检索方式得到的结果缺乏交互性、准确性、指向性,往往其查询结果令用户不知所措。网络信息检索模式能支持概念检索、关键词检索、联想检索及语句检索等,并能利用聚类算法将查询结果分析聚类,使结果清晰条理的推送到用户面前。数字图书馆需不断对信息检索方式和信息服务方式创新,促使数字图书馆发挥服务功能,为用户提供优质的服务。
2.5完善个性化推荐技术
我国绝大多数数字图书馆仍以文献搜索为主,这种非主动的服务方式为用户提供的个性化服务是有限的,从而造成数字图书馆的资源利用率低下的现状。针对这一现象应该完善个性化推荐技术,将被动的提供搜索服务转化为主动的提供推送服务。
个性化推荐技术是目前数字图书馆建设个性化服务的重要的技术手段,数字图书馆可以收集用户的查询信息和浏览信息,为用户提供可能需要的数据资源,并通过个性化推荐技术主动为用户提供信息服务。
3 结 语
在数字图书馆领域应用大数据使个性化服务建设又上了一个新台阶。大数据在数字图书馆中的应用,改变了数字图书馆被动服务的状态,为用户提供了更多个性化信息服务和行动支持,推动了数字图书馆的现代化、个性化服务建设。
本文主要研究了数字图书馆个性化建设过程中主要存在的问题,并给出了相应的建议。总的来说我国数字图书馆个性化服务建设之路任重而道远,对于未来,我们应该多借鉴国外的优秀的个性化服务设计,不断发展数据技术、计算机科学技术,把个性化服务作为数字图书馆的评价标准将有助于推动数字图书馆个性化服务的建设。未来的数字图书馆,我们希望用户在登录数字图书馆的网站后就能为用户提供个性化文献推荐;在有了浏览记录的后,用户就能得到关联个性化图书推荐。论文还有很多不足的地方,希望通过以后的学习对这些问题进行补充。
参考文献:
-
Shuqing Li,Zhiyuan Hao,Li Ding,Xia Xu. Research on the application of information technology of Big Data in Chinese digital library[J]. Library Management,2019,40:8-9.
-
Elizabeth Blackwood. Integrating digital stewardship into library instruction: An argument for student (and librarian) success[J]. The Journal of Academic Librarianship,2019,3:21-23
-
Lorena Siguenza-Guzman,Victor Saquicela,Elina Avila-Ordó?ez,Joos Vandewalle,Dirk Cattrysse. Literature Review of Data Mining Applications in Academic Libraries[J]. The Journal of Academic Librarianship,2015,4:41-42.
-
李潔.数据驱动下数字图书馆知识发现服务创新模式与策略研究[D].吉林大学,2019.
-
李雪莹.高校图书馆个性化服务质量评价研究[D].黑龙江大学,2019.
-
夏秀双.大数据环境下高校图书馆个性化信息服务研究[D].曲阜师范大学,2015.
-
闫晶.数字图书馆资源聚合质量评价及优化策略研究[D].吉林大学,2018.
-
张思凤.基于小数据融合的数字图书馆个性化推荐研究[D].华中师范大学,2018.
-
肖仁锋.基于协同过滤的图书馆个性化推荐方法的研究[D].山东师范大学,2017.
-
李巨伟.数据挖掘在高校图书馆个性化推荐服务中的应用[D].河北科技大学,2018.
-
周恬.我国数字图书馆个性化服务的用户信息保护[D].黑龙江大学,2017.