APP下载

Web挖掘在高职数字图书馆个性化服务系统中的应用

2015-05-12刘巧等

广西教育·C版 2015年3期
关键词:个性化服务数字图书馆高职院校

刘巧等

【摘 要】在分析Web挖掘技术的内容与类型的基础上,探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,构建个性化服务模型,不仅实现了图书馆资源的优化,还能为用户带来全新的数字图书馆服务体验。

【关键词】Web挖掘 数字图书馆 个性化服务 高职院校

【中图分类号】 G 【文献标识码】 A

【文章编号】0450-9889(2015)03C-0092-03

随着计算机网络技术、多媒体技术等高新技术的出现和快速发展,转变了信息存取方式,图书馆向数字化演变已经成为大势所趋。高职院校图书馆作为学生了解国内外科研信息、查阅资料等获取知识的重要场所,建设数字化图书馆也是高职院校图书馆要进行的一项重要革新工作。

数字图书馆是将现代网络、通讯和计算机等技术应用于信息的收集、整理、组织和传递的新的模式和理念,本质是利用各种信息技术为用户提供更加便利的服务,提高信息的广度和深度,提升图书资源的使用效率,提高服务质量。正是基于这样的理念,数字图书馆的个性化服务才应运而生,数字图书馆的个性化服务是根据用户的个性化的需求,搜集、分析、加工和重组信息,从而提供相应的信息服务,让用户获得所需的信息内容,关键在于对人的需求与信息处理能力的有机结合,通过挖掘用户的需求、兴趣和偏好,建立用户需求模型,再利用信息技术整合加工信息,为用户提供与之需求相匹配的信息资源,并且引导用户检索利用信息。本文将探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,为高职院校学生用户提供全新的服务体验。

一、Web挖掘技术

Web挖掘技术是数据挖掘技术在Web环境下的应用,是从大量Web文档集合中提取潜在有用的信息和知识的过程。基本原理在于根据用户的需求提取数据,通过预处理精简数据,去除不相关的冗余数据,接着选择合适的数据挖掘方法分析数据,形成一种易于理解的数据模式呈现给用户,主要有以下三种数据类型。

(一)Web内容挖掘

Web内容挖掘是对Web页面的本信息、图像、多媒体信息等文本内容进行特征提取,采用的技术方法主要是对页面文本的分类和聚类,以从文档内容中抽取出知识,算法的思想如下:

通过上述方法能够将Web页面内容表示成一个个矢量,然后通过计算矢量之间的距离进行文本的分类和聚类。

(二)Web结构挖掘

Web结构挖掘是从利用WWW之间的组织结构和联接关系,对Web页面进行分类,从中推导知识。超文本链接丰富了Web页面上的信息,使得Web页面能够提供除文本内容以外的有用信息,通过利用这些信息,运用挖掘方法从而对页面进行排序,发现重要的页面。

一个重要的页面通常被认为被引的次数较高或者被重要的页面引用。设是一个Web页面,被引用的页面集合为,引用的页面集合为,则 表示页面的重要性,表达式为,其中为引用的页面,表示引用的页面的总数。因此,针对一个查询条件,首先将利用相似度函数查找个页面;其次,计算个页面的重要程度进行排名,计算公式为:,其中,,,表示相似函数。

(三)Web日志挖掘

Web日志挖掘是通过挖掘Web访问记录,如IP地址、访问时间、访问日期、请求的URL以及用户浏览器等,了解用户的行为模式,发现用户感兴趣的模式。在数字图书馆中,主要采用的技术有路径分析和关联规则分析,路径分析是通过分析用户最经常访问的路径,从而调整站点之间的结构;关联规则是分析用户访问的Web页面之间的关联关系,找到隐含的信息。

二、基于Web挖掘技术的数字图书馆个性化服务模型

(一)Web挖掘技术在高职院校数字图书馆个性化服务中的应用

数字图书馆个性化服务是根据不同用户所提出的需求,利用网络技术、人工智能技术等,自动检索、收集网络信息和图书馆数字信息,并结合用户的行为、习惯以及浏览历史等信息,对信息进行整合,然后将这些信息推送给用户的一种综合性服务。Web挖掘技术作为一项综合技术,能够获取、分析用户行为,能为数字图书馆提供重要的信息基础。

1.发现学生用户兴趣,建立个性化的访问空间

一般而言,学生用户在浏览数字图书馆的过程中,会对感兴趣的Web页面浏览时间较长,浏览的次数较多,而对不感兴趣的Web页面浏览时间较短,次数也较少,基于此,我们可以通过用户浏览历史的时间和次数,发现学生用户的兴趣,为其建立个性化的访问空间,有利于用户浏览阅读。

2.实现数字图书馆网站链接结构的优化

通过关联规则分析用户的Web访问记录,发现不同页面之间的相关性,对于增强相关系较高的页面之间的联系,方便用户使用。例如学生用户在查找文献的过程中,除了会关注该文献的参考文献以外,也会去关注内容上较为接近的文献,以及同行关注的文献,甚至是同一个导师指导下的文献,因此,可以将学生用户可能关注的页面信息建立导航链接,实现Web站点的优化。

3.挖掘用户特征,发现用户重点关注领域,提高信息检索的个性化

高职院校师生在使用数字图书馆的过程中,一般是由于某种学术目的或是偏好而进行信息检索,因此,通过对用户检索信息的挖掘,能够发现用户所关注的领域,如物流供应链、教育心理学、图书情报学等,从而进一步为用户提供服务。当用户输入相关的检索关键字之后,将用户重点关注领域的内容优先排在前面,便于顾客快速找到所需的信息,提高信息检索的个性化。

4.根据用户特征,对用户进行分类,实现精准化服务

不同年龄、学历、学科的用户在使用数字图书馆过程中会呈现不同的行为模式和兴趣模式,通过Web挖掘技术能找出各类的特征属性,将用户进行群体细分,从而实现精准化服务。例如,图书馆可以根据不同类别用户的兴趣点,推送讲座信息、讲坛信息、课程信息等,还可以将图书馆新到资料、最新一期的期刊目录通知用户,提高数字图书馆的服务质量。

5.挖掘用户借阅信息,提高图书资源的利用率

对用户所借阅的文献、图书信息进行挖掘,可以发现受欢迎的书籍,并以此向用户推送最近时期的热门书籍和文献,也可根据图书的借阅情况,实行馆际调度,或者是重新购买热门书籍,便于用户借阅,优化图书馆资源,提高利用率。另一方面,对于将旧的、使用少的书籍归类,放置统一书库,减少冗余空间,节省开销。

(二)数字图书馆个性化服务模型

将Web挖掘技术应用于数字图书馆,通过内容挖掘、结构挖掘、日志挖掘,使用聚类分析、关联分析、路径分析等方法,实现用户的个性化服务。基于Web挖掘技术的个性化服务模型如图1所示,主要包括以下几个部分:

1.用户接口

用户接口用于连接用户与图书馆系统,用户通过该接口浏览图书馆网站,浏览所需的图书、期刊信息,同时用于接收系统的反馈信息,这个过程可以学习和记录用户的兴趣。

2.Web挖掘

根据挖掘要求,选择合适的挖掘方法执行挖掘任务,识别用户行为,实现具有针对性、主动的、符合其需求的特色服务。同时,挖掘方法具有可扩充性和易选择性,能够引入新的挖掘方法,提高挖掘的效率。

3.信息推送与反馈

通过Web挖掘,建立用户的个性化信息服务模型,并利用电子邮箱、手机短信等方式将信息推送给用户的个性化终端。用户也可以对推送的信息作出反馈,对信息推送方式、推送内容、推送安排等方面给予评价,以便调整和完善用户的数字图书馆个性化服务。

三、实现案例

目前,我国高校在进行图书馆数字化建设时,已将个性化服务的发展纳入进去。

华中科技大学图书馆推出了Mylibrary系统,基于Web挖掘技术为广大师生提供服务,师生可以在该系统内根据自己的需要和爱好,选择与自己相关的模块,并对一个模块功能进行加工处理。

厦门大学图书馆推出了“图·时光”服务,用来记录师生在图书馆的足迹,以故事的形式展现师生的入馆次数、借阅的数目等内容,受到了广大师生的热捧。

国家科学技术文献中心也运用了Web挖掘技术,整合多家行业单位的数字资源,建立了动态用户兴趣特征模型,为国内各大研究中心提供资源服务,取得了不错的效果。

国家专业图书馆也是基于Web技术,在网络平台上实现图书采购、编目、查询等自动化业务,用户可以随时随地查询各类图书、期刊信息。

总之,将Web挖掘技术运用于数字图书馆,通过内容挖掘、结构挖掘、日志挖掘,使用聚类分析、关联分析、路径分析等方法,构建个性化服务模型,利用该模型可以建立个性化的用户访问空间、实现数字图书网站链接结构的优化、发现用户的重点关注领域、将用户群体细分实现精准化服务、提高高职院校图书资源的利用率等,从而为学生用户带来全新的数字图书馆服务体验。

【参考文献】

[1]赵金龙,胡小丽,王硕.利用 Web3D 技术建设数字图书馆平台的研究[J]. 数字图书馆,2011(1)

[2]王玉珍. 基于Web挖掘的数字图书馆个性化服务体系研究[J]. 情报科学,2014(4)

[3]王发社.高校数字图书馆个性化服务的 SWOT 分析及发展策略[J].图书馆理论与实践,2011(12)

[4]吴志强,王义翠,马慧娟.协同信息推荐: 一种数字图书馆个性化信息服务新模式[J].图书馆,2011(1)

【基金项目】广西高等学校科研项目(KY2015LX672)

【作者简介】刘 巧(1975- ),广西柳州人,柳州城市职业学院讲师,硕士,研究方向:信息技术管理;李燮慧(1974- ),广西柳州人,柳州职业技术学院图书馆馆员,研究方向:图书馆管理。

(责编 丁 梦)

猜你喜欢

个性化服务数字图书馆高职院校
浅析移动时代的图书馆发展策略
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究
基于云计算的数字图书馆建设与服务模式研究
高职院校创新创业教育初探
全球化背景下高职院校韩语专业毕业生就业现状分析
多元智能理论视角下高职院校体育课程评价体系的研究
浅谈财务管理存在的问题及完善措施
刍议数字图书馆计算机网络的安全技术及其防护策略
大数据对高校图书馆个性化服务的影响