APP下载

基于协同过滤的图书馆书目个性化推荐系统

2021-09-29杨雪

微型电脑应用 2021年9期
关键词:书目书籍个性化

杨雪

(陕西国际商贸学院 图书馆, 陕西 咸阳 712046)

0 引言

随着人们生活水平的不断提高,人们对精神生活的追求也日益提高,图书馆已经成为人们经常停留的地方。随着无线移动网络技术的成熟,许多电子图书被保存于图书馆中,人们如何从大量的书籍中找到自己需要的图书十分重要[1-3]。图书馆书目推荐系统可以帮助人们快速定位到需要的书籍,提高了图书馆资源利用率,因此设计性能良好的图书馆书目推荐系统已成为图书馆研究领域的一个重要方向[4-6]。

图书馆书目推荐系统解决了传统图书查找方式,具有一定的智能性,是图书馆管理的一个重要组成部分,当前存在许多有效的图书馆书目推荐系统[7-9]。最常用的图书馆书目推荐系统为:基于朴素贝叶斯算法的图书馆书目推荐系统,基于人工智能技术的图书馆书目协同推荐系统等,它们根据一定的规则将图书书目推荐给用户,减少了用户选择图书时间,但是这些系统存在一定的缺陷,如:无法满足不同用户对图书馆书籍的个性化需求,针对性不强,而且图书馆书目协同推荐精度低[10-11]。

为了解决图书馆书目推荐系统无法满足用户对书目的个性化要求的缺陷,提出了基于协同过滤的图书馆书目个性化推荐系统。首先建立了图书馆书目个性化推荐系统的总体结构,然后根据协同过滤算法计算图书和用户间的相似度,最后根据相似度对书目进行排序,并根据排序结果向用户推荐真正需要的书目,测试结果表明,该系统充分考虑了每一个用户的不同需求,降低了图书馆书目推荐误差,图书馆书目推荐结果更加具有针对性,相对其他图书馆书目推荐系统具有十分显著的优越性。

2 基于协同过滤的图书馆书目个性化推荐系统

2.1 图书馆书目个性化推荐系统的总体结构

结合用户对图书的实际要求,协同过滤的图书馆书目个性化推荐系统结构,如图1所示。

图1 图书馆书目个性化推荐系统的总体结构

从图1可知,该系统主要包含图书馆书目、用户数据库、用户需要书目推荐。数据库主要保存图书馆书目的相关信息以及用户信息,是系统最为重要的部分,便于协同过滤算法对图书馆书目进行个性化数据和推荐。书目推荐模块是本文要重点研究的内容,主要包括:协同过滤算法,书目推荐规则,因此也是图书馆书目个性化推荐系统的核心部分。

2.2 图书馆书目个性化推荐系统的工作流程

基于协同过滤的图书馆书目个性化推荐系统工作流程如图2所示。

图2 图书馆书目个性化推荐系统的工作流程

对图2的工作过程进行分析可以发现,首先对用户个性需求进行分析,从数据库中提取相关的图书书目信息,并对信息进行一定分类预处理,将分类结果存储于数据库中,然后采用协同过滤计算用户与图书之间的相似度,并对两者的关系进行挖掘,建立图书馆书目个性化推荐关联规则,最后将图书馆书目推荐结果Web服务器发送给用户。

2.3 基于协同过滤算法的图书馆书目个性化推荐

现代图书馆包含海量图书数据,不同的图书具有不同的关键词,因此可以根据关键词区别相应的书籍[12]。首先抽取图书的一些关键词,然后计算关键词的权重,并根据权重计算图书相似度,最后根据图书相似度进行书目推荐。

2.3.1 计算图书关键词的权重

当前计算图书馆书目的关键词权值方法很多,相对其他方法,TF-IDF得到图书馆书籍关键词的权重更加科学、合理,因此本文选择其计算图书关键词的权重。TF表示图书馆书目的词频,用于描述关键词对图书的重要程度;而IDF表示图书馆书籍的反向词频,用于描述关键的普遍重要性。设图书馆书籍有F个关键词,它们在图书馆书籍中出现的次数为K,那么TF可以表示为式(1)。

TF=K/F

(1)

设图书总数量为N,包含某个关键词的图书数量为k,那么IDF可以表示为式(2)。

(2)

采用TF-IDF方法可以得到图书馆书籍的关键词权重,具体可以表示为式(3)。

TF-IDF=TF×IDF

(3)

2.3.2 根据图书关键词权重计算图书相似度

图书Bi与Bj包含共同关键词数量为t,对于图书Bi和Bj,第k个关键词的权重值分别为Wik和Wjk,那么图书Bi与Bj的相似度为式(4)。

(4)

2.3.3 计算用户相似度

(1) 计算用户属性相似度。用户属性包括数值型和本文型。设用户Ui与Uj的数值型属性的相似度为simnum(i,j),用户Ui与Uj的文本型属性的相似度为simt(i,j),用户属性相似度为式(5)。

simatt(i,j)=simnum(i,j)+simt(i,j)

(5)

(2) 计算用户活跃相似度。用户Ui与Uj包含共同动态信息的数量为m,第k个动态信息的权重值分别为Uik和Ujk,那用户活跃相似度simact为式(6)。

(6)

(3) 用户相似度包括两部分:属性相似度和活跃相似度,这样可以得到用户Ui与Uj的最终相似度为式(7)。

sim(Ui,Uj)=αsimatt(i,j)+βsimact(i,j)

(7)

2.3.4 计算用户与图书之间的关联性

设用户Ui与图书Bj存在z个联系,那么用户Ui与图书Bj的关联性计算式为式(8)。

(8)

式中,Rik表示Ui与图书Bj的第k个联系值。

2.3.5 用户的图书馆书止推荐规则

设图书集合为:P={P1,P2,…,Pm},事务记录集合为T={t1,t2,…,tn},根据匹配树机制得到支持度和置信度为式(9)、式(10)。

采用K-Means聚类算法将图书馆图书进行分析,划分为K个类型,然后根据匹配树机制建立各类图书匹配规则,计算最小支持度和最小置信度,最后根据最小支持度和最小置信度给用户推荐书目。

3 图书馆书目个性化推荐的性能测试结果与分析

3.1 本文系统的图书馆书目个性化推荐结果

为分析协同过滤的图书馆书目个性化推荐系统推荐的有效性,采用某高校图书馆作为测试目标,该高校图书馆包含了大量的书籍,书籍类别众多,大致可以划分为20多类,面向的读者主要是本校的老师和学生。当一个自动化专业学生进入基于协同过滤的图书馆书目个性化推荐系统后,系统会自动给他推荐相关的书目,具体结果如图3所示。

图3 本文系统的图书馆书目推荐结果

对图3进行分析可以知道,系统给该学生推荐的书目与其专业十分相关,可以满足用户的个性需求,获得了十分理想的书目推荐结果,实验结果证明了本文设计的图书馆书目个性化推荐系统的有效性。

3.2 与其他图书馆书目推荐系统的性能对比

为了测试本文图书馆书目个性化推荐的优越性,采用文献[10]的超图排序的图书馆书目个性化推荐系统和文献[11]的SOM神经网络的图书馆书目个性化推荐系统进行对比实验,选择8类图书和相关用户进行仿真对比实验,采用推荐召回率、推荐覆盖率、推荐准确度、推荐新颖度对实验结果进行评价,它们分别描述如下。

(1) 推荐召回率指针对用户所推荐图书与图书馆内排除无关图书外剩余图书的比例,推荐召回率可有效体现系统的推荐性能;

(2) 推荐覆盖率指推荐书目结果在图书馆内全部图书中分布的广泛程度,覆盖率越高表明系统可挖掘图书馆内图书范围越广,推荐性能越高;

(3) 推荐准确度指系统所推荐书目内图书被用户点击次数占全部推荐书目比例;

(4) 推荐新颖度指推荐书目内出版年限为近三年的图书占全部图书馆图书数量百分比。

3种系统对于8类图书推荐性能对比结果,如图4所示。

(a) 召回率对比结果

(b) 覆盖率对比结果

(c) 准确度对比结果

(d) 新颖度对比结果图4 推荐性能对比结果

图4(a)召回率对比结果可以看出,采用本文系统推荐8类图书书目的推荐召回率在93%以上,明显高于超图排序系统和SOM神经网络系统。本文系统采用协同过滤的书目推荐算法,可有效排除图书馆内无关图书,有效验证本文系统的推荐性能。

图4(b)实验结果可以看出,本文系统推荐图书馆书目的覆盖率在95%以上,明显高于超图排序系统和SOM神经网络系统。本文系统数据挖掘过程中可从图书馆全部图书内搜寻适合用户的书目,具有更大的挖掘范围,有效验证本文系统具有更高的推荐性能。

图4(c)系统测试结果可以看出,本文系统推荐图书馆书目准确度在90%以上,明显高于超图排序系统和SOM神经网络系统。系统测试结果说明本文系统所推荐书目被用户接受概率明显高于另外两种系统,本文系统所推荐书目具有更高的实用性。

图4(d)系统测试结果可以看出,本文系统推荐图书馆书目新颖度在82%以上,明显高于超图排序系统和SOM神经网络系统。本文系统推荐图书馆书目内新书比例明显高于另两种系统,本文系统推荐过程中充分考虑图书馆内新书,令系统推荐结果更加新颖,提升了用户兴趣度,令所推荐书目结果更加具有个性化。

为进一步验证本文推荐系统的有效性,利用匹配树机制对5类图书构建关联分析,对各专业进行图书类别匹配,匹配内容如表1所示。

表1 图书匹配结果

从表1可以看出,本文系统采用匹配树机制对5类图书构建关联结果十分合理。

以表1中的样本为基础,测试本文系统与超图排序系统和SOM神经网络系统在某地某高校图书馆学生以及教师中的推荐有效性,得到成功率对比结果如图5所示。

图5 不同系统的图书馆书目推荐成功率对比

由图5的对比结果可知,本文系统采用的协同过滤算法可针对不同用户充分考虑用户需求,推荐用户所需图书,因此推荐成功率较高,在92%以上,比超图排序系统和SOM神经网络系统成功率更高,因此可以验证本文系统推荐性能的有效性。

4 总结

由于不同用户喜欢不同的书籍,因此图书馆书目个体性要求具有一定的实际应用价值,当前图书馆书目推荐系统忽略用户的个性需求,存在一定的缺陷,如:图书馆书目推荐偏差大等,为了提高图书馆书目推荐精度,提出了基于协同过滤的图书馆书目个性化推荐系统,采用协同过滤算法计算用户与书籍之间的关系,充分考虑用户的个性化需求,改善用户对图书馆书目推荐结果的满意度,并通过具体的图书馆作为研究对象,与其他图书馆书目推荐系统进行了仿真对比测试,结果表明,本文系统解决了当前图书馆书目推荐系统存在的数据稀疏和冷启动弊端,是一种精度高、用户满意的图书馆书目推荐系统,实际应用价值较高。

猜你喜欢

书目书籍个性化
鲁迅与“书籍代购”
Chinese books find an audience overseas中国书籍享誉海外
推荐书目《初春之城》
坚持个性化的写作
曹文轩主编的书籍
新闻的个性化写作
书籍
上汽大通:C2B个性化定制未来
满足群众的个性化需求
本刊邮购书目