APP下载

云计算网络图书馆的海量信息快速定位方法

2018-06-12于俊丽

现代电子技术 2018年12期
关键词:协同过滤

于俊丽

摘 要: 对云计算网络图书馆的信息进行快速定位,在提高其订阅量、缩短订阅时间方面具有重要意义。传统定位方法主要通过对云计算网路图书馆的信息进行预先采集,存储为一个图书信息库,再对其中信息进行定位,信息库更新不及时存在信息定位误差大、耗时长的问題,提出基于ZigBee技术与SVM分类结合的图书馆信息快速定位方法。通过阅读用户信息对图书馆信息进行协同过滤处理,采用SVM分类器对滤波后的信息进行分析,为图书馆海量信息定位提供基础依据,采用ZigBee技术实现对图书馆信息的快读定位。实验结果表明,采用改进定位方法其定位准确率及平均定位准确率均要优于传统定位方法,具有一定的优势。

关键词: 云计算网络图书馆; 海量信息; 信息定位; ZigBee; SVM; 协同过滤

中图分类号: TN711?34; G250.73 文献标识码: A 文章编号: 1004?373X(2018)12?0099?03

Abstract: The rapid positioning of the information of the cloud computing network library is of great significance in improving subscription quantities and shortening the subscription time. In the traditional positioning method, the information of the cloud computing network library is collected in advance and stored as a book information database for information positioning, and the information database is not updated in time, resulting in big information positioning errors and long time?consumption. Therefore, a library information rapid positioning method is proposed based on the combination of ZigBee technology and SVM classification. The collaborative filtering of library information is performed by reading user information. The SVM classifier is used to analyze the filtered information, so as to provide the basic basis for the positioning of massive library information. ZigBee technology is adopted to achieve fast reading and positioning of library information. The experimental results show that the improved positioning method has superior positioning accuracy rate and average positioning accuracy rate than the traditional positioning method, and has certain advantages.

Keywords: cloud computing network library; massive information; information positioning; ZigBee; SVM; collaborative filtering

云计算作为一种网络应用模式可提供从基础资源、软件平台到系统管理的全方位解决方案。将云计算网络使用在图书馆中,使用户、图书馆、家庭、端到端安全性和移动宽带等能在同一环境、不同地点实现图书信息的共享[1]。图书用户的增加,图书馆需要引进更先进的技术,提升读着的借阅效率及图书管理人员工作效率。但现常用的图书馆条形码及磁条会让图书馆信息受到限制,无法直接从网上查询或者查阅图书馆信息及现有图书状态。对此图书馆中各书库如何分布和书库中书架的分区情况,构建直观向导图,系统的查询图书馆信息[2],并把结果经过此导向图展示给读者,读者还可根据此向导图与自己在图书馆中的位置进行对比,迅速地找到想要的图书馆信息。虽然有工作人员对图书进行及时整理,但也会出现图书错架、乱架问题[3]。因此,需要对图书馆的信息进行快速定位,及时进行处理。

1 图书馆海量信息协同过滤分析

图书馆信息主要包括用户信息、图书信息、管理员信息等,信息量很大,就需要对图书馆信息进行协同滤波处理[4]。基于用户的协同过滤是目前被广泛使用的个性化处理技术,其根本思路是依据用户对图书管理信息的偏好搜寻邻居用户,把邻居用户的偏好图书信息,以至今未查询的图书馆信息的形式传输给当前用户[5]。其最基础原理为,当用户[u1]偏好为[item1],而用户[u2]还没有查询到此图书馆信息[item1],用户[u2]和用户[u1]是相似类型的用户,那么用户[u2]对图书馆信息[item1]也存在一定喜欢的概率,从而把图书馆信息[item1]传输给用户[u2]。以用户对图书馆信息的获取为例,示意图如图1所示。

由图1可知,假设查询图书馆信息的用户为[u1],用户[u1]所需的图书馆信息为[b1],[b3],[b4],用户[u2]所需的图书馆信息为[b2],[b5],用户[u3]所需的图书馆信息为[b1],[b3],[b4],[b5]。根据用户相似度计算,可得到用戶[u1]的最近邻用户是[u3]。由于基于用户的协同过滤分析是采用用户与其最近邻的用户所具备的图书馆信息[6],把用户[u3]所需的图书馆信息输送到还未曾使用的图书馆信息[b5]的用户[u1],认为用户[u1]也会需要图书馆信息[b5]。基于用户的协同过滤分析很好地使用了集体分析的思想,经过采用用户集体的力量,获取不同用户之间的相似度,使得同一个群体里的用户具备一样的图书馆信息[7]。基于用户的协同滤波无需考虑图书馆信息的详细内容表示的意思,会加大那些很难理解或者表示的图书馆信息滤波效果。

2 图书馆海量信息分类处理

在对图书馆海量信息进行滤波处理的基础上,采用SVM对其进行分类处理。SVM是一种基于统计学习理论的机器学习法,是检测、识别、定位分析过程中总用的非线性分类器[8],其结构如图2所示。图2中两类训练样本分别用圆圈及方块表示,H是将两类点集准确分开的分类线,[H1],[H2]分别是各类样本里间隔分类线最近的点且平行于分类线,[H1],[H2]间的间隔叫作分类空隙、分类间隔(Margin)。最优分类线可增加分类空隙,实际上就是让推广性界中的置信范围最小化,降低真实风险[9]。

对于图书馆信息线性可分问题,首先设定样本集是[xi,yi,i=1,2,…,n,x∈Rd,y∈1,-1]为类别标号,则图书馆海量信息分类中最优超平面方程表达式为:

3 图书馆信息定位方法整体设计

云计算网络图书馆信息快速定位是将云计算网络与ZigBee技术融合在图书馆内部,实现对图书馆信息快速定位。此定位方法是一对多的定位系统,各阅读器以矩阵的形式排列在书架上[11],当一个阅读器同时获取多个目标标签信息时,产生图书馆信息向量,然后把信息传输给阅读器内部的无线通信模块,经过ZigBee技术把图书馆信息传输到监控中心,实现图书馆信息的快速定位,具体步骤如下:

1) 信息采集是快速定位方法最基本的功能,通过阅读器读取图书标签信息,产生图书信息向量,并对图书信息进行采集,将其传输到控制中心。

2) 控制中心将接收的图书信息通过协同过滤,采用SVM分类器分类后,传输到相应数据存储模块。

3) 当进行信息定位时,控制模块在接收到通信模块发布的定位信息后,通过云计算网络迅速控制图书馆信息,第一时间采用ZigBee技术,对图书馆信息进行定位。

4) 云计算网络作为主要的传递介质,需要第一时间接收到控制中心发出的定位信息,当缓存图书馆信息内存已满时,过剩的信息就会被丢弃,引发缓冲区溢出,造成网络拥塞,需要对图书馆信息进行压缩,降低出现缓冲区溢出的问题。云计算网络图书馆海量信息快速定位流程图如图3所示。

4 实验结果分析

4.1 评价指标

在对有效性进行评估时,采用对评估结果有影响的评价指标,可很大程度上增加定位方法的有效性评估准确度。目前常用的评价指标不能完全对图书馆信息定位结果准确度进行反应,因此采用准确度(Precision)及平均定位准确度(Average Sorting Precision,ASP)来描述该定位方法的有效性,如下:

4.2 实验结果分析

为了验证改进定位方法在海量图书馆信息定位方面的有效性、可行性,以某校图书馆信息库为例,进行实验对比分析。准确度及平均定位准确度分析结果如图4和图5所示。由图4可知,采用传统定位方法时,随着图书馆信息量的增加,其定位信息量也逐渐增加,在信息量过大时,提高定位准确率的同时出现传输拥塞问题,导致定位时长增加,准确率约为42.5%;采用改进定位方法时,随着图书馆信息量的增加,定位准确率逐渐增加,同时定位信息量未出现过多的传输拥塞问题,定位准确率约为83.3%,相比传统定位方法提高了约为40.8%,具有一定的使用优势。由图5可知,采用传统定位方法时,其定位的平均准确率虽有提高的现象,但最终出现了定位信息传输拥塞问题,准确率约为31.8%;采用改进定位方法时,随着图书信息量的增加,其需要定位的量增加,在传输过程中,出现拥塞现在的概率较低,平均准确率约为71.8%,相比传统方法,其平均准确率约为40%,且随着图书馆信息量的增加而逐渐增加,具有一定的优势。

5 结 论

针对传统定位方法一直存在定位耗时长,且易出现定位信息传输拥塞的问题,提出基于ZigBee技术与SVM分类结合的云计算网络图书馆海量信息定位方法。实验结果表明,采用改进定位方法,其定位准确率及平均定位准确率,相比传统定位方法,分别提高了40.8%,40%,具有一定的优势。

参考文献

[1] 杜海宁.基于云计算的图书馆海量数据存储研究[J].图书与情报,2010(3):99?101.

DU Haining. Research on the library mass data storage based on cloud computing [J]. Library & information, 2010(3): 99?101.

[2] 王志强.基于云计算的数字图书馆核心数据管理与保护研究[J].现代情报,2014,34(5):88?90.

WANG Zhiqiang. Study of core data management and protection strategy for digital library based on cloud computing [J]. Modern information, 2014, 34(5): 88?90.

[3] 王平.云计算关键技术在数字图书馆中的应用研究[J].情报资料工作,2010,31(5):52?56.

WANG Ping. On the application of key technology of cloud computing to digital libraries [J]. Information and documentation services, 2010, 31(5): 52?56.

[4] 陈臣,高军.云计算环境下面向用户体验的数字图书馆数据管理策略研究[J].图书馆理论与实践,2014(5):79?81.

CHEN Chen, GAO Jun. Research on the data management strategy of digital library to user experience under the cloud computing environment [J]. Library theory and practice, 2014(5): 79?81.

[5] 陈臣.基于云计算的图书馆大数据分析和决策支持平台构建[J].图书馆理论与实践,2016(5):101?104.

CHEN Chen. Construction of big data analysis and decision support platform for library based on cloud computing [J]. Library theory and practice, 2016(5): 101?104.

[6] 王彦明,薛云,饶洪,等.图书馆云计算可行性研究[J].現代情报,2014,34(7):3?9.

WANG Yanming, X?E Yun, RAO Hong, et al. Feasibility study of cloud computing in library [J]. Journal of modern information, 2014, 34(7): 3?9.

[7] 陈晨.基于云计算的图书馆信息资源共享系统研究[J].现代情报,2011,31(10):169?172.

CHEN Chen. Library information resource sharing system based on cloud computing [J]. Journal of modern information, 2011, 31(10): 169?172.

[8] 王倩.云计算环境下海量音乐资源的高精度定位挖掘方法研究[J].现代电子技术,2017,40(12):19?21.

WANG Qian. Research on high?precision location mining method of massive music resources in cloud computing environment [J]. Modern electronics technique, 2017, 40(12): 19?21.

[9] 陈牮华.基于云计算的网络安全数据传递方法研究[J].计算机仿真,2012,29(8):139?141.

CHEN Jianhua. Network security data transfer method research based on cloud computing [J]. Computer simulation, 2012, 29(8): 139?141.

[10] 吉宇宽.云计算环境中信息交易对图书馆的影响及对策研究[J].图书馆建设,2015(11):72?76.

JI Yukuan. Research on the effects of information trading on library and corresponding countermeasures under the cloud computing environment [J]. Library development, 2015(11): 72?76.

猜你喜欢

协同过滤
基于链式存储结构的协同过滤推荐算法设计与实现
基于相似传播和情景聚类的网络协同过滤推荐算法研究
基于协同过滤算法的个性化图书推荐系统研究
混合推荐算法在电影推荐中的研究与评述