APP下载

Hadoop平台在图书推荐应用中的性能分析

2015-02-10赵彦辉刘树春

现代情报 2014年10期
关键词:频数分类号分布式

赵彦辉 刘树春

[摘要]构建基于分布式平台及大量借阅数据的图书推荐算法。是实现图书馆个性化信息推送服务的关键环节。本文从搭建Hadoup分布式平台和运用Mahout的MapReduce实现算法入手,针对读者借阅记录的分类号进行频数统计和借阅时间统计,依据借阅次数和借阅时间获得偏好值。并使用Mahout基于图书的推荐器,测试伪分布式单节点模式和完全分布式MapReduce计算框架下的推荐效果。测试表明:在MapReauce运算中增加DataNode的数量同时优化BlockSize参数能显著缩短运算时间,是实现个性化荐书服务自动推送的可行方法。endprint

[摘要]构建基于分布式平台及大量借阅数据的图书推荐算法。是实现图书馆个性化信息推送服务的关键环节。本文从搭建Hadoup分布式平台和运用Mahout的MapReduce实现算法入手,针对读者借阅记录的分类号进行频数统计和借阅时间统计,依据借阅次数和借阅时间获得偏好值。并使用Mahout基于图书的推荐器,测试伪分布式单节点模式和完全分布式MapReduce计算框架下的推荐效果。测试表明:在MapReauce运算中增加DataNode的数量同时优化BlockSize参数能显著缩短运算时间,是实现个性化荐书服务自动推送的可行方法。endprint

[摘要]构建基于分布式平台及大量借阅数据的图书推荐算法。是实现图书馆个性化信息推送服务的关键环节。本文从搭建Hadoup分布式平台和运用Mahout的MapReduce实现算法入手,针对读者借阅记录的分类号进行频数统计和借阅时间统计,依据借阅次数和借阅时间获得偏好值。并使用Mahout基于图书的推荐器,测试伪分布式单节点模式和完全分布式MapReduce计算框架下的推荐效果。测试表明:在MapReauce运算中增加DataNode的数量同时优化BlockSize参数能显著缩短运算时间,是实现个性化荐书服务自动推送的可行方法。endprint

猜你喜欢

频数分类号分布式
学习制作频数分布直方图三部曲
基于DDS的分布式三维协同仿真研究
盗汗病治疗药物性味归经频数分析
西门子 分布式I/O Simatic ET 200AL