基于Spark的分布式随机森林在图像分类的应用
2018-04-02覃涛田书云田清龙
电脑知识与技术 2018年5期
覃涛 田书云 田清龙
摘要:随机森林算法是在决策树的基础上建立的一个机器学习算法,它是由多颗决策树组成。本文主要研究spark的分布式系统和传统随机森林算法的结合,提出分布式随机森林算法在图像分类方面的应用,使其能够應对大规模图像分类的挑战。
关键词:大数据;分布式;随机森林
2018-04-02覃涛田书云田清龙
覃涛 田书云 田清龙
摘要:随机森林算法是在决策树的基础上建立的一个机器学习算法,它是由多颗决策树组成。本文主要研究spark的分布式系统和传统随机森林算法的结合,提出分布式随机森林算法在图像分类方面的应用,使其能够應对大规模图像分类的挑战。
关键词:大数据;分布式;随机森林