物流机器人任务分配方法研究综述
2020-02-25
(北京物资学院 北京 101149)
引言
物联网等技术的发展使人们的生活水平不断提高,电子商务也在重塑着人们的购物方式,由此引起以物流为主导的各行各业不断发展。在物流的智能仓储环节,多机器人系统扮演着很重要的角色。与单个机器人相比,多机器人系统拥有效率高、速度快、鲁棒性好以及传递信息准确等优点。
著名多机器人系统研究专家Lynne E。Parker从七个方面总结了多机器人系统领域的主要研究内容及亟待解决的问题[1]。其中最为严峻的且对企业发展影响较大的一个问题就是多机器人的任务分配问题,在多机器人进行协作探索时,特别是在未知环境下,任务分配问题是多机器人系统能效优化的一个极其重要的环节,该怎样提高任务分配的效率是多机器人系统研究的关键问题[2]。
一、多机器人任务分配定义
多机器人系统中的机器人调度过程如下[3]:当有一批订单到来时,一般选择已经存在的任务分配算法,对这一批订单进行分配,各个机器人会被分配到一个或多个订单任务,机器人根据被分到任务的具体信息,通过路径规划算法从当前位置移动到货架位置;然后将货架运输到指定的工作台进行相应处理,再从当前位置移动到下一个任务订单所指向的货架,依次循环直至完成所有被分到的任务。
其中多机器人任务分配的定义[4]为:已知存在一个多机器人系统,一个任务集合以及系统性能的评价指标,为每个子任务寻找一台合适的机器人负责执行该子任务,且使得机器人系统执行完任务集合中的全部任务时所获得的收益达到最大。即将任务按照一定的分配规则,分配给机器人去执行,目标是在保证所有任务完成的情况下,使总成本最小。
二、多机器人任务分配方法研究
对于多机器人任务分配问题,国内外学者已经做了许多研究,下面对于任务分配现存研究方法做出阐述,分别叙述各个方法的优缺点。
(一)深度强化学习方法
深度强化学习[5-6](DRL,Deep Reinforcement Learning)是将深度学习方法与强化学习方法相结合,它集成了深度学习方法在感知问题上强大的特征提取能力,以及强化学习算法的行动决策能力,这些特点使其得以运用于现实场景中的大规模复杂问题。在使用深度强化学习方法解决任务分配问题时,机器人是具有自主决策能力的智能体(Agent),当一批订单来临时,由任务台通过深度强化学习算法进行任务分配,将任务分配给空闲机器人,以实现整体效益最大化。
优点:在多机器人系统中该方法效率较高,精确度高,机器人学习时间较短。
缺点:对机器人性能要求较高,算法较为复杂。
(二)群智能方法
群体智能方法[7]是指利用群体中各个体之间的相互协作和信息分享求解和优化问题。群体智能方法可以在没有集中控制且缺少全局信息的情况下解决分布式问题,能够适用于分布式动态任务分配问题。常见的群智能体智能算法有:蚁群算法、粒子群、鱼群算法等。
优点:稳定性与可扩展性好,很好地动态适应性。
缺点:机器人之间的协调能力差,效率低,不适合复杂情况。
(三)基于市场机制的方法
基于市场机制的任务分配方法[8]是在多机器人系统中,利用分布式的组织方式使得机器人之间保持共享信息,机器人通过投标来获取执行任务的一种分配方法。这是一种具有良好鲁棒性、灵活性的任务分配方法,适合动态不确定环境下求解任务分配问题。
优点:鲁棒性与灵活性较好。
缺点:机器人需要彼此合作,资源耗费大,不能保证通讯中断时的分配效果。
(四)总结
综上,我们可以知道在现在智能仓储系统发展迅速的情况下,在机器人越来越智能的情况下,深度强化学习方法是进行多机器人任务分配的首要选择。
三、小结
本文介绍了多机器人任务分配的基本概念与现存的几种任务分配方法,包括深度强化学习方法、群智能方法、基于市场机制的方法,分别介绍了他们的概念以及优缺点,得到的结论是,在科技发展迅速的今天,使用深度强化学习方法来进行多机器人任务分配是一个较为合适的方法。