物流机器人任务分配方法研究综述

2020-02-25

福建质量管理 2020年11期

(北京物资学院北京 101149)

引言

物联网等技术的发展使人们的生活水平不断提高，电子商务也在重塑着人们的购物方式，由此引起以物流为主导的各行各业不断发展。在物流的智能仓储环节，多机器人系统扮演着很重要的角色。与单个机器人相比，多机器人系统拥有效率高、速度快、鲁棒性好以及传递信息准确等优点。

著名多机器人系统研究专家Lynne E。Parker从七个方面总结了多机器人系统领域的主要研究内容及亟待解决的问题[1]。其中最为严峻的且对企业发展影响较大的一个问题就是多机器人的任务分配问题，在多机器人进行协作探索时，特别是在未知环境下，任务分配问题是多机器人系统能效优化的一个极其重要的环节，该怎样提高任务分配的效率是多机器人系统研究的关键问题[2]。

一、多机器人任务分配定义

多机器人系统中的机器人调度过程如下[3]：当有一批订单到来时，一般选择已经存在的任务分配算法，对这一批订单进行分配，各个机器人会被分配到一个或多个订单任务，机器人根据被分到任务的具体信息，通过路径规划算法从当前位置移动到货架位置；然后将货架运输到指定的工作台进行相应处理，再从当前位置移动到下一个任务订单所指向的货架，依次循环直至完成所有被分到的任务。

其中多机器人任务分配的定义[4]为：已知存在一个多机器人系统，一个任务集合以及系统性能的评价指标，为每个子任务寻找一台合适的机器人负责执行该子任务，且使得机器人系统执行完任务集合中的全部任务时所获得的收益达到最大。即将任务按照一定的分配规则，分配给机器人去执行，目标是在保证所有任务完成的情况下，使总成本最小。

二、多机器人任务分配方法研究

对于多机器人任务分配问题，国内外学者已经做了许多研究，下面对于任务分配现存研究方法做出阐述，分别叙述各个方法的优缺点。

(一)深度强化学习方法

深度强化学习[5-6](DRL，Deep Reinforcement Learning)是将深度学习方法与强化学习方法相结合，它集成了深度学习方法在感知问题上强大的特征提取能力，以及强化学习算法的行动决策能力，这些特点使其得以运用于现实场景中的大规模复杂问题。在使用深度强化学习方法解决任务分配问题时，机器人是具有自主决策能力的智能体(Agent)，当一批订单来临时，由任务台通过深度强化学习算法进行任务分配，将任务分配给空闲机器人，以实现整体效益最大化。

优点：在多机器人系统中该方法效率较高，精确度高，机器人学习时间较短。

缺点：对机器人性能要求较高，算法较为复杂。