智能巡检机器人在抽水蓄能电站巡检任务规划的优化策略
2021-06-30常玉红鲍友革黄建德
常玉红,鲍友革,何 秋,黄建德
(1.国网新源控股有限公司,北京市 100032;2.深圳市瑞德森工业自动化设备有限公司,广东省深圳市813110;3.国网新源华东桐柏抽水蓄能发电有限公司,浙江省天台县 317200)
0 引言
随着机器人在工业应用的普及,智能机器人在电力生产领域成为研究热点,在这个领域的成果有助于实现工业2025战略规划,为智能电站、智慧电站建设提供局部解决方案。抽水蓄能电站大多为地下厂房布局,环境及工况较普通水电站更为复杂,巡检机器人的应用要求很高,包括各种巡检功能、任务的自动规划和异常检测识别等。任务规划是智能巡检机器人研究的最核心的问题之一,也是人工智能算法应用最多的地方。本文是在国网新源桐柏抽水蓄能电站展开对智能巡检机器人的任务规划优化研究,经过算法验证、试验分析等工作,取得了较好的效果。
1 巡检机器人的任务规划
巡检机器人在变电站的应用开展比较早,任务规划的研究偏重于具体巡检项目的规划[1]和路径规划[2]。水电站及抽水蓄能电站巡检机器人任务规划方面的研究比较少,本文就巡检机器人在抽水蓄能电站复杂环境下巡检任务规划的优化策略展开研究应用,提出了巡检任务规划的难点和解决路径,给出了任务规划部署的策略和求解方法,希望对其他抽水蓄能电站巡检机器人应用有参考价值。
智能巡检机器人的巡检任务规划,是为保证高效圆满完成巡检任务成,综合各约束条件,对巡检机器人执行动作进行排序的策略。例如:巡检机器人要完成对尾水人孔门处的巡检,其具体步骤包括最优路径确定、过门、乘电梯、到达指定位置、姿态调整、云台调整、视觉巡检、噪声巡检、振动巡检等,实现这些步骤的程序就是任务规划。而如何通过狭窄的门或走廊,如何乘电梯等,是更为具体的运动规划;如何走才是最短路径,如何按照生产现场规范达到目标位置,是路径规划;调整哪些姿态,完成哪些巡检项目,则是巡检动作规划;任务规划既偏向于高层决策,也包括底层的运动规划、路径规划及巡检动作规划。对于复杂的巡检任务,机器人需要任务规划算法来排序动作,以实现单个动作不可能完成的巡检任务目标。
在机器人巡检过程中,需要时时刻刻计算和预测下一步的动作输出,规划是无时无刻不在的。任务规划是在巡检机器人执行任务之前需要计划的动作进程,是通过程序和算法求解完成任务步骤的过程,是巡检过程的描述,任务规划的本质就是寻找问题的最佳求解过程[3]。抽水蓄能电站现场的实际状况是复杂多变的,巡检机器人做不到对现场不确定性因素进行全面的预测,因此也可能存在规划失败。失败的规划也是有价值的,为系统提供了监督样本,使系统能够及时纠错,完成正确的动作输出。
2 任务规划的难点及解决路径
抽水蓄能电站的巡检任务规划就是制定出满足性能等约束条件,并使任务效能最优的任务实施计划。任务规划分为建立任务模型、任务目标说明和算法程序综合等步骤。巡检机器人是多学科交叉应用的产品,需要人工智能技术、现代控制技术、建模优化技术、决策理论等的支持,在研究各种技术和规划方法的基础上,需要搭建出适合现场需求的任务规划系统,在机器人实际巡检规划的研究应用过程中,许多数据无法直接应用,规划模型算法也无法通用,有些很好的算法应用虽然可行,但后期的使用和维护存在困难。而抽水蓄能电站巡检任务环境具有不确定性,为规划方法的选取以及规划结果的有效性带来了考验,需要任务规划由预先规划向动态实时规划转变[4],这就需要根据具体场景和任务需求选择合适的算法,有时需要融合多种算法,才能够满足实际巡检任务的需要。
由于抽水蓄能电站巡检环境及任务的复杂性,任务规划的环境、约束条件、技术指标都具有很强的非线性及离散性,要素很多并且相互耦合。现场环境的动态性与不确定性、机器人本身的限制,以及规划结果的策略输出等方面,都使得实际任务规划的复杂性越来越高。
解决难点的第一个重要路径是,剔除重复的、不变的部分。当巡检机器人从一个空间状态到达下一个空间状态时,只需要重新考虑状态中哪些是可能变化部分,哪些是固定不变的部分,而无需计算整个新的状态。例如,当巡检机器人从1号机组盘柜运动到2号机组盘柜,两个巡检点的状态空间中,厂房及其他设备的位置并不改变。所以,当规划状态的复杂程度不断提高时,就需要研究如何简化信息量,选择适合的框架来决定哪些状态是可能变化的,哪些状态是固定不变。
第二个重要路径,就是把一个较难问题分割为几个相对简单并且比较容易解决的子问题,通过分解使较难的问题求解变得可能和容易些。但不是每个问题都能够分解,有很多问题是无法合理分解的。为了解决这些问题,若把许多问题看作是可分解的,有可能被分割的某些子问题相关性不高,只有少量才相互作用。所以,需要通过相关性分析,设计合理的参数,达到解决问题的目的。
3 任务规划的基本因素
在巡检机器人实际巡检任务中,机器人的传感器及采集信息都存在或多或少的误差,抽水蓄能电站的现场环境还可能存在诸多未知因素和障碍,所以,规划所依赖的环境信息是不确定的,具有部分可观性。同时,对任务规划输出进程的执行也不可避免地存在误差,这些都成为影响任务成败的重要因素。因此,对处理巡检任务规划过程中的不确定性需要有足够的应对策略。如对环境状态和动作效果都不确定的情况,通过概率统计,部分可观马尔可夫决策过程等一系列决策达到最优的算法模型[5];按照实时动态任务规划的方法,克服环境信息的动态性及不确定性带来的影响,使得巡检机器人在有限的计算资源和时间要求下,给出当前最优的规划输出。
所以,研究分析巡检任务规划的基本因素,有利于简化这种复杂性和算法的求解难度。
3.1 状态空间
巡检任务需要包括巡检机器人所有可能发生的状态空间,比如巡检机器人的位置和姿态、机器人的动作和速度等。离散的和连续的状态都是需要的,在任务规划中,最基本也是最重要一点是,用简洁的规划算法来描述这些状态。
3.2 时间
所有的任务规划问题都是在时间序列上的决策。设计简洁的时间模型,能提高系统的反应速度,简洁的时间模型需要保证正确的机器人控制序列。
3.3 初始状态和目标状态
任务规划一般包含初始化的状态和目标状态,巡检过程就是通过一系列规划的中间状态及控制序列组成。初始状态是整个状态空间的一个特殊点,也是动作序列未发生时的全局状态。目标状态是规划被执行后一系列状态变化后的最终状态。
3.4 操作的控制序列
每一个任务规划都将产生可以改变状态空间的一系列动作。在任务规划中,当控制序列被执行时,巡检机器人的状态需要有返回函数,以处理离散的时间变化或者可微分的连续时间上的变化,同时需要避免时间函数直接在状态空间相邻位置连续变换。
3.5 控制规划
任务规划通过一系列的策略和动作控制巡检机器人完成给定的任务,有效的规划策略应该使控制序列容易被执行。然而,这将使得规划设计更加复杂,从而使预测计算变得很困难。现实是,如果不能很快预测下一步动作输出,巡检机器人将不知道如何工作,所以考虑预测的完美方案是没有实际意义的,也就和贪心算法策略是相似的。大多采用反馈和动作规划,虽然在这种情况下有些状态测量精确度不够,仍然使任务的动作能够被有条件地执行下去。
3.6 标准化
标准化是将有关状态和动作控制规划的输出结果进行编码,形成可执行格式。大致可以分为两种类型:一是只考虑可行性,不考虑其效率;二是在可行并且最优效能下,达到目标状态的最佳性。
4 任务规划的策略
根据抽水蓄能电站巡检任务的需求,巡检机器人通过动作进程来完成各种要求的巡检任务。巡检机器人管理服务系统平台(Robots Server,简称RS系统)向机器人发送巡检任务信息序列,巡检机器人获取并处理信息,完成相关动作后返回信息给系统,管理服务系统接收到机器人的巡检数据和状态信息后做出判定任务是否完成。巡检机器人根据RS系统发布的巡检任务和指定的位置,感知当前机器人在地图上的坐标以及所处环境的数据集合,判断达到目标位置的最优路径、运动方式以及动作逻辑次序等。任务规划将一个任务分解成多个子任务,以便采用成本最低的策略完成给定巡检任务。
如何使巡检机器人用最简洁的动作完成系统部署的任务也是项目需要研究的,在实际巡检进程中,有时会需要机器人同时处理多个子任务。在人工智能技术和机器学习中被描述为:空间状态通过一系列进程而到达最终空间状态,分解图如图1所示。
图1 空间状态分解Figure 1 Spatial state decomposition
目前针对任务规划问题的策略,多采用启发式搜索类算法,如A*算法,文化算法,回答集等[6],通过不断利用搜索进行试探,并在一定的约束条件下,计算得出(近似)最优动作序列后再去执行,从而完成空间状态的变换。这些算法对执行简单任务规划效果比较好,缺点是随着下达巡检任务数逐渐增多,将会组合出非常复杂的动作序列,对时间的要求也越来越严格,没有一定的算力,根本无法在要求的时间之内得出最优的结果,这就需要优化策略来完成目标。
4.1 任务排序策略
为了解决巡检任务复杂组合带来求解困难的问题,可将任务拆分成若干单个子任务,对于单个任务,算法比较容易产生最优解法,降低了求解难度。系统发布的每一个任务,都由任务规划器按照巡检目标的要求拆分成一系列的任务序列描述,形成各单独的子任务来完成执行。这种逐一完成单个序列任务的方法,大大简化了巡检机器人的行动序列组合的复杂程度,同时降低了计算难度,使任务得以及时处理和完成。例如,对抽水蓄能电站主变压器室的巡检任务就隐含包括开门、收放挡鼠板、过门等子任务,只有先执行开门及过门子任务,在主变压器室的门打开,挡鼠板放下后,巡检机器人通过狭窄的主变压器室门,到达目标地点完成对主变压器的巡检任务。当巡检机器人执行完整个任务后,由RS系统判断最后的完成状态。
然而,有利必有弊,任务拆分也会带来全局规划的不可靠性。在巡检中可能会出现一个任务尚未完成的情况下被一个新的任务冲掉,出现任务逻辑混乱。针对这种任务拆分可能带来的问题,通过分析各巡检任务和巡检场景之间的联系,将拆分后的任务序列按逻辑、按权重进行排序,给出一个最优的动作序列,保证每个任务都不会被其后的任务破坏,任务序列执行时不会出现混乱,增大全局规划的可靠性。这样既可以通过任务拆分简化规划,又可以保证每个任务的可靠完成。
4.2 任务预处理策略
在实际巡检场景中,一个任务的两个子任务之间不一定是完全独立的,在执行一个子任务时可能对已完成的前一个子任务造成损害。经试验发现,大多数原因是巡检机器人在执行不同子任务时,处理的对象是同一个传感器或设备,造成端口挤占或数据冲突。所以,对规划的任务进行预处理是有必要的,预处理策略就是通过解析规划的任务,提前预判信息的价值,合理调度,如:提前预判需要输出哪个动作,需要对哪个设备进行操作。经过预处理之后,巡检机器人的执行效率得到很大的提高。
在实际巡检测试过程中,仅仅是这样简单的预处理并不能保证完成所有的任务要求。还需要按照排好的动作序列搜索相关信息,在执行两个任务时,若搜索函数[7]按顺序搜索到的均是一个信息,这就意味着可能会影响到之前执行过的任务。任务预处理策略,还能够在执行任务之前先将所要执行的任务分成两组,把和此任务相关的一组任务信息进行预先处理,而其他任务排序不变,仍按照之前设定的动作序列依次执行,这样可以有效解决此问题。
4.3 任务优先级策略
在任务规划中,对于各种不同的巡检场景需要有一个统一的策略,通过现场调试检验,采用优先级策略。任务的优先级策略是保证巡检机器人在执行下一任务时当前任务为空。这样,巡检机器人在执行下一任务时就不能对已完成的任务造成破坏。具体策略是,将巡检机器人本体状态监测任务设置为最高优先级,将机器人状态信息解析到任务状态中,作为执行其他任务的先决条件。对于机器人需要维护的任务设置为第二优先级,维护任务的状态是可以确定的,比如电量状态、通信状态、传感器状态等,这些状态都设置在一个维护列表里,在执行任务时,首先搜索维护列表,当搜索不到需要维护的项目时,就说明机器人状态满足继续完成巡检任务。在执行规划的巡检项目时,采用给每个动作序列设置不同的优先级,满足高效、准确地完成每个巡检任务的动作,而不会破坏其他任务的状态。
经过模型分析和现场测试相结合,给出每个任务的优先执行序列,巡检机器人就可以按要求处理每个任务。通过对任务按优先级进行排序划分,合理地安排任务执行顺序,使得规划处理起来简单有效,基本可以保证每个任务都能够顺利完成。
4.4 任务交互策略
在实际巡检任务场景中,由于设备检修或其他工作,巡检机器人所处的场景出现改变,机器人本身出现故障重启等,这种情况下,需要巡检机器人感知周围环境来判断自己的位置等信息,或者问询系统以获取当前任务所需的相关信息。巡检机器人获取信息正确性和时效性是整个任务规划的基础。巡检机器人只有获取正确的信息才能完成下一步的任务,所以,和系统间保持交互是必须的,经过试验分析可采用以下策略。
4.4.1 重复查询
在执行巡检任务时,为了顺利完成巡检项目,巡检机器人必须实时获取当前信息。比如对于现场环境变化、未知障碍出现、巡检机器人信息异常丢失等,都需要重新获取信息。这种状况下,向系统重复查询是比较简单的策略。在测试试验中,查询RS系统获得的信息正确率约为65%,错误率约为27%,不可知率约为8%。经计算,实际正确率约为70.6%,错误率约为29.4%。根据贝努里概型二项概率公式,可以计算得到n次之内正确的概率。二项概率公式如下:
式中:K——第k次的概率;
P——正确概率。
可以得到获取正确信息的概率。经过试验测验,重复查询策略是:一般查询系统三次,将得到两次及两次以上相同的信息视为正确的信息。
4.4.2 移动探测
通过巡检机器人原地旋转、局部移动来感知、探测周围的环境信息,将得到更高的正确率。首先原地旋转获取周围环境信息,再小范围移动,再判断传感器得到的信息中是否与已知信息相匹配,如果达到匹配度要求,就继续执行下面的任务;如果没有达到匹配度要求,就需要小范围地移动一下位置,再次探测当前位置的信息,直到找到所需的信息。
4.4.3 融合策略
移动探测策略具有一定的盲目性,当周围环境特征信息本来就非常少的情况下,那么有可能一直也无法达到匹配的要求,这种策略还会导致超时问题,巡检机器人在盲目乱转。一般而言,出现信息丢失,移动探测策略将首先使用,在规定时间内无法获取到足够的信息时,则启动重复查询策略,这样,移动探测和重复查询策略交替融合使用,减少了获取信息的时间,增加了任务规划的可靠性。
通过概率统计随机变量及其分布公式如下:
式中:P——正确概率。
得出准确信息的概率,通过试验一次探测两次查询就可以获得很高的正确信息概率。
5 任务规划求解方法
巡检任务规划需要完成机器人巡检任务分配、任务控制、任务协同等功能,任务规划的上层重点研究目标、项目、系统及机器人之间的优化调度与协调;规划的底层是在任务配置的基础上,确定巡检机器人及巡检子单元所执行的行动序列以及时序关系。需要根据场景的变换选择算法,有时需要多算法融合优化才能达到应用效果[8]。任务规划给出的最优任务序列是通过试验和分析计算得到的,在大部分情况下可以得到有限最优解,在某些局部场景下则不一定是最优任务规划序列。主要求解思路是集中式求解和分布式求解。
5.1 集中式求解法
集中式求解法一种是最优化方法,比如动态规划算法、分支界定算法、穷举算法等,缺点是最优求解会随着任务规模的增大而急剧增加难度。
还有一种是启发式方法,主要有神经网络算法、蚁群算法、搜索算法、粒子群优化算法、模拟退火算法等。
5.2 分布式求解法
分布式求解法一种是自上向下的方法,思路是基于分层求解,即将巡检任务问题分解为若干个子任务问题,巡检机器人同各巡检子平台之间通过协商完成对任务问题的求解。常用的方法包括:分布式模型预测控制方法、分布式马尔可夫决策方法、市场竞拍机制方法等。
另一种是自下而上的方法,是研究反应和行为方法的优化与协调策略,重点是巡检机器人对所处环境变化的动态反应,通过机器人的传感器和动作反馈作用来协调控制机器人的行为。优点是计算量比较小、鲁棒性好。比如,在异步间断通信条件下,分布式任务的一致性方法,通过对系统内其他单元的状态进行有效估计,提高各单元间任务分配的效能;同时在现场WIFI有限通信条件下,用决策—估计模型解决机器人各子系统信息共享及融合,保证巡检机器人移动产生的动态通信连接[9]。
6 运动规划和路径规划
运动规划及路径规划是任务规划底层规划之一,路径规划一般分为全局规划和局部规划。路径规划首先对巡检机器人的任务路径进行描述,也叫运动轨迹的描述,再根据已经给定的轨迹参数,模拟出所要求的运动轨迹。巡检机器人根据巡检任务确定路径参数,选择合适的算法,在给定时间内按一定的速率计算出位置、速度和加速度,完成运动轨迹的预测计算,从而生成巡检机器人的运动轨迹[10]。
巡检机器人运动规划首先要完成空间环境中的定位,通过雅克比矩阵求解微分方程,完成多传感器融合算法,由卡尔曼算法完成机器人的定位。雅可比矩阵如下:
式中:xk——机器人的x坐标;
yk——机器人的y坐标;k
φ——机器人的角度;
vk——机器人的速度。
卡尔曼算法仿真如图2所示,定位的稳定性和定位精度有很大提高。
图2 多传感器约束的卡尔曼算法仿真Figure 2 Kalman algorithm simulation of multi-sensor constraints
在定位的基础上,建立起模型—预测—控制的运动规划算法[11],从而完成运动轨迹的最优线性跟踪,试验仿真如图3所示,可以看出巡检机器人在初始误差较大的情况下,能够快速消除误差并最终达到稳定状态,在运动规划测验中取得不错的效果。
图3 运动规划的跟踪仿真Figure 3 Tracking simulation of motion planning
在任务规划中,不仅要给定巡检机器人的起始点和终止点,而且要给出中间的路径点,如过门地点、乘坐电梯地点等特殊位置,还要对机器人的位置及路径点之间的时间进行合理分配,即给出两个路径点之间大约的运动时间。路径规划是寻找从当前位置到目标位置的最优路径。采用粒子群优化算法、搜索算法、遗传算法、蚁群算法、复合算法、RRT势场法等来解决巡检机器人的运动规划问题。
由于巡检机器人的运动规划问题具有非线性、状态和控制约束的最优控制问题,一般采用最优控制方法进行求解,最优控制方法可分为间接求解和直接求解。间接求解是基于极小值原理推导最优控制一阶必要条件,进而构成最优轨迹的边界进行求解。直接求解是基于参数化将最优控制问题转化为非线性规划问题,并通过数值优化方法求解来获得最优运动轨迹[12]。为平滑运动轨迹,以运动状态微分方程组的输出为反馈,通过输出到输入空间的逆映射来获取最优轨迹控制量输出,使巡检机器人转弯轨迹控制更为平顺,轨迹跟踪更为准确。
7 任务规划的应用
目前,所研发的智能巡检机器人已在桐柏抽水蓄能电站投入试用,如图4所示。巡检机器人系统采用多算法融合策略的任务规划,解决实际复杂场景下的巡检任务部署,搭建适合现场需求的任务规划系统,验证了所用任务规划策略和方法的可行性。按本文设计的任务规划策略,巡检机器人能够完成抽水蓄能电站定时巡检任务,指定巡检任务等任规划的部署。对于隐含在任务中的搭乘电梯、开门以及通过特殊场景的任务,通过算法合理规划,嵌入在整个任务中,完成部署的巡检任务。本文巡检机器人任务规划的优化策略对加快抽水蓄能电站巡检机器人的应用具有现实意义。
图4 智能巡检机器人在执行巡检任务Figure 4 Intelligent inspection robot is performing inspection task
8 结束语
本文研究的目的在于解决抽水蓄能电站复杂场景下巡检任务的部署和优化策略问题,通过智能巡检机器人在国网新源桐柏抽水蓄能电站的实际研究,提出了巡检任务规划的难点和解决路径,给出了任务规划部署的策略和求解方法。从现场试验结果来看,巡检机器人的巡检任务规划取得了很好的效果,基本达到预期目标。随着机器人及人工智能技术的不断发展,如何简化和优化模型,如何提高任务规划的实时性和可靠性,如何在全局规划和局部规划之间进行合理有效分配,以及对于知识库的利用、控制策略的优化、知识获取方式、推理机的应用等问题,还需要进行认真而深入的研究与探索。