APP下载

利用Kmeans与蚁群算法的路径寻优方法

2021-06-05彭熙舜陆安江贾明俊卢学敏

智能计算机与应用 2021年4期
关键词:质心信息量聚类

彭熙舜,陆安江,贾明俊,卢学敏

(贵州大学 大数据与信息工程学院,贵阳550025)

0 引 言

在当今时代,网购已经成为了一种新的潮流,每年由电商举办的双十一、六一八更是风靡盛行。随着快递数目的剧烈增长,物流的配送工作越来越重要。人们购买的物件也是花样繁多,生鲜快递必须满足时效性,装饰类物品需要避免发生碰撞。物流配送过程中常规应用GPS导航,而高效的物流管理取决于两个关键因素,车辆问题(VRP)与资源配置问题,因此路径规划开始被广泛应用于物流管理中。本文提出了利用Kmeans聚类将客户购买物品按照特性进行分类,再利用蚁群算法进行路径规划。

1 研究背景与意义

路径规划是近代兴起的新型技术,被广泛应用于机器人避障,无人机避障,防空导弹系统中。人们的日常生活也开始利用这种技术,比如城市交通规划,GPS智能导航,物流配送管理系统。通常情况下,按照周围环境信息的布局规划,可以将其分为全局和局部两种路径规划[1]。前者需要在实践之前掌握所有的环境数据,提前作出路径规划判断;后者主要是采取传感器实时得来的局部环境信息,及时的给出路径规划。本文主要研究解决车辆路径问题(VPR),以物流中心为起点,派出车辆向不同位置的客户进行物资配送,配送任务结束后返回起点,而其中的关键在于将配送效率最大化,车辆使用率最大化。

路径规划一般是由环境建模,路径搜索,路径平滑这3步所组成[2]。环境建模是起始环节,搭建一个方便计算机规划具体路径的模型,实质上是将物理信息转为数字信息,在空间上相互映射;路径搜索是指在搭建的环境中寻求到达目标的路径信息;路径平滑是在所有的路径信息中选取最优路径。

2 智能算法

2.1 Kmeans算法简介

网络用户的大幅度增长也带动了数据的产生,面对愈来愈多的用户数据,根据其之间的相似性,进行聚类分析(cluster analysis)。所谓聚类并不是通常意义上的按规格分类,空间中点的汇聚称为一个类簇,不同类簇中任意的两点距离应该大于同一类簇中的任意两点距离[3]。具体过程可以描述为,第一步设置一个衡量标准,将系统中的个体数据特性计算区别;第二步使用算法将个体汇编并定义为一个新的集群。如今存在着多种不同的聚类分析方法,如何根据自身要求选择一种合适的算法来进行数据分析成了当务之急。

Kmeans又称为K均值,是一种划分聚类的算法,具有高效简洁的特点普及率高。其算法步骤清晰易懂,首先根据客户需求设置值为k的n个初始质心;其次,将质心散开,将系统中的数据点根据自身特性匹配到与其距离最近的质心,同一个质心中的数据点构成了簇。分析簇中的数据点,更新质心的值。按照以上步骤重复进行,直到质心的值不再变化或者达到了设定的终止条件为止。

为了将数据点匹配到与之最近的质心,需要设定方法来测算距离。给定一个样本空间x i=将i,j设置为样本数,n表示数据特征。首先计算有序距离度量,根据闵可夫斯基距离公式(1):

其次,介绍无序属性距离度量,式(2):

Kmeans在空间中只需考虑数据点与质心问题,它的空间复杂度不高。空间的存储量设定O((m+k)n),其中的m是数据点数,n代表了属性数。它的时间复杂性与数据点的数目有关,所需要的时间于m呈线性表示,为O(I×K×m×n),I代表了收敛的迭代次数。

2.2 蚁群算法

蚁群算法,顾名思义是模仿生物界中蚂蚁特性的算法。这种算法模仿的是蚂蚁从蚁窝中寻找食物所自动生成的最佳路径的过程。在蚂蚁行走的过程里,它们会释放一种被称为信息素的物质,以此来标识自己的行走路径,路径越长的地方,信息素越少,而路径越短的地方,信息素越多,表示了蚂蚁选择走该路径的数量居多。久而久之,信息素少的地方自然也就被淘汰,最后留下来的就是一个优化路线[4]。

蚁群算法在离散空间中是通过离散的点状散布来选取的信息量的最优解。连续空间中的解空间与离散的不同,是以区域性的方式进行表示,不是用离散的点集合表示。连续空间与离散空间有着3处不同,首先是观察蚁群的信息量留存方式;其次蚁群在解空间中寻找最优路径方法;以及最后的群体前进策略。

蚁群算法在连续空间下的寻优方法是基于蚁群的初始分布状态,蚂蚁路途中释放的信息量分布状态,整个蚁群的行进方向策略。因此,可以用数学表达式模拟出基本过程:第一步是将群体的初始分布状态表示,根据问题来设置蚁群的大小,例如设置共有N个小蚂蚁;将问题的定义区间均等分为N个子空间,每个子空间匹配一只小蚂蚁,编号为i。因为蚂蚁会变换自己的活动区域,所以所规定的子空间也是随着蚂蚁同步变化的,一一对应。当小蚂蚁随机移动时,可以发现它所携带的子空间会与其它2个相邻的子空间重叠,根据这个重叠的程度,可以推算出2个相邻子空间内的实际蚂蚁变化程度[5-6]。

按照以上叙述方式,设置提出问题的定义区间是[A,Z],则当种群内的蚂蚁数目为N时,可以得到各个子空间的长度为式(3):

因为蚂蚁有着自身运动的移动子空间,而这个移动子空间的长度与基本子空间是没有区别的,所以有L R=L,那么蚁群的初始点的坐标分布可以定义为式(4):

蚂蚁所处子空间i的左边界为x iL,右边界为x i R,可以得到式(5):

当蚂蚁随机移动k时,移动子空间与相邻子空间的重叠度也为k,那么可以定义两个相邻的子空间内对应当前蚂蚁的实际个数N1的变化为式(6):

所以,当小蚂蚁向右行进时,右边子空间内实际的蚂蚁数目多出了Δn,与之相对,左边的子空间实际蚂蚁数目就减少了Δn。

接下来根据蚂蚁的分布情况来确定空间中的信息量分布密度。若蚁群在x i处的函数值为f(x i),那么可以规定此时蚂蚁留下的信息量峰值为M i,这样可以根据函数与信息量的大小得出最优路径。假设在某一区间内去实现寻找函数的最小值,那么可以得到相应的信息量分布函数,式(7):

其中,R是设定的常数,规定R>f(x i)。 此时可以发现,函数值越小,信息量的分布函数峰值越大。相对的,如寻找函数的最大值,当f(x i)>0,可以得到式(8):

因此,可以得到单个蚂蚁所对应的信息量分布函数为式(9):

在得到蚂蚁群分布的总信息量后,需要确定各子区间内的实际蚂蚁数目[7]。根据信息量分布函数可以得出当前蚁群在各个子空间内分布积分和为式(10):

实际上的各子空间总信息量为式(11):

其中,q代表上上次的总信息量遗留部分,p代表信息量的挥发量。所以可以得出实际总空间中的总信息量为式(12):

按照子空间中的实际总信息量与总空间的信息量可以推算出蚂蚁的分布情况,得出蚂蚁在某一子空间中的数目为式(13):

3 仿真分析

利用Kmeans算法与蚁群算法思想,事先构思出聚类规划和寻优路径的新型路径配送方式。将文本数据导入程序,设N为样本数量,n是样本中的属性数;将蚂蚁群分成4个小组;蚂蚁总数目设为R,最大迭代次数用Tmax表示,表1为不同组参数设置表,其中Mi n代表蚂蚁到其对应的聚类中心的距离最小值。

此外,还需要注意偏离误差的计算,即为蚂蚁到其对应的聚类中心的距离Mi n,Mi n越小,说明蚂蚁越集中,聚类水平高。倘若得到每一只蚂蚁的Mi n值,那么从中挑选出最小的Mi n,其所对应的路径就是本次迭代的最佳路径。而迭代的方法就是利用循环,更新蚁群的信息素,根据新的参数进行寻优计算,直到满足要求为止。当R=100,Tmax=1 000时,仿真分析如图1,当R=100,Tmax=10 000时,如图2所示。

表1 程序参数设置表Tab.1 Program parameter setting table

图1 第一次蚁群聚类结果Fig.1 The first ant colony clustering results

图2 增大迭代次数后的聚类效果Fig.2 The clustering effect after increasing the number of iterations

从图1中可以清晰地看到,共有R=4种蚂蚁组数,此时的M i n是30 690,达到了一定的聚类效果,但还不能满足要求,接下来继续增大迭代次数。将Tma x增大到10 000可得以下结果:

由图2知,此时的Mi n=19 726,相比于第一次聚类效果,在达到良好的聚类分析后,需要找出一条合适的路径,从初始点到聚类中心,接下来需要对路径进行寻优规划。此时用400个单位方块模拟环境地图,边长设置为1,以(0,0)作为初始点,(20,20)作为终点,图3和图4中随机设置障碍物,并用矩阵存储每一代的每一只蚂蚁的爬行路线长度。

图3 蚂蚁爬行路线Fig.3 Ant crawling route

图4 蚂蚁无碰撞最优路径Fig.4 The optimal path of ants without collision

由图3可知,蚂蚁从起始点到终点路线数量复杂,尤其是起始点附近,因为蚂蚁刚从蚁穴出来,数量众多,分泌的信息素也多,因为路径更加的繁琐。在接近终点处,由于路程长度,信息素散发稀释,所以蚂蚁的行进路线自然减少。蚂蚁此次路程的最佳路径如图4所示,在无碰撞的情况下保证路程长度。

4 结束语

利用Kmeans与蚁群算法能够很好地解决物流配送问题,尤其是当下不同种类的物资需要不同的配送方式。物流中心在接到配送订单时,可以利用该组合算法对配送物品进行聚类分析,可以按照物件的时效性,安全性等作为路径规划,这样就能更好的满足客户的需求,同时也减少了物流配送的时间成本。Kmeans与蚁群算法对当下的快递行业有着一定的参考意义。

猜你喜欢

质心信息量聚类
整车质心测量精度的研究
重型半挂汽车质量与质心位置估计
基于数据降维与聚类的车联网数据分析应用
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
基于模糊聚类和支持向量回归的成绩预测
基于近邻稳定性的离群点检测算法
巧求匀质圆弧的质心
基于密度的自适应搜索增量聚类法
走出初中思想品德课的困扰探讨
让多媒体技术在语文课堂飞扬