基于模糊聚类的航空物流资源优化配置算法设计
2022-08-17王玙
王玙
(西安航空职业技术学院,陕西西安 710089)
近年来,航空物流已成为运输业中不可缺少的一部分。尤其是互联网购物的出现,使得运输业得到了一个良好的发展期,消费者对更快运输速度及更高服务质量的追求使得航空物流业进入了快速发展阶段。但不断增长的航空物流需求与航空运力之间的矛盾也逐渐凸显[1],如何利用科学的方法对航空物流资源进行优化分配,提高航空运力,是目前航空物流业发展遇到的一个关键问题[2]。
针对上述问题,该文基于模糊聚类方法设计了一种航空物流资源优化配置算法,对航空物流资源进行优化配置。该算法首先通过模糊聚类中的PCM算法对原始数据进行分类,提高物流资源的检索效率,然后通过特征匹配算法实现了对航空物流资源的优化配置,算法测试结果验证了该文算法的有效性与可行性。
1 模糊聚类
模糊聚类(Fuzzy Clustering)是由模糊集合论和聚类分析衍生出来的一种数据分析算法,旨在给出在边界条件不明确或不准确的情况下,不同对象之间相似程度的计算方法[3]。传统聚类方法在对某样本对象进行分类时,通常认为样本对象的划分结果只属于全部分类中的某一类。但在现实中,对象类别的划分通常不是单一的,经常会出现归属于多种类别的情况。模糊聚类算法可以解决上述提到的问题,其描述了某一对象归属于某一类别的概率。模糊聚类中,每个样本点属于某一类的概率(隶属度)是不确定的,但范围均在0~1 之间[4-6]。按照相似度划分,对象与类别的属性越相似,则相应的隶属度就越趋近于1,归属于该类的可能性便越高。
模糊聚类对数据样本的典型处理分析步骤,如图1 所示。
图1 典型处理分析步骤
模糊聚类对样本进行分析的流程主要分为以下几个步骤[7]:
1)建立初始数据矩阵
首先将需要分析的数据样本划分为n类,对应的论域集合为确定研究对象后,为了使研究内容更加明确,同时划分的结果更加合理且符合预期,需要从样本对象包含的多个属性中选取m个具有代表性的特性指标记:xi={xi1,xi2,xi3,…,xim}(i=1,2,3,…,n)。进而建立所需要的初始数据矩阵,对应的数学表达式为:
在该数据矩阵中,xij代表所研究第i个样本的第j个特性指标对应的数值。
2)数据归一化
通常情况下,得到的初始数据在量纲和数量级上会存在一定的差异。若直接进行处理,所得到的结果将会凸显数量级占优势的一些特性指标,同时降低甚至忽略数量级相对较低的指标,这样会大幅降低最终数据分类结果的准确性[8]。为了解决所提出的问题,则需对初始数据进行归一化处理,使其对应数值映射到规定范围内,以便于后续处理。常见的数据归一化方法包括[9]极大值法、均值法、对数法、标准差法、极差法等。
①极大值法
极大值法进行数据归一化的基本思想是:初始矩阵的各数据除以该数据所在列的最大值,将所得到的结果作为对应位置的归一化值,则对应的数学表达式为:
其中,分子xij代表数据矩阵(i,j)位置上的初始值,分母代表初始值所在列的最大值,yij则是归一化后(i,j)位置上的数值。
②极差法
极差法是对极大值法的一种改进,其进行数据归一化的基本思想是在极大值法的基础上,分子和分母同时减去该数据所在列的极小值,其优势在于能够较好地保持数据的准确性。该方法得到的结果可以被看作是对原始数据的等比例缩放,对应的数学表达式为:
③建立模糊相似矩阵
如式(4)所示,将初始矩阵进行归一化处理后,需要计算样本对象之间的相似系数(模糊相似矩阵)R,通常称这一过程为“标定”。
目前可以进行标定的算法包括[10]数量积法、夹角余弦法、相关系数法以及最大最小值法等。
④建立模糊等价矩阵
初步建立的模糊相似矩阵R只具有自反性和对称性。但在聚类分析时,需要其具有一定的传递性,为此需要将得到的模糊相似矩阵进行一定的改造。通常用二次方计算R传递闭包,通过传递闭包的方式得到相应的模糊等价矩阵R*。
⑤聚类分析
得到模糊等价矩阵后,通过选取合适的λ∈(0,1)即可得到符合需求的分类。同时,对于不同的λ值,会得到不同的聚类结果,从而形成动态聚类图。最终确定阈值λ,通常有3 种方法[11]:1)通过不断尝试调整阈值λ,挑选出结果最符合需求时的λ值;2)由相关领域专家推荐的λ取值;3)由统计学中的F统计量计算得到λ值。
2 算法设计
2.1 算法框架
该文利用模糊聚类所设计的航空物流资源优化配置算法,来提高航空物流资源的配置效率和配置准确率,算法设计架构如图2 所示。
图2 算法设计架构
该算法在功能上可分为三部分:物流需求方、需求提供方以及物流服务平台。其中,物流需求方是指需要通过物流获取生产资料的个人或企业;需求提供方是指为物流需求方提供生产资料的个人或企业;物流服务平台则是对物流资源进行优化配置,其是连接物流需求方与需求提供方的关键部分。
该文算法能够按照设定的规则,将物流任务与物流资源相关特征进行匹配。首先,将需求提供方的物流任务利用模糊聚类算法进行分类;然后,将分类结果中的需求任务转化为能够处理的物流资源属性特征;最终,根据该特征与服务平台资源特征进行匹配,找出其中最符合物流需求的物流资源。同时,由于物流需求方大多数创建的物流任务(LT)均较为复杂,通常还要进行任务分解,将原始物流任务根据一定规则分解为复杂度较低的子任务(LST)序列[12]。
2.2 PCM算法
PCM 算法是模糊聚类算法中适用性最高的算法之一,文中采用该算法进行对象的分类。PCM(Possibility C-Means,可能性C 均值聚类)算法是对传统FCM(Fuzzy C-Means,模糊C 均值聚类)算法的改进,主要不同点在于利用概率的思想对FCM 的隶属度进行描述,同时解除了隶属度之和为1 的约束条件[13-14]。PCM 算法对应的数学模型为:
其中,uij为隶属度,取值范围为[0,1],ηi为权衡系数,m为加权指数,U为隶属度矩阵,V是聚类中心。
PCM 算法处理流程如图3 所示。
图3 PCM算法处理流程
算法流程可描述为[15-16]:首先设置PCM 目标函数所涉及到的参数,然后利用PCM 算法对聚类中心V进行初始化,同时根据条件计算V(k+1)和U(k+1)。若U(k+1)、Uk满足迭代条件,则停止迭代,算法结束;否则,令k=k+1 继续进行迭代,直到满足迭代条件为止,算法结束后所得到的U、V均是PCM 聚类的最优解。流程中所涉及的迭代条件为:
其中,ε为极小的常量。
2.3 特征匹配
模糊聚类PCM 算法能够对物流任务进行有效分类,可以大幅提高物流资源服务的检索效率。特征匹配主要解决物流任务与物流资源匹配的问题,将物流任务需求转换为物流属性特征并与物流服务平台中的物流资源相匹配,进而找出最满足物流任务需求的资源及服务。对应的特征匹配模型如图4所示。
图4 特征匹配模型图
该模型分为三部分:基本特征/历史评价特征(模块1)、非功能性特征(模块2)、功能性特征(模块3)。其中,模块一负责判断当前物流服务是否存在于物流服务集中;模块二负责判断当前物流服务能否在限制条件下顺利完成物流任务;模块三则负责判断是否能够完成物流任务。模型的特征匹配流程是一个不断精确的过程,具体如图5 所示。
图5 特征匹配流程
3 实验测试
为了验证所提出的基于模糊聚类的航空物流资源优化配置算法的有效性与可靠性,基于某物流公司的真实数据集,在完成对算法模型的搭建后,进行了以下实验:物流任务需求分类测试、特征匹配性能测试及物流资源配置性能测试。其中,物流任务需求分类测试主要用于验证算法能否准确地将物流需求方创建的物流需求任务进行分类,分类效果越优则后续进行特征匹配及物流资源的配置效果就越优;特征匹配性能测试主要验证分类后的物流任务需求能否与服务平台中的资源相匹配;物流资源配置性能测试则主要测试算法的总耗时及准确率,同时对算法的有效性与可靠性进行验证。
1)物流任务需求分类测试
该测试分别根据地点及产品类型两种特征进行分类,由于两种类型所涉及的细类较多,无法逐一列举,分类测试的部分数据结果如表1 所示。
表1 物流任务需求分类测试结果
由该项测试结果可以看出,该文算法能够较好地根据所选特征对物流任务需求进行准确分类,且准确率均在99%以上。说明该算法具有良好的样本数据分类能力,这也为后续进行特征匹配及物流资源优化配置奠定了较好的基础。
2)特征匹配性能测试
该项测试主要验证物流任务需求与物流资源匹配的问题,将原始数据分为3 个数据集分别进行测试,测试结果如表2 所示。
表2 特征匹配性能测试结果
由上述结果可以看出,采用该文算法进行特征匹配的匹配率较高,平均匹配率能够达到96.6%,具有较好的效果。
3)物流资源配置性能测试
最后进行算法物流资源配置性能的测试,主要测试算法的总耗时及准确率。其与特征匹配测试采用相同的数据集,测试结果如表3 所示。
表3 物流资源配置性能测试结果
用总耗时除以数据量,可以分别计算出各数据集的单个对象处理效率,结果依次为:24.29 ms、21.89 ms、27.86 ms,平均值为24.68 ms。结合表3 的结果可以看出,该文所提算法具有较好的数据处理效率以及较高的准确率,平均准确率可达95.26%。
4 结束语
该文通过介绍和分析模糊聚类分析算法,提出了基于模糊聚类的航空物流资源优化配置算法。该算法由物流需求方、需求提供方以及物流服务平台所组成,各模块及算法的相互配合共同完成对航空物流资源的优化配置。三项算法的实验测试结果充分验证了文中算法的有效性与可行性,尤其是物流资源配置的准确率能够达到95%。