运用聚类分析评估油库油料保障效能
2018-11-07巨亚荣
巨亚荣,汪 涛,陈 勤
(中国人民解放军陆军勤务学院 a.军事物流系; b.油料系; c.军事物流系, 重庆 401331)
努力建设保障打赢现代化战争的后勤、服务部队现代化建设的后勤和向信息化转型的后勤,是习主席和中央军委赋予军队后勤系统的战略任务[1]。在油料系统贯彻落实“三大建设任务”要求,就是要促进油料保障向信息化转型发展。油料保障的总体目标是充分发挥油料系统人、财、物的作用,把国家分配给军队的有限的油料以及油料装备、油料经费管理好、使用好,最大限度地保障军队建设和作战的需要。要圆满达到这一总体目标,必须依靠科学管理,讲求油料保障效能。
后方油库是军队中担负战略、战役或平时油料储备和供应任务的仓库,其首要任务是做好平战时油料、油料装备(器材)的收发、保管和供应工作[2]。对油库的油料保障效能进行评估,有助于了解、掌握油料保障系统的能力和不足,为油料保障决策提供可靠依据,为提高油料保障的能力创造条件。
聚类是人类一项最基本的认识活动,是研究“物以类聚”的一种方法。聚类分析就是根据事物本身的特性,按照一定的类定义准则,对所研究的事物进行归类[3]。通过适当聚类,事物才便于研究,事物的内部规律才可能为人类所掌握。近年来,随着油料保障信息化在全军部队试点展开,各后方油库积累了大量的油料业务信息数据。这种海量的油料业务数据蕴藏着油料消耗的空间分布及其变化趋势,是进行油料保障效能评估的基础资料[4]。采用聚类分析方法对各油库的油料保障效能进行评估,有助于挖掘隐藏在大量油料保障业务数据中不被人们认知的关于油料保障活动的规律性知识,用以辅助决策,促进油料保障工作的针对性。
1 后方油库油料保障效能评估概述
1.1 相关概念界定
油料保障效能是指完成油料保障任务的有效程度,是油品、油料装备及油料设施(备)、油料保障人员、油料保障机构、油料保障信息、油料经费等蕴含的有利于军队建设和作战行动的作用[5]。油料保障效能与国民经济中所讨论的效益相比具有许多特殊性,致使对它的评价考核工作比较复杂和特殊。
油料保障效能评估,是后勤指挥机关根据油料保障需要,对本级及下级油料保障能力的一种综合性的预先估计,是对油料保障的效益水平进行评价和估算的活动。
1.2 油料保障效能评估的分类
1) 按评估的内容分类
① 单项要素保障效能
后方油库的油料保障效能是由不同要素构成的,这些要素包括油品、装备和设备、人员、保障能力、环境等。对这些不同要素的效能评估,形成油料保障单项要素保障效能评估[6]。单项要素保障效能仅能反映油库在某一方面的效能。
② 综合保障效能
油库综合保障效能,是油库完成某一油料保障任务整体情况的反映,是进行保障效能评估的主要目的。油库综合保障效能的得出依赖于单项要素保障效能,只有在计算出油库所有单项要素保障效能的基础上,按照一定的评估模型,才能得到综合保障效能。
2) 按评估的稳定性分类
① 静态保障效能
油库静态保障效能是油勤人员和油料设备设施等因素所蕴含的保障效能,其特点是在评估时不考虑油库的背景情况和战场环境,只衡量其在正常条件下具备保障能力的状态。
② 动态保障效能
动态保障效能是指油库在特定的保障任务和保障环境下,内部因素和外部因素相互产生系统合力所形成的现实保障效能。动态保障效能是对静态保障效能的发挥、延伸和拓展。
3) 按评估的层次分类
军队油料保障系统是一个多层次、多系统的综合体,根据工作范围和担负的任务大致分为3个层次:一是油料保障部(分)队;二是用油部队;三是各级机关油料部门。后方油库属于油料保障部(分)队。
2 聚类分析的基本原理
聚类分析能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。
2.1 聚类分析中“亲疏程度”的度量
对样品之间的亲疏程度的测量一般有两个角度:一个是个体之间的相似程度;另一个是个体间的差异程度。个体间的相似程度通常用简单相关系数或等级系数衡量,而个体间的差异程度通常采用距离测度。距离测度是一个函数d(x,y),以空间中的两个点作为参数,函数值是一个参数值,该函数必须满足下列准则:
1)dij≥0,对一切xi,xj∈RP,成立,且dij=0当且仅当xi=xj;
2)di,j≤di,k+dk,j,∀xi,xj,xk∈RP
只有满足上述性质的距离测度才可以称为度量。假设有n个样品x1,x2,…,xn,每个样品都有m个指标,因此可用一个m维向量表示,记
xi=(xi1,xi2,…,xim)T,i=1,2,…,n
从直观上看,属于同一类的对象在空间中应该互相靠近,而不同类的对象之间的距离要大得多。个体间距离的定义会受到变量类型的影响,使得个体间距离的定义也因此不同。常用的有曼哈顿距离、欧几里德距离、切比雪夫距离、闵可夫斯基距离等。
① 曼哈顿距离
② 欧几里德距离(Euclidean Distance)
③ 切比雪夫距离(Chebyshev)
④ 闵可夫斯基距离(Minkowski Distance)
2.2 聚类分析的分类
1) 以分类对象为标准
①Q-型聚类分析又称观测聚类或样本聚类,是根据被研究对象的各种特征,把特征相似的研究对象归并为一类[7]。
②R-型聚类分析是指对指标或者变量分类。在实际问题中,描述同一事物特征的变量有很多,对描述研究对象的变量进行归类,使得每一类都能代表观测对象某一方面的特征。
2) 以分类方法为标准
① 系统聚类法
系统聚类法的基本思想是:开始将样品或指标各视为一类,根据类与类之间的距离或相似程度将最相似的类加以合并,再计算新类与其他类之间的相似程度,不断继续这一过程,直到所有的样品(或指标)合并为一类[8]。
② 动态聚类法
动态聚类法的基本思想是:开始按照一定方法选取一批聚类中心,让样品向最近的聚心凝聚,形成初始分类,然后按最近距离原则不断修改不合理分类,直至合理为止[9]。
不管按何种标准分类,其目的都是根据某种标准,把“相似”的事物归类。应用聚类分析应注意以下几点:一是在选择参与聚类分析的变量时,应注意所选变量是否符合聚类分析的要求;二是在聚类分析之前应首先对源数据进行标准化处理,以消除数量级对聚类结果的影响;三是各变量之间不应有较强的线性相关性。
3 案例分析
本节以某战区各后方油库为研究对象,运用SPSS软件,结合年度油库油料保障统计数据,首先采用R型聚类对油库“持续保障能力”指标下属的各个指标进行聚类分析,筛选出最能反映油库持续保障能力的指标;然后采用Q型聚类分析对油库油料保障综合效能进行评估,以确定对战区内油库的分类数目及每个油库所属的级别。
3.1 基于R型聚类分析的后方油库油料效能评估
表1是2015年某战区各后方油库的“持续保障能力”各指标统计表,为描述方便,分别用x1,x2,x3,x4,x5表示“储存能力”、“上级或他部加强力量”、“遭敌破坏后恢复能力”、“收发卸载能力”和“交通运输条件”等5项下级指标。
采用系统聚类法对表中的变量进行聚类分析,聚类时先确定用相似性来测度,聚类数目的范围选择2~3,度量标准选用pearson相关系数,聚类算法选最远元素法,以此来筛选出最能反映油库“持续保障能力”本质特征的指标,达到数据降维的目的。如表2所示,生成的相似性矩阵里的数字为相关系数,若有某两个变量的相关系数接近1或-1,说明两个变量可互相替代。
表1 2015年某战区后方油库“持续保障能力”统计表
表2 相似性矩阵
从表2可以看出,“储存能力”和“收发卸载能力”相关系数较大,“储存能力”和“上级或他部加强力量”的相关系数也较大,因此,两组相关关系中均是二者取其一即可。
从表3中可以清晰地看出,当聚类数目为3时,x1和x4聚为一类,x2和x5聚为一类,x3单独为一类,这和表1中由相关系数所表示的聚类完全一致。再综合油料保障领域的专业知识,仅保留“储存能力”指标较为合适。表3是群集成员表。综合油料保障领域的专业知识,根据实际情况可确定聚类数,进而确定指标的取舍。
表3 群集成员
3.2 基于Q型聚类分析的油料保障综合效能评估
表4是2015年某战区各后方油库的“油料保障效能”统计表,采用Q型聚类法对表中的数据进行聚类分析,即依据表中的某一列数据对各后方油库在该项保障效能的得分值进行分类,以明确各个油库在该项保障效能上所处的级别。
表4 XX战区后方油库油料保障效能统计表
用SPSS软件进行分析。由于开始不确定分为几类,暂时用一个3类范围试探。这一次采用最远邻近法,用平方Eudidean距离进行测度。生成的树状图如图1所示。
从图1所示的树状图可以看出,根据油库油料保障综合效能,可以把油库分为3类:
第1类:a005、a007、a014、a002、a015、a006
第2类:a016、a010、a004、a008、a003
第3类:a012、a001、a011、a013、a009
即第1类油库的各项效能指标处于比较高的段位,第2类油库的各项效能指标处于中等位置,第3类油库的各项效能指标则比较低。评估结果与实际情况相符。
需要指出的是,使用不同的聚类方法会得出不同的分类结果,在实际应用中可选用其他聚类方法将各种结果加以比较[10],以便确定对于不同的聚类结果,究竟哪一种分类较好。一般来说,可以通过两种方法判断,一是根据与分类问题本身有关的专业知识决定取舍;或者将各种结果中的共性取出来,将有疑问的样品放在一边待判,然后选用最短距离法对待判的样品作特殊处理,决定它们的归属。
4 结论
为探索改进部队后方油库油料保障效能评估的方法,引入聚类分析作为一个独立的工具获得油库油料保障效能数据的分布状况。案例研究结果表明,采用聚类分析进行油库油料保障效能评估,能显著降低评估指标数据的冗余度,降低评估成本,且评估算法完全依据原始样本数据的特征,减少了先验知识对评估结果的主观影响,增强了评估的客观性和准确性。运用聚类分析评估油库油料保障效能为探索改进其他相关的效能评估方法提供了新的思路。