APP下载

基于混合聚类的电网企业服务类采购分类研究

2018-02-03郭珊珊王志红赵贝贝

物流科技 2018年1期
关键词:聚类分类服务

郭珊珊,张 立,崔 威,王志红,赵贝贝

(1.国网河南省电力公司,河南 郑州 450000;2.华北电力大学(北京),北京 102206)

0 引言

采购环节是提高企业效益的源头,为了适应新形势下的发展,电网企业对采购管理提出了更高、更严的标准。由于电网企业服务类采购对象种类多、数量大,合理地采购方法可以显著提高工作效率,减少采购费用的支出,所以对每类需求选取适合地采购组织方式具有重要的战略意义。

在快速聚类与系统聚类模型方面,国内外学者在不同方面进行了应用。在混合聚类运用方面,将快速聚类与系统聚类相结合的混合聚类方法对交通数据进行分析,并以经典的silhouette评价指标作为聚类终止条件制定了相应时段的控制方案[1]。在快速聚类运用方面,使用K-means聚类和商业自动数据挖掘工具KXEN提出了江苏常州电信客户细分的解决方案[2]。计算Web服务的相似性,并使用该数据生成K均值聚类算法的集群[3]。采用两阶段K均值聚类来识别第一阶段的不可信度指数,根据第二阶段的索引对用户进行聚类,得到可靠的聚类信息[4]。从数据挖掘技术,客户的供电可靠性要求、客户价值和客户行为三个维度,建立细分指标体系,利用K-means聚类法建立客户细分模型[5]。在K-means算法改进方面,应用改进的K-means算法进行客户聚类,将该方法与经典K均值和分层方法的其他聚类算法进行比较[6]。在系统聚类运用方面,加权的系统聚类方法通过对不同的客户特征赋予不同的权重,达到对客户的聚类结果更符合企业经营目标的目的[7]。应用系统聚类建立图书馆读者细分模型,进而提出了四种不同的细分方式[8]。通过文献综述可知,国内外学者对聚类模型的应用都偏向于一种方法的使用,本文将快速聚类与系统聚类进行综合应用,使得服务类项目的分类更加准确,从而有效提高服务类采购质量,保证采购高效性。

1 混合聚类模型简介

1.1 聚类模型原理

(1)系统聚类的基本思想为:对于位置类别的样本或变量,依据相应的定义把他们分为若干类,分类过程是一个逐步减小类别的过程,在每一个聚类层次,必须满足“类内差异小、类间差异大”的原则,直至归为一类。评价聚类效果指标一般是方差,距离小的样品所组成的类方差较小。样本距离计算方法较多,本文用欧氏距离计算方法:

系统聚类过程操作步骤如下:

①设初始模式样本共有N个,每个样本自成一类,即建立N类,计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。

②假设前一步聚类运算中已求得距离矩阵D(n),n为逐次聚类合并的次数,则求D(n)中的最小元素。如果它是)和)两类之间的距离,则将)和)两类合并为一类由此建立新的分类:

④返回第二步,重复计算及合并,直到得到满意的分类结果(如:达到所需的聚类数目,或D(n)中的最小分量超过给定阈值D等)。

(2)快速聚类的基本思想为将给定的样本划分为K类,K预先指定。基于使聚类性能指标最小化,所用的聚类准则函数是聚类集中每一个样本点到该类中心的距离平方之和,并使其最小化。

聚类过程操作步骤如下:

①为每个聚类确定一个初始聚类中心,这样,就有K个初始聚类中心。

②将样本集中的样本Xi按照最小距离原则分配到最邻近聚类Zj。

通过上述实验结果分析,芪桂通痹汤治疗糖尿病周围神经病变,能明显改善疼痛麻木情况,且对神疲怠乏,自汗畏风,面色苍白,心悸纳呆等征象改善较对照组明显,治疗总有效率明显高于对照组。经观察应用芪桂通痹汤的病人未发现任何毒副作用。

③使用每个聚类中的样本均值作为新的聚类中心。重复步骤②直到聚类中心不再变。

1.2 服务类混合聚类模型的建立

电网企业服务类采购组织方式包括框架协议采购、定点采购、集中批次采购、授权采购四种类别。国网公司为了优化服务类集约化管理体系,深化标准化、信息化手段的应用,推进服务类管理创新,提升服务类集约管理水平,主要采取框架协议采购、定点采购、集中批次采购的组织方式,包含了服务类的绝大部分。授权采购不属于依法必须招标且未纳入总部集中采购目录范围的采购需求,所以本文服务类聚类围绕授权之外的三种方式展开。本文将快速聚类收敛快的特点与系统聚类精度高的特点有机结合,形成混合聚类模型。指标数据应用SPSS19.0统计软件进行聚类分析。首先利用系统聚类精度高的优点,提供的类别距离谱系图确定最优分类数,然后用快速聚类得到最终分类并根据方差分析输出表判断类与类中心差异是否显著,依据分析之后的聚类成员表确定各类项目组成员,对每大类的项目成员总体进行归纳总结项目特点,并分析适用的采购组织方式。

2 算例分析

以国网河南省电力公司2014~2016年服务类需求计划数据为例展开分析,通过对服务类项目总体的特征分析,主要选取四个参与分析的变量,分别为:①金额,②采购频次,③服务商数量,④需求部门数量。按照2014~2016年国网河南省上报的服务类需求计划统计表,采购金额数据选取项目平均值,采购频次选取2014~2016年需求采购上报的总计次数,供应商数量根据供应商资质、位置等条件统计,需求部门选取项目平均个数。数据统计如表1所示。

2.1 模型具体操作步骤

(1)系统聚类过程操作

①在SPSS变量视图中先定义好变量(如图1所示)。

②将采集好的数据输入数据视图(如图2所示)。

③将输入的数据进行系统聚类分析(如图3所示)。

④结果分析。由系统聚类得到图4所示的树状图,树状图各变量分类均匀且明显,可知收集数据指标可以用来做分类依据。

(2)快速聚类用SPSS软件进行具体操作

①首先指定分类数为三类,在右侧选项卡中选择所要输出的表格,选择“初始类中心”、“ANOVA表”和“每个个案聚类信息”(如图5所示)。

②结果分析。为了检验快速聚类采购金额、采购频次、供应商数量这三个类中心之间的差异是否显著,进行方差分析,由表2“方差分析表”输出表可知精确p值均小于0.05,可知所分类各类中心差异显著,分类效果较好。

F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

由表3输出表“每个聚类中的案例数”可知分类大致情况,第一类包含12个个案,第二类包含9个个案,第三类包含6个个案,并没有缺失的服务类个案。

表1 国网河南省2014~2016年服务类需求计划表

图1 定义变量视图

2.2 结果分析

(1)聚类1组分析结果。由快速聚类得出聚类1组包括电网项目前期可研、勘察设计、非生产性技改(10KV以下)、大修项目设计(10KV以下)、技改大修项目监理(10KV以下)、工程造价咨询、前期核准评价、大件运输、变电一、二次设备运维检修、输电、配电设备运维检修、直流设备运维检修、在线监测装置、仪器仪表维护12等个服务。 经过对聚类1组成员整体特征分析可得该组具有以下特点:①及时性要求高;②采购频次高;③价格敏感度高;④执行调整多;⑤全生命周期服务要求高。

由聚类第1组成员的整体特点结合框架协议采购的适用情况可知,聚类1组适合采用框架协议方法。框架采购更适合采购频次高、数量大、服务稳定可靠度高的项目,项目价格的可调整性较大。

(2)聚类2组分析结果。聚类2组包括生产辅助设施、生产标识牌、环境检测维护、消防设施、安防、技防设施维护、设备返厂大修维护、保险、信息技术的开发设计及维修、物业服务、车辆维修、公务印刷、出版和会展、视频制作等9类服务。经过对聚类2组成员整体特征分析可得该组具有以下特点:①价格相对确定;②区域性强;③工作量轻;④技术、经济标准明确;⑤一次性方式。

图2 定义数据视图

图3 系统聚类分析图

图4 使用平均连接组间树状图

由聚类2组的整体特点结合定点采购的适用情况,可得聚类2组成员更适合采用定点采购方式,采购工作量较轻,价格相对波动性小的项目。

(3)聚类3组分析结果。聚类3组包括设备监造、科技研发和咨询、管理咨询、车辆租赁、培训和会议等6类服务,对聚类3组成员整体特征分析可得该组具有以下特点:①通用性强;②价格敏感度高;③供应商数量多;④采购频次高;⑤专业性强。

由聚类3组的整体特点结合集中批次采购的适用情况,可得聚类3组成员更适用于集中批次采购,适用于供应商数量多,价格相对波动较大的情况。

图5 K均值聚类分析图

表2 方差分析表

3 结束语

从电网企业服务类采购现状进行分析,首先建立了采购金额、采购频次、供应商数量的三个维度的指标体系,其次运用系统聚类进行分析,分析分类效果和指标选取效果,最后运用快速聚类将服务类分为三个类别。混合聚类在种类繁多的电网企业服务类需求采购分类中的应用,使服务类采购组织方式精准性增加、系统工作效率提高、时间成本得到节约,对国网公司服务类采购具有重要的现实意义。

表3 快速聚类案例数输出表每个聚类中的案例数

[1]姚佼,徐洁琼.基于混合聚类的城市道路多时段控制研究[J].计算机应用研究,2016,33(11):3274-3278.

[2]Luo Y,Cai Q,Xi H,et al.Customer Segmentation for Telecom with the k-means Clustering Method[J].Information Technology Journal,2013,12(3):409-413.

[3]Vijayan A S,Balasundaram S R.Effective Web-Service Discovery Using K-Means Clustering[C]//Distributed Computing and Internet Technology.Springer Berlin Heidelberg,2013:455-464.

[4]Wu C,Qiu W,Zheng Z,et al.QoS Prediction of Web Services Based on Two-Phase K-Means Clustering[C]//IEEE International Conference on Web Services,2015:161-168.

[5]张晓春,倪红芳,李娜.基于数据挖掘的供电企业客户细分方法及模型研究[J].科技与管理,2013,15(6):104-109.

[6]Kohan N M,Moghaddam M P,Bidaki S M,et al.Comparison of Modified K-means and hierarchical algorithms in customers load curves clustering for designing suitable tariffs in electricity market[C]//Universities Power Engineering Conference,2008:1-5.

[7]原忠虎,李佳,张博.一种加权的系统聚类方法及应用[J].沈阳大学学报(自然科学版),2014,26(3):201-207.

[8]聂珍.一种基于系统聚类的图书馆读者细分模型[J].现代情报,2009,29(9):158-161.

猜你喜欢

聚类分类服务
分类算一算
服务在身边 健康每一天
分类讨论求坐标
服务在身边 健康每一天
服务在身边 健康每一天
数据分析中的分类讨论
基于DBSACN聚类算法的XML文档聚类
教你一招:数的分类
招行30年:从“满意服务”到“感动服务”
基于高斯混合聚类的阵列干涉SAR三维成像