基于聚类分析方法的地方标准规划序列研究
2014-11-17张志刚
张志刚
(河北省高速公路京秦管理处,河北 秦皇岛 066001)
0 引言
“十五”计划以来,公路工程技术标准规范体系日益完善。现行公路工程技术标准规范体系包括综合、基础、勘测、设计、检测、施工、监理、养护及管理和技术指南等方面,共有技术标准83册和技术指南13本[1-2],较好地指导了我国公路工程建设。由于我国地域辽阔,地区的地址情况复杂,仅依靠行业标准和国家标准,很难较好地指导和规范各个省市、地方公路工程的设计、施工和管理。所以对公路工程行业标准规范进行有针对性的梳理和适应性评价,补充和完善地方标准体系,对我国各省、各地区的公路工程建设具有重要的现实意义。本文在分析地方标准适用性的基础上,借助K-means聚类算法提出地方标准规划方法。
1 算法介绍
K-means聚类算法是数据挖掘方法之一,对未知的个案集U={u1,u2,…,un}根据相似数据的平均值即其质心分成k(k<n)组,使相似性最近的个案ui聚集成一类[4-6]。该算法的具体过程如下:
(1)从数据集U中随机选取k个个案作为分类的初始中心C={c1,c2,…,ck};
(3)再次计算各类的中心值;
(4)循环步骤(2)和(3),直到各类的聚类中心不再改变为止。
K-means聚类算法具有简洁、高效的特点,并且可以事先确定聚类的个数,使得其在所有聚类方法中应用最广。
2 数据采集
通过对设计院、施工单位、管理单位、质检单位、大专院校等单位进行关于行业标准或规范中不适应新疆地区公路建设特点的规定和行业标准或规范中没有涵盖或明确规定的,且新疆公路建设中又亟需进行规范的相关技术要求的大量调研,得到样本集U,共有44个个案,每个个案对应4个重要度指标,如表1所示。
表1 样本集
表1 (续)
3 地方标准规划分析
3.1 标准编制的时间管理计划
在公路工程技术标准规范编制时序中,根据轻重缓急原则,提出了标准编制的时间管理计划,见表2。
表2 标准编制时序计划
3.2 聚类分析
利用K-means聚类算法,以重要度指标作为分类指标对数据集中的数据对象进行聚类分析。首先,确定聚类的初始聚类中心,如表3所示:聚类的初始中心C={交通工程类-9,环境保护类-2,路线设计类-4,基础勘测类-4}。然后计算每个案例与聚类中心的欧式距离,如果D(ui,ck)=min{D(ui,ck)},则把该案例ui归为类别ck。
表3 初始聚类中心
依次经过多次迭代,直至聚类中心不再改变,则聚类算法结束,如表4所示:由于聚类中心内没有改动或改动较小而达到收敛。中心的最大绝对坐标更改为0.000。同时得到最终聚类中心和样本数情况,如表5、表6所示。
表4 迭代历史记录
表5 最终聚类中心
表6 样本数情况
根据表5,可以得到每一类别对应的指标最终聚类中心图,如图1所示。从图1中可以看到,每个分类的对应个案的聚类中心,如第一类的急需值为0.47,一般值为0.33,暂缓值为0.05,不需要值为0.09。
图1 最终聚类中心图
由表6可得到聚类结果,如图2所示。从图2中可以得到:第一类有17个个案,第二类有9个个案,第三类有16个个案,第四类有2个个案。
图2 类别与个案
所以,经过分析可以得到新疆公路工程技术标准编制时序,如表7所示。
表7 新疆公路工程技术标准编制时序
4 结语
通过大量的实地调研,运用K-means聚类分析法对所得数据进行分析得到新疆地方标准修编序列。
需要在1~2年内编制完成的近期计划有:基础勘测类-1,基础勘测类-2,基础勘测类-6;路线设计类-6,路线设计类-8,路线设计类-9,路线设计类-10;交通工程类-1,交通工程类-3,交通工程类-5,交通工程类-7,交通工程类-8,交通工程类-9;交通安全类-4,交通安全类-5,交通安全类-6,交通安全类-8。
需要2~5年内编制的中期计划有:基础勘测类-8;交通工程类-2,交通工程类-4;环境保护类-1,环境保护类-2,环境保护类-4,环境保护类-5,环境保护类-6,环境保护类-8。
需要在5~15年内编制的远期计划有:基础勘测类-5,基础勘测类-7;路线设计类-1,路线设计类-3,路线设计类-5,路线设计类-7,路线设计类-11;交通工程类-6;交通安全类-1,交通安全类-2,交通安全类-3,交通安全类-7;环境保护类-3,环境保护类-7。
该序列的研究可以为地方标准的编制和管理起到顶层设计的作用,积极推动地方公路的建设。
[1]杨智生.《公路工程技术标准》调整刍议[J].公路,2006(6):36-38.
[2]公路工程现行标准、规范、规程、指南一览表[J].公路,2011(2):235-236.
[3]曹春梅,陈志国,曹喜军.吉林省公路工程标准体系研究[J].交通标准化,2012(18):8-11.
[4]杨小兵.聚类分析中若干关键技术的研究[D].杭州:浙江大学,2006.
[5]逄玉俊,柳明,李元.K均值聚类分析在过程改进中的应用[J].华中科技大学学报:自然科学版,2009(S1):245-247.
[6]Yiu-Ming Cheung.K-Means:A New Generalized KMeans Clustering Algorithm[J].Patten Recognition Let⁃ters,2003(24):2883-2893.