APP下载

区域公路网结构性能的模糊聚类分析

2015-05-09郑贵省李月明车亚辉

军事交通学院学报 2015年10期
关键词:路网聚类矩阵

王 元,郑贵省,王 鹏,李月明,车亚辉

(1.军事交通学院 研究生管理大队,天津300161;2.军事交通学院基础部,天津300161)

目前,我国公路交通建设取得了巨大的成就,基本形成了以高速公路为骨架、国省道干线公路为主体、县乡村公路为基础的公路交通网络[1]。随着我国交通的不断完善,对公路网的规划、建设和管理需要建立一套科学合理的评价体系。其中,公路网的结构性能评价是公路网评价体系中必不可少的重要组成部分[2]。公路网的结构性能如何,具有模糊性和不确定性,其具有多个评价指标,如密度、连通度、网路覆盖形态等。不同的区域由于社会经济发展水平的不同,公路网的结构性能也各不相同。对此,可以采用模糊聚类的理论,针对收集的不同区域的路网性能指标数据进行模糊C-聚类分析,即可得到不同区域的路网结构性能的分类。对公路网的聚类分析可以揭示公路网不同的发展水平,为整个公路网的规划建设服务。

1 模糊聚类理论与方法

聚类是一种重要的人类行为,通过适当聚类,事物才便于研究,事物的内部规律才可能为人类所掌握。聚类是指按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内的相似性尽量大,按照相似程度的大小,将事物逐一归类。经典的聚类算法将每一个辨识对象严格划分为某一类。但是,实际上某些对象并不具有严格的属性,它们可能位于两类或多类之间,采用模糊聚类可获得更好效果。模糊聚类分析的思想首先由Zadeh L A[3-4]于 1965 年提出。1973 年,Dunn 提出模糊C-均值聚类算法。1981年,Bezdek J C[5]对其进行改进并推广到实际应用中。目前,有关模糊聚类的许多成果都是对聚类算法进行的推广和改进,该算法已被广泛应用于多种领域。模糊聚类分析是根据事物特性指标的模糊性,应用模糊数学方法确定样本的亲疏程度而实现的分类方法,可分为两大类:基于模糊等价关系与模糊相似矩阵的动态聚类算法和基于模糊划分的动态聚类方法。

1.1 基于模糊等价矩阵与模糊相似矩阵的动态聚类算法

(1)建立模糊相似矩阵。设U是需要被分类对象的全体,建立U上的相似系数R,R(i,j)表示i与j之间的相似程度,当U为有限集时,R是一个矩阵,称为相似系数矩阵。定义相似系数矩阵的工作,可以按系统聚类分析中的相似系数确定方法,也可以用主观评定或集体打分的办法。

(2)建立等价矩阵。用上述方法建立的相似关系R,一般只满足反射性和对称性,不满足传递性,因而还不是模糊等价关系。为此,可用求传递闭包的方法,将R改造成R*,在适当的阈值上进行截取,便可得到所需要的分类。R自乘的思想是按最短距离法原则,寻求xi与xj的亲密程度。即先将R自乘改造为R2,再自乘得R4,如此继续下去,直到某一步出现R2k=Rk=R*。此时R*满足传递性,于是模糊相似矩阵R就被改造成一个模糊等价关系矩阵R*。

(3)模糊聚类。有了等价关系的R*后,给定不同置信水平的λ,求R阵,rij>λ的元素变为1,否则变为0,从而达到分类目的。随λ值的降低,由细到粗逐渐归并,最后得到动态聚类谱系图。

从以上的方法中可以看出:在建立相似系数矩阵时,指标权重是人为给定的,显然,计算结果不可避免地受到主观因素的影响;同时,在建立等价关系矩阵时,采用布尔矩阵相乘过程中,需要不断地检验它是否已经是等价关系矩阵;再则,对于不同置信水平λ的选择上也存在着多大为合适的问题。

1.2 基于模糊划分的动态聚类方法

模糊C-均值聚类(fuzzy c-means algorithm,FCMA)用隶属度表示每个样本属于某个聚类的程度。FCMA把n个 xi(i=1,2,…,n)分为 c个模糊组,并求每组的聚类中心,使得目标函数达到最小。

xi(i=1,2,…,n)是 n个样本组成的样本集合,c为预定的类别数目,mj(j=1,2,…,c)为每个聚类的中心,uj(xi)为第i个样本对于第j类隶属度函数。

设目标函数为

式中:Jf为目标函数;b为一个可以控制聚类结果的模糊程度的常数,b越大,分类越模糊,实践证明,b应大于1,但一般不超过2,否则将引起分类失真。其中

在式(2)下求式(1)的极小值,令Jf对mj和uj(xi)的偏导数为0,可得必要条件:

FCMA迭代过程为:①设定初始聚类数目c及参数b,目标函数迭代精度ε;②初始化各个聚类中心mj(j=1,2,…,c);③根据式(4)计算隶属函数矩阵;④根据式(1)计算目标函数,Jf<ε,则算法停止,否则,返回步骤③。

模糊C-均值聚类是较成熟的技术,这是一种寻找最佳划分矩阵的方法,这种方法可以根据样本的特性进行合理分类。

2 实例分析

2.1 公路网结构性能评价指标及实例数据

公路网的结构性能评价就是对相关的各项指标进行定量、定性分析,揭示现状公路网存在的问题,为规划近、远期公路网服务。评价的首要工作是选择评价指标,评价结果的准确与否不仅取决于指标选择的科学性,也取决于指标量化的科学性。经过分析比较,本文选取的指标主要有以下6个。

(1)公路网理想接近规模。公路网理想规模接近度是实际公路网里程接近于理论所需公路里程的程度,反映的是公路网与国民经济发展、人口规模的适应程度。

(2)当量综合密度。当量综合密度定义为将区域中各等级公路的里程依据通行能力折算成标准等级(二级)公路的总里程与区域国土面积、人口、经济指标乘积的立方根的比值,能够较客观地反映公路网的真实规模[6]。

(3)公路网等级水平。公路网等级水平定义为路网中各等级公路里程的加权平均值,反映公路网的等级水平。

(4)连通度。连通度反映的是网络交通节点(公路交叉口或城镇交通枢纽)的连通状况,从路网布局方面反映公路网的结构特点,其定义为规划区域内各节点间依靠公路交通相互连通的强度。

(5)公路网平均车速。公路网平均车速是由公路交通中的公路系统、车辆系统和管理系统综合作用的结果,它综合反映了路网的系统性能。

(6)公路网拥挤度。公路网拥挤度是用来表示公路拥挤或利用程度的指标,公路网拥挤度就是反映整个路网适应负荷的能力,即与交通需求的适应情况。

本文以2005年北京市各区县公路网的结构性能指标数据为实例数据(见表1)进行分析。

表1 北京市路网结构性能评价指标

2.2 数据预处理

根据模糊聚类的要求,为了消除不同量纲对数据的影响,必须对样本进行数据预处理[7]。本文采用平移―标准差处理样本数据:

对数据进行归一化处理:

使用Matlab编程归一化处理后的数据如下:

2.3 聚类结果

设定初始聚类中心数目为3,隶属度矩阵的指数为2,隶属度最小变化量为10-5,按模糊C-均值聚类的运算结果如下。

聚类中心:

分类矩阵:

由分类矩阵可知,样本分 3类:{x1,x2,x9}、{x3,x4,x5,x8,x10}、{x6,x7}。即根据 2005 年北京市各区公路网结构性能指标数据,将北京市各区路网性能分为3类,分别是:{通州,顺义,昌平}、{怀柔,密云,平谷,门头沟,延庆}、{大兴,房山}。

3 结语

采用模糊C-均值聚类的方法,对区域公路网的结构性能做了评价和分类,最后以北京市为例进行了实例分析。结果说明,通过聚类分析可以科学、有效地区分和横向比较各区域公路网结构性能的发展水平,为下一步公路网的规划建设、管理和促进公路交通网络的平衡发展提供科学合理的参考依据。

[1] 沈鸿飞.面向风险评估与应急管理的公路网结构性质评价与分析方法[D].北京:北京交通大学,2012:1.

[2] 朱强.基于GIS的公路网综合评价技术研究[D].郑州:郑州大学,2005:7.

[3] Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.

[4] Zadeh L A.Fuzzy algorithms[J].Information and Control,1968,12(2):94-102.

[5] Bezdek J C.Pattern Recognition with Fuzzy Objective Function Algorithms[M].New York:Plenum Press,1981:11.

[6] 张志清,金光浩,范怀玉.公路网现状适应性评价[J].公路,2007(7):167-168.

[7] 贾继德,孔凡让.发动机连杆轴承故障噪声诊断研究[J].农业机械学报,2005(6):89-90.

猜你喜欢

路网聚类矩阵
基于卫星遥感图像自动提取路网与公路路网的校核比对
高速公路路网复合通行卡(CPC)管理方案探讨
高速公路路网内复合通行卡(CPC)调拨方法研究
打着“飞的”去上班 城市空中交通路网还有多远
多项式理论在矩阵求逆中的应用
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
矩阵
矩阵