APP下载

经济圈交通网络SVM评价方法

2012-09-17

关键词:交通网络超平面经济圈

张 兵 邓 卫

(1华东交通大学土木建筑学院,南昌 330013)

(2东南大学交通学院,南京 210096)

经济圈交通网络SVM评价方法

张 兵1邓 卫2

(1华东交通大学土木建筑学院,南昌 330013)

(2东南大学交通学院,南京 210096)

为了快速高效、科学合理地对经济圈交通网络发展水平进行评价,建立了一种新的机器评价方法——支持向量机(SVM)综合评价方法.在对支持向量机理论研究分析的基础上,应用支持向量机多分类方法建立综合评价模型,提出了基于支持向量机理论的经济圈交通网络机器评价步骤,运用Matlab 7.0软件编程实现,并在综合评价程序中选用RBF核函数.最后,分别应用支持向量机综合评价方法、神经网络综合评价方法和物元评价方法对珠三角和长三角经济圈交通网络发展水平进行评价.结果表明,当选取合适的核函数以及相应的惩罚参数时,支持向量机评价方法在多模式识别及小样本数据分类上具有明显效果,比基于BP神经网络的评价方法效率更高、更准确.因此,该评价方法能够高效地评价经济圈交通网络发展水平.

交通网络;经济圈;评价;支持向量机;神经网络

支持向量机(support vector machine,SVM)是20世纪90年代中期由Vapnik[1]基于统计学理论中的VC维理论以及结构风险最小化原理而提出的一种全新的机器学习方法.针对有限样本,SVM建立了一套完整、规范的基于统计的机器学习理论和方法,减少了算法设计的随意性.目前,SVM已成为机器学习的研究热点,国内外研究主要集中在模式识别、数据挖掘、概率密度估计、数据预测等领域[2-4],而应用SVM 进行交通系统评价的相关研究还比较少.

由于经济圈交通网络综合评价非常复杂,各个因素互相影响,呈现出复杂的非线性关系,可以看成是一个典型的非线性、高维模式的分类问题,所以本文运用SVM理论对其进行评价.根据SVM具有较强模式识别能力的特点,通过对已有小样本评价指标数据进行机器学习,计算出经济圈交通网络发展水平的正确分类,从而确定经济圈交通网络发展水平.基于支持向量机理论的综合评价完全依靠评价数据映射在高维特征空间内的分布状态,消除了评价过程中的随机性和评价专家主观上的不确定性以及认识上的模糊性,同时,评价过程可以运用计算机编程实现,操作简单,学习效率高,从而具有较高的评价效率.

1 支持向量机

1.1 支持向量机原理

支持向量机理论最初来自于对数据分类问题的处理[5].该方法的机理可以简述为:寻找一个满足分类要求的最优分类超平面,使得超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化.理论上来说,支持向量机能够实现对线性可分数据的最优分类[6].由于SVM 是以样本间的距离作为划分依据的模式识别方法,具有较好的泛化能力,其数学模型中样本仅以点积形式出现,使得这种方法很容易推广到非线性情况[7].

SVM的原理就是通过在原空间或经投影后在高维空间中构造最优分类面,将给定的属于2个类别的训练样本分开,构造超平面的依据是2类样本离超平面的距离最大化.对于线性可分问题,其原理是设定划分训练集的初始超平面,并根据最大间隔原则对其进行优化,确定最终的决策超平面(决策函数),从而使得训练集中的样本能够正确分类;对近似线性可分问题,则是通过引入松弛变量,来“软化”线性可分问题对优化间隔的要求,即允许有不满足约束条件的样本点存在,并引入一个惩罚参数加以适当限制,从而将近似线性可分问题转化为线性可分问题进行求解.而对于非线性可分问题,可通过一个非限制性核函数将输入向量映射到高维线性特征空间,将非线性可分问题转化为线性可分问题进行求解.因此,近似线性可分问题和非线性可分问题最终都可以转化为线性可分问题进行求解.

1.2 支持向量机分类模型

假设线性可分类问题的训练集为

其中,xi∈X=Rn,yi∈Y={+1,- 1},i=1,2,…,n.考虑问题为线性可分,则在Rn中必存在着超平面:

使得训练点中的正类输入和负类输入分别位于超平面的两侧,或者是存在参数对(ω,b),使得

根据规范超平面的形式及其充要条件,结合最大间隔原则,分类问题可表述成一个最优化问题:

对于近似线性可分问题,由于需要适当“软化”对间隔的要求,即允许有不满足约束条件yi((ω·xi)+b)≥1的样本点存在,故引入松弛变量 ξi≥0,i=1,2,…,n,从而得到新的约束条件:

为了避免ξi取太大的值,可引入惩罚参数C>0,在目标函数里对它们进行惩罚.于是,原始问题转化为最优化问题:

按照最优化理论中凸二次规划的解法,可将其转化为 Wolfe对偶问题来求解.因此,构造 Lagrange函数并推导出原问题的Wolfe对偶问题为

式中,αi为Lagrange乘子.

假设是对偶问题(7)的任一解,可以得到原始问题的一个解(ω*,b*,ξ*).然后计算;选择α*的一个小于C的正分量,并据此计算xj).最后构造超平面(ω*·x)+b*=0,求得决策函数:

对于非线性可分问题,引入实现线性映射的核函数K(xi,xj).选择不同的核函数K(xi,xj),可构成不同的支持向量机,其决策函数的形式为

从低维空间向高维空间映射过程中空间维数会急速增长,在特征空间中直接计算最优分类超平面将变得非常复杂,而支持向量机采用核函数则可以将这一问题转化到输入空间中进行.目前,常用的核函数主要有:

①线性核函数

②多项式核函数

③径向基核函数(RBF)

④多层感知器核函数(Sigmoid核函数)

由于RBF核函数可以将样本非线性地映射到更高维的空间中,从而解决了类别和属性间非线性的关系问题,并且RBF核函数数值限制条件较少,参数的数目也较少.而线性核函数是RBF核函数的特例,Sigmoid核函数取某些特定参数时的性能与RBF核函数相同[8].因此,本文在SVM 评价模型中选择RBF核函数.

2 支持向量机评价模型

由于在SVM中引入了最优超平面,因此,可以利用这种特性对数据进行分类,使得SVM只是一个二元分类算法,即寻找一个满足分类要求的分割平面,并使训练集中的点距离该分割平面尽可能远.然而,当运用SVM理论进行综合评价时,需要对评价对象进行评价确定其评价等级,即判断评价对象所属类,这是多元分类问题,因此需要构造多分类模型.目前,支持向量机多分类模型主要有“一对一”方法和“一对多”方法[7].由于后者具有较高的分类速度,能避免分类中的不可分区域,并且在计算机编程时相对容易实现,因此在SVM多分类评价中,多选用“一对多”方法.

2.1 支持向量机多分类方法

2.1.1 “一对一”方法

“一对一”方法(one-against-one method)是在k类训练样本中构造所有可能的2类分类器,每个分类器仅在k类中的2类训练样本上训练,分别构造k(k-1)/2个SVM分类器.在构造类别i和类别j的SVM子分类器时,样本数据集分别选取属于类别i和类别j的样本数据作为训练样本数据,并将属于类别i的数据标记为正,将属于类别j的数据标记为负.测试时,将测试数据对k(k-1)/2个SVM子分类器分别进行测试,并累计各类别的得分,选择得分最高者对应的类别为测试数据的类别.

2.1.2 “一对多”方法

“一对多”方法(one-against-rest method)的主要思想是在k类训练样本中分别构造k个支持向量机子分类器.在构造第i个支持向量机子分类器时,将属于第i类别的样本数据标记为正类,不属于i类别的数据标记为负类.测试时,对测试数据分别计算各个子分类器的决策函数值,并选取最大函数值所对应类别作为测试数据的类别.因此,该方法只需要训练k个两分类支持向量机,故其所得到的分类函数的个数(k个)较少,分类速度相对较快.但是,由于每个分类器的训练都需要将全部的样本作为训练样本,这样需要求解k个二次规划问题,因此其训练速度随着训练样本数量的增加而急剧降低.

2.2 支持向量机综合评价模型

基于支持向量机理论的综合评价实质上就是将评价对象经标准化处理,运用理想分类器经决策函数运算输出分类结果,即为综合评价等级.SVM评价不仅避免了模糊综合评价和灰色聚类等方法权重赋值和隶属函数确定中的人为因素的影响,而且在有较多评价对象时,具有较高的评价效率.SVM综合评价模型步骤为:

①确定评价的种类.若评价对象划分为e个等级,采用“一对多”分类方法,共构造e个两分类支持向量机.

②按照评价对象各评价指标的e个分类等级,每个等级分别设计m个训练样本,这样总训练样本数为me个.

③先用训练样本进行训练,对参数进行校正,通过实验确定不同的参数,然后比较选择较好的参数,这里取σ2=0.2,C=1.采用k-fold交叉验证优化参数,其基本思想是首先将样本随机等分成k份,每份中的2类样本数具有相同的比例,然后轮流选择其中1份为测试集,其余k-1份为训练集,进行交叉验证,不断调整核参数,当测试误差达到理想值时,即可得到最优核参数C和r,得到的分类器即为理想分类器.

④将评价对象数据标准化,即将数据转换到[0,1]区间内,输入SVM 模型中求解出特征值.

⑤根据输出的特征值,确定评价对象的分类.

基于SVM的综合评价模型如图1所示.

图1 基于SVM的综合评价模型

3 2种机器评价方法的对比分析

基于SVM的综合评价与基于BP神经网络的综合评价同属于机器评价,有必要对2种机器评价方法进行对比分析.

3.1 基于BP神经网络的综合评价方法

神经网络评价方法的机理是根据学习模式的数据,通过学习和训练,找出输入与输出之间的内在联系,进而求得问题的解.该方法对于弱化权重向量求解中的人为因素,是十分有益的.并且基于BP网络的评价方法能够处理含有噪声或不完全的数据,具有较强的容错能力[9].

对于线性可分数据的二值分类,如果采用神经网络来实现,可以简单描述为系统随机产生一个超平面并移动它,直到训练集合中属于不同类别的点正好位于该超平面的不同侧面,则分类完成.但是这种机理决定了其不能保证最终所获得的分割平面位于2个类别的中心,这对于分类问题的容错性是不利的.而保证最终所获得的平面位于2个类别的中心对于分类问题的实际应用是相当重要的.

3.2 SVM综合评价方法的优越性

与传统机器评价方法相比,SVM综合评价方法不仅克服了传统机器评价方法对样本数据要求过高的缺点,还有效地克服了维数灾及局部极小问题,并在处理非线性问题时计算简便、误差极小,显示了其优越性.神经网络方法虽然也能解决非线性问题,但由于其存在结构不易确定、易陷入“过学习”和局部极小等固有的缺陷,从而限制了其实际应用.

SVM综合评价方法与基于BP神经网络的评价方法相比较,其主要优点有:

1)不需要大批量的样本,而是针对有限样本.SVM能充分利用训练样本的分布特性在模型的复杂性和学习能力之间寻求最佳折中,并且目标是得到现有信息下的最优解而不是样本数趋于无穷大时的最优值,解决了样本数据不足带来的问题.

2)SVM评价模型最终将评价过程转化为一个二次型寻优问题,从理论上说,得到的将是全局最优解,解决了在神经网络评价方法中无法避免的局部极值问题.

3)SVM评价模型将复杂系统问题通过非线性变化转换到高维特征空间,并构造线性判别函数来实现原始空间中的非线性判别函数,特殊性质的核函数能保证机器有较好的推广能力并能巧妙地解决高维问题.

4)SVM评价模型的目标是结构风险最小化,同时考虑了经验风险和置信范围的最小化,因而SVM评价模型具有较好的推广能力.

4 算例分析

4.1 数据获取

根据经济圈交通网络特征,筛选出表征经济圈交通网络特性的20个指标构建经济圈交通网络指标体系,通过查找相应年鉴以及指标统计数据,计算各指标对应属性值以及预测目标年属性值,运用SVM评价综合方法进行横向和纵向对比评价.经济圈交通网络评价指标与对应属性值如表1所示.

4.2 经济圈交通网络SVM评价方法

根据SVM相关理论及SVM多分类器原理,经济圈交通网络SVM评价方法步骤如下:

步骤1 抽取训练样本和测试样本

按照评价指标体系分级标准,对应每一等级建立10组样本数据,共5×10=50组样本数据,每一组样本数据对应20个指标数值和1个对应等级值,“优”、“良”、“中”、“一般”、“差”5个等级分别用数值1~5对应.最后,在样本数据中从每个等级抽取2组数据作为测试样本,则测试样本共计10组.

表1 珠三角经济圈与长三角经济圈交通网络评价指标属性值

步骤2 评价指标标准化

由于各个指标属于不同的数量级,没有统一的度量标准,因此要对原始数据进行标准化处理,使之无量纲化和归一化.设xij(i=1,2,…,n;j=1,2,…,m)为评价系统内第i个评价对象中第j个指标的原始值,设x0j为第j个指标在各评价对象中的最优值(“效益”型指标取该指标在各评价对象中的最大值,“成本型”指标取该指标在各评价对象中的最小值),于是X0=(x01,x02,…,x0m)为该系统内的最优指标集(所对应的方案为最优方案),即参考数列.实验表明,若不进行指标标准化处理,则会降低机器评价运算速度,增加评价误差.

步骤3 构造多分类支持向量机

选择“一对多”方法构造多分类SVM模型,并基于Matlab 7.0软件以及SVM工具箱进行编程,其中核函数取RBF核函数.设惩罚因子初值C=1,σ2=0.2,用步骤1中的50个有效样本对支持向量机进行训练.将10组测试样本代入SVM模型,输出的对应类别若不符合实际,则利用k-fold交叉验证优化参数,直到输出和测试样本类别一致为止.

步骤4 判别评价对象所属类别

将指标数据标准化后的6组评价对象输入支持向量机模型(SVM综合评价程序),计算求出所属类别.当惩罚因子C=2,σ2=0.4时,分别进行5次运算,输出6组评价对象的所属类别,如表2所示.

为了验证输出类别的正确性,即评价结果的合理性,按照物元评价方法进行评价,所得到的计算结果与运用SVM分类得到的结果完全相同(见表2).为了验证SVM评价方法在机器评价中的优势,采用基于BP神经网络的评价方法[10],对同一样本数据及评价对象进行评价.设置神经网络隐层节点数为20,输出维数为5,训练次数为100,对上述50组有效样本进行训练学习,然后输入6组待评价数据,分别进行5次运算,计算结果和运算时间如表2所示.

表2 基于SVM的经济圈交通网络评价结果

由表2可看出,基于SVM的评价算法与基于神经网络的评价算法相比,计算时间至少降低了94.12%,并且经过多次连续运算结果稳定,没有出现过学习和泛化性问题.而基于神经网络的评价,经过5次运算得到的评价结论不尽相同.这是由于基于神经网络的评价机理决定了其分类最终获得的分割面相当靠近训练集中的点,从而出现“过学习”现象,造成神经网络方法的泛化性能较差.而SVM评价方法中引入了最优超平面,使训练集中的点距离该分割平面尽可能远,也就是保证分割平面两侧的空白区域最大,因此评价结果稳定性较好.

4.3 评价结论及分析

对评价结果进行分析,2020年珠三角经济圈交通网络发展水平为等级2,即发展水平为“良”,2007年、2008年、2012年珠三角经济圈交通网络发展水平为等级3,因此都处于“中等”状态,而2006年珠三角经济圈与2007年长三角经济圈交通网络发展水平则处于“一般”状态.由于评价对象X1和X6分类结果都为等级4,X2,X3和X4的分类结果都为等级3,因此需要进一步对评价对象进行优劣排序,可以根据评价对象数据映射到特征空间内与最优超平面之间的最短距离判断其优劣.计算同一等级下评价指标数据在SVM中映射到特征空间内时与超平面的距离值,结果如表3所示.

表3 经济圈交通网络SVM评价距离值

根据表3,在同一等级3时(评价等级“中”),评价对象X2,X3和X4的评价指标数据在SVM 中映射到特征空间中与超平面(分类3)的距离排序为d4>d3>d2,因此评价对象X4≻X3≻X2(“≻”表示优于),即珠三角经济圈交通网络发展水平状况为:X5≻X4≻X3≻X2≻X1.

而在输出等级为4时(评价等级“一般”),评价对象X1和X6的评价指标数映射到特征空间中与超平面(分类4)的距离相比较有d6>d1,即X6≻X1,因此2006年长三角经济圈交通网络的发展水平比同时期的珠三角经济圈交通网络发展水平要高一些.综上,可以确定评价对象的优劣排序为:X5≻X4≻X3≻X2≻X6≻X1.

5 结论

1)与传统的神经网络评价方法相比,支持向量机评价方法从结构风险最小化原则出发,求解的是一个二次型寻优问题从而得到全局最优解,有效地解决了过学习、非线性以及局部极小等问题,在小样本、非线性、高维模式下的系统评价问题中具有许多特有的优势.

2)经济圈交通网络SVM评价方法,具有评价效率高、客观性强、评价结论准确等优点,并可以运用计算机快速评价,适用于具有较多评价对象的复杂系统,因此在经济圈交通网络多指标综合评价中有着较好的应用前景.

[1]Vapnik V.Statistic learning theory[M].2nd ed.New York:Springer-Verlag,1999.

[2]邓乃杨,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2005.

[3]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报:自然科学版,2010,33(7):968-971.

Liu Wei,Sun Lin.Classroom teaching quality assessment based on support vector machine[J].Journal of Hefei University of Technology:Natural Science Edition,2010,33(7):968-971.(in Chinese)

[4]梁雪春,龚艳冰,肖迪.一种多核加权支持向量机的水质预测方法[J].东南大学学报:自然科学版,2011,41(S1):14-17.

Liang Xuechun,Gong Yanbing,Xiao Di.Novel method for water quality prediction based on multi-kernel weighted support vector machine[J].Journal of Southeast University:Natural Science Edition,2011,41(S1):14-17.(in Chinese)

[5]Boser B,Guyon L,Vapnik V.A training algorithm for optima margin classifier[C]//Fifth Annual Workshop on Computational Learning Theory.Baltimore,MD,USA:ACM Press,1992:144-152.

[6] Vapnik V,Gokowich S,Smola A.Support vector method for function approximation,regression estimation,and signal procession[M]//Advances in Neural Information Processing Systems9.Cambridge,MA,USA:MIT Press,1997:281-287.

[7]徐红敏.基于支持向量机理论的水环境质量预测与评价方法研究[D].长春:吉林大学,2007.

[8]刘坤,刘贤赵,孙瑾,等.基于支持向量机的水环境质量综合评价[J].中国环境监测,2007,23(3):81-84.

Liu Kun,Liu Xianzhao,Sun Jin,et al.Comprehensive assessment of water environmental quality based on support vector machine[J].Environmental Monitoring in China,2007,23(3):81-84.(in Chinese)

[9]陈君,李聪颖,丁光明.基于BP神经网络的高速公路交通安全评价[J].同济大学学报:自然科学版,2008,36(7):927-931.Chen Jun,Li Congying,Ding Guangming.Traffic safety assessment of freeway based on BP neural network[J].Journal of Tongji University:Natural Science,2008,36(7):927-931.(in Chinese)

[10]周伟,张生瑞,高行山.基于模糊理论和神经网络技术的公路网综合评价方法研究[J].中国公路学报,1997,10(4):76-83.

Zhou Wei,Zhang Shengrui,Gao Xingshan.A study of the comprehensive evaluation for the road network based on the fuzzy theory and neural network[J].China Journal of Highway and Transport,1997,10(4):76-83.(in Chinese)

SVM evaluation method of transportation network in economic circle

Zhang Bing1Deng Wei2

(1College of Civil Engineering and Architecture,East China Jiaotong University,Nanchang 330013,China)
(2School of Transportation,Southeast University,Nanjing 210096,China)

To evaluate the development level of the transportation network in economic circle efficiently and scientifically,a new machine evaluation method called support vector machine comprehensive evaluation method is established.The comprehensive evaluation model is built by the support vector machine multi-classification method based on the analysis of the support vector machine theory,and the steps of the evaluation of the transportation network in economic circle are proposed.Then,comprehensive evaluation procedure is realized by Matlab 7.0 software and the radial basis function(RBF)kernel is selected.Finally,the support vector machine comprehensive evaluation method,the neural network evaluation method and the matter-element evaluation method are applied to evaluate the development level of transportation network of the Pearl River Delta and the Yangtze River Delta economic circles.The results show that the support vector machine comprehensive evaluation method has a significant effect in multi-pattern recognition and small sample data classification,and it is more efficient and more accurate than the evaluation method based on BP neural network when appropriate kernel function and corresponding punishment parameters are selected.Therefore,the proposed evaluation method can efficiently evaluate the development level of the transport network in economic circle.

transportation network;economic circle;evaluation;support vector machine(SVM);neural network

U491

A

1001-0505(2012)06-1227-06

10.3969/j.issn.1001 -0505.2012.06.037

2012-04-12.

张兵(1981—),男,博士,讲师,zbing1981@sohu.com.

国家高技术研究发展计划(863计划)资助项目(2007AA11Z202).

张兵,邓卫.经济圈交通网络 SVM 评价方法[J].东南大学学报:自然科学版,2012,42(6):1227-1232.[doi:10.3969/j.issn.1001-0505.2012.06.037]

猜你喜欢

交通网络超平面经济圈
有向图上高维时间序列模型及其在交通网络中的应用
全纯曲线的例外超平面
涉及分担超平面的正规定则
2020成渝地区双城经济圈建设大事记
国防交通网络关键节点识别模型研究
以较低截断重数分担超平面的亚纯映射的唯一性问题
一种基于支持向量机中分离超平面求取的算法*
基于人工智能方法的交通网络规划发展
上海市对长三角经济圈经济辐射力的计量分析
首都经济圈建设存在问题及对策建议