基于SVM的道路路面性能评估分析与应用
2019-03-14,
,
(1.九江市公路管理局,江西 九江 342000;2.南昌工程学院,江西 南昌 330099)
0 引言
随着社会经济的发展,公路交通量不断增加,公路路面结构在交通荷载和恶劣自然环境综合作用下出现早期破损现象[1-3]。为提高道路使用寿命,保证道路使用安全,就需要对道路的使用性能进行综合评价和预测来实现科学经济的维修改造[4-7]。由于影响路面的各因素更多的是一种非线性关系,因此,传统的性能评价模型通用性受到一定的限制[8-11]。目前一些新的路面性能评价模型得到深入研究[12-15],如基于灰色理论评价,通过建立道路关联因素影响模型来解决路面评价指标的模糊特征,降低了人为影响因素,但权函数的确定、灰聚类系数等指标仍受到经验影响,具有一定主观性[16];神经网络法具有收敛速度快,自学习能力强等特点,但神经网络算法更多的是针对路面结构优化,缺乏对路面综合养护以及经费支出等的考虑[17];而马尔科夫概率预测模型能够较好地反应各影响因素对路面性能变化的不确定性,提高了预测精度,但模型仅是对状态概率矩阵的预测,缺乏对路况指标预测的直观表现[18]。
本文在综合分析相关评估模型的基础上,选择采用支持向量机(SVM)来进行沥青路面性能评估。利用SVM的超强泛化能力和易训练特点,获得全局最优解,从而对影响路面使用性能的因子进行综合评价。
1 支持向量机对分类问题的评价
1.1 线性可分问题的分类
支持向量机在对路面评价的线性可分问题分类,即是在SVM评价模型下寻找到最优分类面。如图1所示。其中实心体和空心圆代表不同类型的样本,用H作为样本间的分类超平面,H1和H2分别为距超平面最近距离且相互平行的界面,二者间的距离称之为分类间隔。SVM的最优分类面即是在保证样本训练错误率为0(样本正确分开)的同时分类间隔达到最大。
图1 线性可分数据样本Figure 1 Linear separable data samples
设样本为n维向量,该区间内l个样本所属类别表示为:(xi,yi),i=1,2,…,l,超平面H表示为:w·xi+b=0。上式中:xi∈Rn,yi∈{1,-1}l,w为权向量,b为偏置。显然对于所有样本x均满足式(1)。
(1)
将式(1)进行合并,获得归一化不等式如下:
yi(w·xi+b)≥1i=1,2,…,l
(2)
则样本集内的点xi到平面H的距离如下:
(3)
由最优分类超平面定义,则分类间隔表示为:
p(w,b)=mind(w,b,xi)+mind(w,b,xi)=
(4)
(5)
对于线性可分训练集,对应的优化问题为:
S.t:yi(w·xi+b)≥1
(6)
引入拉格朗日乘子ai,将上述优化条件转化为求解拉格朗日函数:
(7)
此时拉格朗日函数在鞍点处是关于w,b的极小点。分别对w,b求导,获得训练集最优分类判别函数转变为:
(8)
在实际施工过程中,采集的数据存在较大噪声,因此,容易导致分类间隔较小或不存在。即使采用很强的核也很难将训练数据完全分开,为保证正确分类且分离距离最大前提下寻找到有效的误差分类点,引入非负松弛变量ξi,则式(2)转化为:
yi(w·xi+b)≥1-ξi
(9)
此时,相应的优化问题转变为:
S.t:yi(w·xi)+b≥1-ξi,ξi≥0
(10)
式中:C为惩罚因子,且C>0,C越大,则对错分样本约束越大[19]。保证样本到超平面距离最大,提高泛化能力,同时尽量降低最小误差量。同样对引入ξi变量的优化问题进行拉格朗日变化,有:
(11)
(12)
根据KKT定理,可得最优解满足:
ai,βi,ξi>0,
ai[yi(w·xi+b)-1]=0,
βiξi=0
(13)
(14)
训练集的最优分类叛变函数转化为:
(15)
1.2 非线性可分问题的分类
对于分线性分类超平面,如图2所示。各样本间很难用直线来进行划分,因此,采用超曲面概念来进行过样本划分。超曲面中并没有平面间隔问题,因此,建立一个样本映射关系来讲超曲面问题转化为寻找超平面关系。
图2 非线性不可分数据样本Figure 2 Nonlinear indivisible data samples
设样本xi通过相互映射关系Ψ:x→H将向量xi映射到高维特征空间H。当空间H中建立了最优超平面后,训练算法中只需要获得空间点积信息,空间H只需要在进行内积运算,只要核函数K(xi,xj)满足Mercer条件[20],对应某一变换空间内积为K(xi,xj)=ψ(xi)·ψ(xj),能有效避免“维数灾难”问题[21],而并不要求知道映射关系Ψ,确定训练集最优分类判别函数为:
(16)
其中,xi为支持向量,则式(4)为一个支持向量机,类似于一个神经网络的分类函数形式,输出量为神经网络中中间层节点的线性组合,各中间层节点分别与相应的输入样本和支持向量内积互为关系。
计算中,利用核函数的训练作用将原空间中非线性样本转化为特征空间可分的线性训练样本,该类训练函数包括了线性核函数、径向基函数核函数、二层神经网络Sigmoid核函数等。本文中根据沥青路面性能评估指标的选定标准,选择采用径向基核函数进行样本划分:
K(xi,x) =exp(-γ‖xi-x‖2),γ>0
(17)
式中:γ为核函数参数。
为确定支持向量机的参数,本文在对比人工法、双线性法以及网格法的基础上,决定采用交叉验证法寻找SVM参数。通过5-fold交叉验证[22],对C和X设置初始值和结束值,设定步长分别为1和-1,将样本代入libSVM软件模型中进行精度测试。
1.3 多分类问题
对于多值分类问题,常见的有一对多分类器、一对一分类器和多级B支持向量机分类器。相关试验结果指出[23-24],“一对多分类器”能更好的解决路面性能的分类。即将某一种类别样本作为一个类别,其余样本作为另一类别,并在第K类和其他K-1类间构建新的超平面。基于该种条件下,系统仅需构建K个SVM,对应的各SVM将某一类数据从其他类别中鉴定出来。
2 路面性能评价实例验证
2.1 样本数据归一化
长株高速路段位于京广高速主干线湖南境内一段,连接长沙、株洲等地,线路主线长48.35 km,双向四车道,全封闭,设计时速100 km/h。全线路面结构分为连续配筋混凝土路面、沥青混凝土路面、钢筋混凝土路面。本文以K369+369~K408+612段检测数据进行分析,选定路面状况指数(PCI)、错台指数(CT)、平整度指数(RQI)、脱空指数(TK)、抗滑性能指数(SRI)作为评定指标,评价标准分为优(85~100分)、良(70~85分)、中(50~70分)、差(0~50分)四个级别,路段的原始检测数据见表1所示。
表1 路段原始数据得分表Table 1 Section raw data score table评价指标检测数据评价指标检测数据PCI84.6TK76.4CT75.3SRI86.3RQI89.2
对样本进行归一化处理,将样本归一化处理为[0,1]区间样本值,并取路况评价指标分级标准平均值作为阈值,建立归一化计算公式:
(18)
表2 路况评价数据归一化表Table 2 Normalization of road condition evaluation data评定指标评定级别优良中差检测数据归一化PCI10.7780.51800.882SRI10.7780.51800.906CT10.7780.51800.745RQI10.7780.51800.956TK10.7780.51800.762
2.2 分类判别函数评价
以I类(优类)分类函数为例,确定输入输出函数:
X1=[1.000,1.000,1.000,1.000,1.000]
X2=[0.778,0.778,0.778,0.778,0.778]
X3=[0.518,0.518,0.518,0.518,0.518]
X4=[0.000,0.000,0.000,0.000,0.000]
(19)
取径向基核函数K(gi,g)=exp(-γ‖xi-x‖2),γ>0建立SVM回归模型。基于交叉验证法获得模型的C=10,γ=0.5,借助maltab8求解可得K(x1,x1)=exp(-0.5‖x1-x1‖2)=1;K(x1,x2)=0.800 9;K(x1,x3)=0.617 6;K(x1,x4)=0.367 8;K(x2,x2)=1;K(x3,x2)=0.771 2;K(x3,x3)=1;K(x4,x2)=0.459 5;K(x4,x3)=0.595 3;K(x4,x4)=1。
(20)
采用maltab工具对二次优化函数输入进行计算,获得相应评价指标的输出值,即:x=[9.403 5,8.169 8,0.308 8,0.929 2],z=-6.909 0,对应的评价值分别为a1=9.403 5;a2=8.169 8;a3=0.308 8;a4=0.929 2。
i=1,2,3,4
(21)
同理,获得其他评价等级的分类方程以及对应的评价指标值:
i=1,2,3,4
(22)
i=1,2,3,4
(23)
i=1,2,3,4
(24)
下面针对路段1的测试数据进行评价,将Xc=[0.882,0.957,0.906,0.745,0.762]输入值带入到优化函数中,获得K(x1,xc)=0.825,K(x2,xc)=0.885,K(x3,xc)=0.626,K(x4,xc)=0.826。带入优化分类器中得:
sgn(-2.162)=-1
可以判定该路段不再I类(优)等级。同样带入良分类器中,计算可得:
sgn(1.845)=1
可判定该路段为II类(良)等级。
3 结语
a.采用SVM路面性能评价模型对线性可分样本的分类,建立线性分类超平面,将线性样本转化为样本训练错误率为0时的最优分类间隔最大值,通过引入非负松弛变量ξi保证正确分类且分离距离最大前提下寻找到有效的误差分类点。
b.对非线性分类超平面,采用超曲面进行样本划分,建立由超曲面转化为寻常超平面关系的样本映射关系。引入核函数将非线性训练转化为可分的线性训练样本,并基于交叉验证法寻找SVM参数最优值。对于SVM的多类分类问题,通过“一对多分类器”来实现路面性能多值分类。