基于支持向量机的泥石流危险性评价★
2014-08-08于建洲
于建洲 袁 颖
(石家庄经济学院勘查技术与工程学院,河北 石家庄 050031)
基于支持向量机的泥石流危险性评价★
于建洲 袁 颖
(石家庄经济学院勘查技术与工程学院,河北 石家庄 050031)
采用支持向量机的计算方法,对云南省7个样本集的评价指标数据和目标值进行了分组训练和测试,建立了泥石流危险性评价模型,达到了较明显效果,指出该方法在泥石流危险度划分中具有较好的利用价值。
泥石流,支持向量机,危险性评价
0 引言
泥石流是一种常见的山区地质灾害,具有突然爆发、能量大、来势凶猛、破坏力极强的特点,常瞬间就能淹没村庄、农田,冲毁道路桥梁等建筑物,给山区人民生命安全、经济发展和建筑交通造成极大威胁和损害。因此,泥石流危险性评价在土地应用、城镇规划道路选线等减灾预案中都具有重要作用[1]。
泥石流危险性评价是根据泥石流危险度划分出各区域(或单沟)泥石流危险等级的方法,其本质属于模式识别问题[2]。泥石流危险性评价现在常用神经网络的方法[3],神经网络方法需要大样本作为基础,而大量泥石流数据的采集存在一定困难。本项目引入支持向量机的方法进行泥石流的危险性评价。支持向量机是一种机器学习算法,可以有效的解决小样本、非线性及高维模式识别问题[4]。
1 支持向量机理论
支持向量机的主要特征是引入了结构风险最小化代替了经验风险最小化,核心思想是把数据非线性映射到高维核空间,在核空间构造具有低VC维的最优分类超平面[4-6]。以二分类数据为例,对于给定的训练样本:(xi,yi),i=1,2,…,l,x∈Rn,y∈{±1},超平面记为(w,x)+b=0,为使分类面对所有样本正确分类且具备分类间隔,就要求满足如下约束:
yi[(w·xi)+b]≥1(i=1,2,…,l)。
可以计算出分类间隔为2/‖w‖,因此构造最优超平面的问题就转化为在约束条件下求:
引入Lagrange函数:
其中,ai>0为Lanrange乘数,则xi为支持向量,得到它的对偶问题:
计算最优权值向量w*和最优偏置b*,分别为:
构造超平面(w*·x)+b*=0,由此可得最优分类函数为:
f(x)=sgn{(w*·x)+b*}=
核函数是支持向量机应用研究的关键,直接决定最终的效率和性能。支持向量机大多数是非线性的,不同的核函数有其自身的特性,本论文借鉴了原立峰等[7]的研究成果,选用RBF径向基函数,其具有较强的非线性映射能力,应用极为广泛。
2 泥石流危险性评价SVM模型的建立
2.1 评价指标
泥石流沟岩性及构造特征的复杂性,决定了影响泥石流危险性的评价因子很多,刘希林等[8]对泥石流影响因子作出分析,根据其在危险度判定中起主导作用还是辅助作用分为主要因子和次要因子,通过灰色关联度分析,最终得出一次泥石流(可能)最大冲出量(L1)、泥石流发生频率(L2)为主导因子,流域面积(S1)、主沟长度(S2)、流域最大相对高差(S3)、流域切割密度(S6)、泥砂补给段长度比(S9)为辅助因子。
2.2 建立模型
本次研究选取文献[8]中云南省37条沟的259个数据为基础,根据文献[7]原立峰等对其做出的评价数据,将泥石流危险度的评价结果分为:轻度危险、中度危险、高度危险和极度危险4类(分别用1,2,3,4表示),通过上述因子评价泥石流的危险性。
本文中使用了 LIBSVM 相关工具包[9],从37个样本中剔除6个样本(包括1大箐沟、5黄龙山沟、16王官屯沟、20花沟、23蒋家沟、37白泥沟,保证每个地区有一个样本代表)作为训练样本,而剔除的部分作为测试样本,分别对原始数据进行(0,1)归一化处理,支持向量机核函数选用径向基(RBF),采用交叉验证法进行网格搜索寻找最优参数值,最终选取了惩罚因子c=4,核参数g=0.015 625,结果显示能够对训练样本和测试样本准确分类。
3 实例应用
为测试上述所建立模型的推广性,又采用黄河上游积石峡水电站库区16条泥石流沟[10]数据进行了验证,采用原始的c,g值,测试结果显示16条沟中仅有5条测试准确,而我们采用其他优化算法确定的c,g值进行预测,也只有6条准确。当我们将黄河的部分数据加入到样本数据集进行重新训练并作预测时,发现有12条沟测试准确,识别率提高到75%,此时c=512,g=1。这说明即使SVM模型对云南省37条沟的数据计算很准,但其推广和运用能力依然不能识别黄河上游积石峡水电站库区16条泥石流沟,需要添加更多的待识别区域的样本数据才能使建设的SVM具有更好地推广性和正确的识别效果,调整后的预测结果见表1。
表1 黄河上游积石峡水电站库区16条泥石流沟预测结果
4 结论与建议
支持向量机作为一种新型基于数据统计学习的机器算法,在本文的研究中运用泥石流沟的7个影响因子较有成效的解决了小样本的泥石流危险度评价问题,同时也对泥石流的防治提出了工程性等级要求。
由于本次研究训练样本仅31条,各样本的危险性等级分布不均匀,评价模型并未达最优水平,所以评价结果也存在不足。但笔者相信在今后可通过相应的改进与调试建立更好的SVM预测模型,使其适用于滑坡、崩塌等地质灾害的预测和评判。
[1] 王伟奇.中国泥石流现状及浅析[J].科技信息,2009(29):597,745.
[2] 李秀珍,孔纪名,李朝凤.多分类支持向量机在泥石流危险性区划中的应用[J].水土保持通报,2010(5):128-133,157.
[3] 刘涌江,胡厚田,白志勇.泥石流危险度评价的神经网络法[J].地质与勘探,2001,37(2):84- 87.
[4] 丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011(1):2-10.
[5] 白 鹏,张喜斌.支持向量机理论及工程应用实例[M].西安:西安电子科技大学出版社,2008.
[6] 张 蓉.基于支持向量机的泥石流危险性预测[J].信息与电脑(理论版),2012(12):29-31.
[7] 原立峰,周启刚,马泽忠.支持向量机在泥石流危险度评价中的应用研究[J].中国地质灾害与防治学报,2007(4):29-33,39.
[8] 刘希林,唐 川.泥石流危险性评价[M].北京:科学出版社,1995:15-26.
[9] 任金龙.基于支持向量的铁路泥石流危险性评价方法研究[D].成都:西南交通大学,2011.
[10] 胡亚东,傅荣华,夏克勤.黄河积石峡水电站库区泥石流危险度评价[J].灾害学,2004,19(2):36- 41.
Debris flow risk evaluation on the basis of SVM★
YU Jian-zhou YUAN Ying
(College of Survey Technology and Engineering, Shijiazhuang College of Economy, Shijiazhuang 050031, China)
The paper adopts SVM methods, trains and tests 7 samples’ evaluation index data and target value in Yunnan, establishes debris flow risk evaluation model, achieves obvious effect, and finally points out that: the method has better using value in debris flow risk assessment.
debris flow, SVM(Support Vector Machine), risk evaluation
1009-6825(2014)36-0041-02
2014-10-20 ★:石家庄经济学院学生科技基金科研重点项目(项目编号:KBG201402)
于建洲(1992- ),男,在读本科生; 袁 颖(1976- ),男,副教授
P642.23
A