APP下载

高维小样本条件下的变电工程造价预测研究

2016-02-07王绵斌王建军张晓曼

湘潭大学自然科学学报 2016年4期
关键词:高维降维变电

齐 霞, 王绵斌, 张 妍, 王建军, 张晓曼

(1. 国网冀北电力有限公司 经济技术研究院,北京 100045; 2.华北电力大学 经济与管理学院,北京 102206)

高维小样本条件下的变电工程造价预测研究

齐 霞1, 王绵斌1, 张 妍1, 王建军2*, 张晓曼1

(1. 国网冀北电力有限公司 经济技术研究院,北京 100045; 2.华北电力大学 经济与管理学院,北京 102206)

利用因子分析方法对影响输变电工程的因素进行了筛选,建立适合小样本条件下的概算估算模型.通过某地区的实例分析,证实了提出方法的有效性.

输变电工程;造价预测;小样本

为应对环境污染以及全球资源日趋减少等问题,社会对节能减排、环境友好型新能源的发展与探究等要求日益提高,因此,对作为清洁电能运输保障基础的输变电工程的要求也不断增强.在输变电工程建设环节,如何控制输变电工程造价问题是一个非常重要的问题.然而,由于输变电工程涉及的因素众多,使得审核人员在审核输变电工程造价时,能够参考的可类比的输变电工程十分有限.目前的审核中,多是依靠审核人员的相关经验进行主观上的推测,缺乏科学定量化的手段进行估算.因此,研究高维小样本条件下的输变电工程造价估算问题,辅助输变电工程造价管理控制成为一个研究热点.在小样本的条件下,对研究对象进行预测的一个思路是在原有的样本条件下尽可能地利用已有样本的信息进行扩展,得到适合统计模型的样本量,对研究对象进行建模预测.但是有学者研究指出,基于大量统计样本的预测模型,如线性回归、神经网络等不再适用,并且在多属性的情况下首先需要做的工作是降维[1-2].很多学者对小样本数据预测建模进行了研究,如灰色预测模型[3-4],支持向量机模型[5]等.上述研究均取得了不错的成果,但是目前对于输变电工程造价的小样本预测估算问题还很少见到.由于在实际输变电工程造价时,不同线路电压等级、地形、出线方式、建设规模等因素均会造成工程造价的较大偏差,因此,在某工程造价估算审核时,将使得审核人员的可参照类比工程有限,需要建立高维小样本条件下的估算模型帮助审核人员给出该工程造价的审核参考值.本文以输变电工程中的变电工程为研究对象,构建了高维小样本条件下的变电工程造价预测估算模型.首先采用因子分析方法中的主成分分析方法对影响变电工程造价的高维情况进行降维处理,在此基础上,构建适用于小样本条件下的支持向量机预测模型对变电工程造价进行估算,为变电工程的造价控制提供借鉴.

1 研究方法

1.1 高维小样本条件下变电工程造价预测思路

输变电工程造价可以分为两类,包括输电线路工程造价数据和变电工程造价数据,其中变电工程指的是在输变电工程中对变电站进行建设的工程,其造价包括安装工程费用、建筑工程费用和其他费用三个部分.安装工程包括主变安装、配电安装、无功、控制、通信、远动、电缆接地等工程,建筑工程包括主变、配电相关建筑、供水系统等.影响整个变电工程的造价环节众多,每个环节控制造价的因素众多.因此,往往在收集一个工程项目数据时,其属性有近百个,加上影响整个变电工程造价的变电规模、建筑规模、电压等级等,影响变电工程的因素更加复杂,对某个变电工程造价进行估算控制时,可类比的工程偏少.在此种情况下,应该首先对变电工程造价的历史数据进行降维处理,然后利用降维后的因素对造价的历史数据进行分类,在分类的基础上对其进行小样本条件下的预测建模工作,从而得出预测结果.

1.2 利用主成分分析方法进行降维处理

对影响因素进行分析的方法简称为因素分析法,该方法是利用相关方法(多为统计方法)对研究对象和相关影响因素之间的影响程度进行定量化的分析.因素分析法分为单个因素分析法和多因素分析法等,在属性筛选上应用得较为广泛.较为常用的因素分析法有主成分分析法.

对数据降维处理较为常用的方法是主成分分析法.主成份分析法化繁为简,借助线性转换,经过投射的方法将高维数据转化到低维空间中去处理,通过转换能够删减重复,并在保留大部分原属性信息的条件下精简属性.主成分分析法在经投射形成的坐标中,以原始数据方差为依据,将其看成信息贡献率,依据信息贡献率将各个成分进行排序,并作为属性筛选的参考值.应用主成分分析法进行属性筛选的步骤如下:

(1) 确定样本矩阵并标准化. 选取样本集,构建样本矩阵X=(xij),1≤i≤m,1≤j≤n.其中xi=(xi1,xi2,…,xim)′表示样本记录数,x=(x1,x2,…,xn)表示指标,并将矩阵标准化.

(2) 计算标准化后矩阵的m个指标的协方差矩阵相关系数矩阵R,其中矩阵中元素 rij的计算为

(3) 计算特征值λ,并按照大小排列,根据特征值计算各成分的方差贡献率αi及累计方差贡献率bi,其计算方式分别如下:

确定筛选后因素也就是主成分的标准一般有两个:或者是定义一个累计贡献度,取达到该累计贡献度以前的所有因素,一般取为85%;或者是选取特征值大于1的因素.

1.3 支持向量机预测方法

支持向量机继承了神经网络的优点,并且改进了神经网络的全局寻优能力,使得使用同样样本训练后的预测值为唯一值,并且在小样本下表现良好的特性.该方法是目前预测方法中的较新的方法,在小样本的情况下被认为是能够完全替代神经网络的智能预测方法.支持向量机的基本原理如下:

假设有训练样本集G={(xi,di)},i=1,…,N, xi∈Rn,di∈R1.支持向量机预测模型是将样本点x映射到高维空间F中,构建下述估计函数进行线性回归:

y = f(x)=wψ(x)+b,

其函数逼近问题等价于如下函数最小:

其中‖w‖2/2表示的是函数的平滑程度, Lε(d,y) 称为ε-敏感损失函数.通过引入松弛变量ζ、ζ*和拉格朗日公式进行转换,可将上式变成

利用Karush-Kuhn-Tucker条件和对偶理论求目标函数的极值,可以将原问题转化为:

求解上述问题可得到支持向量机回归函数:

式中K(xi,xj)称为核函数,需要满足Mercer条件,一般选取高斯核函数

K(xi,xj)=exp(-||xi-xj||2/2s2) .

2 实证分析

对某区域变电站工程造价审核后的概算数据进行收集,共收集到执行新规定后的具有标准数据的变电工程42项,其中500 kV及以上等级3项,220 kV等级9项,35 kV等级及以下7项,110 kV等级的变电工程23项.通过资料的收集情况可以看出,线路工程历史造价资料主要集中在110 kV等级,其余电压等级的工程资料样本量太少,因此选择110 kV的变电工程作为样本实验数据.110 kV的变电工程对应的属性指标近百个.历史资料中,变电工程属性指标主要有:主变容量、静态投资、动态投资、本期电容器规模、110 kV本期出线、35 kV本期出线、10 kV本期出线等.

表1 变电工程主成分分析结果表

首先,利用上文中的主成分分析法对变电工程进行降维处理,在降维计算前,为了消除量纲影响,首先利用归一化将各指标数据归结到[0,1],利用Matlab进行计算,可以得到主成分分析后的结果,如表1所示.通过结果可以看出,筛选后的属性因素有本期规模、占地投资、电力电缆投资、控制电缆投资、建筑投资、土石方投资这6个属性对造价技术经济指标贡献率达95%以上.

结合得到的属性筛选结果,对样本数据按照4∶1的比例进行分割,即选择80%的工程数据作为训练样本,其余20%左右的工程数据做为测试样本,利用Matlab libsvm工具箱进行支持向量机模型的构建,输入变量为上述筛选出的6个变量,输出变量为工程的静态投资,利用libsvm中的默认优化参数设置进行预测,其预测结果如图1所示.

从图1中可以看出,整个样本集的预测结果均表现不错,基本和原值曲线吻合.曲线前半段较后半段拟合效果更好,说明预测结果在训练集部分表现较测试集部分更好,具体的误差分析如表2所示.

表2 利用支持向量机给出的最后预测结果及误差分析

表2中的静态投资的数值是归一化后的数据,其中训练集的平均绝对误差(MAPE)是1.37%,而测试集的平均绝对误差是1.8%,所有测试点的误差不超过3%,最大值为2.78%,结合电力工程造价的误差标准规范,在5%以内的概算造价均符合实际要求,因此所建模型可以满足实际工作的需要,表明了模型的有效性.

3 结 论

本文对高维小样本情况下的变电工程造价预测估算问题进行了研究,针对多因素高维情况,首先利用因素分析法中的主成分分析方法进行降维处理,选取累计贡献率达95%以上的6个因素作为小样本下支持向量机预测模型的输入变量,对工程造价的静态投资进行了预测,所得预测结果经过测试检验能满足实际工作的需要,可以为输变电工程造价审核控制提供参考.

[1] 谢力,魏汝祥,蒋国萍. 基于分片逆回归的小样本组合预测建模方法[J]. 统计与决策,2013(2):73-76.

[2] 谢力,魏汝祥,蒋国萍,等. 基于局部线性嵌入的小样本组合预测方法[J]. 统计与决策,2015(9):9-12.

[3] 王正新. 基于傅立叶级数的小样本振荡序列灰色预测方法[J]. 控制与决策,2014(2):270-274.

[4] 曾波,孟伟. 基于灰色理论的小样本振荡序列区间预测建模方法[J]. 控制与决策,2016(7):1311-1316.

[5] 陈保家,陈雪峰,田红亮,等. 小样本条件下的设备实时可靠度预测研究[J]. 现代制造工程,2015(1):1-8.

责任编辑:龙顺潮

Transmission Project Cost Forecasting under the High-dimension Small Sample Conditions

QIXia1,WANGMian-bin1,ZHANGYan1,WANGJian-jun2*,ZHANGXiao-man1

(1.Electric Power Economic Research Institute in Northern Hebei Technology, State Grid, Beijing 100045; 2. School of Economics and Management,North China Electric Power University, Beijing 102206 China )

This paper uses the factor analysis method to select the important factors from high dimensional conditions at first, and establishes a suitable estimate model under the condition of small sample. Finally, a case study of a certain region is given and the results show that the proposed method is effective.

transmission project; cost estimation; small sample

2016-04-23

国家自然科学基金项目(71401054)

王建军(1981—),男,吉林 白山人,博士,副教授. E-mail:chgc8@126.com

TP29

A

1000-5900(2016)04-0112-04

猜你喜欢

高维降维变电
有向图上高维时间序列模型及其在交通网络中的应用
混动成为降维打击的实力 东风风神皓极
浅谈变电运行中继电保护问题
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
变电运行技术在电力工程中的应用
高维洲作品欣赏
基于矩阵模型的高维聚类边界模式发现
对变电运行防误闭锁装置的分析
220kV变电运行中的故障排除方法探析