APP下载

输变电工程造价水平智能评估与监测方法研究

2021-07-29徐雄军黄丞远薛田良

电力学报 2021年2期
关键词:特征选择工程造价监测

杨 龙 ,徐雄军 ,黄丞远 ,薛田良 ,张 磊

(1.国网孝感供电公司 运维检修部,湖北 孝感 442000;2.三峡大学 电气与新能源学院,湖北 宜昌 443002)

0 引言

要实现电网高质量发展,专业化、精准化的输变电工程造价管理是其重要的基础。而做到专业化、精准化的输变电工程造价管理首先需要解决的是如何对现有工程进行造价水平进行评估,只有在已知现有造价水平的情况下才能进一步评估和监测在建工程的造价情况,从而实现精准动态造价管控。但是,目前鲜有针对输变电工程造价水平的评估方法研究,此缺失影响了输变电工程的投资管控效率。

目前,对输变电工程造价进行管控,主要从两方面进行。一是从影响造价水平的因素入手,通过筛选主要影响造价水平的因素对工程整体造价进行定性分析。文献[1]从影响深度入手,对影响变电工程造价的16个主要因素进行递阶层次关系分析,按照递阶关系,把影响因素分为深层原因、浅层原因及表层原因,把深层原因确定为关系因素。文献[2]从造价影响因素因果链角度,采用系统解释结构模型ISM,找到了影响工程项目造价的表层原因、中层原因和深层次原因。文献[3]针对设计阶段的造价影响因素进行了分析。文献[4]针对输电线路工程造价影响因素进行了分析,采用筛方法选择了杆路长度、输送容量、地形综合系数、线材价格、风速、塔材价格、覆冰7个指标为工程造价主要影响因素,并进行了工程检验。文献[5]从影响造价的全责角度,把造价影响因素归结为客观原因、建设方原因、设计原因和施工原因等4个方面。文献[6]从相关性角度,分析出了电缆能耗、经济指标和运行长度三个关键影响因素。另一种研究思路是结合某一具体工程造价指标对工程造价情况进行研究。文献[7]以工程决算投资为指标,针对220 k V变电工程,通过识别关键因素构建支持向量机评估模型,结合工程进行造价评估。文献[8]通过工程概算投资,构建REGR-WNN组合变权模型,对工程造价进行监测。文献[9]结合工程静态投资,以随机森林和支持向量机建立智能概算估算模型,结合实例验证了该方法的有效性。

无论是从影响造价水平因素入手,还是从某一具体工程造价指标出发,都给现有输变电工程造价管控提供了一定的决策依据。然而上述方法仅通过已知数据进行统计分析计算,是一种典型的事后控制策略,统计分析结果如何体现输变电工程造价水平?统计数据变化后造价水平会如何变化?如何对正在进行的工程进行造价水平监测预警?上述问题在目前方法下还无法有效回答。随着人工智能技术在各行业的广泛应用,通过对输变电造价历史数据库的深度学习,进行输变电工程造价水平监测成为解答上述问题的一种可行方法。

为此,本文提出一种输变电工程造价水平智能评估监测方法,主要结合机器学习解决高维小样本特性造价数据带来的影响,并实现智能化的电网工程造价水平评估监测过程。基于某省工程造价数据,证明所提方法的可行性。

1 输变电工程造价数据特征分析

输变电工程主要包含变电工程、线路工程、通信工程三大类。表1给出了某省2010年—2018年输变电工程造价数据库各类工程样本容量及样本特征维度统计结果。如表1所示,各类型输变电工程造价原始样本经数据预处理后,可用于输变电工程造价监测的样本仅占原始样本的50%左右。另一方面,由于输变电造价过程的复杂性,现有各类工程的造价特征维度达到了106维(平均维度)。因此,输变电工程造价数据库具有明显的高维小样本特性。

表1 输变电工程造价数据特征Tab.1 Data characteristics of transmission and transformation engineering cost data

一方面,特征维度高、样本容量小的高维小样本数据会造成单一维度的绝对样本容量偏少,在造价水平评估过程中出现“过拟合”现象;另一方面,高特征维度又会为带来“维数灾”问题。这都会严重影响工程造价水平评估的精准性。因此,为实现精准化的输变电工程造价水平评估监测,需要对原始的工程造价数据进行特征选择处理[10]以消除高维小样本特性带来的不良影响。

2 基于随机比特森林的输变电工程造价数据特征选择方法

为减小高维小样本造价数据带来的特征选择稳定性问题,考虑采用基于深度比特神经网络的随机比特森林(Random Bits Forest,RBF)学习算法[11],提出了一种RBF-RCE输变电工程造价数据特征选择方法,如图1所示。该方法主要分为如下三步。

(1)步骤1,输变电工程造价数据特征辨识聚类。主要采用K均值聚类算法(K-Means Clustering)对样本特征进行聚类筛选,形成m个特征聚类,特征fi与fj之间的相关距离定义如式(1)所示:

(2)步骤2,输变电工程造价数据特征重要性计算。基于Bootstrap重采样获得M组训练样本集,以及袋外测试集(Out of Bag,OOB)。在此基础上,对所有特征进行随机特征置换,获得置换训练集。把训练集和特征随机训练集分别用随机比特森林算法进行准确率学习,得到OOB准确率γi和γfij。然后采用公式(2)~公式(5)计算特征重要度fimp:

(3)步骤3,剔除多余特征,形成最终特征子集。首先根据特征总数设定特征类,删除阈值p和特征数,删除阈值q,后续分为如下三种情况考虑:

①根据步骤1,当完成输变电工程造价数据特征辨识聚类工作后,若所取得的特征类m大于p值时,删除特征得分最低特征类中的d×10-2特征,具体删除特征数量根据m而定。

②当特征类m小于p,且特征得分最低特征类中特征数大于q时,则删除特征得分最低特征类中的d×10-2特征。

③当特征类m小于p,且特征得分最低特征类中特征数小于q时,则不做特征删除,直接构成新的样本特征子集。最后判断是否满足终止条件,若满足,则输出为最终特征子集;若不满足,返回第一步进行迭代。

通过RBF-RCE特征选择方法,能够实现对高维造价数据的降维处理,同时有效扩充了工程样本数量,进而避免由工程造价数据的高维小样本特性,对后续分类学习可能造成的“维数灾”以及过拟合现象的不良影响。RBF-RCE特征选择方法的提出,有效解决了以往针对工程造价数据的处理方法缺乏的困境,为后续的数据识别分类的准确性提供了有力保障。整体的RBF-RCE工程造价数据特征选择方法如图1所示。

图1 RBF-RCE特征选择方法Fig.1 RBF-RCE feature selection method

3 输变电工程造价水平智能评估监测方法

3.1 动态造价水平评估监测指标

为衡量输变电工程造价水平,本文建立了动态造价水平评估监测指标(Dynamic Cost Level,DCI),如式(7)所示。

式中,ESI,i(Estimated Static Investment,ESI)为工程i的概算静态投资,FSI,i(Final Accounts Static Investment,FSI)为工程i的决算静态投资。其评价标准如式(8)所示:

式中,α为造价水平合格临界值,大于α表明该工程造价结果不满足平均造价水平要求,输出结果0;反之,则表明该工程符合造价水平要求,输出结果为1。然而,实际评估过程中如何选择α的值,是一件困难的事情,主要有以下两方面考虑:

(1)变电工程、线路工程与通信工程要因具体工程类型的不同来选择不同的α值,才能实际反映工程的造价水平。

(2)常规输变电工程技术经济管控中有一个期望指标(α*),该指标表示从技术经济管理角度需要达到的理想DCI值。但是现有数据分析表明,大多数工程是无法严格达到这一理想指标的α*,如果采用α*作为造价水平合格临界值,造价评估监测结果将无法反映真实的造价水平。

为此,提出了一种分段区间指标选取方法作为可行的解决途径。通过综合2011年—2018年三类工程的造价数据库分析三类工程DCI分布情况,变电工程的DCI指标95%以上分布在(0,0.32)区间内,线路工程DCI指标95%主要集中在(0,0.3)内,而通信工程的DCI指标有95%分布在(0,0.45)区间。为此,根据不同工程类型的实际情况设置阈值,可得改进的输变电工程造价水平评价准则如式(9)所示:

式中,α0为不同工程的DCI指标上限,取值分别为0.32(变电工程),0.3(线路工程),0.45(通信工程),超过即代表该项工程造价超标。α*为造价期望值,取值一般在0.1到0.2之间。

3.2 输变电工程造价水平智能评估模型

造价水平智能评估监测模型主要分为三个模块,分别为造价数据处理模块,数据分类学习模块以及在线评估监测模块。以造价数据处理模块为起始,通过数据分类学习模块,最终凭借在线评估监测模块实现对工程的实时在线造价评估监测,具体的工程造价水平智能评估监测方法如图2所示。

在图2中,三个模块结合形成了整体的工程造价水平智能评估监测方法,关于各模块的具体描述如下所述。

3.2.1 造价数据处理模块的构造

在工程造价数据处理模块中,主要涉及对原始工程造价数据的收集以及在此基础上的数据处理工作。针对工程造价数据库,采用上文提及的RBF-RCE特征选择方法进行造价数据预处理,使处理后的造价数据不再具有高维小样本特性,保证最后的在线评估监测模块能够正常工作,得到准确的评估监测结果。通过将工程造价数据库与特征选择方法的整合,构造成造价数据处理模块,负责对工程造价数据进行学习分类前的数据预处理工作。

3.2.2 数据分类学习模块的设计

本模块的设计目的是通过训练得到一个最优评估器以完成后续的在线评估监测工作。通过将造价数据处理模块处理后的造价数据直接输入到数据分类学习模块中进行分类学习。考虑需要实现较好的学习效果,采用集成学习的方式,集合多个学习器,对处理后的工程造价数据进行学习分类。在集成学习的基础上,造价水平智能评估监测模型通过结合一种基于NP准则的伞式集成学习方法。该方法,将多个基础较弱的学习器结合NP准则改进得到新的学习器(如NP-ADA、NP-SVM等)。结合NP准则,使原本的基础较弱的学习器的学习能力得到提升,能够对工程造价数据进行更好的学习分类。在接收到预处理的造价数据后,通过图2中流程筛选出最优的学习评估器。根据多个改进学习器得到的结果,进行评优筛选,结合最优评估器筛选评价机制,选取最终分类结果最精准的分类器作为最优评估器进行后续的在线评估监测,具体的评优机制采取投票策略[12],具体如式(10)所示:

式中,hi(x)为各基础学习器的分类结果,Ci为最优取值,H(x)为输出的最优评估器。

结合投票策略筛选出最优评估器后,将最优评估器作为对工程进行造价评估监测的基础,与后续的在线评估监测模块结合,完成最终对工程造价水平的在线评估监测过程。

3.2.3 在线评估监测模块的搭建

在上述模块筛选出最优评估器后,通过最优评估器与RBF-RCE特征选择方法结合构成在线评估监测模块的核心。当存在待评估监测造价水平的工程时,将其具体造价数据输入到在线评估监测模块中,待评估监测造价数据首先通过RBF-RCE特征选择方法进行特征选择处理,经过特征选择后的数据输入到最优评估器中进行评估监测。最优评估器采取在线实时评估监测的方式,以电网工程造价大数据为基础,通过最优评估器学习得到的工程造价评估结果纳入工程造价大数据库中,与同类型工程的造价水平进行实时在线的分析比对,进而得到精准化的工程造价水平评估监测结果,实现实时在线化的电网工程造价水平智能评估监测。

4 算例验证

通过选取某省2010年—2018年造价数据库作为测试数据,采用结构系统解释模型ISM与本文提出的输变电工程造价水平智能评估监测方法同时对该组数据进行评估分析,并对评估结果加以比较,用以校验智能评估监测方法的有效性。

在实例验证中,从造价影响因素因果链的角度出发,以22类主要影响工程造价的因素为主,对工程整体造价进行评估分析。采用ISM模型对该组数据进行分析评估,得到如表2所示的造价评估结果。

表2 ISM造价评估分析结果Tab.2 ISM cost evaluation analysis results

表2中工程类别一栏数字1代表变电工程,2代表线路工程,3代表通信工程。综合分析,通过ISM模型对工程整体的造价评估分析得到的DCI与实际工程计算得到的DCI的平均偏离在6%左右,最大偏差达到12%,部分工程因评估DCI偏差较大导致最后评估结果出现问题。

采用本文所提的基于伞式NP集成式输变电工程造价水平智能评估监测方法,对该组数据进行评估分析,得到如表3所示的造价评估结果。

表3工程类别中数字含义同表2。由表3可知,利用本文所提的智能评估监测方法进行评估,得到的工程DCI与实际工程计算的DCI精确度平均不到2%,最大精确度为5%,此结果总体优于传统ISM模型的评估结果。即使出现评估DCI存在偏差的情况,也未对最后的评估结果造成影响,由此可知本文所提的智能评估方法能够给出符合实际工程造价的评估分析结果。

表3 智能评估监测方法造价评估分析结果Tab.3 Intelligent evaluation and monitoring method cost evaluation analysis results

相比传统的ISM模型,基于伞式NP集成式输变电工程造价水平智能评估监测方法得到的工程造价水平更加精准化,证明了其具有工程应用前景。

5 结论

本文所研究的基于伞式NP集成式输变电工程造价水平智能评估监测方法相比传统ISM模型评估工程造价水平方法,通过针对性处理工程造价数据高维小样本特性,解决造价数据“维数灾”及“过拟合”问题,有效优化提高了工程造价评估结果的精确性。相较于传统ISM模型评估方法,基于伞式NP集成式输变电工程造价水平智能评估监测方法的评估结果的精确度提高了4.40%,解决了传统ISM模型对于工程造价水平评估费时费力且误差较大的问题,具有较好的工程实际应用前景。

猜你喜欢

特征选择工程造价监测
特色“三四五六”返贫监测帮扶做实做细
建筑工程造价预结算审核探讨
建筑工程造价预结算审核与实践举措
工程造价管理控制探讨
民用建筑工程造价超预算与解决方法
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法
网络安全监测数据分析——2015年12月