APP下载

融合蒙特卡洛算法的电力工程造价预测分析

2023-12-08王冬超李维嘉陈志宾

沈阳工业大学学报 2023年6期
关键词:蒙特卡洛约简粗糙集

王冬超, 周 波, 李维嘉, 陈志宾, 孙 俊

(1. 华中科技大学 电气与电子工程学院, 湖北 武汉 430074; 2. 河北省电力有限公司 经济技术研究院, 河北 石家庄 050001; 3. 华北电力大学 能源动力与机械工程学院, 北京 102206; 4. 河北赛克普泰计算机咨询服务有限公司 软件造价部, 河北 石家庄 050081; 5. 辽宁能源投资集团 辽宁省城乡燃气股份有限公司, 辽宁 沈阳 110006)

在智能电网时代,电力工程建设关键在于如何在电力系统中科学地实现各项特性和性能指标的数字化描述[1]。随着智能化电网的快速发展和变电站建设的全面推进,智能化电力工程的建设对工程造价提出了更高的要求[2]。从长远发展来看,提高电力建设设计阶段的数据预测及总价控制水平具有前瞻性的意义,有助于提升和推动智能化电力的大规模普及[3-4]。

本文以智能化电力工程造价预测及管控策略为研究方向,着眼于电力工程设计中各阶段的造价分析,通过与传统自动化变电站对比,分析智能化变电站电力建设过程中不同技术带来的造价差异[5]。以电力工程全寿命周期的总造价成本为研究目标,通过分析、预测各个分项目的造价,确定影响工程造价的核心因素。模拟智能电站的总造价发展趋势,通过内部和外部因素寻找解决策略,为电力工程的智能化发展提供有效的理论支撑。

1 电力工程造价预测理论与设计思路

电力工程造价通常包括两个方面[6]:变电站的工程投资和工程所涉及到的人力、物力、材料等相应的市场价值总和。该价格费用一经计算完成,就具备了相对稳定性。研究将该费用划分为4个方面:设备采购、建筑材料、人力安装、其他费用。

1.1 电力工程造价预测理论

在实际应用过程中,有4种常用的造价方法:1)通过分析不同事物间的非线性关联度确定相关关系,在数据量充足的情况下尝试拟合最优线性方程;2)仿照生物界动物神经元的运行模式,采用前馈神经网络技术对非线性信息进行并行行为模拟;3)针对小样本数据的增强训练模型,通过寻找平行长平面的最优值实现对小样本数据的超平面预测;4)具有周期、不稳序列的协调规整预测理论方法[7]。上述方法旨在避免伪回归的线性存在。当存在非平稳时间序列时,数据只具有相同增减趋势,变量间缺乏因果关系,从而会使回归方程无法良好拟合。因此解决的重点是协调验证,当有多个变量时,利用多种算法验证非平稳序列的因果。本文拟采用基于粗糙集[8-9]的数据预处理理论,结合蒙特卡洛随机数据模拟的方法对电力工程造价进行预测。

1.2 研究设计思路

智能化变电站由自动化变电站升级而来,目前应用较多的智能化变电站常采用的设计形式有电力一次性设备和智能终端结合、互感器与电力合并单元相结合两种方式,其与常规自动化变电站的设计形式有显著差异。此外,目前110 kV智能化变电站的投资效益在5年后会逐渐显露,远少于预估的至少20年的寿命周期。因此,对变电站总工程造价合理区间的科学预测是指导智能变电站工程设计的重要一环[10-12]。

蒙特卡洛法是一种评价指标特征数值和概率分布的模拟算法,可以对不确定因素进行模拟,呈现评价因素的概率分布曲线。然而,在许多实际工程应用中,影响系统结果的初始因素是多种多样的,数据来源也不统一,因此如何剔除异常数据,让主要数据发挥重要作用对总造价预测具有重要意义。基于粗糙集属性约简的数据挖掘技术是新兴的数据预处理技术,通过对原始数据进行清洗剔除、归约压缩、选取重要属性因素等处理,可以较好地处理大量冗余原始数据,再结合蒙特卡洛方法,可达到最佳模拟效果。

2 电力工程造价预测方法及实验

电力工程的总造价可以看作是各个分项目的造价之和。每个分项目的单位造价又可通过历史数据获取其概率分布,这些分布具有各自形态,通过对这些分布形态的模拟可得到工程单位造价的总分布。

2.1 蒙特卡洛模拟预测

蒙特卡洛模拟算法是概率统计中一种随机测试的实验方法,主要采用积分计算,将需要计算的积分转换为随机变量g(r)的概率分布,用符号〈g〉表示,即

(1)

在原始密度分布f(r)中抽取样本点r1,r2,…,rN,得到N个随机抽样g(r1),g(r2),…,g(rN)。依据大数定律取其算数平均值作为积分估值,即

(2)

该模拟算法通过概率模型构建所求问题,并在有限范围内获得问题的近似最优解。利用蒙特卡洛算法对随机数据进行模拟计算的步骤如下:

1) 输入经过筛选、清洗的随机信息原始参数;

2) 在一定概率分布的约束下,随机选取变量值;

3) 确定具有评价指标参数的数学模型;

4) 根据模拟结果,确定评价指标的样本值。

经过上述步骤的多轮模拟计算,得出评价指标的概率分布和特征值,调整实验次数,使其结果满足精度匹配需求。

2.2 设计原理

粗糙集是一种不一致、不精确场景下分析抽象知识和数据的工具,其通过分类、规约等手段可有效得到研究对象概率。在粗糙集理论中,“知识”是对现实或抽象对象的分类结果,通过“不可分辨”的分类形成等价关系知识库。数据处理阶段,在使用条件属性集、决策属性集对知识进行表达时存在如何维持知识库大小的问题,而解决的基本策略是剔除其中不重要或不相关的属性,简称属性约简。

对电力工程造价费用结构进行分析时,首先要确定目标函数与自变量,然后对原始数据进行分析,剔除异常样本,确定单位指标造价并计算各项核心指标。电力总单位造价可表示为

C=C1+C2+…+Ci+…+CN

(3)

式中,Ci为分项单价。通过历史数据回溯,确定分项概率分布,同时将分项做模拟抽样并累加,然后对模拟结果进行统计,得到概率造价数据,最终将模拟参数与模型相拟合,实现造价预测。

2.3 电力造价预测模型的建立

首先分析目标数据,确定约束数据条件,并建立目标;然后分析删除冗余属性,并用粗糙集理论进行属性约简。其中属性约简算法采用差别矩阵,具体设计流程如下:

1) 输入一个决策表T=(U,W,F),其中:U为论域,即原域;W为条件E和决策D的非空集合;F为对象属性数值。差别矩阵定义为

(4)

(5)

属性规约是确定属性规约集的最简核心,记为Kernel。决策表中差别矩阵的原有分属性构成该决策表的相对D核,当E是决策表的一个相对约简时,即表明E相对于D核独立,记作KDE。

2) 根据差别矩阵得到Mn×n=(dij)n×n三角阵形式,遍历所有元素搜索差别矩阵,直至遇到空集退出;否则,继续步骤3)。

3) 遍历搜索得到差别矩阵的全部原分属性,并赋值为

(6)

从中得出包含相对D核的全部可能属性组合,若满足非空且属性元之间相互独立,则该集合即为约简后的属性集。

4) 输出约简属性集,算法结束。

5) 若约简属性集为用户的最少属性约简表,则继续转为蒙特卡洛方法的随机变量输入数据;否则转入上述步骤2)继续进行约简,直至最终确定最简属性集。

2.4 实证计算

在实际运行中,智能化变电站的预期寿命主要取决于基建结构、电气一次和二次设备寿命等因素,所以智能化变电站的全寿命也应从这几方面统计。基建结构若要达到极限60年,需要按照标准相应地提高建设要求。分布于变电站的断路器、开关等使用寿命通常可达到40年,而高压设备内置传感器则应大于15年,半导体器件的平均寿命为10年,电磁、机械、电解电容类器件寿命约为10年。虽然220 kV智能化变电站目前还未显示出其在全寿命周期内的投资收益,但据统计,110 kV智能化变电站在投资6年后的收回效果已初步显现。

2.5 蒙特卡洛模拟实验数据分析

本文采集不同地区的6个已完工的110 kV方案对应的智能化变电站原始工程数据进行分析,其中三相主变压器单位容量统一为50 MVA,所涉及的三相主变压器数量分别为1台、2台和3台。通过属性规约剔除异常样本后,对应的单位容量建工、购置、安装的造价费和其他费用分别如表1、2所示。

表1 单位容量造价费Tab.1 Unit capacity cost

表2 单位容量其他费用Tab.2 Other charges for unit capacity 元

利用粗糙集理论对搜集到的基础数据进行属性约简预处理,得到在电力工程总费用中占比份额较大的单位容量造价。自变量为单位容量费,包含建工费、设备费、安装费,其他费有建厂费、管理费等。其中主要分项是单位容量建工费、购置费、安装费、建场费,其造价数据分布如图1所示,其中,曲线为基于粗糙集理论的属性约简蒙特卡洛模拟曲线。

图1 单位容量分项造价分布Fig.1 Distribution of itemized cost for unit capacity

由图1可以看出,本文所提出的蒙特卡洛模拟曲线近似满足正态分布。

2.6 计算结果与分析

选取2 000组110 kV智能化变电站单位容量进行造价估值,其数据拟合分布形态如图2所示。为了便于展示,仅选取最小值为310.09元/kVA,最大值为399.76元/kVA区间上随机10次抽样数据,经计算均值为350.11元/kVA,方差约为17.23,正态分布的模拟包络曲线和实际数据分布趋势一致。显然,随着抽样数据量的增加,预测精度将会进一步提高。

图2 模拟结果拟合分布图Fig.2 Fitting distribution of simulation results

在相同数据区间抽取10组造价数据,将基于粗糙集的蒙特卡洛模拟算法与传统蒙特卡洛模拟算法进行对比,结果如图3所示,其中有效最小取值为310.09元/kVA,最大取值为399.76元/kVA。本文所提改进算法在相同造价数据下精度至少提高0.5%。

图3 基于粗糙集的蒙特卡洛与传统蒙特卡洛模拟结果对比Fig.3 Comparison of results between Monte Carlo based on rough-set and classical Monte Carlo simulations

3 结束语

蒙特卡洛模拟法通过对不确定因素的模拟,能够提供评价指标的特征值和累计概率曲线。在进行方案比选时,不但可以比较评价指标期望值的大小,还可以比较方案的风险,大幅提高了决策的科学性。但是在实际应用中,影响最终模拟结果的初始因素很多,因此,本文在智能变电站工程总造价预测中,考虑到原始数据的多样性和冗余属性,首先采用基于粗糙集理论的属性约简方法对原始数据进行规约筛选,保留主要数据;然后再结合蒙特卡洛方法定量确定预测对象概率水平,构建设计阶段工程造价预测模型,实现所需精度要求下的变电工程总造价的科学预测。实验表明,当概率置信度调整为98%时,电力工程的造价区间与预测区间保持一致。本文所提方法为造价预测提供了参考决策,也为综合提升智能化变电站电力工程设计的总造价管控能力提供了理论基础。

猜你喜欢

蒙特卡洛约简粗糙集
基于Pawlak粗糙集模型的集合运算关系
征服蒙特卡洛赛道
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
基于模糊贴近度的属性约简
利用控制变量方法缩减蒙特卡洛方差
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
蒙特卡洛模拟法计算电动汽车充电负荷
基于蒙特卡洛的非线性约束条件下的优化算法研究