APP下载

Kriging方法在输电线路气象环境建模中的应用①

2019-04-10卢耀华王胜明谢丹丹

计算机系统应用 2019年2期
关键词:插值网格化测点

卢耀华,王胜明,郭 剑,项 震,谢丹丹

(南瑞集团(国网电力科学研究院)有限公司,南京 211106)

(国电南瑞科技股份有限公司,南京 211006)

外部气象灾害导致的输电线路故障是影响电力系统安全稳定运行的重要因素之一.近年来极端外部气象灾害频发,雷电、台风、冰灾、暴雨、极端大风、沙尘暴等气象灾害对电网产生严重破坏,给电网的安全稳定运行带来极大挑战.为此如何应对气象灾害成为电力系统亟需解决的关键问题之一,气象灾害检测预警、风险防控相关理论及技术已成为电气工程领域的长期研究热点.文献[1-3]提出了电力系统应对外部自然灾害的停电防御架构;文献[4]研究了气象因子引发的电网连锁故障预测技术;文献[5,6]提出了气象因素引发的输电线路风险及故障概率评估模型;文献[7]提出了考虑天气因素的电网可靠性区间评估及其仿真算法;文献[8]阐述了电力微气象风偏灾害监测预警技术及系统的实现.但由于研究所使用的气象数据主要来源于数量有限且与电网分布不一致的气象测点,无法为研究灾害引发的线路故障提供完整的输电线路气象环境数据模型,因此需要对输电线路气象环境数据进行精细化处理.

离散数据网格化是目前科学和工程研究中数据处理的重要技术,气象数据进行网格化是对其精细化处理的有效手段[9].网格化的关键是空间插值处理,即通过已知样本点数据来估算未知样点的数据.常用的气象数据空间插值方法包括: 反距离权重法(Inverse Distance Weighted,IDW)、样条函数法(spline methods)、趋势面分析法(trend surface methods)和克里金法(Kriging methods)等[10].其中Kriging插值法不仅考虑待插值点与邻近测点的空间位置,还考虑了各邻近点之间的位置关系,而且利用已有测点值空间分布的结构特点,有效避免了系统误差产生的“屏蔽效应”,在气象数据的空间插值中得到广泛应用.文献[10,11]比较分析了几种常用的气象数据空间插值方法;文献[12]研究了普通Kriging在空间插值中的应用;文献[13]分析了Kriging插值参数设置对网格化结果的影响;文献[14]研究了网格化的尺度问题.如上所述对于气象数据的空间插值已有较多研究,但鲜有与输电线路关联气象环境数据的插值研究.

本文基于空间数据建模相关的GIS、DEM、插值方法、网格化尺度问题等关键技术,分析了Kriging插值技术的原理,实现了基于Kriging插值方法的输电线路气象环境数据网格化建模.详细分析了Kriging插值方法及其校验评价标准,并以江苏省级电网单日的温度数据为例,通过仿真实验验证了适用该区域输电线路气温数据插值的Kriging算法半变异函数模型的选取过程,为后续分析气象温度对输电线路的影响提供基础数据.

1 Kriging空间插值方法原理

Kriging空间插值法是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法.通过引进以距离为自变量的半变异函数来计算权值,既能反映变量的空间结构特性,又能反映变量的随机分布特征.半变异函数和相关分析的结果表明小区域范围内存在空间相关性,可通过Kriging算法对缺失区域进行插值估算;另外,通过半变异函数,Kriging算法很容易实现局部加权插值,从而克服了一般距离加权插值方法插值结果的不稳定性.Kriging插值方法的优点还在于不仅考虑了已知数据点的空间相关性,还在给出了待估计点数值的同时,能给出表示估计精度的方差[15,16].

Kriging方法通过对已知样本点赋予权重来求得未知样点的值,可简单表示为如下公式:

式中,Z*(x)为待插值点x的预测值,λi为参与插值的已知样本点xi测量值Z(xi)的权重系数,n为参与插值的已知样本点数量.求取xi需要满足以下两个条件,一是Z*(x)估计值偏差的数学期望为0,即最优条件;二是使得估计值Z*(x)和实际值Z*(x)之差的平方和最小,即无偏性条件.在保证Z*(x)线性无偏且方差最小的情况下可以得到普通Kriging的方程组如公式(2)所示[17]:

式中,γ(xi,yj)是采样点xi和xj之间的半变异函数,ψ是极小化处理时的拉格朗日乘数.由方程组(2)求解可得到加权系数λj,将其带入公式(1)可求出待估值Z*(x).

Kriging用半变异函数来表示变量的空间结构特征,根据拟合半方差的半变异函数模型的不同可分为球型模型、指数模型、高斯模型和线性模型[18].其半变异函数模型分别为:

球面模型(Spherical Model,SM):

指数模型(Exponential Model,EM):

高斯模型(Gaussian Model,GM):

线性模型(Linear Model,LM):

式中,a为变差距离,即曲线到达基台值时所对应的分离距离;h为步长,为各点的地理坐标差值以及维度差值平方和的均方根,h为0时γ(h)为0;C0为块金值,反映的是最小抽样尺度以下变量的变异性及测量误差.当采样点的距离为0时,半变异函数值应为0,但由于存在测量误差和空间变异,导致两采样点非常接近时,它们的半变异函数值不为0,即存在块金值;C为放大系数,为保证预测值的准确,一般不进行放大或缩小,C设为1;C0+C为基台值,是随着采样点间距的不断增大,变异函数的值趋向的一个稳定常数.

2 输电线路气象环境网格化建模实现

输电线路气象环境的数据建模不仅与常规的气象要素有关,还与经纬度、海拔高程、微地形等有关.因此其网格化建模涉及到地理信息系统(Geographic Information System,GIS)的空间分析技术、数字高程模型(Digital Elevation Model,DEM)、空间插值方法的应用以及校验分析等问题.

GIS是在计算机软硬件支持下对整个或者部分地球表层空间中的有关地理分布数据进行采集、存储、管理、运算、分析、显示和描述的技术系统[19].GIS空间分析通过空间数据和空间模型的联合分析来挖掘空间目标的潜在信息,提取和传输空间信息,分析对象是地理目标的位置和形态特征.

DEM是数字高程模型的简称,它是用一组有序数值阵列形式表示连续变化的地面高程的一种数字化地面模型,各种地形特征值均可由DEM派生.以DEM为基本输入的数字地形分析通过地形属性计算和特征提取,实现对地形属性(高程、坡度、曲率等)的定量刻画,是GIS系统空间分析的重要组成部分[20-22].

根据输电线路气象环境数据的特征分析,应用Kriging空间数据插值方法,确定如图1所示的网格化建模实现步骤.

Step 1.创建网格: 利用电力系统已建设的GIS系统,根据指定的经纬度研究范围及网格精度要求等参数,生成覆盖研究区域的网格及网格中心点数据.

图1 输电线路气象数据网格化建模步骤

网格化的精度选择,不仅要考虑气象测点的分布密度和精度、地形复杂度、灾害影响输电线路的范围尺度、DEM的可选尺度,还要考虑到计算处理能力,在各个因素之间做出平衡[23,24].与划分网格尺度不同的输入数据,需要进行尺度转换.尺度转换通过数学函数来实现,常用函数有回归分析法、变异函数、自相关分析、分形分析、小波变换等.

Step 2.地形分析: 加载DEM数据,采用提取分析法,将Step1生成的网格点作为基点,输入经纬度与之匹配的DEM数据,生成每个格点的高程值,以此形成地形信息.

气象测点、线路杆塔模型提供的实际高程与其经纬度对应的DEM中的高程不完全一致,实际高程比DEM提供的高程精度高,但由于气象数据的网格化依赖于DEM进行插值,因此,使用DEM的高程数据反而能得到更为精确的插值结果.

Step 3.加载测点信息: 根据研究的灾害类型,加载来自气象部门气象测点、电网微气象测点、覆冰测点、雷电定位测点等多源气象测点的空间位置信息(包括经纬度和高程等),确定测点所在的网格.

Step 4.Kriging空间插值: 空间插值研究的本质是通过空间建模来拟合生成充分逼近要素空间分布特征的函数方程.以已有的气象测点数据为输入,利用Kriging的不同半变异模型进行插值,并通过定量指标对插值结果进行评价.选取评价最优的半变异函数模型进行插值,确定研究区域内每个网格与气象测点的数据映射关系,建立输电线路关联网格的气象数据推算函数模型.

Step 5.计算气象信息数值: 以气象测点的历史、实测、预测数据为输入,根据步骤Step 4确定的气象数据推算函数关系模型,计算分析区域内所有网格对应的历史、实测、预测气象数据.

步骤Step 4和Step 5都以气象测点的数据为输入,不同的是Step 4是为了确定网格与气象测点的数据映射关系,而Step 5用以计算网格的气象数值.

Step 6.获取输电线路气象环境数据: 根据输电线路的首末端厂站及杆塔的空间分布以及线路走向,结合输电线路在遭受到不同类型气象灾害时的受影响空间范围,获得对应线路气象数据的取值网格集合.这些网格通过Step 5插值后的数据即为该输电线路的气象环境数据.

上述的6个步骤中,Step 1至Step 4是为了确定研究区域内网格与气象测点的数据映射关系,只需要执行一次.每次进行气象环境数据网格化计算时只需要执行步骤Step 5和Step 6.

3 实验验证与结果分析

3.1 插值评价标准

在进行空间插值拟合时,有多个变异函数可供选择,如何比较各种函数模型的优劣需要定量的指标作为依据.输电线路气象环境的网格化插值由于测点数量有限,采用逐点交叉验证的方法验证模型的精度.方法是: 依次移除一个测点,用剩余测点进行空间插值,得到被移去点的预测值,最后做出实测样品与预测样品的散点图并对估计误差进行统计.

插值精度可以通过计算三项检验标准来判断: 平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)、均方根误差(Root Mean Squared Error,RMSE).通过计算一致性指标(the index of agreement,A)来衡量预测值和真实值的吻合程度,A取值在0~1之间,1表示预测值与实测值完全吻合,0表示不吻合.

四项检验标准的计算公式如下:

式中,Oi为第i个测点的实测值;Pi为第i个测点的预测值;为n个测点实测值的平均值;P¯为n个测点预测值的平均值;n为用于插值的测点总数.

3.2 仿真实验

基于电力系统已有的GIS系统,选取江苏省为研究区域,按照3 Km×3 Km的网格大小对其进行网格划分,利用电网可获取的996个气象测点2017年某日的温度数据,对其进行30%的均匀随机抽样并检验数据分布特征.该日江苏省的温度数据范围为8℃到13℃,且数据符合正态分布特征.选取东仲5643线、江陵5292线、堡任5231线、陵武5288线、任上5238线、上盐5239线、上仪5240线、田都5216线、伊上5251线等部分500kV的输电线路,依据线路杆塔地理位置绘制线路走向,将其加入到GIS系统,以反映不同半变异函数模型下的输电线路气象环境数据对比.在使用默认参数的条件下,分别利用Kriging的4种半变异函数模型进行插值,插值结果如图2至图5所示.

图2 球面模型插值结果

3.3 结果分析

基于前文确定的Kriging插值校验方法,统计后可得表1所示的交叉验证结果.从校验结果对比可知,对于选定区域的温度网格化插值,高斯模型的MAE为0.812,MRE为0.117,RMSE为1.05,较其他三种模型误差大,且一致性较其他3种模型小,由此可知高斯模型建模拟合效果较差;球面模型和指数模型平均绝对误差分别为0.032和0.037,比较接近,标准均方根误差为0.308和0.297,表明误差较小,一致性指标分别为0.94和0.96,说明这两种模型的拟合效果较好,其中指数模型的拟合效果最优.从插值校验结果对比可知,在使用默认参数的情况下对江苏省输电线路关联温度分布插值,各函数模型的优选顺序为: 指数模型>球面模型>高斯模型>线性模型.

图3 指数模型插值结果

图4 高斯模型插值结果

4 结论与展望

影响气象数据网格化建模精度的因素主要包括2个方面.第一是插值方法本身引起的误差,如参与插值的气象测点数量、插值方法的选择、插值参数的设置等;第二是外界因素对气象要素的影响而引起的误差,如高程、经纬度、坡度、坡向、输电线路走向、气象测点的数目和分布状况、大气环流及观测数据本身的误差等对不同气象要素的影响.

图5 线性模型插值结果

表1 四种半变异模型插值校验结果

由于篇幅所限,文中只选取了江苏省级电网可获取的单日温度数据进行了仿真实验,对不同半变异模型的插值结果进行了比较以选取适合该省内输电线路温度数据插值的半变异函数.然而,如前文所述影响气象数据空间分布的因素众多,很难确定一种适用于所有时空环境的气象数据插值方法,需要综合分析各种影响因素,结合各种网格化插值方法的特点进行离散点的动态自适应插值,才能得到最优的插值结果.这也是后续需要进行进一步深入研究的方向.

猜你喜欢

插值网格化测点
徐州市云龙公园小气候实测与分析
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
农业农村部部署推进乡镇农产品质量安全网格化管理
基于CATIA的汽车测点批量开发的研究与应用
水下单层圆柱壳振动声辐射预报的测点布置改进方法
智慧社区视野下网格化社会服务客体研究
室外风环境实测及PHOENICS 模拟对比分析研究*
——以徐州高层小区为例
基于pade逼近的重心有理混合插值新方法
不同空间特征下插值精度及变化规律研究
河北发力网格化监管信息化