APP下载

复杂天气和地形下的地表太阳辐射估算模型及其在超短期光伏发电功率预测中的应用

2023-11-16王依婷

上海第二工业大学学报 2023年3期
关键词:太阳辐射波段聚类

王依婷

(上海第二工业大学信息技术中心,上海 201209)

0 引言

近年来,由于对不可再生资源的浪费,给国家的资源开发带来了巨大的压力。在这种情况下, 可再生的清洁能源太阳能引起了广泛的关注。如今, 太阳能的开发和利用主要包括太阳能热利用、光化学转化以及光伏发电等方面[1]。在这些应用中, 光伏发电因其使用寿命长的优势而受到电力行业的高度赞誉并得到广泛应用,安装维护方便,传动简单,故障率低,噪声干扰小。此外,中国还对分布式光伏项目投入了极大的关注和支持, 自然资源部办公厅、国家林业和草原局办公室、国家能源局综合司发布关于支持光伏发电产业发展规范用地管理有关工作的通知中提出,鼓励利用未利用地和存量建设用地发展光伏发电产业[2]。在保护生态环境的前提下,鼓励在沙漠、戈壁、荒漠等地区建设大型光伏发电站,这对于光伏发电领域的研究具有一定的理论意义和现实价值。

光伏发电系统的能量主要受太阳辐射能的影响。太阳能电池板通常被安装在光伏电站的固定位置,因此只能在该位置接收太阳辐射能。然而,由于四季更替和气候变化,同一地点接收到的太阳辐射能会随之发生变化, 具有间歇性、随机性和波动性等特点。为了更好地解决这个问题,预测光伏输出功率至关重要,这样可以在不影响电网正常运行的情况下更有效地利用太阳辐射。此外, 当太阳辐射进入地球表面时,往往会受到不同因素的影响,导致不同程度的减少[3]。在这些因素中, 云量对光伏发电的影响更为显著。因此, 研究人员正在努力从云层的随机变化中探索规律,并找出相应的应对策略。这些措施可以应用于光伏发电量的预测,有助于提高预测的准确性。

综上所述,考虑到云阴影和地形对地表太阳辐射的影响,本文进行了基于CCD/IRS 数据的地表太阳辐射估算模型的研究和验证。通过改进该模型,还构建了光伏超短期功率预测模型,以满足多云天气的需求。

1 数据来源及模型构造

1.1 CCD/IRS 数据介绍

中国资源卫星数据与应用中心是国家卫星应用体系的重要组成部分之一,也是国家三大卫星应用中心之一。该中心承担着对地观测的重要任务,通过卫星对陆地、海洋、大气等进行高分辨率、高精度、高时空覆盖的观测, 为国家农业、林业、水利、环保、气象等多个领域提供了重要数据支撑。其中,HJ-1B 卫星数据库是该中心的重要资源之一,包含了大量的对地观测数据,可以为各类研究提供支持[4]。在本文中, 该中心的数据为研究提供了重要的数据支撑,为研究的深入开展提供了有力保障。

HJ-1B 卫星搭载了2 个电荷耦合器件(charge coupled device,CCD)相机和1 个红外光谱(infrared spectroscopy,IRS)相机。其中,CCD 相机能将光线转化为电荷、存储和转移电荷,是气象观测相机的重要组成元件[5]。HJ-1B 卫星上的CCD 相机地面像素分辨率为30 m,而IRS 相机的参数为150 m/300 m,使用4 个波段的红外光谱(infrared spectroscopy,IR)成像。可见光和红外相机都安装在同一颗卫星上, 因此可以轻松获取具有正确一致性的测量参数[6]。数据采集过程中的相关参数如表1 和表2所示。

表1 CCD 相机绝对辐射参数Tab.1 Absolute radiation parameters of CCD cameras

表2 IRS 相机在不同波段的参数Tab.2 Parameters of IRS cameras in different wavebands

1.2 地表太阳辐射估算模型

1.2.1 晴天的辐射估算模型

在晴朗无云的天气中,太阳辐射一般包括直接辐射和散射辐射,需要对这两种类型的辐射分开考虑[7]。首先, 水平面上直接辐射可用以下公式方程(1)表示:

式中:Ii(hor)表示在i波段接收到的直接辐射;Ioi是该波段的太阳常数;T(clear)i是该波段的辐射透过率;Er是日地距离的修正系数;Z是指太阳光线入射方向和天顶方向的夹角,也叫太阳天顶角。在该估算过程中,i被分为波段1 和波段2,分别代表可见光波段0.29~0.7 μm 和近红外波段0.7~4 μm。通常,Io1的值为38 kJ·m-2·min-1,Io2的值为43 kJ·m-2·min-1。

因为大气层中的空气、水汽、气溶胶等物质会对太阳辐射产生影响,即使没有云层遮挡,太阳辐射进入地球表面时也会受到一定程度的吸收和散射。在进行太阳辐射和光伏发电研究时,需要考虑这些因素对太阳辐射的影响[8]。总透过率的计算式如下:

式中,T(clear)i表示无云状态下i波段的总透过率,由下标为o、r、g、w 和a 的T所代表的元素分别指臭氧、瑞利、混合气体、水蒸气和气溶胶的辐射透过率。

在大气污染的研究中,臭氧和气溶胶的浓度是非常重要的指标。但是,由于监测设备的限制,有些地区的臭氧和气溶胶数据难以获得。为解决这个问题,本文使用了相关的模型公式来模拟所需的参数。具体的计算方法分别为:

式中:Ua为指气溶胶含量;Ma为气溶胶光学质量;β为指浑浊系数;Z为指太阳天顶角;Φ为指纬度;alt 是指被测区域的海拔高度。

这些模型公式基于大量的实验数据和理论分析,能够在一定程度上准确地预测臭氧和气溶胶的浓度。

同样,臭氧含量也是通过这种模型公式得出的,其计算方法如下所示:

式中:U0指臭氧含量;Jd指儒略日(在儒略周期内以连续的日数计算时间的计时法)[10];d指的是周期,其他参数与以上的公式相同。

在晴朗天气下散射辐射的计算涉及2 个方面:直接散射辐射和地球与大气多次反射产生的散射辐射[9]。本文中假设地表面反照率为0,则直接散射辐射式为

式中:Fi表示校正因子, 用于补偿算法的某些缺陷;BR1是指第1 波段瑞利散射(又称“分子散射”)的前向散射因子;Ba是指气溶胶的前向散射因子;Tasi是指i波段的散射透过率;Twsi是指i波段的水汽散射透过率。

Eddi代表由地球和大气之间的多次反射引起的散射辐射,其算法如下:

在式(9)中,ρgi是地表反照率,ρsi是天空反照度。总散射辐射为

每个波段的太阳总辐射量为

宽带太阳总辐射为

1.2.2 阴天辐射估算模型

在阴天和多云的情况下, 太阳辐射的计算方法是用式(1)乘以云层的辐射透过率,即

式中:T(cloud)i是指云在i波段的辐射透过率,其他参数与晴x天辐射估算模型中的参数相同。

云的光学厚度是用来描述云对太阳辐射的影响程度的参数,它反映了云本身的光学特性,包括云的厚度、密度、形状等因素。光学厚度越大,代表云对太阳辐射的吸收和散射越强, 即云越厚密。云的光学厚度被用来计算云的透过率。本文主要参考了HJ星第3 波段(中心波长为0.65 μm)的反射率与云光学厚度之间的关系。

当反射率范围为0.15~0.35、0.35~0.5、0.5~0.55、0.55~0.6、0.60~.65 和0.65~0.7 时, 对应的云光学厚度为0~1、1~4、4~8、8~16、16~32 和32~64。

云透过率主要是根据以下公式计算:

式中:Tcloud1表示波段1 的云透过率;µ0是太阳天顶角的余弦;β(µ0)代表对应的后向散射比;τn是云光学厚度。

用以下方程求出波段2 的云透过率:

式中:Tcloud2表示带2 的云透射率;w0表示单次散射比,其他参数与上面其他方程式相同。

使用上述算法, 可以获得阴云和多云状态下的云影,将受到云干扰的区域和未受影响的区域区分开来,据此,在云阴影区使用多云辐射算法进行辐射估计,在非阴影区使用晴天辐射算法进行辐射估计,这样的方法可以有效地提高辐射估算的准确性和实用性。

1.3 地形校正估算模型

假设不考虑地面和大气之间的多次反射, 那么倾斜地形所接收到的太阳总辐射Et可以分为三部分。第1 部分是斜坡上的直接辐射Edrt, 第2 部分则是来自天空的散射辐射Edift,第3 部分则是来自邻近地形Eat的附加辐射。则

通常,特定地形对地表太阳辐射的影响由3 部分组成:

(1) 直接辐射的影响。不同的斜坡有不同的角度,因此它们与太阳辐射形成的角度也不同,这将影响斜坡上不同位置的日照时间。

(2)来自天空散射辐射的影响。不同的倾斜角度也会改变天空中的散射粒子,太阳与地面目标的位置之间的角度会受到影响,从而影响辐射光的入射角和某些位置的天空阴影程度。

(3)对邻近地形辐射的影响。目标定位点与相邻位置之间的相互屏蔽会对结果产生干扰[11]。

直接辐射的地形校正模型考虑了目标像素本身和相邻像素的阴影效应,如下式所示:

式中:Edirh表示接收到的直接辐射,I表示入射角。如果I >90, 则表示像素被自身遮挡。L为判断投影的二元系数。当L= 0 时, 目标点被相邻像素遮挡,当L=1 时,意味着目标点没有遮挡。

在散射辐射修正模型中,各向异性指数k代表各向异性散射在天空总散射中的权重,k的计算方法分别为:

式中:S表示斜率的斜率, rad;Sh为太阳高度角;I0=1 367 W/m2。

1.4 超短期光伏发电功率估算模型的构建

在构建光伏功率估算模型时,通常会将1 d 的时间分为多个时段,以便更加精细地估算太阳辐射的变化情况。云量系数是反映云量多少的一种无量纲指数, 它通常是通过对云影像进行处理得到的。在估算云量系数时,需要采用一些聚类算法,以便将云量系数的变化趋势进行更好的描述,这对于光伏功率估计模型的构建非常重要。

K-Means 算法通常用欧氏距离来计算样本点之间的距离[12]。方程如下所示:

式中:dij表示样本点i和样本点j之间的欧氏距离;x是样本点i的k次特征值;n为特征向量的维数。

为了解决聚类中心初始化随机的问题,通常使用迭代方法进行聚类分析。迭代方法包括以下步骤:首先根据当前聚类中心计算每个样本点所属的类别,然后重新计算聚类中心点,最后判断聚类中心是否改变,若改变则继续迭代,直到聚类中心不再变化为止。这种迭代方法能够有效地聚类数据, 帮助我们更好地理解数据的分布规律和特征。

K-Means++ 算法是K-Means 算法的一种改进形式, 被广泛应用于聚类领域。该算法可以将数据集划分为多个簇, 每个簇内的数据相似度较高, 而不同簇之间的相似度较低。通过对云量系数进行聚类, 可以更好地描述云量随时间的变化趋势, 从而更准确地估算太阳辐射的变化情况。K-Means++算法通过选择初始聚类中心时最大化聚类中心之间的距离,有效地解决了传统K-Means 算法对初始聚类中心敏感的问题,从而提高了聚类的准确性和稳定性。

在对云遮蔽系数进行聚类时,根据不同的天气类型进行划分,定义了5 个聚类类别。因此,云遮挡系数的聚类以每个周期的云遮挡系数的相关值作为特征向量,即

式中:i表示样本数;表示云层覆盖系数的极大值;是其最小值;为平均值,为方差值。

不同时段内的气象和太阳辐射条件会存在差异。为了提高光伏功率估算的准确性, 在建立光伏功率估算模型时,需要根据云量系数的聚类结果,将不同时段内的气象数据、地面太阳辐射历史数据和光伏功率进行分类,然后针对不同的数据集,分别建立光伏功率估算模型。

为了训练光伏功率估算模型,可以使用下式来表示训练数据特征向量:

式中:n表示输入特征的尺寸;m表示采样点的数量。

式(24)包括历史数据中的地面太阳辐射值、环境温度、相对湿度、气压和风速等输入特征,以及对应的光伏输出功率输出值。这些特征能够反映光伏发电的环境条件和光伏电池的特性。因此, 需要针对不同的时段和气象条件选择相应的特征,并建立相应的光伏功率估算模型。这样就能更准确地预测光伏发电的功率输出情况,为光伏发电的管理和运营提供更好的支持。

综上所述,在进行光伏发电预测之前,需要根据预测期内的云量系数聚类类别选择适合的光伏发电预测模型。然后, 将预报期内各个时刻的地面太阳辐射预报值和数值天气预报预报值作为输入向量引入模型,最终可以得到预测时间内各个时刻光伏发电量的估算值。

2 实验结果与分析

2.1 地表太阳辐射估算模型的实验验证

区域A 被选为建议的表面太阳辐射估计模型的例子分析。阴影区域采用多云辐射算法, 非阴影区域采用晴天辐射算法。最后, 对得到的地表太阳辐射分布结果进行了比较和分析。

实验中,首先将所选地形分为有云区和无云区,然后再将其分为阳坡和阴坡两个部分。接着,使用3种算法模型对分割后的区域进行了测量和比较。

其中, 算法1 为未经改进的传统BP 神经网络,是一种误差反传播的多层前馈神经网络,目前在理论研究和性能方面已经非常成熟,也是目前在天气数据预测中应用最广泛的算法之一;算法2 是一种通过3D 效应和辐射地形效应对算法1 进行了改进的算法; 算法3 为在算法2 基础上又进行了地形校正后的算法。实验结果如图1 所示。

图1 云层覆盖的阳坡辐射值Fig.1 Radiation values of sunshine slope covered by clouds

图1 表明,算法1 的估计辐射值明显高于算法3。根据算法1,实验的辐射量达到了晴天的辐射量,1~1.1 kW/m2, 平均偏差约为400 W/m2。算法2 的估计辐射值也很高。由于是在阳坡上, 地形校正后的辐射值更大,平均偏差约为500 W/m2。

图2 中, 与算法3 相比, 算法2 的估计辐射值明显过高。最大差值为500 W/m2, 平均偏差约为300 W/m2。算法1 的大部分估算值也比较高。由于地形属阴坡,校正后的辐射值较低,偏差较大。因此,平均偏差约为400 W/m2。

图2 云覆盖阴坡的辐射值Fig.2 Radiation values of shade slope covered by clouds

图3 中,算法2 的估计辐射值明显低于算法3。最大差值为650 W/m2,平均偏差约为400 W/m2。

图3 无云阳坡的辐射值Fig.3 Radiation values of sunshine slope without cloud

图4 表明,算法2 的辐射值估计较算法3 低,最大差值达到了480 W/m2,平均偏差约为300 W/m2。而算法1 的大部分估算值则较高。由于地形原因,该区域是一个阴凉的斜坡,因此经过校正后的辐射值较低,偏差较大,平均偏差约为350 W/m2。

图4 无云阴坡辐射值Fig.4 Radiation values of shade slope without cloud

在算法1 中,由于没有考虑到地形和云层的影响,其估计结果与实际情况存在较大差异,尤其在阴坡和有云区表现更为明显。而在算法2 中, 通过引入3D 效应和辐射地形效应, 能够更准确地估算表面太阳辐射,因此在多云和特殊地形条件下,相较于算法1 有了更好的表现。但是在阴坡和有云区仍然存在一定的误差。为了解决这个问题,算法3 在算法2 的基础上进行了地形校正,通过对阴坡和有云区的地形进行校正,使得估算结果更加准确。因此,在实验中,算法3 的表现最为优秀,能够更准确地估算表面太阳辐射,为后续的光伏发电功率预测提供了更为可靠的依据。

尽管在计算和测量过程中仍存在一些不准确之处,但以上分析表明,所提出的太阳辐射估算算法在多云条件和特殊地形下的表面太阳辐射估算方面比传统算法更为有效。因此,基于该模型,我们可以进行超短期光伏功率估算的研究和模型构建。

2.2 超短期光伏功率估算模型的验证

本实验采用Python3.10 作为实验平台, 利用B光伏电站2019 年的历史数据进行光伏功率估算模型的训练。该电站位于海拔260 m 的高度,装机容量为10 kW, 并配备高分辨率气象站, 能够实时采集地表太阳辐射、环境温度、相对湿度、风速、气压等气象数据, 数据的时间分辨率为每15 min 一次。通过利用这些数据, 可以训练出一个准确的光伏功率估算模型,为光伏发电的管理和运营提供更好的支持。

在进行数据采集时, 由于传感器故障、传输错误等原因,数据可能会出现丢失或异常情况。为了更好地利用数据的价值,需要进行合理的数据预处理,以获得更准确的预测结果。熊猫包(python package index,PyPI)可以用于数据预处理,其中包括检测和填充缺失值和异常值、删除夜间数据以及特征归一化等操作。为了更好地处理数据, 需要进行以下步骤: 需要判断当天缺失值的总数是否超过20%。如果缺失值的数量超过20%,则需要考虑其他的数据处理方法,例如删除这一天的数据或者采用其他的插值方法。②如果存在缺失值或异常值,可以采用线性插值的方式来填充数据。由于气象数据具有特殊的时间序列相关性,线性插值可以较好地还原数据的变化趋势。另外,如果存在极端异常值,例如气温异常高或低,可以考虑将这些数据视为缺失值进行处理。③需要去除地表太阳辐射为零的夜间数据,因为在夜间,光伏电站并不会产生电力。这样可以减少误差,并提高光伏功率预测的准确性。④对数据进行归一化处理,将每个特征值映射到0~1 的范围内。这可以消除量纲的影响,使得各个特征值之间具有可比性, 有利于模型的训练和预测。在归一化处理时,可以采用最大最小值归一化或标准化等方法,具体选择哪种方法需要根据数据的分布情况来确定。

在进行数据预处理的基础上, 使用Python 的K-Means 算法对云量系数进行聚类。然后, 根据聚类结果,对5 类数据集进行训练,以建立光伏功率估算模型。图5 说明了训练光伏发电模型在各种数据集中的偏差: 不同云遮挡程度下光伏发电的最终拟合效果如图6 所示。

图5 不同数据集训练的光伏发电模型偏差Fig.5 Deviation of photovoltaic power generation models trained on different datasets

图6 不同云遮挡程度下光伏发电的最终拟合效果Fig.6 Final fitting effect of photovoltaic power generation under different cloud cover levels

从上到下,图6 中的3 组曲线分别表示少量云层遮挡下的光伏功率拟合效果、较多云层遮挡下的光伏功率拟合效果和大量云层遮挡下的光伏功率拟合效果。

不同聚类结果的拟合效果不同,其中,云遮挡程度越高,拟合效果越好。总体来说,光伏发电模型的预测精度满足要求。

在实际的光伏功率估算中, 由于不同的天气条件下地表太阳辐射的估算效果不同,同时估算的部分输入数据还依赖于数值预报,因此实际的估算效果(以地表太阳辐射等特征的预测值作为模型输入)与拟合效果(以历史地表辐射等特征的真值作为模型输入)之间存在一定的偏差。这个偏差的大小与不同的天气条件、不同的数值预报模型等因素有关,需要在模型训练和评估时进行考虑。

图7 展示了10:00~14:00 2 种天气类型的预测结果,其中包括一组变化趋势平缓的曲线,代表晴天无云时的光伏功率估算结果,以及一组变化趋势较明显的曲线,代表阴天时的光伏功率估算结果。在晴朗无云的日子里,光伏功率的估计结果相对较准确, 而在阴天情况下, 估计结果则存在一些轻微的偏差。

图7 实际光伏功率估算效果图Fig.7 Actual photovoltaic power estimation rendering

经过实验验证, 尽管准确预测具有随机变化的云遮挡系数仍然具有挑战性,但该模型已经显示出了优异的表现,实验的数据从侧面验证了该模型的有效性。进一步的研究可以致力于完善该模型, 提高其预测精度和适用性,以更好地支持太阳能发电的实际应用。

3 结 论

地面太阳辐射估算模型对光伏发电预测模型的构建具有重要意义。为此, 在考虑云阴影和特殊地形对地表太阳辐射影响的基础上,对基于CCD/IRS数据的地表太阳辐射估算模型进行了研究和探讨。在此基础上,将该估算模型应用于光伏发电的预测,构建了考虑云遮挡影响的超短期光伏发电估算模型, 并进行了实验验证。结果表明, 研究表明, 考虑云影和复杂地形的地面太阳辐射估算模型的测量结果比传统模型的平均偏差更小, 精度更高。这种模型通过考虑云影和复杂地形等因素,能够更准确地模拟太阳辐射的分布情况,从而提高了光伏发电功率的估算精度。在此基础上构建的超短期光伏功率估算模型,能够有效预测晴天和阴天不同条件下的光伏输出功率,证明了该模型的有效性。

然而,由于时间和条件的限制,本研究仍存在一些不足和亟待解决的问题。例如,仅考虑了表面太阳辐射模型在光伏功率估算中的作用,而其他因素的影响仍需进一步探索。此外, 对不同天气类型对光伏发电功率估算模型的影响的讨论还不够深入。因此,未来应构建更加准确的估计模型,以获得更加有效的解决方案。

猜你喜欢

太阳辐射波段聚类
春日暖阳
邯郸太阳辐射时空分布特征
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
基于PCA 的太阳辐射观测算法研究
太阳辐射作用下钢筒仓结构温度场分析研究
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
洛阳地区太阳辐射变化特征及影响因子分析
一种层次初始的聚类个数自适应的聚类方法研究