中国北方太阳总辐射模型优化及适用性评价
2023-07-25邓红艳李艳灵吴宗俊崔宁博
邓红艳,李艳灵,吴宗俊,崔宁博,赵 璐,高 颖
(1.咸阳市水利工作队,陕西 咸阳 712000;2.四川大学水力学与山区河流开发保护国家重点实验室,成都 610065;3.仁寿铧锐农业投资有限责任公司,四川 仁寿 620500)
0 引 言
地球表层99.80%的能量来源于太阳,太阳总辐射(Rs)对地表温度[1]、作物蒸散发[2]和区域水循环有着重要意义[3]。而实测太阳总辐射不仅设备昂贵,还面临技术、环境等困难,如辐射观测站点覆盖面不够广泛和均匀、数据在时间序列上不连续[4-6]。经验模型基于数据驱动的原理,以概率论和数理统计理论为基础,构建太阳总辐射与气象因子(日照、气温等)的回归关系模型,形式简单、所需参数少又容易获取,成为太阳总辐射模拟的首选方法[8]。
利用经验模型模拟太阳总辐射一直受到国内外学者广泛关注。估算Rs的模型可分为三类,基于温度模型、基于日照时数模型和混合模型。Ångström[9]最早采用日照时数和晴空辐射(RS0)计算Rs,Prescott[10]在Ångström 的研究基础上引入地外总辐射(Ra),根据晴空指数和日照百分率的线性关系建立的Ångström-Prescott(A-P)模型被广泛使用。Bahel 等[11]发现三阶Ångström 模型的精度高,并提出了适用于全球的Bahel 模型。虽然基于日照时数的模型估算Rs较为准确,但会受到日照资料缺失的限制[12],因此,基于温度的Rs估算模型被提出。Hargreaves 等[13]考虑到Rs对日间温度的影响,建立了仅以温度为输入数据的Hargreaves 模型;Allen 等[14]考虑大气压的影响,在Hargreaves模型的基础上提出了Allen模型,并在美国9个代表地点进行测试,发现预测精度高;Chen 等[15]发现在Hargreaves 模型和Allen 模型中,Rs/Ra与Tmax-Tmin之间的函数关系影响模型精度,提出了对数函数关系的Chen 模型。除单一考虑温度和日照时数,研究学者发现结合多种气象因素计算Rs有利于提高经验模型的准确性[16],提出了混合模型。Chen等[15]考虑温度和日照的综合影响,提出一种混合模型,其Rs与相对日照(n/N)和温度差分别为幂相关和对数相关;Fan等[17]采用中国20 个气象站点的数据,提出了考虑降雨、温度和日照时数的Fan模型。
由于不同地区的气候条件存在差异,经验模型的参数取值对模拟结果的准确性有一定影响,因此需要进行参数率定,优化经验模型的参数。Liu 等[18]选取中国15 个气象站点数据,采用最小二乘算法优化16 种经验模型,模拟中国不同地区日Rs;邹清垚等[19]选取四川省7 个辐射站点的气象数据,采用最小二乘算法优化6 种Rs经验模型,评价其在3 种天气类型下的适用性。相比于最小二乘算法,智能算法更适合于复杂函数的优化问题,具有适用性更强、精度更高的特点。然而,目前使用智能算法率定Rs经验模型参数的研究较少,已有研究也大多采用遗传算法进行参数率定。袁宏伟等[20]分别采用最小二乘法和遗传算法率定Angstrom 模型参数,并发现遗传算法率定的结果更优。相关研究大多仅在日尺度评价模型精度,对长时间序列评价模型精度研究很少。
中国北方地区主要为干旱和半干旱地区,地形复杂多变,太阳辐射资源丰富[21],精确模拟Rs对于北方地区利用辐射资源提高农业生产效率和发展光伏农业具有重要现实意义。因此,本文根据地面高程将中国北方划分为6 个区域,采用47 个气象站点逐日数据(1994-2016 年),在日和月尺度上系统评价三类辐射模拟模型在中国北方的适应性,为北方地区Rs研究提供理论依据。
1 材料和方法
1.1 研究区概况
北方地区(73°E~135°E,33°N~53°N)位于秦岭-淮河线和青藏高原以北,海拔为-156~7 452 m,约占中国陆地面积的50%。地形高程整体上由西向东递减,干旱少雨,降水量在800 mm 以下,且从东向西呈递减趋势,是中国主要的干旱区和半干旱区,太阳辐射资源丰富,但分布不均[22]。因地形、气候差异,北方地区的干旱具有明显的区域特征[23],根据高程差异将中国北方划分为6 个区域,各区域站点分布如图1所示。
图1 北方地区气象站点分布及分区示意图Fig.1 Distribution of meteorological stations and division of North China
本文数据源为47 个代表性站点1994-2016 年逐日数据(来源于中国气象数据网http://data.cma.cn),包括日最高气温(Tmax)、最低气温(Tmin)、日照时数(N)、降雨(P)和总辐射量(Rs),各气象要素在6个区域的日均值见表1。
表1 中国北方地区6个区域的日平均气象数据Tab.1 Daily average meteorological data of six regions in North China
1.2 地表总辐射模型
本文选取3 种基于温度的模型(Annandale、CH 和Goodin模型)、3 种基于日照时数的模型(Ångström-Prescott、Ogelman 和Almorox-Hontoria 模型)、1 种混合模型(Fan 模型)模拟太阳总辐射。Fan 等[24]考虑温度、降雨量和相对湿度的影响,将气温日较差的多项式、平均气温、降雨量和相对湿度的函数进行不同耦合,提出6 个模型计算中国太阳总辐射,GPI为0.446~0.892,同年提出最适合中国的Fan 混合模型,因此本文选用Fan 模型为混合模型代表。具体表达式见表2。
表2 地表太阳总辐射计算模型Tab.2 Global solar radiation calculation models
1.3 参数率定
本文采用鱼群算法对三类经验模型进行参数优化,利用北方地区各代表性站点1994-2010 年数据进行参数优化,2011-2016年数据对优化结果验证。
人工鱼群算法是由李晓磊等[29]于2002 年提出的一类基于动物行为的智能优化算法。该算法根据水域中鱼生存数目最多的区域模拟鱼群的觅食行为而实现寻优,是集群体智能思想的一个具体应用,具较强的稳定性、鲁棒性等能力。鱼群算法的基本表达式如下:
式中:Rand( )为[-1,1]区间的随机数;Step为移动步长;Xi为第i条人工鱼的状态。
人工鱼群算法主要分为4 种基本行为,分别为觅食行为、聚群行为、追尾行为和随机行为,关于更详细的人工鱼群算法请参考李晓磊等[29]。
1.4 评价方法
本文采用决定系数(R2)、平均绝对误差(MAE)、归一化均方根误差(RRMSE)和相对误差(RE)评价温度、日照时数和混合模型在日、月和季尺度上的模拟精度,具体表达式如下:
式中:Xi、Xj为太阳总辐射实测值;Yi、Yj为模拟值;和分别为X和Y的平均值;n为数据样本数量;GPI由指标R2、MAE、RRMSE、MBE和RMSE计算。j为所有模型同一指标j归一化后的中位值;yij为模型i的j指标的归一化值;αi为系数,当指标为R2时,取-1,其余指标取1。
R2越接近1,模型精度越高;MAE、RRMSE、RE、MBE和RMSE的绝对值越小,模型精度越高;GPI值越大,模型精度越高。
2 结果与讨论
2.1 模型参数率定值
由于北方地区不同区域受季节变化、积雪覆盖、云层厚度、污染物浓度、纬度及海拔等影响,在不同地区模型参数的取值不同,对Rs模拟结果的准确性产生明显影响,为了降低Rs模拟的不确定性,提高其准确性和有效性,需对各模型中的参数进行优化,以提升北方地区Rs模拟模型精度。地表太阳总辐射模拟模型在北方地区各分区优化后的模型参数率定值见表3。
表3 地表太阳总辐射计算模型参数率定值Tab.3 Calibration of parameters in global solar radiation calculation models
由表3 可知,T1 模型优化后的参数a介于0.150~0.171;T2 模型优化后的a、b 参数分别介于0.271~0.295、-0.162~-0.142;T3 模型优化后的a、b、c参数分别介于0.772~0.789、5.411~5.438、1.215~1.255;N1 模型优化后的a、b参数分别介于0.238~0.254、0.500~0.521;N2 模型优化后的a、b、c参数分别介于0.187~0.201、0.676~0.680、-0.149~-0.137;N3 模型优化后的a、b参数分别介于-0.029~-0.023、0.308~0.316;M1模型优化后的a、b、c、d、e、f参数分别介于0.060~0.067、0.451~0.458、0.751~0.761、-0.026~-0.021、0.042~0.057、0.001~0.002。3种日照模型在北方地区参数比较稳定,其中日照时数一次项的参数比推荐值大;3种温度模型参数变化范围较大,说明温度模型在北方不同地区波动较大;混合模型中参数e相对其他参数变化范围大,说明北方不同地区的降雨不均匀对混合模型影响较大。
2.2 太阳总辐射日尺度精度比较
三类经验模型在日尺度上模拟太阳总辐射精度见表4。由表4 可知,在日尺度上模拟太阳总辐射时基于日照时数的模型(N1-N3) 精度最高,其次为基于温度的模型(T1-T3),混合模型相对较差(M1),R2分别为0.90~0.93、0.64~0.78 和0.80~0.90,MAE分别为1.47~1.95、2.51~4.33 和4.88~6.28 MJ/(m2·d),RRMSE分别为12.85%~19.67%、22.00%~40.08%和41.53%~46.00%。基于日照时数模型在Ⅵ区精度最高,其次为Ⅲ区和Ⅰ区,R2分别为0.93、0.93 和0.91,MAE分别为1.56、1.59 和1.68 MJ/(m2·d),RRMSE分别为13.28%、14.32% 和17.81%;基于温度模型在Ⅵ区精度最高,其次为Ⅴ区和Ⅲ区,R2分别为0.77、0.77 和0.73,MAE分别为2.98、3.35 和3.35 MJ/(m2·d),RRMSE分别为25.67%、30.48%和29.48%;混合模型在Ⅴ区精度最高,其次为Ⅱ区和Ⅰ区,R2分别为0.90、0.80 和0.83,MAE分别为5.65、5.07 和4.88 MJ/(m2·d),RRMSE分别为43.17%、42.75% 和43.03%。
表4 基于温度、日照时数和混合经验模型模拟中国北方地区日太阳总辐射Tab.4 Simulation of daily solar radiation in North China based on temperature, sunshine duration and hybrid empirical models
图2采用箱线图表示三类模型在日尺度上的模拟精度。由图2 可知,基于日照时数的模型中,N2 模型模拟Rs精度最高,其次为N1,再之为N3。从3 类模型在6 个分区模拟Rs精度参数看,在6 个分区R2中位值分别为0.93、0.92 和0.92,MAE中位值分别为1.62、1.63 和1.74 MJ/(m2·d),RRMSE中位值分别27.89%、29.42%和36.18%;基于温度的辐射模型中,T2 模拟精度最高,其次为T1,再之T3,R2中位值分别为0.73、0.71和0.79,MAE中位值分别为2.96、3.12 和3.88 MJ/(m2·d),RRMES中位值分别为15.02%、15.48%和17.02%;混合模型M1 模拟Rs精度参数R2、MAE和RRMSE中位值分别为0.85、5.50 MJ/(m2·d)和42.78%。
图2 基于温度、日照时数和混合模型经验模型模拟中国北方不同地区日太阳总辐射Fig.2 Simulation of daily solar radiation in different zones of North China based on temperature, sunshine duration and hybrid empirical models
日照时数模型精度高于温度和混合模型,在日照模型中N2 模型精度最高。地球表面的太阳辐射量与日照时数密切相关,这是导致基于日照时数模型精度较高的主要原因[30]。此外,地球表面的太阳辐射以长波辐射的形式被大气层吸收或散发到空中,被大气层吸收的部分则会使大气温度升高,而地面长波辐射强度因下垫面的差异而变化,使得气温和Rs间的相关性不强,导致基于温度的辐射模型模拟精度低于基于日照时数模型。尽管混合模型可以提高太阳辐射估测的精度,但由于大多数气象站实测日照时数数据具有有效性和可靠性,日照的模拟模型比混合模型的精度高[31]。研究表明二次多项式模型精度比线性A-P、指数、对数等模型精度高[32-34],N2 模型结构为二次多项式模型,所以N2模型的精度最高。
2.3 太阳总辐射月尺度精度比较
三类经验模型模拟太阳总辐射在月尺度上精度性能见表5。由表5 可知,在月尺度上基于日照时数的模型(N1-N3)精度最高,其次为混合模型(M1)和基于温度的模型(T1-T3),R2分别为0.94~0.97、0.92~0.95 和0.86~0.95,MAE分别为25.45~44.29、36.21~102.73 和101.25~144.56 MJ/(m2·d)。基于日照时数模型在Ⅲ区精度最高,其次为Ⅴ区和Ⅵ区,R2分别为0.95、0.94 和0.93,MAE分别为65.10、77.76 和75.18 MJ/(m2·d);基于温度模型在Ⅲ区精度最高,其次为Ⅱ区和Ⅰ区,R2分别为0.97、0.96 和0.95,MAE分别为35.92、34.50 和34.50 MJ/(m2·d);混合模型在Ⅴ区精度最高,其次为Ⅲ区和Ⅵ区,R2分别为0.95、0.94 和0.94,MAE分别为134.67、115.15和144.56 MJ/(m2·d)。
表5 基于温度、日照时数和混合经验模型模拟中国北方地区月太阳总辐射Tab.5 Simulation of monthly total solar radiation in northern China based on temperature, sunshine hours and mixed empirical model
实测值和三类模型模拟值在月尺度上模拟精度比较见图3。由图3 可知,在月尺度上,各个区域内的模拟值和实测值Rs的总体趋势相同,均呈开口向下的抛物线,且在Ⅰ-Ⅳ区均在1-5 月呈上升趋势,6-12 月呈下降趋势,上升时RE增大,范围为-17.47%~13.59%,下降时RE减小,范围为-17.56%~14.10%,5 月的RE最大,范围为-7.49%~11.93%;在Ⅰ-Ⅵ区内除T3 和M1 模型模拟结果偏低,其余模型均精度较高,RRMSE范围为6.37%~17.74%,RE范围为-17.56%~14.10%。基于日照时数模型(N1-N3)的模拟精度最高,其次为基于温度模型(T1-T3),最差的为混合模型(M1),RRMSE范围分别为6.91%~13.25%、8.11%~32.60%和29.06%~42.45%,RE范围分别为-3.49%~10.58%、-31.37%~20.87% 和-41.65%~-28.01%。日照时数模型中,N2 模拟精度最高,其次为N1,较差的为N3,RRMSE平均值为9.51%、10.32%和11.42%,RE平均值为-2.42%、4.04%和6.39%;温度模型中,T2模拟精度最高,其次为T1,较差的为N3,RRMSE平均值为12.63%、12.91%和20.78%,RE平均值为-2.68%、3.56%和-9.36%;对于混合模型M1,RRMSE平均值为37.64%,RE平均值为-37.54%。
图3 基于温度、日照时数和混合模型经验模型模拟中国北方地区月太阳总辐射RsFig.3 Simulation of Rs in North China based on temperature,sunshine duration and hybrid empirical models at a monthly scale
日照时数模型在Ⅵ区精度最高,其次为Ⅲ区和Ⅴ区,RRMSE分别为9.22%、8.96%和10.03%,RE分别为3.05%、-4.16%和4.15%;温度模型在Ⅵ区精度最高,其次为Ⅲ区和Ⅱ区,RRMSE分别为13.06%、14.08%和14.28%,RE分别为-1.27%、-2.11%和-2.17%;混合模型在Ⅱ区精度最高,其次为Ⅰ区和Ⅵ区,RRMSE分别为35.57%、35.78%和37.56%,RE分别为-35.50%、-35.69%和-37.56%。
在月尺度上模拟研究发现,1-5 月太阳总辐射量在增多,6-12 月太阳总辐射量在减少。在不考虑天气因素的条件下,理论上太阳高度角越大,直接辐射和散射辐射量越高,太阳辐射总量越高[35]。混合模型在北方各分区RRMSE和RE较低,这是因为中国北方部分地区大气污染严重,气溶胶浓度较大,且不同月份气温差异很大,导致北方地区各气象参数具有复杂耦合关系[36,37]。而混合模型考虑的气象参数较多,气温、日照时数、降雨量与Rs间关系不稳定,所以混合模型模拟Rs偏差较大。
3 结 论
本文基于北方地区47 个站点1994-2016 年气象资料,利用鱼群算法优化日照、温度和混合模型中的经验参数,采用实测值验证三类模型模拟结果,在日、月和季尺度上对温度模型(T1、T2 和T3 模型)、日照时数模型(N1、N2 和N3 模型)和混合模型(M1)模拟精度评价,探究中国北方地区的最优模拟模型,结果如下。
(1)日尺度上,日照时数模型精度高于温度模型和混合模型,R2范围分别为0.90~0.93、0.64~0.76 和0.80~0.90,MAE范围分别为1.51~1.95、2.51~4.33和4.88~6.28 MJ/(m2·d),其中日照时数模型中精度最高为N2 模型,温度模型中精度最高为T2模型。在各个区域上,日照时数模型在Ⅵ和Ⅲ区精度最高,温度模型在Ⅵ区和Ⅴ区精度最高,混合模型在Ⅴ区和Ⅱ区精度最高。
(2)月尺度上,7 种模型在北方地区6 个分区的实测值与模拟值均呈开口向下的抛物线,在5月达到最大值。日照时数模型模拟精度高于温度模型和混合模型,RE范围分别为-11.33%~10.58%、-29.20%~21.37%和-28.01%~-48.74%;在日照时数中N2 模型精度最高,RRMSE范围为6.91%~15.23%,RE范围为-5.35%~2.16%;在温度模型中T2 精度最高,RRMSE范围为7.80%~17.74%,RE范围为-13.41%~7.53%。日照时数模型和温度模型在Ⅵ区和Ⅲ区精度最高,混合模型在Ⅱ区和Ⅰ区精度最高。
(3)季尺度上,日照时数模型精度最高,其次为温度模型,混合模型精度最差,RE范围分别为-9.65%~11.06%、-28.29%~11.80%和-38.27%~45.18%。日照时数模型中N2 精度最高,RE范围为-9.65%~0.86%;温度模型中T2 精度最高,RE范围为-14.58%~5.36%,秋冬季节的精度高于春夏季节。日照模型在Ⅵ和Ⅴ区精度最高,温度模型在Ⅴ和Ⅲ区精度最高,混合模型在Ⅵ和Ⅱ区精度最高。