基于大气环流特征量和海温的水稻生育期预报模型研究
2023-08-23任义方刘瑞翔颜佳任
郝 玲,张 佩,任义方,刘瑞翔,颜佳任
(1.连云港市气象局,江苏 连云港 222006;2.江苏省气象局,江苏 南京 210008)
水稻是江苏省第一大粮食作物,常年种植面积为220万hm2,种植面积和稻谷产量分别占全省粮食面积和总产量的40%和60%,分别约占全国水稻种植面积和水稻总产量的7%和10%,单产稳居全国第一。水稻生育期是生产上品种布局、播期安排、茬口衔接等环节必须考虑的问题,也是农事活动安排如病虫防治、肥料施用等必须关注的。同时,开展农用天气预报既是落实中国气象局战略部署的重要内容,也是中国气象局制定的业务考核指标之一。作为农用天气预报的一个重要环节,准确预测预报水稻关键生育期则显得尤为重要。
众所周知,大气环流是指大范围大气运行的现象,它的水平尺度在1000 km以上,垂直尺度在10 km以上,时间尺度在10万s以上。这种大范围的大气运行不仅制约着大范围天气的变化,而且是气候形成的基本因素之一[1-2]。目前,已有研究表明,在气候变暖的背景下,全国水稻各生育期呈现延长或缩短的变化趋势[3-8],其变化除了与水稻品种更新有关外,还与关键时段的温度和日照时数等气象因子有关[9-10]。另外,大量研究表明,海温的异常变化不仅会影响大气环流[11],而且对降水[12-14]、温度[15]等地面气象要素[16]的变化具有十分重要的影响,既是影响气候变化的关键因子,也是影响水稻生育期变化的间接因子。
根据中长期天气预报原理,海温和环流特征量是气象学中长期天气预报的重要因子。本文以江苏为例,以对中国气候有重要影响的西太平洋海温和环流特征量为长期预报因子,采用相关统计分析方法分别建立了江苏省水稻主要生育期的预报模型。这些模型经过拟合检验,效果较好,为中长期农用天气预报奠定了技术基础。
1 资料与方法
1.1 数据来源
本文选取8个水稻观测站有记录以来的农业气象资料,其中兴化、镇江、宜兴、昆山这4站资料的时间为1980─2015年,赣榆站资料的时间为1981─2015年,淮安站资料的时间为1984─2015年,徐州站资料的时间为1986─2015年,高淳站资料的时间为1990─2015年,因此统一用1990─2015年的资料做相关分析。大气环流特征量资料来自国家气候中心,海温资料来源于西太平洋(10°S~50°N、120°E~80°W)海表面温度月平均值,水平分辨率为5°×5°。
1.2 数据处理
为了将水稻的生育期数值化,以便建模,本文对各生育期进行了数据转换处理。播种期、返青期:以每年的1月1日为基准,计算播种期为当年的第多少天;返青期则在播种期的基础上继续累加实际的日数。例如徐州1986年水稻播种期为5月11日,为当年的第131天,故将5月11日转换为131。出苗至乳熟期:为了尽量避免由于播期的变化导致各生育期转换后的数据发生改变,本研究对出苗至乳熟的9个生育期进行了归一化处理,即首先统计播种至各生育期的天数,用其除以播种至成熟期的天数,即为各生育期处理后的数据。
本研究将影响我国天气过程的74项500 hPa大气环流特征量和海表面温度月平均值作为自变量,应用场相关分析方法及最优化相关处理技术,寻找表征江苏省水稻生育期的最佳特征因子,并建立其回归模型。
1.3 方法
1.3.1 最优化因子相关分析 自变量与因变量之间存在着不同形式(线性、非线性)的相互关系,找到两者之间最合适的相关形式非常重要,但也十分困难。而最优化相关普查方法可以解决这一问题。为了增加因子的信息量,首先对因子进行膨化处理,然后再进行最优化普查。
因子X的线性和非线性[含单调的和非单调的单峰(谷)型]化处理可归纳为一种通用变换形式:
式(1)中:a、b为待定参数,且Xmin≤b≤Xmax,B=max(Xmax-b,b-Xmin)。
经上式变换后,Q与Y(Y为因变量)必为单调关系,且(|X-b|/B+0.5)的值在区间[0.5,1.5]内变化。对于单峰(谷)型关系的因子,为了避免X在最低值或最高值附近出现个别样本的偶然误差影响,b的取值以[Xmin+(Xmax-Xmin)/4,Xmax-(Xmax-Xmin)/4]为宜。至于a值,根据我们的实际工作经验,一般在(-10,-1/10)和(1/10,10)2个区间内取值效果较好。待定参量a、b可用最优化技术求出。令目标函数为:
式(2)中:R为当a、b取一定值时,Q与Y的相关系数。
应用二维寻优的变量转换思路将式(2)分解为一元问题进行逐步处理。于是,采用上述方法进行相关普查后,获得了一批与因变量相关最显著的自变量因子。
1.3.2 最佳海温自变量因子的选取 由于太平洋海温是一个场,为了避免单相关的偶然性,在进行最优化相关处理前,需首先利用场相关分析方法对海温场进行相关普查,即根据场相关分析原理[14],剔除高相关格点不足3个的海温区,以存在连续4个以上显著相关格点的海区作为1个显著相关区,取区内格点海温的平均值作为1个新的海温因子。再将新的海温因子进行最优化普查(方法同1.3.1),挑选出与水稻生育期相关最显著的海温因子。
1.4 稳定性检验与独立性检验
通过最优化相关普查方法可以找到显著相关因子,但它不能保证选择到的因子与因变量之间相关的平稳性。因此,本文采用滑动相关检验法对普查得到的因子进行稳定性检验,以淘汰掉一些相关程度前好后差或波动变化较大的因子,保证所选因子与水稻生育期之间具有稳定、显著的相关关系。然后采用主成分识别法对普查得到的因子进行独立性检验,剔除共线性因子,即在达到α=0.01信度水平的显著相关因子中剔除复共线性因子,最终剩下的因子就是分别与各站点水稻各生育期相关显著、稳定且相对独立的因子。
1.5 预报模型的构建
由于已考虑了因子相关的最优化、显著性、稳定性和独立性,因此,由自变量组合的联立方程可以达到非奇异的效果。利用逐步回归分析方法,从8个站点中保留下的相关环流和海温因子中,筛选出贡献最大的因子,建立稳定、可靠的水稻生育期回归预报模型。考虑资料来源和预报时效,选取上一年1月到动态预报前1个月的因子进行分析处理。
2 结果与分析
2.1 江苏省水稻生育期的环流预报模型
2.1.1 水稻生育期与环流特征量的相关分析 通过分析得到,8个水稻观测站的水稻生育期均与全球副高各种指数相关密切。受篇幅限制,本文仅以镇江站水稻分蘖期与环流特征量的相关分析为例,从表1可以看出:镇江水稻分蘖期与全球副高各种指数的相关性均达到了0.01的极显著水平。
表1 镇江站水稻分蘖期的环流特征量最优因子相关普查结果
2.1.2 水稻生育期的环流特征量预报回归模型的构建 由于已经考虑了因子相关的最优化、显著性、稳定性和独立性,因此,由自变量组合的联立方程可以达到非奇异的效果。利用逐步回归分析方法,从8个站点保留下的相关环流因子中,筛选出贡献最大的因子,建立了各站点水稻主要生育期的环流预报模型。受篇幅限制,本文仅以镇江、淮安站为例,从表2、表3中可以看出,2个站点水稻各生育期的回归模型均达到了0.01的极显著水平,说明所建回归模型稳定、可靠。
表3 淮安站水稻主要生育期的环流预报模型
2.2 江苏省水稻生育期的海温预报模型
2.2.1 江苏省水稻生育期与西太平洋海温的关系分析 为了寻找江苏省水稻各生育期的前期海温强信号区,对8个站点的当年水稻生育期与上一年1月到当年各生育期前1个月的各月海温场资料进行计算,根据临近原则,寻找相关区。结果显示,江苏省8个站点的水稻各生育期对太平洋海温响应明显,受篇幅限制,本文仅以镇江水稻分蘖期、淮安水稻抽穗期的相关系数空间分布图为例,详细分析这2个代表站点代表生育期与太平洋海温的相关性。
镇江水稻分蘖期与上年1月至当年5月太平洋海温均存在高相关区(指相关系数≥0.32或≤-0.32,通过0.05显著性检验),相关系数的空间分布较为一致,基本上都呈现“西负东正”的特征(西太平洋存在负相关区,东太平洋存在正相关区)(图1)。具体而言,在西太平洋10°N以北存在显著负相关区,在高相关中心相关系数的绝对值均在0.45以上;在上一年1─7月,高负相关区域范围逐步增大,相关性逐步增强,并逐步向西移动,其中上一年6月,显著相关区域集中在3个海区,地理位置为(45°N~50°N,170°E~165°W)、(10°N~35°N,130°E~140°W),负相关中心的相关系数达到-0.51;上一年7月至当年1月,高负相关区域逐渐减小、分散;当年2月以后,高负相关区域范围再次逐步增大,相关性逐步增强。正相关区位于东太平洋海区,在上一年1─4月,高正相关区域范围逐步增大,相关性逐步增强;上一年5─7月,正相关区消失,至8月再次出现;上一年8月至当年2月,高正相关区域范围再次逐步增大,相关性逐步增强,其中当年2月正相关中心的相关系数达到0.51;从当年3月开始,高正相关区域逐渐缩小。
图1 1980─2015年镇江水稻分蘖期与太平洋海温的相关系数
淮安水稻抽穗期与上年1月至当年5月太平洋海温均存在高相关区(指相关系数≥0.34或≤-0.34,通过0.05显著性检验)(图2)。从正相关区来看,总体呈现“东西太平洋的正相关区交替出现”。具体来说,在上一年1─4月,西太平洋25°N以北、东太平洋5°N以南均存在高相关区,其中西太平洋正相关区的相关性逐步增强,上一年4月正相关中心的相关系数达到0.61;从上一年5月开始,西太平洋的正相关区域逐步减小,至上一年7─9月时消失;但上一年7─9月东太平洋地区开始出现正相关区,且随着时间的推移,该相关区域范围逐步增大,相关性逐步增强,至上一年11月时正相关中心的相关系数达到0.47;从上一年10月开始,西太平洋地区再次出现正相关区,且相关区域范围逐步增大,相关性逐步增强,至当年1月时正相关中心的相关系数达到0.62;之后高相关区域逐渐减小,在当年3月以后消失。从负相关区来看,上一年1─9月,在10°N以北、140°W以东存在高相关区,其中1─6月相关区域范围逐步增大,相关性逐步增强,至上一年6月时负相关中心的相关系数达到-0.55;随后该相关区域逐渐减小,相关性逐步减弱;从当年2月开始,负相关区域逐步向北扩大,相关性逐步增强;当年6─7月存在3个负相关中心,相关系数分别达到-0.59、 -0.53、-0.57。
图2 1984─2015年淮安水稻抽穗期与太平洋海温的相关系数
由此可见,无论是水稻分蘖期还是抽穗期,都与上年和当年太平洋海温存在高相关性。因此,太平洋海温对水稻分蘖期和抽穗期具有可预报性,而且海温影响的滞后效应可大幅提高预测模型的预报时效。
2.2.2 水稻生育期的海温预报回归模型的构建 为了使建立的预测模型的拟合和预报效果达到最佳,本文将相关区内格点海温的平均值进行了最优化处理;在此基础上,进一步考虑了预报因子相关的稳定性和独立性。利用逐步回归分析方法,建立了江苏省8个站点水稻各生育期的海温预报回归模型,限于篇幅,本文仅以镇江、淮安站为例。从表4、表5中可以看出,2个站点水稻主要生育期的海温预报模型均达到了0.01的极显著水平。
表4 镇江水稻主要生育期的海温预报模型
表5 淮安水稻主要生育期的海温预报模型
2.3 预报模型的拟合效果
利用上述环流和海温预报模型进行回代检验,对水稻各生育期进行模拟检验,图3、图4分别给出了镇江水稻分蘖期和淮安水稻抽穗期环流和海温预报模型的拟合情况,由此可以看出,2个模型的历史拟合效果均较好,其中镇江水稻分蘖期的环流回归预报模型的拟合误差平均为2.88%,其中拟合误差超过5%的年份有6个;海温回归预报模型的拟合误差平均为5.42%,其中拟合误差超过5%的年份有16个。淮安水稻抽穗期的环流和海温回归预报模型的平均拟合误差分别为1.02%和1.08%,且所有年份的拟合误差均小于3%。
图3 镇江水稻分蘖期环流和海温回归预报模型的模拟情况
图4 淮安水稻抽穗期环流和海温回归预报模型的模拟情况
3 结论与讨论
本文选取影响我国天气过程的74项500 hPa大气环流特征量和海表面温度月平均值作为自变量,应用场相关分析方法及最优化相关处理技术,寻找了预测江苏省水稻生育期的最佳特征因子。
水稻生育期与全球副高各种指数相关密切,水稻各生育期与全球副高各种指数的相关性均达到了0.01的极显著水平。利用逐步回归分析方法,筛选出贡献最大的因子,建立了稳定可靠的江苏8个站点水稻各生育期的环流回归预报模型,各个模型的历史拟合效果均较好。
江苏省水稻各生育期对太平洋海温响应明显,与上年和当年太平洋海温存在高相关性,因此太平洋海温对水稻生育期具有可预报性。利用逐步回归分析方法,建立了江苏各站点水稻各生育期的海温回归预报模型,各模型的历史拟合效果也较好。
作物的生长发育进程受当地环境的直接影响,气象条件是主要的影响因子,其中气温、日照时数等气象要素的变化会改变作物的生长速率和生育期[17-18];而各地气象要素的变化又与气候背景场息息相关。由于气候背景是由大尺度因子构成的,对各地气象要素的影响具有滞后效应[19],因此利用大气环流特征量和海温来建立江苏省水稻生育期的预测模型,不仅可以大幅提高预测模型的预报时效,而且能有效地弥补短期农用天气预报的不足。在实际业务服务中,利用所建模型可以提前1~2个月对水稻生育期进行预测。虽然本研究所建立预测模型的拟合效果均较好,但在今后实际应用中的预报效果还有待于验证。
IPCC发布的第五次科学评估报告指出,自工业化以来,全球地表温度持续升高,出现了气候变暖的趋势[20]。未来除了采用气候因子来预测作物生育期外,还可以划分不同的生育阶段,在作物种植气候资源评估等方面做进一步分析研究[21-23],然后通过选育和调整优良品种以使之更好地适应气候变化。