基于Himawari-8卫星AOD产品的河南省能见度反演研究
2020-11-25许乐心李琳琳
许乐心,费 烨,李琳琳
(1.河南省气象探测数据中心,郑州 450003;2.国家气象信息中心,北京 100081;3.三峡水利枢纽梯级调度通信中心,湖北宜昌 443000)
随着经济的发展,人类活动对环境的影响增大,水平能见度日益成为一个备受人们关注的气象要素,它与交通运输、空气质量、人类健康息息相关。目前,气象台站使用水平能见度仪观测地面能见度。由于气象站点只是在一定范围内具有代表性,观测结果在空间上具有离散特征。而低能见度天气的水平尺度变化范围很广,地面观测站点的观测结果不足以涵盖尺度较大的低能见度天气过程。随着卫星遥感技术的发展,越来越多的遥感数据被应用于天气监测、预报,防灾减灾之中。卫星观测数据既可以做到空间上的大面积覆盖,也可以实现与地面台站观测的同步进行。目前在气溶胶研究、能见度反演、污染物分布及输送等方面已经得到了很多成果[1-6]。例如,通过对Terra和Aqua的MODIS气溶胶光学厚度(Aerosol Optical Depth,AOD)与地面能见度对比分析,证明了卫星的气溶胶数据产品可用于能见度的研究[7-12],常用的研究方法包括数理统计、气溶胶标高法、数值模式、神经网络等。Fu等[13]利用Terra/MODIS的AOD数据产品和AERONET数据建立混合线性效应模型来估测PM2.5浓度,结果显示,在冬季时, MODIS的AOD数据的空间覆盖率约为50%,通过增加AERONET的协同作用,能将AOD数据的空间覆盖率提高至81%。气溶胶标高法也常被用于建立气溶胶光学厚度和地面能见度之间相互关系[14-16]。Kessner等[8]通过气溶胶标高建立了AOD与地面能见度之间的重要联系。张倩倩等[16]利用气溶胶标高和乘幂公式分别建立能见度估算模型,提出乘幂公式对能见度4~10 km部分估算效果较好,在大值和小值区反演误差较大;气溶胶标高法在能见度大值和小值区反演具有明显优势,但在小值区反演会出现负值。冯沁等[17]将Terra和Aqua的MODIS和FY-2A/MERSI的AOD资料运用到同化预报试验,可明显降低空报和漏报率。不少学者将神经网络方法应用于卫星的能见度反演研究中,建立了AOD估算能见度模型,取得很好的效果[18]。
日本气象厅在2014年7月发射了新一代静止气象卫星Himawari-8,全区域的时间分辨率可以达到10 min/次,搭载的新型传感器AHI(Advanced Himawari Imagery)波段包含了气溶胶通道,在能见度反演方面潜力极大。因此本文的研究思路是利用Himawari-8的AOD数据产品,运用线性混合效应模型,将卫星的AOD数据产品作为固定因子,将观测时间、台站位置等因素作为随机因子来反演河南省地面能见度,以提高地面能见度的时空分辨率,为霾天气过程的预报、预警提供数据支撑。
1 数据和算法
1.1 数据来源
1.1.1 台站数据 数据选用了2018年12月—2019年2月河南省119个国家地面观测站的逐小时10 min水平能见度资料,气象数据来自于CIMISS气象数据统一服务接口提供的中国地面逐小时资料集。台站分布如图1所示。
图1 河南省119个国家级地面观测站分布
1.1.2 卫星数据产品 卫星数据是由日本Himawari-8卫星观测,由国家气象卫星中心定标、反演得到的气溶胶光学厚度数据集产品。数据时段同为2018年12月—2019年2月。该气溶胶数据产品的时间分辨率为10 min,空间分辨率约为2 km。数据通过ftp方式从国家气象卫星中心获取。
为验证该套数据的可靠性,利用2018年12月美国Aqua卫星AOD数据产品对Himawari-8数据进行验证。从NASA官网下载Aqua卫星L2级数据产品,该气溶胶数据产品时间分辨率为5 min,空间分辨率约为3 km(https://ladsweb.modaps.eosdis.nasa.gov/search/order/1)。
1.2 反演算法
本文使用的算法是线性混合效应模型,这个模型的特点是在进行建模时既包含固定因子又包含随机因子。现实中有很多数据问题是不能简单地采用普通线性回归处理的。固定效应一般是那些可以预测的因素,能够完整地划分总体;而随机效应则更多是因为个体差异导致,并且同一个体在不同的重复测量中也存在组内随机差异。
假设能见度和1/AOD存在线性关系[8],不同的台站,这两者之间的线性关系会存在差异,即线性方程的斜率项和截距项是不同的。不同的日期、相对湿度、甚至于大气环流形势等等都会对能见度有影响。线性混合效应模型能够综合考虑这些因素的影响,可以将时间、相对湿度、台站经纬度信息作为随机因子,建立如下模型。
(1)
其中,i代表站点,j代表时间,Vi,j代表不同台站不同时间的地面水平能见度,τi,j代表不同台站不同时间的AOD,α和β分别为截距和斜率项,μj,υj分别代表时间随机因子对截距和斜率产生的随机效应,si代表台站经纬度信息、相对湿度等因素产生的随机截距项,εi,j为随机误差项。
2 Himawari-8卫星气溶胶数据产品质量验证
大量研究成果证明,Terra和Aqua的MODIS的AOD产品精度相对可靠[19-20]。由于Himawari-8为地球同步卫星,其气溶胶产品的时间分辨率可以达到10 min,空间分辨率约为2 km。与Terra和Aqua极轨卫星相比,Himawari-8在时间分辨率上有很大的优势,将Himawari-8的气溶胶数据应用到研究中,可提高大气能见度反演的时间精度。为验证Himawari-8气溶胶数据产品的可靠性,先利用Aqua/MODIS数据产品对Himawari-8的AOD数据进行了质量对比。
图2给出了两套卫星数据AOD产品在2018年12月16日14时的分布情况。通过对比可以看出,Himawari-8卫星的AOD数据产品的空间覆盖率要比Aqua卫星AOD数据产品的高,Aqua卫星由于其极轨卫星的特点,受到AOD反演方法的限制,在河南东北部地区和西部地区靠近图像边缘没有反演得到AOD数据。
图2 2018-12-16T14 Himawari-8(a)和Aqua(b)卫星AOD产品对比
为了定量讨论Himawari-8卫星AOD数据产品的质量,这里需要先对两套卫星资料进行数据匹配。Aqua是极轨卫星,相对太阳静止,Aqua的过境时间为地方时13:30。因Himawari-8卫星AOD数据产品的时间分辨率为10 min,Aqua卫星气溶胶数据产品的时间分辨率为5 min,以Aqua过境时间为时间基点,选择和Aqua过境时间最近的Himawari-8卫星气溶胶产品匹配。另Himawari-8卫星气溶胶产品的空间分辨率为2 km,Aqua卫星气溶胶产品的的空间分辨率为3 km,因而以Aqua卫星产品数据经纬度为中心,±1.5 km范围内所有的Himawari-8的AOD数据做空间平均,得到空间分辨率为3 km的Himawari-8 AOD数据。
通过匹配得到2018年12月两套AOD产品关系(图3)。两套卫星数据2018年12月在河南地区共有41 194对匹配数据,相关系数达到了0.87(通过了0.05显著性检验)。图中散点的颜色代表在对应位置散点出现频率的大小,颜色越接近红色,表示该数值出现频率越高。两套卫星AOD产品数值分布相近,一致性很好,大部分数值均集中在AOD=1以内。通过和理想的y=x曲线对比,AOD=0.61是两条直线的交点,在AOD小于0.61时,相比于Aqua,Himawari-8的AOD数值略微偏小;在AOD大于0.61时,Himawari-8的AOD数值略微偏大。两套数据产品最大差异不超过0.11,因此Himawari-8的AOD数值产品是可靠的。
图3 Aqua卫星和Himawari-8卫星的AOD数据的散点密度及相关性分析
3 能见度反演模型验证与应用
使用线性混合效应模型对Himawari-8的AOD和河南省台站观测的能见度数据进行建模。通过验证发现台站观测的1 min水平能见度和10 min水平能见度在数值上差别不大,因此使用10 min水平能见度。采用交叉验证的方法,随机挑选80%的AOD数据进行建模,将剩余20%的数据计算得到能见度数据,通过和台站观测的能见度对比来验证模型效果。由于AOD数据产品是格点数据,台站数据是离散型的,因而需先进行空间匹配,将AOD格点场的数据插值到台站。采用平均插值算法,即以台站位置作为中心,±5 km范围Himawari-8的AOD的算术平均值来进行空间匹配,得到与台站数据一一对应的逐小时的AOD数据用于建模。通过多次参数试验,当台站位置和观测时间作为影响斜率的随机因子时模型效果最优。
将所获取的2018年整个冬季能见度和卫星数据进行逐小时匹配、逐小时建模,考虑到能见度的演变在时间上具有连续性,添加建模时次的前两个小时卫星数据作为模型的时间随机因子,当模型可用站点数超过30时,进行建模并计算该模型的决策系数。在回归模型中,决定系数越高,代表可以被解释的程度越高,回归模型的效果越好。由于静止卫星在夜间时段没有数据,且AOD数据产品在反演时受到云等的影响,可建模时段主要集中在10—15时。从建模的统计结果上看,决策系数的数值范围为0.24到0.96。通过绘制箱线图(图4)可以看出,去除部分异常数据,模型的决策系数大部分集中在0.4以上,逐小时的决策系数中值均在0.7以上,证明模型是可靠的。
图4 2018年冬季数据模型决策系数箱线
为了验证模型的反演效果,选取2018年12月16日06UTC数据所建模型,将空间匹配后的AOD数据代入模型,得到各台站的反演能见度数据集,并与台站观测能见度进行对比。如图5所示,能见度的计算值与台站观测值相关系数可以达到0.82,通过了显著性检验。观测能见度和反演能见度的数值大部分集中在5~20 km之间,能见度的观测平均值为11.3 km,卫星反演平均值为11.8 km,绝对平均误差为1.69,均方根误差为3.72 km。模型计算的能见度与观测能见度具有很好的一致性。
图5 观测能见度与模型计算能见度的散点密度及相关性分析
应用上述模型,将分辨率为2 km的Himawari-8卫星AOD数据代入到模型中,即可计算得到空间分辨率为2 km的河南省格点能见度产品。选取2018年12月16日14时个例来说明反演效果,模型反演的格点能见度与观测能见度对比如图6所示。通过模型计算得到的能见度(图6 a)与台站观测能见度(图6 b)分布基本一致,河南省的西北部地区能见度较大,空气质量较好;在安阳、濮阳、新乡、焦作等豫北地区有一片区域能见度较小;重污染地区主要位于豫南。反演的能见度空间分布要比台站观测精细很多,能见度的空间分辨率得到了显著提高。
4 结论
利用Himawari-8卫星的AOD数据产品和河南省地面气象观测资料,分析了Himawari-8的AOD数据产品与Aqua卫星AOD数据产品的一致性, 并建立了能见度的线性混合效应模型。
图6 2018-12-16T14河南省能见度分布(a:模型反演;b:台站观测)
模型选取卫星AOD数据产品作为模型的固定因子,将台站位置和观测时间作为随机因子,利用模型反演得到河南省高分辨率的能见度图。主要结论如下。
(1)Himawari-8卫星的AOD产品与Aqua 的AOD产品一致性较好,相关系数达到0.87,通过了0.05的显著性检验。
(2)通过建立线性混合效应模型,反演得到的能见度与观测的能见度相关系数达到了0.82,通过了0.05的显著性检验,观测能见度的平均值为11.3 km,反演能见度的平均值偏差仅为0.5 km。
(3)根据模型反演了2018年12月16日14时的地面能见度。结果表明,模型的模拟结果与观测数据分布特征基本一致,空间分辨率明显提高,可达2 km。