APP下载

双权重质量控制法在FY-3B/IRAS资料中的应用研究

2014-01-05刘晓蓓孔芹芹

成都信息工程大学学报 2014年6期
关键词:亮温控制法离群

王 根,刘晓蓓,杨 寅,孔芹芹

(1.安徽省气象信息中心,安徽合肥230031;2.国家气象中心,北京100081)

0 引言

数值天气预报(Numerical Weather Prediction,NWP)已成为当今世界天气预报中的重要手段。在数值预报中影响预报准确性的主要因素有2个:NWP模式本身的准确程度;用作预报模式积分的初始条件的好坏。资料同化则为数值天气预报模式提供精确的初始条件提供了可能[1]。

随着遥感探测技术的发展,卫星资料弥补了海洋和人烟稀少地区资料不足的缺陷,对全球预报准确性地提高起到了至关重要的作用[1]。红外探测器主要覆盖CO2和H2O光谱区域。CO2和H2O吸收带分别提供大气温度和湿度信息,而温度、湿度是模式变量用于数值模式进行预报,表明红外探测器资料在数值预报中应用具有重要的意义[2-3]。

以前间接使用卫星数据,首先把卫星观测到的通道亮温进行反演得到模式可以使用的温度、湿度信息,称为“卫星到模式”的反演途径。由于反演是一对多的问题,有学者提出使用正则化思想,主要增加约束条件解决一对多的不确定性。随着技术的发展,变分同化可以直接使用卫星通道亮温,用正演方法避免反演不确定性[1,4]。

变分同化基础是统计中的估计理论。常用的方法有最小方差估计、最大似然估计和贝叶斯理论,最小二乘拟合事实上是高斯误差分布假定下的最大似然估计[5-6]。变分同化基本思想是将资料同化归结为一个二次泛函极小化问题,对其求极小化得到所需要的解。变分同化要求误差满足高斯分布,目的是应用最小二乘理论,最小二乘法要求误差相互独立、以零为数学期望具有相同方差且满足高斯分布。当实际观测值包含离群点时,误差不服从高斯分布具有“拖尾现象”。最小二乘法对偏离高斯分布的假定十分敏感,这种偏斜可能会对变分同化系统的稳健性产生致命的影响[7-8]。根据最小二乘法的数学理论,最终结果是离群值和正常值之间的妥协与真实解相差较远,导致估计出的参数不准确,所以在进行资料变分同化时需要首先运用合适算法识别出数据中的离群点并加以处理(称为变分同化前的质量控制部分)[7-8]。

资料的质量控制算法是变分同化关键的步骤,也是国内外学者研究的热点。陶士伟等[9]对北京地区地面自动站的资料基于极值检查、要素间一致性检查、时间一致性检查等多种检查方法进行了相应资料的质量控制算法研究。郝民等[10]在中国区域GRAPES(Globe and Regional Assimilation and Prediction System)三维变分同化系统中对常规观测资料(包括船舶、探空、地面及飞机等资料)进行了变分质量控制,改进了该系统分析与降水预报结果。Qin et al[11]基于变分同化中观测误差和背景误差均要求满足高斯分布的假定,利用2008年1月1°×1°的NCEP(National Centers for Environmental Prediction)资料提出了基于经验正交分解质量控制法对地面2m观测温度进行了质量检查与处理,取得了较好的结果。

对于卫星资料而言,一般是基于通道亮温偏差进行质量控制算法研究,所谓亮温偏差是卫星通道观测亮温(O)与模拟亮温(B)之差,定义为O-B[12]。模拟亮温通过把背景场(文中采用NCEP分析场资料)输入到快速辐射传输模式,文中采用欧洲中心European Centre for Medium-Range Weather Forecasts(ECMWF)的Radiative Transfer for TIROS-N Operational Vertical Sounder(RTTOV)[13]计算得到。目前变分同化系统中多采用阈值检查法进行资料的质量控制,将不满足的观测资料剔除[14],对于卫星资料而言,式中yoi、ybi分别为通道i的实际观测亮温与背景场模拟亮温,k为倍数,σo为标准差。算法的缺点是样本中的离群点(尤其是偏差较大的离群点)会影响统计结果。Zou et al[15]提出基于双权重质量控制进行GPS掩星资料的处理取得了较好的结果。双权重法现被用于一系列资料的质量控制研究中(如,FY-3A微波湿度计资料[12])。文中将双权重质量控制算法用于FY3B/IRAS资料,剔除受地表发射率、云影响和误差较大的离群资料。

1 双权重质量控制算法介绍

采用质量控制算法的目的是找出资料中的离群点,即离开均值“距离”较大的资料[12]。实际执行质量控制算法过程中,离群点值的定义(超过多大的值称为离群点)对最终结果会产生一定的影响。一般先统计所要研究的观测资料以及模拟与观测资料之间的偏差得到资料的分布结构和统计特征,再根据数理统计理论并结合经验确定离群值。也可以基于稳健统计思想,稳健统计具有两个优点:(1)当数据分布结构未知或虽然已知不满足高斯分布时,稳健统计能够较好地描述所研究的问题;(2)当样本数据中存在离群点时,稳健统计不会偏离实际解太远,也即是稳健统计对离群点不太敏感[7-8]。基于稳健性较强的双权重质量控制法进行FY3B/IRAS资料的应用研究,利用双权重平均值和标准差可以减小离群点对统计结果的影响。

IRAS资料(xi,i=1,2,…,n)中的离群点可以通过双权重法进行识别。其中,xi是通道亮温偏差O-B。双权重平均值和双权重标准差BSTD计算公式[12,15]:

其中,M是中位数,wi是权重函数,Xi是样本值(即通道亮温偏差yoi-ybi)。权重函数wi定义为

式中,MAD是偏差中位数,即的中位数。若|wi|>1,则取wi=1。

离群资料可以根据Z值的评分确定:

2 FY3B/IRAS资料质量控制试验

2.1 观测、背景资料及模式介绍

中国第二代极轨气象卫星风云三号B星(Feng Yun-3B)于2010年11月5日发射升空。文中研究其携带的红外分光计(Infrared Atmospheric Sounder,IRAS),只考虑IRAS前20个通道。关于通道探测的气体和探测最大贡献层见参考文献[16]。观测资料为全球L1c格式的IRAS观测资料(时间从2012年12月26日00时至2013年1月4日18时共10天)。L1c格式数据来源于国家卫星气象中心数据室。把NCEP分析场00时、06时、12时和18时的资料作为背景场采用RTTOV进行IRAS通道亮温模拟。

全球/区域同化和预报系统GRAPES是中国科学家在充分吸收国外数值天气预报和相关学科最新研究成果的基础上,自主设计的新一代数值同化和预报模式[17]。GRAPES模式共有4个模块:标准初始化模块、资料同化模块(3DVar)、预报模块和后处理模块。当前GRAPES-3DVar变分同化系统可以同化探空、云迹风、GPS水汽反演资料和卫星通道亮温等资料。GRAPES-3DVar采用ECMWF的快速辐射传输模式RTTOV进行卫星通道亮温模拟。

2.2 资料质量控制试验以及结果分析

基于双权重质量控制法(Quality Control,QC)对IRAS通道亮温偏差(O-B)进行处理。双权重平均值和标准差能够减小离群点对统计结果地影响。具体执行过程中分两步进行:

Step1:粗检查。粗检查即极值检查,要求IRAS通道观测亮温和相应的模拟亮温取值在150K~350K,剔除此范围外的资料。

Step2:离群点检查。离群资料通常是根据该资料离开样本均值的距离结合标准差进行度量。样本数据(xi,i=1,2,…,n)中的离群点可以通过双权重法进行识别。其中xi是IRAS通道亮温偏差O-B。

基于双权重法进行IRAS资料质量控制研究,先采用2012年12月26日00时和06时资料为例做简单说明。

2.2.1 IRAS通道观测和模拟亮温

限于篇幅,文中只给出通道4的情况。图1分别给出通道4的观测亮温(Obs)、模拟亮温(Sim)、亮温偏差(Bias)和基于双权重质量控制法得到的Z-score。需要说明的是文中把Z-score大于4的值都标记为4。

图1 IRAS通道4在2012年12月26日00和06时观测亮温(Obs)、模拟亮温(Sim)、亮温偏差(Bias)和Z-score值分布

从图1可以看出,亮温偏差主要集中在-34K~14K,模拟出的结果整体效果较好,但少数地区(如,极区)偏差较大。从Z-score图可以看出,Z-score得分与偏差分布具有较好的一致性。对IRAS通道亮温在粗检查的基础上,需要进一步剔除亮温偏差超过20K的通道视场点亮温资料[7]。

下面根据通道亮温偏差(O-B)基于双权重质量控制法进行FY3B/IRAS资料处理研究(离群点识别)。

2.2.2 IRAS 资料离群点识别

计算2012年12月26日00时和06时通道4亮温偏差Z-score值。通过计算Z-score值对O-B进行双权重质量控制得出不同Z-score值离群点和通过双权重质量控制法的离散点分布。灰色点代表未通过双权重质量控制的离群点,黑点代表通过双权重质量控制的点。

图2 通道4不同Z-score离群点散点图

区别常规阈值法只对亮温偏差做简单的阈值判断,双权重法从所用的样本出发,减小离群点对最终结果的影响,具有稳健性并且能够保留一些具有“天气现象”的资料。通过双权重质量控制法能够剔除一些异常资料,Z-score值越大通过双权重质量控制的点越多,图中对应的黑色区域越大。对于Z-score值的给定,需要进一步研究如何取值使质量控制后的效果更好。对Z-score值的给定既要考虑离群资料对偏差和标准差的影响,又要考虑离群资料占总观测资料的比例(要尽可能多地保留观测资料)。

对IRAS前20个通道离群点占总观测资料百分比进行统计。考虑到FY3B/IRAS前20个通道中虽然通道权重函数不同,但很多通道探测目的相同。限于篇幅,图3只给出通道4双权重质量控制(QC)前/后40个时次(2012年12月26日00时到2013年1月4日18时)通道偏差(O-B)均值、标准差以及离群资料百分比在不同Z-score值(Z-score<1.5、Z-score<2.0和 Z-score<3.0)随时间(Dec26-Jan4)变化图。

从图3可以看出,Z-score<1.5时通道亮温偏差均值和标准差比双权重质量控制前减小的幅度大,但剔除的离群资料百分比较大。

图3 IRAS通道4亮温偏差(O-B)不同Z-score下的均值、标准差和离群资料百分比

通过统计通道亮温偏差QC前/后的均值和标准差随时间变化,有些通道亮温存在正偏差,而有些通道亮温存在负偏差,所有通道O-B的均值和标准差随时间变化很稳定(其他通道情况图略)。说明通过双权重法剔除离群资料可行,能够应用到GRAPES-3DVar变分同化系统中作为卫星资料初步的质量控制。

图4给出 Z-score<2.0时2012年12月26日到2013年1月4日共10天IRAS通道O-B均值、标准差[18]柱状图。

经过双权重质量控制后去除的离群点都是偏差较大的点(有正偏差和负偏差)。偏差的存在有多种原因,如云和降水的影响、地表发射率不精确、资料中扫描角较大的视野点(需要考虑通道亮温偏差订正)等。文中只是验证基于双权重质量控制法进行FY3B/IRAS资料质量控制的可行性,初步剔除IRAS通道亮温偏差比较大的离群资料。在实际业务变分同化中FY3B/IRAS资料进GRAPES-3DVar同化需要进行严格的质量控制。

图4 IRAS通道亮温双权重质量控制前/后,满足Z-score<2.0)亮温偏差均值和标准差

图5 FY3B/IRAS双权重质量控制前/后通道1、6、11、20亮温偏差均值和标准差散点分布图

2.2.3 耦合双权重法的FY3B/IRAS资料质量控制应用研究

目前GRAPES-3DVar系统中没有同化FY3B/IRAS资料的完整模块。首先,需要把开发的同化IRAS资料模块嵌入到GRAPES-3Dvar变分同化系统中;其次,进行同化FY3B/IRAS资料测试。同化时间从2012年12月24日18时到2013年1月22日00时,背景场来自NCEP的分析场。为了简化只同化FY3B/IRAS资料和常规资料(包括探空、地面、飞机和船舶资料)。通过近一个月的O-B(通道观测亮温与背景场模拟亮温之差)和O-A(通道观测亮温与GRAPES-3DVar同化后的分析场模拟亮温之差)各个时次(每6小时为一个时次)的偏差均值和标准差统计得到同化后偏差均值和标准差显著减小(图略),说明嵌入的模块接口正确。

2013年7月7日06时 FY3B/IRAS(图5)资料在 GRAPES-3DVar中双权重质量控制前(Before QC)/后(After QC)的通道亮温偏差均值(mean)和标准差(std)。质量控制过程包括双权重质量控制和偏差订正(偏差订正方法具体实施过程参考文献[3])。

前面介绍双权重法用于FY3B/IRAS资料的质量控制试验,目的是初步剔除一些“离群点”,而把双权重法的思想耦合到GRAPES-3DVar中是经过了严格的质量控制算法处理。经过质量控制后的模式模拟值与观测值已经比较接近,通道亮温偏差均值绝对值和相应标准差减小,说明质量控制方法是可行的。从上面的离散点图更能说明GRAPES-3DVar系统的性能。

5 结束语

利用双权重质量控制法进行了风云三号B星红外分光计IRAS资料的应用研究。通过监测偏差O-B检验FY3B/IRAS观测资料的质量,达到对FY3B/IRAS资料的质量控制。IRAS前20个通道资料基于双权重质量控制后通道偏差标准差整体显著减小,且随时间波动幅度比双权重质量控制前更稳定。通过把双权重法耦合到GRAPES模式进行IRAS资料的质量控制应用研究,得到此方法用于IRAS资料的质量控制是可行性的。通道亮温偏差绝对值接近于0,满足后期变分同化的理论要求。

[1] 王根.主成分累计影响系数法一种用于高光谱资料的通道选择新技术[D].南京:南京信息工程大学,2011.

[2] 戴铁.利用风云三号气象卫星红外分光计反演大气CO2浓度的理论研究[D].南京:南京信息工程大学,2008.

[3] 王根,陆其峰,刘辉,等.FY-3B红外分光计亮温观测模拟偏差订正的初步研究[J].红外,2014,35(1):18-23.

[4] 张华.辐射率资料的直接同化方法及应用研究[D].兰州:兰州大学,2004.

[5] 邹晓蕾.资料同化理论和应用[M].北京:气象出版社,2009.

[6] Eugenia Kalnay.大气模式、资料同化和可预报性[M].蒲朝霞,杨福全,邓北胜,等译.北京:气象出版社,2005.

[7] Wang G,Zhang J W.Generalised variational assimilation of cloud-affected brightness temperature using simulated hyper-spectral atmospheric infrared sounder data[J].Advances in Space Research,2014,54(1):49-58.

[8] Zhang J W,Wang G,Yang Y,et al.Study on Hyper-spectral Atmospheric Infrared Sounder Assimilation[J].International Journal of Hybrid Information Technology,2013,6(1):123-128.

[9] 陶士伟,仲跻芹,徐枝芳,等.地面自动站资料质量控制方案及应用[J].高原气象,2009,28(5):1202-1209.

[10] 郝民,张华,陶士伟,等.变分质量控制在GRAPES-3DVAR中的应用研究[J].高原气象,2013,32(1):122-132.

[11] Qin Z K,Zou X,Li G,et al.Quality control of surface station temperature data with non-Gaussian observation-minus-back-ground distribution[J].J Geophys Res,2010,115,D16312.

[12] 胡言青,官莉.采用双权重算法进行FY-3A微波湿度计资料质量控制试验[J].气象科学,2013,33(1):59-65.

[13] Hocking J,Rayer P,Saunders R,et al.RTTOV v10 Users Guide[M].NWPSAFMO-UD-023,EUMETSAT,Darmstadt,Germany,2010.

[14] 董超华,李俊,张鹏,等.卫星高光谱红外大气遥感原理和应用[M].北京:科学出版社,2013.

[15] Zou X,Zeng Zhen.A quality control procedure for GPS radio occultation data[J].J.Geophys.Res.,2006.

[16] Qi C L,Chen Y,Liu H,et al.Calibration and validation of the InfraRed Atmospheric Sounder onboard the FY3B satellite[J].IEEE Transctions on Geoscience and Remote Sensing,2012,50(12):4903-4914.

[17] 薛纪善,陈德辉.数值预报系统GRAPES的科学设计与应用[M].北京:科学出版社,2008.

[18] 王刚.定量分析与评价方法[M].上海:华东师范大学出版社,2002,9:87-95.

[19] 刘志权,张凤英,吴雪宝,等.区域极轨卫星ATOVS辐射偏差订正方法研究[J].气象学报,2007,65(1):113-123.

猜你喜欢

亮温控制法离群
量化控制法指导髌骨粉碎性骨折术后功能锻炼的效果观察
一种基于邻域粒度熵的离群点检测算法
霰谱分布特征对强对流云高频微波亮温影响的模拟研究
基于南太平洋的AMSR2 L1R亮温数据质量评估
一种相似度剪枝的离群点检测算法
不对称电压的综合有源控制法
特许经营协议(IFRIC 12)运营方的会计核算与启示
浅析电力系统可靠性评估中的重要控制法
离群数据挖掘在发现房产销售潜在客户中的应用
2014年2月12日新疆于田MS7.3地震热红外亮温异常分析