APP下载

中国气温和降水序列年代际分量的显著性检验

2011-01-09谢瑶瑶李丽平王盘兴罗小莉

大气科学学报 2011年4期
关键词:正态测站正态分布

谢瑶瑶,李丽平,王盘兴,罗小莉

(南京信息工程大学1.气象灾害省部共建教育部重点实验室;2.大气科学学院,江苏南京210044)

中国气温和降水序列年代际分量的显著性检验

谢瑶瑶1,2,李丽平1,2,王盘兴1,2,罗小莉1,2

(南京信息工程大学1.气象灾害省部共建教育部重点实验室;2.大气科学学院,江苏南京210044)

对1951—2008年中国160站年和四季的气温、降水序列是否服从正态分布进行显著性检验,以此为基础进一步对气温和降水序列中的年代际异常分量显著性作了严格的统计学分析,结果表明:1)大多数测站气温序列服从正态分布,大多数测站降水序列不服从正态分布;气温、降水序列是否服从正态分布与地域有一定联系。2)气温、降水序列中年代际变化分量的显著性存在明显差异,多数测站气温序列年代际分量显著,只有少数测站降水序列的年代际分量显著。3)因为1951—2008年中国160站年、季气温和降水序列不全服从正态分布,特别是降水序列的非正态性严重,建议对它们的统计显著性检验采用Monte Carlo方法。

中国年和季气温、降水;线性分量;年代际变化分量;方差贡献;显著性检验

0 引言

年、季平均气温和降水量是最基本的气候状态参数,它们的年代际变化分量为短期气候预测提供背景(施能等,1995;施能,1996;陈兴芳和孙林海,2002;李崇银等,2002),也是气候变化及异常研究关注的基本问题。方差分析是判断气象要素序列方差构成中年代际分量显著性的基本方法,常用于方差分析显著性检验的方法有F检验和Monte Carlo显著性检验方法。依据统计学理论,F检验的样本序列必须来自正态分布的母体。按照统计学原理(穆德和格雷比尔,1982;李贤平,1997;盛骤等,2001;施能,2002;黄嘉佑,2007;魏凤英,2007),大样本平均量一般服从正态分布,据此可直接假定气温和降水序列服从正态分布,采用F检验方法对气温、降水序列的年代际分量作显著性检验。问题在于,气温和降水序列的取样独立性在时、空两方面均难以保证,由它们求得的大样本平均量也就不一定服从正态分布,这很容易导致虚假的检验结果,近年来一些研究者提出了这个问题。施能和陈辉(1988)研究了我国35个测站的月降水量,发现它们均不服从正态分布。陈雅芬等(1994)指出江西年、月平均气温和年降水量服从正态分布,月降水量一般不服从正态分布。胡文东等(2006)、方建刚等(2009)分别对宁夏和陕西的月、季、年降水量进行正态性分析,指出年降水量服从正态分布,月降水量则不然,并且其地理分布存在明显的地域特征。曹杰和陶云(2002)指出降水量的统计分布具有较强的局地性。周雁翎等(2007)、赵佩红(2007)对不服从正态分布的气象要素进行了正态化处理。这些研究都表明气象要素的概率分布十分复杂,在对其进行统计分析之前,有必要先研究其分布特征,在此基础上,再选择合适的统计检验方法。

本文首先对中国160站年、季气温和降水是否服从正态分布进行统计检验;对遵循正态分布的要素,同时使用F检验和Monte Carlo检验方法对其中年代际分量的显著性进行检验,并对比分析两种方法检验结果的异同。

1 资料和方法

1.1 资料

本文所用资料为国家气象信息中心提供的1951—2008年中国160站逐月气温和降水量资料。根据需要,把资料整理成年平均、季平均气温和年、季降水总量序列。其中,春、夏、秋和冬季分别对应3—5月、6—8月、9—11月和12月—次年2月。

1.2 方法

某站要素序列x是本文的直接分析对象,其元素x(t)是第t年的年、季平均气温或总降水量,是大样本统计量。记其对应距平序列为x',其年代际分量记为x's。x'、x's的标量形式为

根据中心极限定理(穆德和格雷比尔,1982),若随机变量相互独立且服从同一分布,当样本充分大时,其均值或和近似服从正态分布。由于单站日气温(降水)既不相互独立,也不一定服从同一分布(施能等,1997;施能等,2004),故它们的均值(或总量)的x(t)不一定服从正态分布。在对要素x序列的年代际变化分量进行方差显著性分析前,首先需判断x(t)是否服从正态分布,以确定适当的方差贡献显著性检验方法。

本文采用谐波分析方法提取年、季平均气温和总降水量序列的年代际变化分量;采用“检验峰态系数和偏态系数统计量的方法”对气温、降水序列进行分布的正态性检验;采用F检验和Monte Carlo检验方法进行方差显著性检验。

2 气温和降水年代际分量的分离及其显著性检验

2.1 单站要素距平序列年代际分量的分离

x'中的年代际变化分量x's是序列

图1给出了南京站年和四季气温、降水样本距平序列及其相应的年代际变化分量分离结果。

2.2 单站要素序列的正态性检验

在对要素序列年代际分量进行显著性检验之前,首先需要了解要素序列是否服从正态分布。常用检验“偏态系数cs和峰态系数ce两个统计量”的方法检验要素样本x分布的正态性(黄嘉佑,2007;魏凤英,2007)。当信度α=0.05时,偏态系数和峰态系数的临界值分别记为cs,0.05、ce,0.05。当同时成立时,判断样本x来自正态母体。

以南京站气温和降水为例,表1给出了南京年和四季气温及降水距平序列进行正态分布检验的结果。可见,南京站年、季气温均服从正态分布;除夏、秋季外,南京站的降水也服从正态分布。图2给出了南京站降水和气温的频数直方图,它们直观表达了上述结论。

图1 1951—2008年南京年和四季气温距平(a,c,e,g,i)、降水距平(b,d,f,h,j)的时间演变曲线(虚线为年代际分量)a,b.年平均;c,d.春季;e,f.夏季;g,h.秋季;i,j.冬季Fig.1 Time series of annual and seasonal(a,c,e,g,i)temperature and(b,d,f,h,j)rainfall anomalies(solid line)and the interdecadal component(dashed line)from 1951 to 2008 in Nanjinga,b.annual;c,d.spring;e,f.summer;g,h.autumn;i,j.winter

2.3 单站要素年代际分量方差贡献的显著性检验

容易证明,构成(3)式中分解式x'=x's+x'¯s右端的两个部分正交,即

且因为x'的自由度为n-1,x's、x'¯s的自由度分别为2K、n-1-2K,故根据施能(2002)可以构造统计量

它们可用于检验要素的年代际分量x's在要素距平序列x'方差构成中显著与否。

表1 1951—2008年南京站年和四季气温、降水距平分布的正态性检验Table 1 Test of normality distribution for annual and seasonal temperature and rainfall in Nanjing from 1951 to2008

按照文献(《数学手册》编写组,2005),当样本x来自正态母体时,Fs服从F分布,使用F检验。本文样本容量n=58,年代际变化截断波数K=6,取α=0.05时,其临界值Fs,0.05(12,45)=1.975。而按照文献(冯康,1978),无论x来自何种分布的母体,均可使用Monte Carlo方法检验x's的显著性。

本文参照文献(王蕊,2009),设计了对年或季的要素距平年代际分量x's进行Monte Carlo显著性检验的方案。下面简要给出其步骤:

1)随机排列x'1 000次,得新序列p(p=;这种方法所得的新序列分布全同于x';

2)从p中分离出年代际变化分量p,求得相应统计量pF^s(p=

3)将p作非升序排列,得h取h=50的h为α=0.05的临界值F^s,0.05;

表2给出了用Monte Carlo显著性检验方法对1951—2008年南京年和季气温、降水序列进行显著性检验的结果。可见,除夏季外,年平均和其余三季的气温年代际分量通过了显著性检验;降水则除冬季外,年平均和其余季节年代际分量均未通过显著性检验。由表1可知,对除夏、秋季降水以外的、来自正态母体样本的气温、降水年代际分量Fs值(共8个)可以进行F检验;所得结果与Monte Carlo显著性检验结果比较可见,气温的Monte Carlo检验结果完全同于F检验结果(相同率达到10/10),降水的Monte Carlo检验结果与F检验略有偏差(相同率为5/6,差在冬季Fs)。通过Monte Carlo检验结果与F检验结果比较可见,Monte Carlo显著性检验方法可用于气象要素年代际分量的显著性检验。

表2 1951—2008年南京年和四季气温、降水方差构成的Monte Carlo显著性检验Table 2 Monte Carlo test of variance components for annual and seasonal temperature and rainfall from 1951 to 2008in Nanjing

3 中国160站气温和降水年代际分量的显著性检验

3.1 正态性检验

在上节基础上,对1951—2008年中国160站的年平均和四季的气温、降水作了分布正态性检验,并将全场(共160站)通过检验的站点总数η汇总于表3。另外,根据文献(Livezey and Chen,1983;Lu et al.,2009),对信度α=0.05时,只有当通过检验的站点总数大于等于13站时,被检验为显著测站的要素时间序列样本才可以认为产生于正态母体。由表3可见,大多数测站(80%以上)的年和四季气温服从正态分布;年平均降水有多数测站来自正态分布母体,而季节平均的降水来自正态母体的测站数均占总站数的50%以下,其中冬季只有26%。

图2 1951—2008年南京年和四季气温距平(a,c,e,g,i)、降水距平(b,d,f,h,j)的频数直方图(虚线为正态分布概率密度函数,Δt、Δr为组距)a,b.年平均;c,d.春季;e,f.夏季;g,h.秋季;i,j.冬季Fig.2 Frequency histogram of annual and seasonal(a,c,e,g,i)temperature and(b,d,f,h,j)rainfall anomalies in Nanjing from 1951 to 2008(the dashed line denotes normal distribution probability density function and Δt,Δrindicate group interval)a,b.annual;c,d.spring;e,f.summer;g,h.autumn;i,j.winter

图3 1951—2008年中国160站气温(a,c,e,g,i)和降水(b,d,f,h,j)服从正态、非正态分布的站点分布(α=0.05;其中▲为服从正态分布站点,○为非正态分布站点;深(浅)阴影代表正态(非正态)分布站点集中区域)a,b.年平均;c,d.春季;e,f.夏季;g,h.秋季;i,j.冬季Fig.3 The distribution of stations where(a,c,e,g,i)the temperature and(b,d,f,h,j)rainfall are in normal and non-normal distribution at 160 stations in China from 1951 to 2008(α=0.05;▲denotes normal distribution stations,and○denotes non-normal distribution stations;deep(shallow)shaded areas denote normal(non-normal)distribution concentrated areasa,b.annual;c,d.spring;e,f.summer;g,h.autumn;i,j.winter

图3给出了年、季气温、降水服从正态分布站点的地理分布,并标出了非正态(正态)分布相对集中的区域。可见,降水的正态、非正态分布散布区域与曹杰和陶云(2002)给出的结论较为一致。关于气温的正态、非正态站点地理分布的特征及原因,有待今后进一步研究。

表3 1951—2008年中国160站年、季气温、降水服从正态分布站数及所占百分比(α=0.05)Table 3 The number of stations where the temperature and rainfall are in normal distribution in China from 1951 to 2008(α=0.05)

3.2 年代际分量的显著性检验

对于要素样本均服从正态分布的那些站,其要素年代际分量的显著性检验可用F检验和Monte Carlo显著性检验两种方法同时进行。表4给出了中国160站中气温、降水服从正态分布的测站的两个要素年代际变化分量通过F检验和Monte Carlo显著性检验的站数。可见,两种方法检验结果差别不大,其中,气温年代际分量通过显著性检验比率高,除夏季外,年和其余三季均在50%以上;降水的年代际分量通过显著性检验比率远低于气温,均在20%以下。

表4 服从正态分布的测站气温、降水的年代际分量通过显著性检验的站数及所占百分比Table 4 The number of stations where the interdecadal components of the temperature and rainfall passed the significance test among the stations of normal distribution

表5统计了不服从正态分布的测站气温、降水年代际变化分量的显著性。由于母体不服从正态分布,其显著性只能通过Monte Carlo显著性检验。可见,非正态分布的气温、降水的年代际变化分量的显著性情况与正态分布的情况类似,即非正态分布的气温年代际分量通过显著性检验的比率高,均在50%以上;非正态分布的降水年代际分量通过显著性检验的比率远低于非正态分布的气温年代际分量。

表5 由Monte Carlo方法检验出气温、降水为非正态分布的测站的年代际分量显著站数及所占百分比Table 5 The number of stations where the interdecadal components of the temperature and rainfall were significant by using Monte Carlo test method among the stations of non-normal distribution

表6汇总了1951—2008年中国160站气温、降水中年代际分量通过Monte Carlo检验的总站数。可见,多数站气温年代际分量是显著的。其中,年和春、冬季显著站数较高,这与屠其璞(1984)分析结果一致。只有少数站的降水年代际分量通过显著性检验。

表6 中国160站年、季气温、降水年代际分量通过Monte Carlo显著性检验的总站数及所占百分比(α=0.05)Table 6 The number of stations passing Monte Carlo significance test for the interdecadal components of the annual and seasonal temperature and rainfall among the 160 stations in China(α=0.05)

为了更清楚显示降水、气温年代际分量显著的区域分布情况,图4给出了气温、降水年代际分量通过显著性检验的站点空间分布。可见,年气温显著站基本与全国160站点分布一致;春季气温序列中我国西南及华南地区显著站点减少;夏季气温序列中长江流域显著站点较少;秋季气温的显著站点数则集中在我国三北地区、西南以及沿海一带。降水序列中,年和四季通过显著性检验的站点均占少数,其中显著站点较多的冬季(22站),站点分布主要集中在东北北部及长江、黄河上游地区;秋季(15站)显著站点主要分布在长江沿岸。根据文献(Livezey and Chen,1983;Lu et al.,2009),从全场角度考虑,可认为中国年、季降水年代际分量总体上不显著。

图4 1951—2008年中国160站气温(a,c,e,g,i)和降水(b,d,f,h,j)中年代际分量通过Monte Carlo显著性检验的站点(图中●所示)分布(α=0.05)a,b.年平均;c,d.春季;e,f.夏季;g,h.秋季;i,j.冬季Fig.4 The stations(●)where the interdecadal components of(a,c,e,g,i)temperature and(b,d,f,h,j)rainfall are significant in Monte Carclo significance test among the 160 stations in China from 1951 to 2008(α=0.05)a,b.annual;c,d.spring;e,f.summer;g,h.autumn;i,j.winter

4 结论

本文在对1951—2008年中国160站年和四季的气温、降水分布的正态性检验基础上,着重对气温、降水年代际异常分量的显著性作了严格的统计学分析,得到以下主要结论:

1)1951—2008年中国160站中大多数测站的气温服从正态分布,大多数测站降水不服从正态分布;气温、降水是否服从正态分布与地域有一定联系。

2)气温、降水序列中年代际变化分量的显著性存在明显差异,多数测站气温的年代际变化分量显著,只有少数测站降水的年代际分量显著。

3)因为1951—2008年中国160站年、季气温、降水不全服从正态分布,其中降水的非正态性严重,所以建议采用Monte Carlo检验方法对它们进行统计显著性检验,包括方差分析和相关分析的显著性检验等。本文采用的Monte Carlo检验方案,所得结果合理,可供参考。

致谢:国家自然科学基金委员会地球科学部南京信息工程大学大气资料服务中心提供了1951—2008年中国160站逐月平均气温、降水量资料,谨致谢忱。

曹杰,陶云.2002.中国的降水量符合正态分布吗?[J].自然灾害学报,11(3):115-120.

陈兴芳,孙林海.2002.我国年、季降水的年代际变化分析[J].气象,28(7):3-9.

陈雅芬,刘福基,张超美.1994.江西省主要气象要素的正态分布检验[J].江西气象科技(4):34-35.

方建刚,毛明策,程肖侠.2009.陕西降水的正态分布特征分析[J].西北大学学报,39(1):131-136.

冯康.1978.数值计算方法[M].北京:国防工业出版社:211-242.

胡文东,陈晓光,李艳春,等.2006.宁夏月、季、年降水量正态性分析[J].中国沙漠,26(6):963-968.

黄嘉佑.2007.气象统计分析与预报方法[M].北京:气象出版社:33-35.

李崇银,朱锦红,孙照渤.2002.年代际气候变化研究[J].气候与环境研究,7(2):209-219.

李贤平.1997.概率论基础[M].2版.北京:高等教育出版社.

穆德A M,格雷比尔F A.1982.统计学导论[M].史定华,译.北京:科学出版社:169-177.

盛骤,谢式千,潘乘毅.2001.概率论与数理统计[M].3版.北京:高等教育出版社:147-148.

施能,陈辉.1988.论我国季、月降水量的正态性和正态化[J].气象,14(3):9-13.

施能,陈家其,屠其璞.1995.中国近100年四个年代际的气候变化特征[J].气象学报,53(4):531-539.

施能.1996.北半球冬季大气环流遥相关型的长期变化及其与我国气候变化的关系[J].气象学报,54(6):675-683.

施能,魏凤英,封国林,等.1997.气象场相关分析及合成分析中蒙特卡洛检验方法及应用[J].南京气象学院学报,20(3):355-359.

施能.2002.气象科研与预报中的多元分析方法[M].北京:气象出版社:14-19.

施能,顾俊强,黄先香,等.2004.合成风场的统计检验和蒙特卡洛检验[J].大气科学,28(6):950-956.

《数学手册》编写组.2005.数学手册[M].北京:高等教育出版社.

屠其璞.1984.近百年来我国气温变化的趋势和周期[J].南京气象学院学报(2):151-162.

王蕊.2009.小波功率谱Monte Carlo显著性检验的一个简易方案[J].南京气象学院学报,2009,32(1):140-144.

王绍武.2011.现代气候学研究进展[M].北京:气象出版社:81-158.

魏凤英.2007.现代气候统计诊断与预测技术[M].北京:气象出版社:19-41.

赵佩红.2007.新会气候资料的正态分布检验及正态化处理[J].广东气象,29(1):27-28.

周雁翎,张琼雄,张练.2007.粤西降水量的分布特征及正态分布检验[J].广东气象,29(3):32-34.

Livezey R E,Chen W Y.1983.Statistical field significance and its determination by Monte Carlo technique[J].Mon Wea Rev,111(1):46-59.

Lu Chuhan,Guan Zhaoyong,Wang Panxing,et al.2009.Detecting the relationship between summer rainfall anomalies in Eastern China and the SSTA in the global domain with a new significance test method[J].J Ocean Univ China,8(1):15-22.

Significance test on interdecadal components of temperature and rainfall series in China

XIE Yao-yao1,2,LI Li-ping1,2,WANG Pan-xing1,2,LUO Xiao-li1,2

(1.Key Laboratory of Meteorological Disaster of Ministry of Education;2.School of Atmospheric Science,NUIST,Nanjing 210044,China)

On the basis of the normality significance test of the annual and seasonal temperature and rainfall series at 160 stations in China from 1951 to 2008,the significance of the interdecadal anomaly components of temperature and rainfall series is statistically analyzed.The results show that:1)Temperature at most stations was normally distributed while rainfall was not,which was somewhat related to the regions.2)There was obvious difference in the significance of interdecadal components of temperature and rainfall series.The interdecadal component of temperature was significant at most stations while it was the case at only a few stations for rainfall.3)Since not all the annual and seasonal temperature and rainfall,especially the rainfall series,were normally distributed at the 160 stations in China from 1951 and 2008,the statistical significance should be tested by Monte Carlo scheme.

annual and seasonal temperature and rainfall in China;linear component;interdecadal variation component;variance contribution;significance test

P423

A

1674-7097(2011)04-0467-09

2010-10-10;改回日期:2011-03-24

国家重点基础研究发展计划项目(2010CB951601);公益性行业(气象)科研专项(GYHY(QX)201006038)

谢瑶瑶(1986—),女,安徽宿州人,硕士,研究方向为大气环流异常与短期气候预测,xyy_maggie@163.com.

谢瑶瑶,李丽平,王盘兴,等.2011.中国气温和降水序列年代际分量的显著性检验[J].大气科学学报,34(4):467-475.

Xie Yao-yao,Li Li-ping,Wang Pan-xing,et al.2011.Significance test on interdecadal components of temperature and rainfall series in China[J].Trans Atmos Sci,34(4):467-475.

(责任编辑:刘菲)

猜你喜欢

正态测站正态分布
GNSS钟差估计中的两种测站选取策略分析
利用二元对数正态丰度模型预测铀资源总量
全球GPS测站垂向周年变化统计改正模型的建立
测站分布对GPS解算ERP的影响分析
基于对数正态分布的出行时长可靠性计算
双幂变换下正态线性回归模型参数的假设检验
正态分布及其应用
基于泛正态阻抗云的谐波发射水平估计
半参数EV模型二阶段估计的渐近正态性
χ2分布、t 分布、F 分布与正态分布间的关系