绵阳站气温均一化检验及初步分析
2011-06-29周志君周秋雪
周志君, 周秋雪
(1.绵阳市气象局,四川绵阳621000;2.成都信息工程学院,四川成都610225)
能够反映气候实际变化的均一性气候序列是进行气候预测以及气候变化预估的基础。理论上,历史气候要素序列应该是不包括人为干扰因素的能够真实反映当地天气和气候变化信息的数据。但在气候序列形成过程中,站址迁移、仪器变更、仪器故障、新的平均计算公式、观测时次变化以及观测者的操作误差等人为因素,导致了气候序列产生突然不连续(即断点),站址环境的渐变也可能产生渐变的非均一性。
气候资料的非均一性,直接影响到气候分析研究结论的代表性和准确性。气候资料的均一性检验和订正对于提高气候资料的质量和均一性状况具有实用意义和价值。早在20世纪80年代中期,国外许多研究者就开始在气候资料均一性检验和订正方面开展了大量的探索性研究工作,并已经取得了一定的进展[1-9]。近年来中国不少研究者也开始注重这方面的工作,分别对中国的地面及探空资料进行了均一性检验与订正研究[10-17]。
在前人大量工作的基础上,利用SNHT方法对绵阳气象站点年平均气温序列做均一性检验和资料订正工作。旨在对四川气候资料均一性研究提供依据。
1 数据及方法
1.1 数据
绵阳及周围共14个站点1961~2010年月平均气温的观测资料。14个站点名称及其相应的台站号分别为:绵阳(56196),安县(56190),平武(56193),江油(56195),梓潼(57304),三台(57307),盐亭(57308),绵竹(56186),彭州(56189),什邡(56197),德阳(56198),中江(56199),广汉(56291),资阳(56298)。
1.2 方法介绍
1.2.1 气温序列的正态性检验
常用的正态检验方法有Shapiro-Wilk检验,Mudholkar检验,Kolmogorov-Smirnov检验,X2检验,Anderson-Darling检验,Epps-Pulley检验,偏度和峰度检验等。其中许多方法均要求样本大小n要充分大(n≥50),即只适用于大样本,而且计算工作量较大,普及范围较差。但是Mudholkar检验、Shapiro-Wilk检验和偏度和峰度检验就没有大样本的要求。其中Mudholkar检验的特点是简便、灵敏,仅需要10个以上的数据便可。Shapiro-Wilk检验需要的样本数只要8≤n≤50就适用,因为小样本(n<8)对偏离正态分布的检验不太有效。Shapiro-Wilk检验是目前被公认的比较好的正态检验方法。偏度和峰度检验适用于样本容量1<n<5000的场合。
而对气象要素序列进行均一性检验,最关键的就是要求被检验序列要服从正态分布。文中采用的正态性检验方法为Shapiro-Wilk检验。
该检验由Shapiro和Wilk在1965年和1968年提出,用于检验一个随机样本是否取自正态分布。检验方法及步骤:
(1)将每个站点50年的年平均温度值按从小到大排列 x1≤x2≤x3≤…≤xn,如果有一些值相等,则按顺序重复列出。
(2)计算 S=∑ak[x(n+1-k)-x(k)],当 n为偶数时,k=n/2;当 n为奇数时,k=(n-1)/2。ak在样本容量为n是有固定值,查表可得。
(4)选定检验水平α,按n和α查w分布表(表1)。当w>w(n,α)时,认为站点的年气温序列是服从正态分布。
表1 Shapiro-Wilk检验统计量分位数P=0.01和P=0.05分布表
1.2.2 气温序列的非均一性检验
常用的非均一性检验方法有:距平累加法,连续t检验法,回归检验法,标准正态法(SNHT)等等。其中SNHT不依赖元数据,它对于幅度较小的不连续点的检测较为敏感,并且所检验的序列可以是不同的气候要素,诸多优点使SNHT检验被众多学者争相采用。采用该方法对绵阳站点年均气温序列进行均一性检验。方法及步骤会在第三部分加以说明。
2 检验前的资料处理
对某一个测站资料进行均一化检验,必须先了解气候资料包含了哪些非均一性的因素。一般有3种[20]:序列本身存在时间非均一性,大尺度的影响(常常是由于大气环流所造成的突变现象),局地环境产生的影响。实际上,一个地区内的若干测站,由于受大气环流控制,应该有共同的气候变化特征。但是对于某个测站由于局地环境变化给资料带来的影响,只能通过与相邻测站的资料进行比较及诊断。这种比较可以使用与邻站的比值序列或差值序列进行诊断[10]。为了排除选用单个站点产生的随机性影响,参照前人的研究方法,选用绵阳周围的多个站点作为参考站点。
图1 绵阳及周围测站海拔高度等值线图
表2 绵阳站及其相邻站点的位置和建站时间
图1显示的绵阳及周围共14个站点的分布图,从图中可以很直观的看到周围站点与绵阳站点的远近程度和高度差异。表2具体列出了14个站点的经纬度,海拔高度,建站时间等信息。从中筛选出距离绵阳15km以内,海拔高度差在100m以内,并且在该时段内数据完善的8个站点,并对这8个站点的年平均温度序列用Shapiro-Wilk方法进行正态性检验。结果如表3所示。
气候序列均一性检验的基础和关键是建立待检序列的参考序列和检验序列,通过待检序列和参考序列的对比来判断序列的均一性。参考序列首先必须是均一的,才可以代表待检序列真实的气候序列变化,但这种理想状况是不可能达到的。因此先用两种常用的突变检验法(滑动t检验和山本检验),对8个站点的气温序列进行检验,排除掉两种方法共同检测出相同突变点的站点。结果如表3所示。
表3 筛选站点的正态性检验结果
查表1,w(50,0.05)的值为0.947。从表3中可以看到,在该显著性水平下只有广汉站点的气温序列不符合要求。滑动 t检验和山本法共同检测出江油有3个突变点,因此该站点也排除。在剩下的站点中再选取相关系数最高的四个站点作为参考站点,即绵竹、德阳、中江、广汉。
3 SNHT检验
3.1 构建被检测序列
参照文献[21]的方法构建被检验序列z。被检验站(绵阳)气温序列x为f(xi),参照站点的函数g(yi)是用4个参照站点气温序列加权平均求取的。即
(1)式中rj为被检测站与第j个参照站之间的相关系数,k为参照站的站数,yij为第j个站点第i年的年均气温值,为被检测站点50年的年均气温均值为第j个站点50年的年均气温均值。求 f(xi)与g(yi)的差值序列再对差值序列进行标准化处理其中为差值序列的标准差。即为被检验序列。
3.2 SNHT检验方法的实施
为了更加有效的检测出尽可能多的断点,参考文献[21],同样采用半级分段法。比如在[1,n]之间第一次检测出了一个超过信度的 T0max,断点在a处。再把序列分为两个子段:[1,a]和[a+1,n],分别对这两个子段进行均一性检验。若某一个字段内再出现断点,就继续再分再检验,直到没有新的断点出现。
图2 T0max显著性水平临界值
图3为采用半级分段法后检测出来的各段 T0值曲线图。绵阳站在这母段里面检测出来的 T0max=11.75,远超过了该序列长度95%信度检验的阈值,出现断点的序列号为 32,对应的年份为 1992年。然后再对和这两个子段进行SNHT检验,第一个子段的断点的年份是1962年,T0max=12.18,同样超过了该序列长度95%信度检验的阈值。第二个子段的断点年份是2002年,T0max=6.32,超过了该序列长度90%信度检验的阈值。继续再分后,只有这个子段检测出了断点,对应的年份为1975年,T0max=6.75,超过了该序列长度90%信度检验的阈值。即在1961~2010这50年间,绵阳的气温序列一共产生了四个断点,对应的年份分别是:1962,1975,1992,2002。其中1992年和1962年这两个断点达到了95%的信度检验,1975和2002年达到了90%的信度检验。根据间断点位置查阅绵阳站的历史沿革发现,1963年1月绵阳站有迁站记录。新站地址为绵阳市普明公社,经度为 104°40′E,纬度为31°28′N,海拔高度为470.8米。与原址绵阳县北门外沿江村(104°46′E,31°29′N)的海拔高度差约20.8米。2003年1月绵阳站再次迁站,新站地址为绵阳市涪城区石塘镇瓦店村八社(104°44′E、31°27′N),海拔高度为 522.7米,距上一个站址的海拔高度差约51.9米。此次迁站前后,观测场拔海高度变化相对较大,且观测场周围环境也发生了较大变化。以前测站是面靠公路,周围房屋较多。新搬迁的地址位于城郊坡上,周围鲜有楼房,视野开阔。固认为该两次迁站是致使气温序列数据不均一的主要原因之一,这是一种较为典型的台站迁移导致某个月平均气温序列发生变化的例子。1975年断点产生的原因可能是其附近年份的观测时次发生了变化。绵阳站历史沿革资料显示,1978年以前是采用02、08、14、20时4次实测数据计算的平均值,1978年以后改成了每日5次定时观测。不过1992年前后既没有发生台站迁移,也没有仪器的变更和计算方法的改变,故认为该断点的产生并不是人为因素造成的。接下来对该断点产生的原因做如下分析。
图3 被检测序列 z的分段T0值曲线图
图4为绵阳站1961~2010年气温距平的时间序列图,从图中可以看到该地区的气温在近50年来是显著增加的,其气候趋势系数[22-24]通过了99%的信度检验。增温速率达到了0.2℃/10a,高于整个四川盆地的平均增温速率[25]。从趋势线(经过9年滑动平均)来看,20世纪90年代初期以前,趋势线均位于零线以下,气温偏低。20世纪80年代中期开始持续增温,与整个中国地区显著增温发生的时间段一致[26]。但是,从图中可以明显看到,1992年的年平均气温值是这个增温的过程中的极低点,说明1992年气温的异常偏低是使该年份成为显著断点的原因之一。
图4 绵阳年平均气温距平序列(粗实线为9年滑动平均)
图5 1989~1995年逐月平均气温
图5为1989年~1995年逐月的月平均气温图。从图中可以看到6月份的平均气温显著偏低,其次是1、2、3月。参照表4中的数据可知,1992年绵阳气温异常偏低主要是由于1、2、3、6月气温偏低所致。这也是造成1992年为气温序列断点的主要原因之一。
表4 1992年月平均气温以及与1991、1993年的气温差值(℃)
4 结果及分析
经过检测发现,绵阳站 1961~2010间年均气温序列一共产生了 4个断点,即 1962、1975、1992、2002年。其中1962年和2002年这2个断点均是因为绵阳站迁站造成的,再次证明台站的迁移对气温资料均一性的影响较大。1975年断点产生的原因可能是其附近年份的观测时次发生了变化,由4次定点观测改为了5次定点观测。1992年断点产生原因是由于该年1、2、3、6月份气温异常偏低所致。至于影响气温异常偏低的物理机制还需要进一步研究分析。
虽然文中只检验出绵阳气温序列的间断点,这只是数据均一化工作最基础的部分。因此下一步的工作重点是将这些变点后的数据给予订正,给出均一化的数据,为气候与气候变化研究提供可靠的数据来源。
[1]Alexandersson H.A homogeneity test applied to precipitation data[J].International Journal of Climatology,1986,6:661-675.
[2]Groisman P Y,Koknaeva V V,Belokrylova T A,et al.Overcoming biases of precipitation measurement:A history of the USSR experience[J].Bull.Amer.Mereor.Soc.,1991,72:1725-1733.
[4]Easterling D R,Peterson T C.A new method for detecting and adjusting for undocumented discontinuities in climatological time series[J].International Journal of Climatology,1995,15:369-377.
[5]Vincent L A.A technique for the identification of inhomogeneities inCanadian temperature series[J].Journal of Climate,1998,11:1094-1104.
[6]Li Q X,Liu X N,Zhang H Z,et al.Detecting and adjusting on temporalinhomogeneity in Chinese mean surface air temperature dataset[J].Advances in Atmospheric Sciences,2004,21(2):260-268.
[7]Yan Z W,Jones P D.Detecting inhomogeneity in daily climate seriesusing wavelet analysis[J].Advances in Atmospheric Sciences,2008,25(2):157-163.
[8]Li Z,Yan Z W.Homogenized daily mean/maximum/minimumtemperature series for China from 1960-2008[J].Atmospheric andOceanic Science Letters,2009,2:236-242.
[9]Li Q X,Dong W J.Detection and adjustment of undocumenteddiscontinuitiesin Chinese temperature seriesusing a composite approach[J].Advances in Atmospheric Sciences,2009,26(1):143-153.
[10]李庆祥,刘小宁,张洪政,等.定点观测气候序列均一性研究[J].气象科技,2003,31(1):2-11.
[11]吴增祥.气象台站历史沿革信息及其对观测资料序列均一性影响的初步分析[J].应用气象学报,2005,16(4):461-467.
[12]崔宜少,李建华,丛美环,等.威海气象站年平均气温等气象要素资料的非均一性检验[J].应用气象学报,2006,17(4):511-513.
[13]高凤姣,李长军.山东省45年年平均气温均一性检验[J].气象科技,2007,35(5):744-749.
[14]吴利红,康丽莉,陈海燕,等.地面气象站环境变化对气温序列均一性影响[J].气象科技,2007,35(1):154-158.
[15]高晓容,李庆祥,董文杰.五台山站历史气候资料的均一性分析[J].气象科技,2008,36(1):112-118.
[16]江志红,黄群,李庆祥.近50年中国降水序列均一性检验与订正研究[J].气候与环境研究,2008,13(1):67-73.
[17]郭艳君,李庆祥,丁一汇.探空资料中的人为误差对中国温度长期变化趋势的影响[J].大气科学,2009,33(6):1309-1318
[18]李庆祥,张洪政,刘小宁,等.中国均一化历史气温数据集(1951-2004)(1.0版)[R].北京:国家气象信息中心气象资料室,2006.
[19]曹丽娟,严中伟.地面气候资料均一性研究进展[J].气候变化研究进展,2011,7(2):129-135.
[20]黄嘉佑,李庆祥.一种诊断序列非均一性的新方法[J].高原气象,2007,26(1):62-66.
[21]韩海涛,胡文超,刘积林,等.兰州站气候资料序列均一性的初步分析[J].干旱气象,2008,26(3):34-38.
[22]施能,陈家其,屠其璞.中国近100年四个年代际的气候变化特征[J].气象学报,1995,53(4):531-539.
[23]施能.北半球冬季大气环流遥相关的长期变化及其与我国气候变化的关系[J].气象学报,1996,54(6):675-683.
[24]施能,黄先香,杨扬.1948-2000年全球陆地年降水量场趋势变化的时、空特征[J].大气科学,2003,27(6):971-982.
[25]陈权亮,任景轩,晁华,等.20世纪50年代以来我国气温的区域变化[J].安徽农业科学,2010,38(7):3571-3574.
[26]左洪超,吕世华,胡隐樵.中国近50年气温及降水量的变化趋势分析[J].高原气象,2004,23(2):238-244.