近42年北京气温数据的处理和分析
2018-11-14安徽理工大学计算机科学与工程学院王三好
安徽理工大学计算机科学与工程学院 王三好
本文利用全球站点无线电高空探测资料数据集(the Integrated Global Radiosonde Archive,简称IGAR)获取了北京市近42年来0-10km的温度数据资料。并通过对所获取的数据进行预处理,在保证数据的完整性和准确性的前提下,对北京市的年平均温度数据采用线性拟合和Mann-Kendall突变检验等方法,进行温度分析,发现北京市的年平均温度整体呈现上升趋势,且在2002年气温发生突增现象。
近年来,随着信息社会的发展,高空大气数据的获取手段越来越多,数据量也越来越大;而且高空大气数据参数多样,且数据当中易参杂一些错误或者未收集的信息,因此大数据的数据处理方法在气象数据的分析中得到了广泛的应用(王星.大数据分析:方法与应用[M].清华大学出版社,2013;曾忠禄.大数据分析:方向、方法与工具[J].情报理论与实践,2017,40(1):1-5;樊重俊,刘臣,霍良安.大数据分析与应用[M].立信会计出版社,2016.);而进行数据分析的前提首先要保证使用数据的准确性和完整性,常见的数据处理方法有数据清理、数据集成、数据变换和数据归约等(王尧.基于大数据的数据处理方法研究分析[J].数字技术与应用,2014(6):98-98.)。本文在以IGAR(陈哲,高杰,杨旭.IGRA全球站点探空数据集及其资料质量状况分析[J].气象与环境学报,2013(5):106-111.)数据集为基础,并使用大数据预处理方式,获取了北京近42年来0-10km区域内高空的气温数据,然后又对北京市的年平均气温进行了细致分析,希望可以帮助人们了解北京市的气温变化。
1 资料和方法
1.1 研究资料
本文利用IGAR高空探测资料获取了北京从1956-2016年的气温数据,同时根据IGAR数据集的特点,将北京数据集当中的1956-1974年间的不完整和错误的数据进行了删除,并对1956-2016年的数据进行再分析,最后获取北京1975-2016年0时和12时的气温数据进行分析,并使用Excel、OrgrinPro 2017对数据进行线性分析,同时使用matlab对数据进行降噪处理,使用Mann-Kendall突变分析法对北京气温进行分析研究。
1.2 研究方法
本文使用线性趋向分析和Mann-Kendall突变检验分析(简称M-K法)、等方法对北京市的温度数据进行分析。其中M-K法是一种非参数统计检验方式,对变量是否具备正态分布并没有具体要求,多用于气候要素变化趋势的显著性检验及突变检测,其公式如下:
式中采用:Zc—秩相关系数;τ—检验统计变量;P—数据序列所有对偶观测值(Rj, Ri, j > i)中Rj> Ri出现的次数;n—序列长度;—方差。
2 结果与分析
2.1 年平均温度的变化趋势
图1所示是1975-2016年北京市年均温度的变化,从图中可以看出,近42年来北京市年平均温度-9.06℃;由线性趋势分析可知,北京市从1975年以来的温度呈现逐渐增加的趋势,且线性拟合的相关程度值为0.734,具有高度相关性,再根据十年际温度变化特征(如表1所示)结果可发现,从1975以来至今,10年际的平均温度变化模式总体呈直线上升,最高的10年平均温度分布区间在2005-2016年之间(-7.62℃),最低10年平均温度分布区间在1985-1994年之间(-10.33℃);且由图可知年平均最大值是在2007年温度为-6.45℃,而年平均最小值是在1985年温度为-11.55℃。
图1 1975-2016年北京市年均温度的变化
表1 北京市每十年的平均温度变化
图2 北京市年平均温度变化的Mann-Kendall突变分析图
2.2 年平均温度的Mann-Kendall突变检验分析
图2所示是北京市年平均温度变化的Mann-Kendall突变分析图,本文利用matlab对气温进行降噪处理,然后使用Mann-Kendall突变分析对降噪的气温数据进行突变检验,从图中可以看出,北京市的年平均温度在2002年时UF和UB相交,且在从1991-2016年北京市的平均温度总体表现缓慢上升,因此其在2002年为气温突增点。
3 结论
本文通过使用数据填充、筛选等数据预处理方法,在保证数据的完整性和准确性的前提下,获取了北京市1975-2016年的年平均气温数据,同时通过对数据进行均一化和降噪处理,使用线性拟合和M-K突变检验等方法对获取的数据进行分析,发现北京市的年平均温度整体呈现上升趋势,且年平均气温在2002年时温度出现了突增。