基于主成分分析的安徽省汛期降水空间聚类研究
2019-07-19王雅燕
王雅燕
摘 要:基于安徽省15个雨量站1957—2016年的日降水数据,利用主成分分析和系统聚类相结合的技术,对安徽省汛期降水的时空特征进行了分析。结果表明:根据汛期降水量,安徽省可划分为以下4类区域,分别为淮北、淮河沿岸、江淮及江南区域,对应的多年平均汛期降水量分别为591.6、617.0、695.0和883.2mm,且具有淮北少于淮河沿岸,淮河沿岸少于江淮,江淮少于江南的地带性分布规律。淮北和淮河沿岸年汛期降水量无突变,江淮和江南的突变点分别在1968和2007年,且除淮北区域年汛期降水量有轻微的下降趋势外,其他3类区域均有明显增加的趋势。淮北区域汛期降水量主要受10a、4a左右的周期波动影响,淮河沿岸主要受14a、10a、18a左右的周期波动影响,淮河沿岸主要受23a、10a、4a左右的周期波动影响,淮河沿岸主要受28a、5a、10a、13a左右的周期波动影响。
关键词:区域划分;主成分分析;系统聚类;汛期降水;安徽省
中图分类号 TV125 文献标识码 A 文章编号 1007-7731(2019)11-0157-8
Abstract:Based on the daily precipitation data of 15 meteorological stations in Anhui Province in 1957—2016, the field of precipitation during flood season in Anhui Province was divided into regions. The results show that:Anhui Province was divided into four regions by principal component analysis and hierarchical clustering method, namely the region north of Huaihe River, the region near Huaihe River, the region between Yangtze River and Huaihe River, and the region south of Yangtze River. And the precipitation during flood season of the region north of Huaihe River was 591.6mm which was less than 617.0mm of the region near Huaihe River, and less than 695.0mm of the region between Yangtze River and Huaihe River, and less than 883.2mm of the region south of Yangtze River. The mutation years of precipitation during flood season of the region between the Huaihe River and the Yangtze River and the region south of the Yangtze River in Anhui Province were 1968 and 2007, and there was a significant increase trend in the other three kinds of regions except the region north of Huaihe River. And the Morlet wavelet analysis results show that the precipitation during flood season of the region north of Huaihe River is mainly affected by the periodic fluctuations of 10a and 4a, the precipitation during flood season of the region near Huaihe River is mainly affected by the periodic fluctuations of 14a, 10a and 18a, the precipitation during flood season of the region between Yangtze River and Huaihe River is mainly affected by the periodic fluctuations of 23a, 10a and 4a, the precipitation during flood season of the region south of Yangtze River is mainly affected by the periodic fluctuations of 28a, 5a, 10a and 13a.
Key words:Region division; Method of principal component analysis; Hierarchical cluster method; Precipitation during flood season; Anhui province
1 引言
降水頻数和强度的变化会给水文循环带来较大的影响,进而影响到整个生态系统[1]。在全球变暖的背景下,大气中温室气体比例的提高会造成降水时空变化[2],水文循环也随之发生改变,从而改变了地区的水资源总量,使得水资源的合理规划及利用更加困难。
近年来,国内外学者开展了一系列针对降水气候变化及时空特征的研究,如赵丹等[3]采用对趋势分析较准确的成对斜率回归中值法,计算了淮河流域不同级别降水的降水量等指标,得出淮河流域各区域的时空分布特征。石军等[4]用EOF方法对江苏省极端最高气温进行了客观分区,并分析了各分区极端最高气温的气候变化趋势和突变差异。杜良敏等[5]使用聚类分析对中国夏季降水的部分影响因子进行分区,并分区域展开降水量的特征分析和预测。
安徽省横跨长江和淮河流域,处于中国的东部季风区和南北气候过渡带内。虽然目前已有较多关于安徽省降水时空变化的特征分析研究,但针对安徽省降水分区的研究较少,大多数是以全省范围进行分析,或者以行政区划分为依据进行研究。由于安徽省境内地形较为复杂,兼有山区、平原以及丘陵地带,使得地理条件空间差异较大,以全省或者以行政区划分来进行研究,难以说明不同区域的气候特征。而主成分分析法[6]可从大量的指标数据中提取出几个能够代表整体数据体系的各不相关的综合指标,即主成分,以此来解释原先较多的指标规律,适用于对安徽省15个站点60a的数据进行降维。系统聚类法[7]则是按照某种相似性将原先没有类别定义的数据集划分成几类,每一类的数据都有相似性,适用于对安徽省进行区域划分。鉴于此,本研究采用主成分分析与聚类分析相结合的气候区划方法,对安徽省的汛期降水量进行分区。分区结果可为安徽省区域防汛抗旱管理工作提供依据,也是分析区域汛期降水时间分布特征的基础,即聚为同一类的区域汛期降水的时间演变规律分析时,可采用该类区域的汛期面均降水量为指标,比以整个行政区域的面均降水量为指标更具科学性。
2 资料与方法
2.1 研究数据 研究数据选用1957—2016年安徽省的15个雨量站,分别为砀山、亳州、宿州、阜陽、寿县、蚌埠、滁州、六安、霍山、合肥、巢湖、安庆、宁国、黄山、屯溪。对各个站点20:00至次日20:00的日降水数据进行统计分析,数据来源为中国气象科学数据共享服务网。根据安徽省降水、径流特点,汛期为5月1日至9月30日[8]。
2.2 研究方法
2.2.1 主成分分析法 对安徽省15个站点60a的汛期降水量序列进行主成分分析[9],步骤如下:
(1)对安徽省第i站点第j年的汛期降水量Xij(i=1,2,···,m;j=1,2,···,n)进行空间上标准化处理变为Yj,即:
式中,[Xj]和S(Xj)指各站点第j年的均值和标准差。m=15,表示安徽省15个站点;n=60,表示从1957—2016年共60a。
(2)将标准化矩阵处理成相关系数矩阵Z,即:
式中,[Y]是Y的转置。
(3)求出相关系数矩阵Z的特征值λj(j=1,2,···,n)和对应的特征向量Aj=(aj1,aj2,···,ajn),每个特征向量都是n阶的行向量。
(4)计算各个特征值对应的方差贡献率ωj,即:
(5)取前p个特征向量作为Y的系数(通常选取累计方差贡献率在80%以上的前几个特征向量),计算出第p个主成分(各个主成分的方差为对应的特征值)。则第i个站点第p个主成分为:
2.2.2 系统聚类法 对安徽省15个站点近60a的前几个典型汛期降水主成分序列进行系统聚类,将安徽省划分为几个区域。以安徽省15个站点为样本,对样本进行聚类,相似性的划分依据有很多,这里选用欧式距离作为划分依据,将每一个站点看作p维空间的1个点(p的含义同上),则第[i]个站点的位置可表示为[i(Fi1,Fi2,···,Fip)]。令[duv]为站点u和v的距离:
再选取离差平方和计算类间距离。根据计算结果决定聚类数量和各类的样本[11]。
2.2.3 滑动t检验 气候突变的检测方法有多种,采用滑动t检验方法[12]对长时间序列进行突变点的检测。将数据时间序列分为2个序列,即滑动点前后分别取n1和n2个数据,然后分别计算取得2个数据序列的均值[X1]、[X2]及方差S12、S22,计算公式如下:
选取n1=n2=5,显著性水平取0.01(t=3.36)。若滑动统计量t超过临界范围,则降水数据的时间序列可能发生突变。
2.2.4 小波分析 利用小波分析方法的伸缩和平移等运算功能对函数或信号序列进行多尺度细化分析,研究不同尺度(周期)随时间的演变情况。Morlet函数是一种复数小波,具有很好的时频局部性,其函数定义为[13]:
式中,φ(t)为基本小波,t是时间,ω0为频率。当ω0>5.0时,Morlet小波满足容许性条件(表示该小波稳定),这里采用ω0=6.2,此时时间尺度a与周期T数值相等[14]。以此对60a安徽省汛期降水量时间序列进行小波分析,以求出其周期规律。
3 结果与分析
3.1 安徽省汛期降水区域划分 使用主成分分析法对安徽省15个站点60a汛期降水量降维。计算结果显示,前2个特征向量的方差贡献率已高于75%,故选用前2个特征向量来计算主成分,并据其使用系统聚类法进行分类,结果见图1。
由前2个主成分系统聚类图可知,黄山站都是单独的一类,原因可能是海拔为1840.4m的黄山站降水主要为山地地形雨,故将黄山站列为单独一类,再对剔除该站后的14个站进行空间聚类分析。表1列出了剔除黄山站后重新计算的前6个特征值的方差。
由表1可知,前6个特征向量累积方差贡献率为84.7%,接近85%。但是前2个特征向量的累计方差贡献率为59.2%,接近60%,而且第3个特征值的方差贡献率仅8.5%,低于10%,考虑到提取数据的典型性,选用前3个特征向量计算主成分。特征向量中的元素作为标准化后的站点逐年汛期降水量的系数,线性组合后得出各个站点对应的主成分值。在该线性组合中,绝对值大的系数所对应年份汛期降水量对该主成分值影响较大。前3个主成分系数绝对值较大的年份见表2。
由第1主成分分布图2(a)可知,安徽省南北互异且从南到北由正到负,系统聚类结果显示安徽省可以分为2类,长江为2类区域的分界。其中,霍山站地处大别山区迎风坡,地形作用使其降水增加,因此霍山站的汛期降水量较多,聚类结果偏向于南部。取第1主成分系数绝对值较大的负值年分析,霍山站2000、2003、2007年汛期降水量分别为764.9、1127.2、654.4mm,均属于降水较多年,远高于地理位置上附近站点的同年降水量,而安庆、宁国及屯溪3个站的同年汛期降水量均值分别为641.8、996.3、739.7mm,该类4个站的汛期降水量数值相差不大,主成分数值更加接近,所以第1主成分划分结果中霍山站被划归到南部区域,与安庆、宁国和屯溪站同属一类。
由第2主成分分布图2(b)可知,第2主成分数值以中部为界,中部为正值,东南和西北均为负值,系统聚类结果显示安徽省可分为2类,第1类有6个站点,分别是西北部的阜阳、宿州、亳州、砀山及东南部的宁国、屯溪;第2类有8个站点,分别是中部的蚌埠、霍山、合肥、六安、寿县、巢湖、滁州及东南部的安庆。中部区域的主成分数值表现出与周围地区相反的特征,可能是因为中部区域地处江淮之间多为丘陵地区,处于气候过渡地带。取第2主成分系数绝对值较大年分析,安庆站正值年1962、1975、1982、1991年汛期降水量分别为856.7、1115.5、695.2和1226.8mm,明显多于地理位置相近的宁国和屯溪站的同年数值。安庆站负值年1967年为541.5mm,明显少于宁国和屯溪站,而系数绝对值较大年份的中部区域站点汛期降水量与安庆站数值接近,导致安庆站在第二主成分上的聚类上未被划归到与宁国、屯溪一类中,而是划归到中部区域站点一类。
由第3主成分分布图2(c)可知,其在地理上规律不明显,系统聚类结果显示,安徽省可分为3类,与地理的南北划分区别较大,主要是西北部的砀山站被划归到了中部区域,东南部的屯溪站被划归到了淮河沿岸区域。取第3特征主成分系数绝对值较大年分析,砀山站正值年1978、1985、2005、2010年的汛期降水量分别为695.4、715.8、747.4和645.9mm,而同年同属于西北部的亳州和宿州汛期降水量都处于历年的较低值,在300~500mm,砀山站负值年1968、1998、2007年的汛期降水量分别为352.8、471.8、600.9mm,而同年亳州和宿州站的汛期降水量则均处于700~1000mm,明显多于砀山站,这是导致第三主成分的聚类上砀山站被划归到中部区域的主要原因。屯溪站正值年的汛期降水量分别为335.0、569.1、788.3和1349.6mm,而同年同属于东南部的宁国和安庆汛期降水量都处于历年的较低值,在350~500mm,屯溪站负值年的汛期降水量分别为534.1、841.9和809.9mm,而同年宁国和安庆站的汛期降水量均高于屯溪站,在800~1000mm,而屯溪站同年的汛期降水量与淮河沿岸的阜阳、寿县和蚌埠数值接近,这是导致第3主成分的聚类上屯溪站未被划归到宁国、安庆一类而是划归到淮河沿岸区域的主要原因。
由表4可知,前2个主成分的系统聚类结果基本上符合安徽省地理上东南、中部和西北的格局。前3个主成分的系统聚类结果则将安徽省分为江南、江淮、淮河沿岸、淮河以北4类区域。其主要区别是前3个主成分聚类结果比前2个的结果多了一类,3类结果中的东南部类别的霍山被划归到4类中的淮北区域,3类结果中的西北部的阜阳和蚌埠及中部的寿县被划归到4类中新的一类即淮河沿岸区域。其主要原因是:第3主成分在分类时多了一个淮河沿岸类,即阜阳、蚌埠及寿县。前2个主成分聚类的第1类中,霍山站与同类别的其他3个站间距离较大,这导致在对前3个主成分进行聚类时霍山站被更靠近的屯溪、宁国和安庆站剔除,被划归到中部区域。故综合前3个主成分,聚类结果多了一类淮河沿岸。
综上所述,基本上可将安徽省分为以下4类区域,第一区域为西北部的砀山、亳州、宿州和阜阳,定义为淮北区域;第2区域为淮河流域周边的阜阳、寿县、蚌埠,定义为淮河沿岸;第3区域为中部的滁州、六安、霍山、合肥和巢湖,定義为江淮区域;第4区域为东南部的安庆、宁国和屯溪,定义为江南区域。下面对安徽省4类区域汛期降水的时空规律展开研究。
3.2 安徽省各区域时空分布规律
3.2.1 时间规律 4类区域的汛期降水量年际变化如下:
由图4可知,除淮北区域的年汛期降水量呈轻微下降趋势外,倾向率为-0.4mm/10a,淮河沿岸、江淮区域及江南区域均有明显增加趋势,倾向率分别为10.5mm/10a、24.4mm/10a及31.6mm/10a。淮北区域年汛期降水量最大值为1963年的1117.0mm,最小值为1966年的268.8mm。淮河沿岸年汛期降水量最大值为1991年的1136.8mm,最小值为2001年的247.3mm。江淮区域年汛期降水量最大值为1991年的1270.1mm,最小值为1966年的311.3mm。江南区域年汛期降水量最大值为1999年的1653.2mm,最小值为1978年的392.1mm。
釆用滑动t检验对各区域的汛期降水量序列进行趋势检验分析,结果如图5所示(实线代表滑动t统计量,上下两条虚线代表显著水平为0.01的临界线)。
由图5可知,淮北区域和淮河沿岸60a汛期降水量未发生突变,江淮区域1968年发生突变,江南区域2007年发生突变。
为进一步了解安徽省4类区域汛期降水量的周期波动,使用Morlet小波函数进行分析,得到4类区域60a汛期降水量的小波实部等值线图和小波方差图(图6)。
从图6(a)小波系数等值线图可以看出,淮北区域汛期降水量序列存在10a和4a左右较为明显的周期波动,且10a和4a周期波动贯穿整个计算时域。同时,在1960—1980年左右还存在20a左右的短周期波动,该波动在1980年后停止。因此,淮北区域60a汛期降水量序列主要受10a和4a左右2个尺度周期波动影响。由图6(a)小波方差图可知,尺度a=10a和4a时,小波方差出现峰值,且10a时处于最高峰,表明该序列第1主周期为10a,第2主周期为4a。
从图6(b)小波系数等值线图可以看出,淮河沿岸汛期降水量序列在1982年左右开始14a左右较为明显的周期波动,同时存在10a左右的波动周期。另外,还存在18a左右的周期波动,到1977年左右波动停止。因此,淮河沿岸60a汛期降水量序列主要受14a、10a以及18a左右3个尺度周期波动影响。由图6(b)小波方差图可知,尺度a=14a、10a和18a时,小波方差值均较高,表明该序列第一主周期为14a,第2、3主周期分别为10a、18a。
从图6(c)小波系数等值线图可以看出,江淮区域汛期降水量序列在23a左右周期波动较为明显,存在3次较明显的正负交替,在10a左右周期波动较为明显且贯穿整个计算时域。因此,江淮区域60a汛期降水量序列主要受23a、10a以及4a左右3个尺度周期波动影响。由图6(c)小波方差图可知,尺度a=23a、10和4a时,小波方差出现峰值,且a=23a时数值最大,表明该序列第1主周期为23a,第2、3主周期为10a和4a。
从图6(d)小波系数等值线图可以看出,江南区域汛期降水量序列存在28a左右较为明显的周期波动,且28a周期波动贯穿整个计算时域。同时,在1970—1985年左右还存在5a左右的短周期波动,且在1960—1980年左右还存在10a左右的周期波动,而后跃居到13a左右的周期。因此,江南区域60a汛期降水量序列主要受28a、5a、10a和13a左右3个尺度周期波动影响。由图6(d)小波方差图可知,尺度a=28a、5a、10a和13a时,小波方差出现峰值,表明该序列第1主周期为28a,第2主周期为5a,第3、4主周期分别为10a和13a。
综上所述,安徽省4类区域都存在10a左右的周期波动。
3.2.2 空间规律 计算安徽省4类区域近60a的多年平均汛期降水量,结果见表5。由表5可知,安徽省多年平均汛期降水量依次为江南区域>江淮区域>淮河区域>淮北区域,呈现从北到南递增的规律。
4 结论和讨论
(1)采用主成分分析对60a安徽15个站点的汛期降水量序列降维并进行系统聚类,在将黄山站单独列为1类后,对其他14个站点60a的汛期降水量数据重新进行主成分分析,选用累计贡献率达67.6%的前3个特征向量计算主成分,分别进行系统聚类,最终将安徽省划归为4类,即淮北区域的砀山、亳州和宿州,淮河沿岸的阜阳、寿县和蚌埠,江淮区域的滁州、六安、霍山、合肥和巢湖,以及江南区域的安庆、宁国和屯溪。
(2)除淮北区域汛期降水量呈轻微下降的趋势外,淮河沿岸、江淮区域及江南区域的汛期降水量均有明显增加的趋势。根据滑动t检验结果显示:淮北区域和淮河沿岸汛期降水量未发生突变,江淮区域于1968年发生突变,江南区域于2007年发生突变。
(3)根据Morlet小波分析结果显示:淮北区域60a汛期降水量序列主要受10a和4a左右周期波动影响,淮河沿岸60a汛期降水量序列主要受14a、10a和18a左右周期波动影响,江淮区域60a汛期降水量序列主要受23a、10a和4a左右周期波动影响,江南区域60a汛期降水量序列主要受28a、5a、10a和13a左右周期波动影响,
(4)安徽省4类区域汛期降水量多年平均汛期降水量依次为江南区域>江淮区域>淮河区域>淮北区域,呈现从北到南递增的规律。
参考文献
[1]王佳,周玉良,周平,等.基于集对分析的安徽省梅雨期降水空间特征研究[J].水电能源科学,2018,36(11):1-4.
[2]陈晓宏,刘德地,王兆礼.降水空间分布模式识别[J].水利学报,2006,37(6):711-716.
[3]趙丹,张叶晖,刘俊杰.淮河流域近58年降水特征分析[J].水电能源科学,2018,36(11):9-13.
[4]石军,何健,潘晓春,等.江苏省极端最高气温的时空变化与分区研究[J].水电能源科学,2017,35(10):4-7.
[5]杜良敏,柯宗建,刘长征,等.基于聚类分区的中国夏季降水预测模型[J].气象,2016,42(1):89-96.
[6]常文娟,梁忠民,马海波.基于主成分分析的干旱综合指标构建及其应用[J].水文,2017,37(1):33-38,82.
[7]孙倩倩,刘晶淼.基于聚类分析的中国东北地区气温和降水时空变化特征[J].气象与环境学报,2014,30(3):59-65.
[8]胡姗姗,刘倪,贾天山,等.安徽汛期淮北区域性暴雨大尺度环流特征及成因分析[J].中国农学通报,2014,30(34):144-152.
[9]万新宇,包为民,荆艳东,等.基于主成分分析的洪水相似性研究[J].水电能源科学,2007,25(5):36-39.
[10]吴凤燕,关洪林.湖北省干旱分区及各区易旱类型研究[J].中国水利,2011(11):33-35.
[11]王栋,梁忠民,王靖,等.基于主成分聚类分析的云南省干旱自然分区[J].南水北调与水利科技,2017,15(2):15-21,28.
[12]魏凤英.现代气候统计诊断与预测技术(第2版)[M].北京:气象出版社,2007:63-65.
[13]吕继强,莫淑红,沈冰.新疆和田降雨小波分析和非趋势波动分析[J].水电能源科学,2008,26(5):7-9.
[14]王晓琳.基于小波分析的邯郸山区水文特性分析与预测[D].邯郸:河北工程大学,2012.
(责编:张宏民)