基于主成分聚类分析的云南省干旱自然分区
2017-06-05王栋梁忠民王军杨靖
王栋 梁忠民 王军 杨靖
摘要:干旱自然分区能揭示研究区干旱的发生发展规律,为制定抗旱防灾减灾对策提供理论依据。基于主成分聚类分析法,选用地形起伏度、多年平均干旱指数、P75%年降水量负距平百分率和年降水变差系数四个指标对云南省进行干旱自然分区,并使用ArcGis软件绘制相应的干旱自然分区图,最后采用单因素方差分析法检验分区结果的合理性。结果表明:云南省中东部地区比西部地区更容易发生干旱,这与相关年鉴资料的统计分析结果基本一致;四个干旱自然分区之间差异显著,进一步证实了本文干旱自然分区结果具有一定的合理性。
关键词:主成分聚类分析;分区指标;干旱自然分区;合理性检验
中图分类号:S162.2 文献标识码:A 文章编号:1672-1683(2017)02-0015-07
干旱是指在一定区域一段时间内水分的收支不平衡而形成的水分短缺现象,是人类面临的主要自然灾害之一,具有发生频率高、分布范围广、持续时间长和灾害损失重等特点。近些年来,随着水资源短缺现象日趋严重,进一步导致干旱范围扩大和干旱程度加重,给人类社会经济活动等方面产生巨大影响。干旱的影响及发生发展具有地域性,其影响因素众多,除了气候因素外,还和地形、地貌、植被等因素密切相关。相同的氣候条件下,不同的区域其干旱的发生发展过程不同,则干旱的监测预测预警也应不同,相关部门采取的防旱抗旱措施也将不同。根据影响干旱的自然因素(降水、蒸发和地形等),对研究区进行合理的干旱自然分区,能揭示研究区干旱变化规律,为干旱的监测预测预警业务、客观诊断和科学评估干旱灾害奠定基础。鉴于此,开展区域干旱自然分区研究工作显得尤为重要。
目前,前人对干旱分区做了大量探索性的研究,比如王曼丽等利用干旱频率对山西小麦进行干旱分区;刘巽浩等根据降水量、干燥度、结合温度,同时辅以地貌、作物等指标,将我国干旱半干旱农区分为4大农区及9个亚区:刘敏等采用综合考虑水分盈亏和同期作物蓄水量的农业干旱指标,分析湖北省主要干旱类型时空分布特征并给出农业干旱分区;倪深海等根据水资源的特点、农业受旱成灾的情况及水利设施抗旱能力,采用层次分析模型,进行全国农业干旱脆弱性分区:杨奇勇等选取13个指标,运用密切值法对湖南省97个县(市)进行了农业干旱脆弱性分区研究:吴风燕等分析了湖北省年降雨量、年蒸发量、年干燥度以及年径流量Cv值空间分布规律,并以此对湖北省干旱分区进行修正;黄晚华等以国家标准中的气象干旱和农业干旱指标为主,采用逐级指标筛选法对南方季节性干旱进行3级分区。通过上述研究可以看出,前人对干旱分区的研究主要集中于农业干旱分区、干旱脆弱性分区等:然而只考虑影响干旱危险性的自然因素,研究在自然条件下,干旱易发程度的空间分布及主要特点的相关研究却相对较少。为应对近年来云南省干旱频发的态势,掌握云南省干旱变化规律及特点,迫切需要分析云南省干旱类型,提出合理的干旱自然分区,为不同干旱区的防旱抗旱政策制定提供依据。本文采用主成分聚类分析法,对云南省进行干旱自然分区,并应用AreGis软件绘制相应的干旱自然分区图,最后检验分区的合理性。
1研究区概况
云南省是一个内陆边疆省份,东经97°31′-106°11′、北纬21°08′-29°15′,总面积约39万km2,其中,山地是云南省主要地貌类型,占全省面积84%。云南兼具低纬、山原、季风气候,全省降雨充沛,多年平均降雨量达1 278.8mm,但降水量时空分布极不均匀,由北部、中部向东、南、西三面逐渐增多,同时汛期(5月-10月)降水量占全年的80%以上:全省多年平均径流深为576.7mm,多年平均产水模数为57 7万m3/km2,汛期(5月-10月)径流量站占全年60%以上;导致冬春、夏初极易出现干旱灾害、夏秋出现洪涝灾害。
自古以来,云南省就是一个干旱灾害频发的地区。据资料记载,云南省1300年一1990年的691年问,发生2111次干旱,其中大旱76次,平均每9 1年发生一次,小旱135次,平均每51年发生一次;近些年来,干旱有严重化的趋势,特别是2009年-2010年为百年不遇的全省性大旱。通过分析1950年-2010年相关统计资料,随着时间的推移,云南省的农作物受旱面积、成灾面积、影响人口、粮食损失量等均呈上升趋势,并且全省发生大范围的干旱越发频繁,且干旱灾害的严重程度呈加重态势。越来越频繁的干旱给全省的农业、城镇供水、农村人畜饮水以及水力发电、工业生产等方面造成严重的影响。
2数据和研究方法
2.1数据来源
研究区DEM高程数据可通过中国科学院提供的“地理空间数据云”平台获取:实测气象数据来源于中国气象数据共享中心提供的全国气象站逐日观测数据,选取研究区内35个气象站点1971年-2010年日尺度的降水、平均气温、平均相对湿度、平均风速、日照时数。
2.2研究方法
主成分分析就是设法将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量来代替原来变量。通常,数学上的处理就是将原来的变量做线性组合,作为新的综合变量:Fj=aj1X1+aj2X2+…+ajpXp,j=1,2,…,p(1)式中:X1,X2,…,Xp为初始p个变量;F1,F2,…,Fp为p个综合变量,也即主成分;aj1,aj2,…,ajp为线性组合系数,且满足:Fi与Fj(i≠j,i、j=1,2,…,p)之间不相关;各主成分方差依次递减(或不增),Var(F1)≥var(F2)≥…≥Var(Fp);组合系数(‘d㈡‘d小。aj。)构成的向量为单位向量,aj21+aj22+…+aj2p=1,j=1,2,…,p;主成分的方差之和等于初始变量的方差之和,Vat(X1)+Var(X2)+…+Var(Xp)=Var(F1)+Var(F2)+…+Var(Fp)。
要求出主成分,实际上只需求出组合系数(aj1,aj2,…,ajp)即可,研究步骤如下。
(1)对原始数据标准化处理:设初始p个变量(X1,X2,…,Xp)的样本容量均为n,由于各变量的量纲不一致,故对初始变量进行标准化处理,Zi=(Xi-Xi)/Si,i=1,2,…,p,Xi和Si为变量的均值和标准差。
(2)计算p个变量的相关系数矩阵R。
(3)计算相关系数矩阵R的特征根(λ1,λ2,…,λp),及相应于特征根λj所对应的单位特征向量aj=(aj1,aj2,…,ajp),j=1,2,…,p,单位特征向量aj也即是组合系数。
(4)由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,根据主成分累计贡献率的大小选取前k个主成分。贡献率就是指某个主成分的方差占全部方差的比重,即
(2)
贡献率越大,说明该主成分所包含的初始变量的信息越多。主成分个数k的选取,主要根据主成分的累积贡献率来决定,一般要求累计贡献率达到80%以上,这样才能保证选择的主成分能包括初始变量的绝大多数信息。
(5)最终确定的k个主成分样本为Y1,Y2,…,Yk,其中
(3)
聚类分析是从样本的特征出发对样本进行分类,主要是通过样本的数值特征分析各个样本之间的亲疏程度。目前,聚类分析的方法很多,如层次聚类法或K均值聚类方法,考虑到计算运行速度,本文采用K均值聚类方法,该算法简便且易操作,特别适用于大规模数据的聚类具有较快的运算速度,因而在实践中得到了广泛的应用。经过主成分分析后,各指标间相互独立,降低了数据的冗余性,以主成分样本来进行K均值聚类,能够提高干旱自然分区的聚类效果。K均值聚类方法的具体理论和聚类步骤参见文献。
3云南省干旱自然分区
3.1干旱分区指标
指标的选择是干旱自然分区的前提工作,遵循完整性、代表性、简明性、可操作性和可评价性原则,综合考虑云南省干旱形成的自然地理环境以及干旱的特点等因素,本文选取地形起伏度、多年平均干旱指数、P75%年降水量负距平百分率和年降水变差系数这四个指标,对云南省进行干旱自然分区。
(1)地形起伏度。
地形起伏度是用于划分地貌类型的一个重要指标,是指某一区域内,最高点高程和最低点高程之间的差值,体现区域的地形特征。根据数字高程模型(DEM),通过ArcGIS分析工具计算地形起伏度,通常情况下,地形起伏度越大,越容易发生干旱。
(2)多年平均干旱指数。
干旱指数是反映气候干燥程度的指标,通常定义为年蒸发能力与年降雨量比值,即:
(4)式中:I为干旱指数;E0为年蒸发能力,可通过FAOPenmarrMonteith方法来计算;P为年平均降水量。根据多年平均蒸发能力和多年平均降水量可算得多年平均干旱指数I。当I<1.0时,表示该地区的蒸发能力小于降水量该地区为湿润气候;反之,则该地区偏于干燥。,越大,则蒸发能力超过降雨越多,干旱程度越严重。
(3)P75%年降水量负距平百分率。
P75%年降水量负距平百分率反映了枯水年份(降水频率P=75%)年降水量低于多年平均降水量的程度,计算公式如下:
(5)式中:D为P75%年降水量负距平百分率:P为多年平均降水量:P75%为P=75%年份的年降水量:D越大,表明枯水年份降水量越小,干旱程度也越严重。
(4)年降水变差系数。
年降水变差系数反映年降水量系列的离散程度,计算公式为
其中,
(7)式中:Cv为年降水变差系数;σ是年降水量标准差;Pi为第i年降水量;P是多年平均年降水量;N是年降水系列长度。Cv越大,年降水的年际变化剧烈,越容易发生干旱;反之,则年降水量的年际变化小,越不容易发生干旱。
地形起伏度可通过DEM高程数据来计算;根据云南省境内35个气象站点1971年-2010年共40年的降水量和平均气温等气象资料,计算各个站点的年降水量、年潛在蒸散发,基于ArcGis中栅格计算器工具以及克里金空间插值技术,实现了云南省四个干旱分区指标的空间分布,见图1。
3.2分区结果
首先对选取的地形起伏度、多年平均干旱指数I、P75%年降水量负距平百分率D和年降水变差系数Cv四个干旱分区指标系列进行标准化处理;其次计算各指标间的相关系数,得到相关系数矩阵,并计算相关系数矩阵的特征值、方差贡献率及累积方差贡献率,见表1:最后根据提取主成分个数一般要求其累积方差贡献率达到80%的原则,提取前两个主成分(Yi,i=1,2,代表第i个主成分),其累积方差贡献率为82.2%,因此前两个主成分基本概括了原始指标的信息,前两个主成分的因子载荷矩阵见表2,描述了主成分与各个干旱分区指标问的相关程度。通过主成分分析,干旱分区指标得到很大程度的简化,表明对原始指标进行主成分分析是有效的,实现了对干旱分区指标降维处理的效果。
根据四个干旱分区指标与干旱事件发生的关系,Y1和Y2值越大,越容易发生干旱,并且Y1比Y2的影响更大。以主成分分析后提取的两个主成分Y1和Y2为基础,采用K均值聚类方法对云南省进行干旱自然分区,结合ArcGis空间分析工具,最终云南省共划分为四种干旱等级区,见图2。
(1)干旱易发区。
本区地处云南省中东部地区,主要分布于楚雄市、曲靖市、玉溪市和昆明市,还有大理州和红河州的小部分地区。该区多年平均干旱指数为2.36,尤其在楚雄市最大:枯水年的降水量偏离多年平均值的程度是全省最大的区域:年降水变差系数达到了0.2,也在全省中最大:此外,该区地形起伏度却为全省最低,约为370 m。由于降水量和蒸散发量最直接影响自然条件下的干旱易发性程度,因此,综合考虑四个干旱分区指标,该区在云南省中最容易发生干旱,为干旱易发区。
(2)干旱中发区。
该区处于云南省东北部、东南部和中部偏西地区,主要分布于大理州、丽江市、红河州、文山州和昭通市,还有迪庆州、玉溪市和曲靖市的部分地区。该区的地形起伏度相对较大,平均为692m,特别是在迪庆州内的部分区域最大;多年平均干旱指数、枯水年降水量负距平百分率和年降水变差系数分别达1.93、0.25和0.17,仅次于干旱易发区:综合各分区指标的影响,该区易发干旱的程度在整个云南省中为中间等级,属于干旱中发区。
(3)干旱轻发区。
该区位于云南省的西部和南部地区,主要分布于迪庆州、怒江州、保山市、德宏州、临沧市和西双版纳州,还包括普洱市、红河州和文山州部分地区。该区的地形起伏度相对比较小,仅比干旱易发区的大,大约542 m:多年平均干旱指数、枯水年降水量负距平百分率和年降水变差系数均小于干旱易发区和干旱中发区,分别为1.51、0.2和0.15;综合各分区指标,该区在云南省中发生干旱次数较少,为干旱轻发区。
(4)干旱少发区。
该区位于云南省的西部和南部地区,主要分布于普洱市、怒江州、保山市、德宏州和西双版纳州,还包括红河州的部分地区。该区多年平均干旱指数、枯水年降水量负距平百分率和年降水变差系数在云南省中最小,分别为1.08、0.17和0.13,特别是在普洱市地区内最小;然而其地形起伏度在云南省内最大,平均为977m,尤其是在怒江州内地形起伏度最大:鉴于该区域降水量大,降水年际变化小,干旱指数也很低,综合各分区指标,该区在云南省中发生干旱次数最少,为干旱少发区。
3.3干旱影響因素分析
气候的干湿状况和干旱易发性密切相关,气候干湿以降水量与蒸发量的对比关系来反映,云南省内降水量基本都要大于蒸发量,主要通过降水量体现在云南省内气候干湿状态,因而降水量的空间差异性可以体现云南省各地区的干旱易发性。西南暖湿气流是云南地区的主要的降水水源,因受到山地、河谷等地形的影响,地形起伏度造成云南降水的空间分布差异较大。云南省内海拔由南向北逐渐增加,低海拔地区主要集中于云南南部地区,而高海拔地区主要集中于北部地区,特别是滇西北地区;从地形起伏度来分析,滇中、滇东地区的地形起伏较小,滇西、滇西北、滇东北以及滇东南地区的地形起伏比较大。在这种特有地形条件下,云南省东北和西南地区降水量差异明显,呈现由南向北、由西向东逐渐减小的特征,降水相对较多的地区主要位于滇西南、滇南和滇东南一带,而在滇中、滇中以北的滇西北和滇东北地区降水相对较少。这主要是由于地势由南向北逐渐抬高,来自孟加拉湾和南海的西南暖湿气流在向北、东移的过程中不断的成云下雨,中间伴有地势起伏较大的高山阻挡,当到云南中部、东北部和西北部时水汽已大大减少,降水也随之减少。因此,从空间尺度来看,滇中、滇东北和滇西北地区相比于滇西和滇西南地区更容易发生干旱。
从年际变化尺度来分析,云南省内各地区的年降水量年际差异较大,没有显著的变化趋势,近几年降水量呈现偏少状态;然而伴随着全球气候变暖的态势,年平均气温呈显著的上升趋势,特别是自20世纪90年代以来,增加趋势更为明显。综合考虑云南年降水和平均气温的变化趋势,云南有从冷湿型气候向暖干型气候缓慢转变的趋势,因此近些年云南更容易发生干旱,并且发生干旱的覆盖的范围很广,譬如,2009年-2010云南省年降水量较历史同期显著偏少,气温偏高,导致了2009年-2010云南大旱。从年内尺度来看,云南干湿季分明,雨季(5月-10月)的降水量占年降水量的80%左右,主要集中在夏季和秋季,因而对于降水量较小的春季和冬季,更容易发生干旱,而且旱情往往比较严重,特别是当雨季开始晚,容易发生春旱甚至春末初夏连旱。若是上年雨季结束早,来年雨季开始又晚,将会发生冬春夏连旱现象,受灾面积扩大,灾情愈发严重。
另外,云南省地形地貌极其复杂,主要呈现波涛状高原和山区特征,高山峡谷相间特征在滇西北尤为突出,全省大部分地区(特别是东部地区)发育着各种类型的岩溶地形,也即喀斯特地貌。近些年来,由于气候变化和人类活动的影响,旱涝灾害事件频繁发生,导致水土流失严重,生态环境极为脆弱,加之当地土层相对较薄,从而造成石漠化面积扩大及等级提高,危害日益严重,尤其是云南省东北部地区石漠化极为严重。当枯季降水较少,出现旱情时,石漠化分布的区域的干旱愈发严重。从植被因素方面分析,云南省西南部及南部地区降水充沛,干旱事件较少发生,主要为常绿阔叶林,具有亚热带雨林特征;由南向北、由西向东,随着降水量的逐渐减少,干旱事件也越容易发生,下垫面植被类型也由常绿阔叶林向针叶林、灌木灌丛等转变。对于水利工程因素方面,目前全省已建成蓄水水库5500多座,绝大部分为小型水库,水资源开发利用程度较低:对骨干水利工程难以顾及的地区,五小水利工程在当地的建设取得了一定的成就,但投入仍然较少,因此当旱情较轻时,抗旱效益十分显著,一旦遭遇特大干旱,譬如2009年-2010年大旱,小水库及五小工程极易出现缺水干涸现象,造成旱灾损失特别严重。
综上所述,云南省中东部地区比西部、南部地区更容易发生干旱,并且近些年来干旱愈发严重,容易发生春夏连早,甚至冬春夏连旱。另外,根据《云南省统计年鉴》、《云南省水利统计年鉴》和《云南省旱情簡报》等资料,统计1990年以来云南省各州(市)的干旱情况,统计出昭通市、曲靖市、昆明市、玉溪市、文山州、红河州、楚雄州、大理州和丽江市发生干旱次数明显多于其它七个州市,表明云南省干旱自然分区结果与云南省历史上发生干旱的实际情况大致吻合。
3.4分区合理性检验
为了检验主成分分析下的干旱自然分区结果的合理性,现对分区后各级干旱区的四个干旱分区指标样本之间作单因素方差分析,结果见表3。
首先对于地形起伏度指标,它的平均组间偏差平方和为6 660,平均组内偏差平方和为1.149,平均组间偏差平方和明显大于平均组内偏差平方和,相应F统计量为5.796,F统计量的相伴概率要小于显著性水平0.01。同时,分别对多年平均干旱指数、枯水年降水量负距平百分率和年降水变差系数这三个分区指标做以上分析.可以发现每个指标的平均组间偏差平方和远大于平均组内偏差平方和,F统计量的相伴概率远小于显著性水平0.01。因此,可认为对于每一个分区指标,4个干旱自然分区之间存在显著的差异。也即,根据地形起伏度、多年平均干旱指数、枯水年降水量负距平百分率和年降水变差系数四个分区指标,采用主成分聚类分析方法对云南省进行干旱自然分区具有一定的合理性。
4结语
(1)在总结干旱分区相关研究方法和成果的基础上,基于主成分聚类分析法,利用地形起伏度、多年平均干旱指数、P75%年降雨量负距平百分率和年降水变差系数四个干旱分区指标对云南省进行干旱自然分区,分为干旱易发区、干旱中发区、干旱轻发区和干旱少发区。从云南全省来看,云南省中东部地区比西部地区更容易发生干旱:同相关年鉴资料的统计分析结果对比可知,云南省干旱自然分区的结果与历史上发生的实际干旱情况基本吻合。
(2)为验证云南省干旱自然分区结果的合理性,采用单因素方差分析法,对各分区的四个干旱分区指标进行检验分析,四个分区指标的平均组间偏差平方和都远大于平均组内偏差平方和,F统计量的相伴概率远小于显著性水平0.01,表明相同干旱分区内差异较小,不同分区间的差异显著。可认为依据本文中的四个干旱分区指标采用主成分聚类分析法对云南省进行干旱自然分区有一定的合理性。
(3)干旱自然分区的研究为防旱抗旱工作提供的科学研究,比如干旱监测评估、旱灾风险分区、旱灾风险评估等等,值得今后研究探讨。