基于聚类分析浅析水利行业发展
2019-08-08张婉
张 婉
(北方工业大学,北京 100144)
1 水利发展与水资源现状
水利建设对于一个国家的国民经济和社会稳定发展至关重要,高效合理利用水资源可以达到防洪、灌溉、排涝、防灾、减灾,因此国家对于水利工程也是相当的重视。2016年全国政府性基金收入中南水北调工程基金共6.49亿元、国家重大水利工程建设基金363.48亿元,全国政府性基金支出中南水北调工程基金共9.45亿元、国家重大水利工程建设基金346.72亿元、中央水库移民扶持基金281.06亿元。国家在水利方面的地方一般公共预算支出高达4280.45亿元,在南水北调工程上的一般公共预算支出为35.55亿元。我国水利设施用地面积共3.5902万km2,拥有中型水库3890个,容量1096亿m3;小型水库93850个,容量705亿m3。水电发电量达11933.7402亿kW·h。我国现代大型跨流域调水工程有南水北调、河北省引滦入津、引滦入唐、山东省引黄济青、山西省引黄入晋、钱塘江引江济太、东北的北水南调工程、广东的东深供水工程、甘肃的引大入秦工程等。我国现代大型蓄水工程包括长江三峡水利枢纽工程、四川都江堰水利枢纽、广东陆丰陂洋镇、广西龙潭水库等。
2 各地区水利行业发展情况
应用层次聚类分析方法,将水利行业发展情况相似的地区聚为一类,共分出5类地区。
层次聚类是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性。数据点之间的距离越小,相似度就越高。层次聚类法的优点是对样本的输入顺序不敏感。本文数据来源于中国统计年鉴,将选取以下7个指标来分析全国各省水利行业发展情况:水利、环境和公共设施管理业全社会固定资产投资;水利设施用地面积;水利、环境和公共设施管理业法人单位数;水利、环境和公共设施管理业城镇非私营单位就业人员数;水利、环境和公共设施管理业城镇非私营单位就业人员平均工资;水力发电量;供水综合生产能力,见表1。首先对数据进行标准化处理,然后对数据中的缺失值进行处理,用平均值来代替缺失值,使用欧式距离矩阵,来计算对比不同类别数据点之间的距离,并对距离值最小的数据点进行组合,生成聚类树。
表1 聚类分析结果
第一类地区中宁夏、西藏、青海是较为干旱的地区,因此水利行业发展较为缓慢。而海南省则从水资源管护转变为水生态治理。第二类地区属于一线城市,各个行业发展较为均衡,发展水平较好。第三类地区位于华东和中南地区,水资源较为丰富。华东地区是我国水电装机较为集中并且抽水蓄能电站主要的集中的地区,水利行业发展形势较好。第四类地区中云南、四川皆是水电大省,云南省发电量在全国排第二名。第五类地区包含了中国十大干旱省份中的七个省份,主要水利发展方向是高效节水方面的水利工程。
通过聚类分析,发现对于不同地理位置的各省市,水利行业发展情况不同。第一类和第五类中大部分地区属于干旱、水资源短缺的地区,要充分高效利用已开发的水源、发展节水型农业、提高水利管理的科技含量、提高人们的节水意识和水资源环境保护意识等。第三类地区,水资源丰富,主要需要做好防洪、除涝以及防止水土流失等预防措施,并且要提高水利设施安全性能,用科技带动水利行业发展。对于第四类地区,水电能源是清洁能源,能再生、无污染、并且运行费用低,还可以提高资源利用率与经济社会的综合效益,第四类地区有条件在保护水资源和生态环境的同时发展开发水电能源。
3 水利行业项目发展与产业增加值关系
本文应用典型相关分析,找出水利行业项目发展情况与产业增加值之间的关系。典型相关分析的基本原理是为了从总体上考察两组指标之间的相关关系,从而分别在两组变量中提取有代表性的两个综合变量U和V,U为水利行业发展的线性组合,V是三大产业增加值的线性组合。利用这两个综合变量之间的相关关系来反映水利行业发展情况与产业增加值之间的总体相关性。数据来源于统计年鉴,选取2004—2016年水上运输业;水利、环境和公共设施管理业;水利管理业的全部建成投产项目个数代表水利行业项目发展情况作为第一组变量,第一、二、三产业增加值代表产业增加值作为第二组变量。以此作为研究数据,使用R统计分析软件,首先通过计算两组变量的相关系数矩阵求出特征值和典型相关系数,结果见表2。然后进行典型相关系数检验,根据检验将提取两对典型相关变量,最后根据系数矩阵得出表达式,见表3—4。
表2 典型相关系数
表2认为在α=0.05水平上前两个典型相关是显著的。第一对和第二对典型变量的相关系数为0.99728和0.717826说明U1和V1以及U2和V2之间具有高度的相关关系。
表3 x的典型载荷
表4 y的典型载荷
由典型载荷可知,典型相关变量的表达式为:
(1)
式中,U1—水利行业发展的线性组合,其中X2(水利、环境和公共设施管理业项目数)有较大的载荷,说明水利、环境和公共设施管理业项目数能充分解释水利行业项目发展情况;V1—三大产业增加值的线性组合,其中有较大载荷的变量是Y3(第三产业增加值);Y1—第一产业增加值有也较大载荷,说明第一、三产业增加值对产业增加值贡献很大。在第二对典型变量(U2,V2)中;U2—水利行业发展的线性组合,其中X2(水利、环境和公共设施管理业项目数)和X3(水利管理业项目数)都有较大的载荷;V2—三大产业增加值的线性组合,其中Y1(第一产业增加值)和Y2(第二产业增加值)有较大的载荷。第二对典型变量的相关关系远不如第一对相关显著。
综合两对典型变量可知,水利、环境和公共设施管理业及水利管理业项目数可以充分代表水利行业项目发展情况,三大产业中,第一、二、三产业的增加值在不同程度上都影响着总增加值的变化,并且第一产业增加值对产业增加值有促进作用。
图1 得分等值平面图
通过两对典型相关变量的得分等值平面图如图1所示可以看出,第一对典型相关变量得分散点在一条近似的直线上分布,两者之间呈高度线性相关关系,散点图上没有离开群体的差异点。第二对典型相关变量得分散点也在一条近似的直线上,虽然有些偏离情况发生,但总体还是呈现出了线性相关关系.综合第一和第二对典型相关变量来看,我国水利行业发展与产业增加值关系很稳定,整体波动平稳。水利、环境和公共设施管理业及水利管理业的发展充分影响了水利行业的发展并且影响第一、二、三产业增加值,尤其是一、三产业,彰显了水利、环境和公共设施管理业及水利管理业是水利行业发展的重中之重。
4 结语
随着社会经济和科技的进步,水利发展越来越注重人类生活与自然环境的协调统一。我们要充分利用大自然的自我修复能力,加强水土保持和水功能区管理,保护、恢复和改善生态环境。再此基础上进一步加强水利基础设施建设,顺应各省地理环境优势,为水资源合理配置创造条件。治水思路也将逐步完善并走向成熟,这也加大了对水利行业高层次专业技术人才的需求。接下来根据不同地区情况,具体问题具体分析,顺应自然、利用科技创新,发展水利建设,推动我国经济增长。