基本农田补贴数据处理与统计分析方法的探讨
2017-07-07李灶强
李灶强
(广州市增城区国土资源测绘院,广东 广州 511300)
基本农田补贴数据处理与统计分析方法的探讨
李灶强*
(广州市增城区国土资源测绘院,广东 广州 511300)
基于GIS技术,获取基本农田和权属相关数据并建立统计汇总数据库,按权属划分规则来对基本农田补贴数据进行处理,根据数据统计分析对权属隶属等级数量的要求,通过多种空间运算和逻辑运算,结合现在较为先进的数据统计分析方式,探讨当前工作生产中最有效的基本农田补贴数据处理与统计分析方法。
GIS;数据库;逻辑运算;空间运算;统计分析
合理利用土地和切实保护耕地是我国的基本国策,自2012年起,为切实保护耕地和基本农田,广东在全省范围内建立和实施基本农田保护经济补偿制度[1]。该基本农田保护经济补偿制度的实施细则由各地级以上市制度并组织实施,按照上级通知确定的基本农田补贴范围、补贴对象、补贴条件等要求,对承担基本农田保护任务的单位给予补贴[2]。
在统计分析基本农田补贴的范围和对象过程中,权属隶属等级一般有社、村、乡镇、地市,甚至要求包含户等更细等级。由于ArcGIS等GIS软件欠缺对多等级数据的统计分析能力,本文旨在完成建立统计汇总数据库后,通过运用多种数据统计分析方式,比较其在实际生产中的优点和缺点,探讨当前工作生产中最有效的基本农田补贴数据处理与统计分析方法。
1 数据处理与统计分析方案概述
完成基本农田补贴数据处理与统计分析任务一般有以下步骤:首先摸底调查并制订方案、收集资料、数据整理并建库、数据处理、数据统计分析、成果检查、输出成果表和成果图。实现空间数据建库我们主要运用GIS软件,而数据统计汇总部分,就根据计算方案要求制度不同的统计分析方法如图1所示,主要包含ABC三种方案。方案A如图1(a):直接利用GIS自身软件的工具和功能来完成统计分析;方案B如图1(b):在GIS软件嵌入编程语言二次开发实现更强大数据处理功能来实现统计分析;方案C如图1(c):用GIS软件整理并建立数据库后结合其他第三方统计分析软件来完成数据统计分析任务。
图1 数据处理与统计分析方案图
2 基本农田补贴数据建库与统计分析一般过程
2.1 数据建库
首先根据行业应用特点对数据库进行建模;然后收集整理资料,把有用资料提取并转换导入到指定的数据库;最后经过相应的设计进行合适的空间运算和逻辑运算等。在基本农田补贴数据处理过程中一般通过ArcGIS等GIS软件实现数据建库。
以广州市增城区为例,根据国土相关部门制订的基本农田补贴计算方案,首先收集基本农田范围数据、地类现状数据、已报批征用项目范围数据等,通过空间运算计算出现有的基本农田补贴范围。再结合村界镇街和集体所有权证等权属数据对补贴范围数据进行空间运算和逻辑运算,然后把数据整理并导入生成GDB数据或shp数据等,从而初步建立好基本农田补贴统计分析空间数据库,主要流程如图2所示。
图2 统计分析空间数据库建立流程图
2.2 数据统计分析
在基本农田数据库中,基本农田和权属相关数据的数据库字段一般包含社名、村名、镇名、市名、坐落、面积、集体证权利人名等。权属数据划分按一定规则,首先按已发农村集体所有权证范围分割,然后不在此范围的按村社等界线分割。数据统计分析一般通过ArcGIS等GIS软件进程相应的相交、擦除等空间远算,再加上特定的逻辑运算并导出生成数据表,在数据表中进行相应的统计分析来完成。
3 数据统计分析方法
3.1 GIS软件自身的数据统计分析功能
GIS软件自身一般具备数据统计分析功能,可此功能只能统计两维的单项的数据。以ArcGIS软件[3]为例,对简单的单项或单列的单一等级统计数据,通过对数据表进行汇总和统计分析可以快捷地统计数据如图3所示,而对多等级统计数据就无法靠自身功能去直接计算实现了如图4所示。
图3 单一等级的数据统计分析图例
图4 两个等级的数据统计分析图例
以增城区为例,在增城区基本农田补贴数据中,以社为统计等级,可以运用ArcGIS软件。如果用ArcGIS软件进行统计[4],社的上一等级为行政村,每个行政村需要统计一次。现增城区共300多个行政村,需统计300多次之后再综合数据进行分析。这样不仅工作量大效率低而且成果容易出差,所以多等级的数据统计分析在GIS软件上不常用。
3.2R数据统计分析语言及其在GIS中的应用
R统计分析语言是一种用于数据统计分析的计算机语言[5],常用于在GIS中数据统计分析。目前国外GIS软件仍主要以Esri、MapInfo和Geoconcept为主导,国内主要有超图、MapGIS等GIS软件。GIS应用软件中也出现了开源的应用软件,当前主要以PostGIS、GRASS为主要代表。以在GRASS中使用R语言为例,进行数据分析主要包含以下四个过程:首先,获取所需的程序包;其次,从GRASS状态下进入R程序;然后,使用R和GRASS及相关的程序包所提供的功能进行数据分析;最后,显示、保存分析结果。
R数据统计分析语言在GIS中的应用,能实现多等级的数据分析功能如图5所示,完成数据统计分析工作非常有效,可要求作业人员对编写和运用R语言的能力非常高,一般的程序员都较难实现。
图5 多个等级的数据统计分析图例
3.3 Excel实现数据统计分析
Excel软件自身可调用函数实现单个处理的数据统计,然而结合编程语言才可实现多等级数据的批量处理和统计分析如图5所示。如VBA语言,VBA作为一种宏编程语言,在文本信息处理、数据统计分析等领域已得到广泛应用[6]。
在GIS软件中的基本农田补贴统计分析基本数据库可以包含SHP数据也可以是GeoDatabase数据,SHP数据可用Excel软件直接导入DBF文件,如果是GeoDatabase数据就要在属性表中将其数据生成一个DBF文件,然后用Excel软件打开,再进行数据整理。最后利用VBA语言编程嵌入Excel软件打开的DBF文本进行数据统计分析。然而这种方式快捷有效,可对作业人员的VBA语言编程能力要求较高。
3.4 用Access实现GIS数据统计分析
(1)Access与GIS数据连接
Access是由微软发布的关系数据库管理系统。Access支持mdb格式数据,且在数据字段设计,别名修改以及批量字段复制等操作简便易行。利用Access强大的DDE(动态数据交换)和OLE(对象的链接和嵌入)特性,可以在一个数据表中嵌入多个Excel表格、DBF文件等,还可以建立动态的数据库报表和窗体。Access与GIS数据连接比较容易,将基本农田补贴数据库统计表转换为DBF表数据形式,再将其导入Access数据库中就可以对其进行分析操作。如果数据是SHP数据,可直接把其DBF文件导入Access数据库中,如果是GeoDatabase数据就要在属性表中将其数据生成一个DBF文件,然后将其导入Access数据库中。
(2)Access的查询分析
Access有强大的数据处理、统计分析能力[8],在统计分析上万、十几万项数列及以上的数据时速度快且操作方便。以Access 2007为例,其操作步骤大致为:导入数据表、打开数据表、点击查询向导、选择简单查询向导、选定参与统计的字段、点选汇总、点击完成。通过此查询分析功能就能快捷有效地实现数据统计汇总,而且等级字段可以灵活调动。对于处理多等级的基本农田补贴数据来说,运用Access的查询分析功能就可有效快捷地实现数据统计汇总任务,而且操作简便对作业人员要求不高。
4 结 语
基于GIS技术,根据上级要求建立好基本农田补贴数据库,通过实现数据统计分析的方法,简要地探讨了GIS软件自身的数据统计分析能力、R数据统计分析语言在GIS中的应用能力、Excel数据统计分析能力和用Access数据统计分析能力的利与弊。日常工作中,在保证成果质量的同时我们更会追求快捷和有效的生产方式。在多年基本农田补贴数据统计分析的经验中,应用ArcGIS软件建库并进行合理的空间和逻辑运算,然后结合Access,利用其查询功能来完成多等级的数据统计分析是最为有效便捷的处理方法。此方法已经应用于增城区基本农田补贴数据统计分析过程,保证了数据质量,提高了操作效率,为基本农田保护经济补偿制度的实施发挥了一定作用。
[1] 赖文浩. 广州实行基本农田保护补贴制度[N]. 中国国土资源报,2011-06-15(2).
[2] 国土资源部. 关于建立基本农田保护经济补偿制度的意见[J]. 国土资源通讯,2012(21):45~46.
[3] 汤国安,杨昕. ArcGIS地理信息系统空间分析实验教程(第2版)[M]. 北京:科学出版社,2012:3~8.
[4] 陈於立,李少华,史斌等. ArcGIS开发权威指南[M]. 北京:电子工业出版社,2015:177~182.
[5] 李倩星. R语言实战:编程基础、统计分析与数据挖掘宝典[M]. 北京:电子工业出版社,2016:9~13.
[6] 袁武先. VBA技术在Excel表格数据统计中的应用[J]. 电脑编程技巧与维护,2016(14):67~81.
[7] 施永香. Access2007在IT审计中的应用[J]. 南京审计学院学报,2011(8):41~45.
Discussion on the Basic Farmland Subsidies Data Processing and Statistical Analysis Method
Li Zaoqiang
(Surveying and Mapping Institute of Land and Resources in Zengcheng of Guangzhou,Guangzhou 511300,China)
Based on GIS technology,get the basic farmland and ownership of the relevant data and establish the statistical database,according to the Ownership Division Rules to the basic farmland subsidies data processing.According to the statistical analysis of the data on the grade of membership ownership level requirements,through a variety of space operations and logical operations,combined with the more advanced statistical methods of data analysis,discussion on the most effective methods of data processing and statistical analysis of the basic farmland subsidy in the current work.
GIS;database;logical operation;spatial operation;statistical analysis
1672-8262(2017)03-145-03
P209
B
2017—03—16
李灶强(1982—),男,工程师,注册测绘师,主要从事测绘项目质量控制和生产管理等工作。