APP下载

流域管理数据库中社会经济数据分摊汇总方法探索

2012-04-14曾俊轩戴能武

水利信息化 2012年6期
关键词:市辖区长江流域分摊

曾俊轩,张 沙,戴能武

(长江水利委员会网络与信息中心,湖北 武汉 430010)

0 引言

数据是水利信息化的核心,是各类水利业务应用系统的支撑和基础。随着水利信息化进程的不断深入,各级政府、事业单位和社会公众对流域内社会经济统计数据的需求越来越大,要求也越来越高。社会经济统计数据作为社会经济发展的脉搏,服务于防汛抗旱、水资源保护与管理、水土保持监测与管理、水利工程建设与管理、农村水电及电气化管理、水利规划设计管理等多种应用业务[1],在流域管理与决策中发挥着越来越重要的作用。但是,目前可获取到的社会经济统计数据大多只能提供到县一级,无法精确到乡镇,因此对于县级行政区中只有部分区划在流域中的情况,如果直接使用社会经济数据将造成极大的误差。

以长江流域水行政管理数据库中社会经济统计数据应用为例,从统计专题、指标设计、指标内涵等方面分析社会经济统计数据的特征,梳理了流域水行政管理中的数据应用需求,提出一套以流域空间单元为划分、以数据分摊汇总为思路进行社会经济统计信息整合的应用方案,并讨论该方案的优缺点。

1 社会经济统计数据特征

社会经济统计数据是社会经济组成要素在现实世界的时间与空间框架中运动与变化过程的反映[2],公布形式有统计年鉴、电子文档、数据库等。其中,统计年鉴主要根据政府公报、文件、国家重要报刊和各类统计报告的内容精选编辑而成,内容丰富、数据可靠,目前已成为了解和掌握我国国民经济和社会各领域发展状况权威的、不可或缺的工具和资料来源。由于年鉴连续出版并提供逐年可比的资料与数据,已吸引越来越多的用户利用年鉴获取所需的各种统计数据。

国家和地方各级统计局每年的社会经济统计数据庞大,从统计指标内容来看,涉及自然资源、国民经济核算、人口、就业人员和职工工资、科技教育卫生、财政、物价指数、人民生活状况、三大产业各种指数等主要方面;从统计范围涉及的行政层级来看,主要分为省、市、县3级。根据目前社会经济统计数据的特点,用户在利用数据时需要注意以下问题:

1)部分统计专题在时间维度上不连续。例如,河南省统计年鉴 2001年市级统计数据有23个专题,2007年有29个专题,虽然统计的内容大部分相同,但用户在使用数据时仍可能遇到上一年存在的指标在下一年却空缺的情况。

2)不同行政区划对统计指标内容和类型要求存在差异。首先,省、市、县级统计指标涵盖范围不完全一致,用户在使用数据的过程中可能会出现某些指标在省、市级存在而在县级空缺的情况。例如,福建省 2009年的统计年鉴中包含了省、市级“有效灌溉面积”数据,但县级相应指标数据却没有。其次,年鉴中绝大部分市(自治州)目前尚无市辖区社会经济统计数据,用户仅能查到部分直辖市市辖区的数据。例如,用户可以在年鉴中找到2009年上海市辖区内黄埔区的“年末总人口数”,却查不出江苏省南京市辖区内玄武区的“年末总人口数”。

3)各地同类统计指标的内涵和单位不完全统一。例如,针对“总人口数”,有些地区是按“户籍人口数”统计,而有些地区按“常住人口数”统计。又如,针对“总户数”这一指标单位,一般省、市级年鉴中是按“万户”计,而县级年鉴中是按“户”计。

只有注意到上述这些问题,才能科学合理地使用好统计年鉴中的社会经济统计数据。

2 流域水行政管理数据库中社会经济数据应用需求

长江流域水行政管理数据库中的社会经济数据,主要包含行政区划、人口、经济状况、农作物播种面积及产量等相关信息。社会经济信息在洪水调度预案评估、灾情跟踪监测与评估、水资源保护与管理、水土保持监测与管理、水利工程建设与管理、农村水电及电气化管理、水利规划设计管理等方面发挥重要作用,为防汛调度和指挥抢险救灾提供科学决策依据,为分析水土保持和水利工程建设对社会经济发展的影响提供数据支撑,为水利规划设计提供重要的参考信息,从而提高流域管理的决策科学水平。

为了更好地服务于流域管理工作,水利信息工作者应根据流域管理的应用需求对社会经济统计数据进行一定的分析与处理,运用科学的手段提炼出符合流域管理使用要求的社会经济数据。以下以长江流域水行政管理数据库为例,分析其对社会经济统计数据的应用需求:

1)空间范围应针对长江流域所辖行政区。长江流域水行政管理工作主要是针对长江流域范围开展的,所以行政区范围的正确性显得尤为重要。长江流域行政区划应根据长江流域所管辖的范围而定,提供包括19个省、市、自治区的社会经济数据。

2)数据统计范围应以长江流域空间范围为界。目前各级年鉴所涉及的社会经济数据是按行政区划的全境范围统计的,而行政区划与流域范围不完全重合,因此会出现某些指标不仅包含长江流域内的数据,还包含流域外的数据。例如,浙江省 2005年全省总人口数为 4602.11万人,但该省在长江流域内的区域仅4个地级市、5个县级市和7个县,该省2005年流域内的实际总人口数应为 818.57万人。从实际工作需要考虑,社会经济数据主要用于长江流域范围内的管理工作,因此应对获得长江流域相关行政区的统计数据进行处理,剔除长江流域外的数据,尽可能准确地反映流域内的社会经济状况。

3)统计指标数据应进行统一规整处理。对于调整变更后的社会经济统计总量指标数据,应按照县、市、省3级行政层级由下至上逐级调整和汇总,使得各级统计数据指标单位统一,逻辑关系合理。这样处理后的社会经济统计数据,结果更接近实际值,才能在流域空间范围内符合流域水行政管理的应用需求。

3 基于流域范围的统计数据分摊汇总应用方案

3.1 资料来源

首先要保证数据来源的正确性。资料来源主要是正规出版的按行业和行政区域分类的中央、地方、行业等年鉴数据,如《中国统计年鉴》、《长江年鉴》,以及长江流域内各省、自治区、直辖市的统计年鉴等。对于收集到的原始数据,通过人工进行格式统一、度量单位换算等初步加工,然后开展数据的填报工作。

3.2 工作范围

从实际工作需要出发,将行政区划限定为流域管辖的范围,以长江流域为例,包括上海市、江苏省、浙江省、安徽省、福建省、江西省、河南省、湖北省、湖南省、广东省、广西壮族自治区、重庆市、四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海省等19个省级行政区划,以及包含的120个市(不含所属市辖区),683个县共 822个行政区域。如果行政区域有变更,则应根据实际情况及时进行调整。

3.3 处理方法

对于部分面积在长江流域内的行政区域,应针对“人口”、“面积”等总量指标进行一定比例的分摊计算,得出最接近实际情况的数据值。

从当前年鉴中可获取的统计数据来看,选取面积百分数为分摊比例较为合适,即土地面积只有部分位于长江流域的区域,百分数表示属于长江流域面积占全市、县、区的百分比。例如,统计年鉴中江西省赣州市安远县 2010年的“耕地面积”值为11082.00万m2,同时根据年鉴,该县有 74% 的面积属于长江流域,按此面积占比估算,该县在长江流域中的“耕地面积”约为 8200.68万m2。

数据的填报应按行政层级从下至上,由县级逐级向上计算并调整。数据的调整修正包括以下几种情况:

1)县级数据。当年鉴中有较全面的县级统计数据,且该县面积在长江流域所占面积的比例明确时,可直接将原始统计数据乘以该百分比即能获得修正后的县级数据。计算公式为

县级数据 =年鉴原始县级统计数据×县级面积占比

2)市级数据。年鉴中一般只包含市级统计数据,而缺少市所属市辖区的数据(直辖市除外)。在计算“人口”、“面积”等总量指标值时,如果直接将某市所辖县修正后的统计数据求和,会因缺少市辖区的数据使求和后的市级数据小于实际值。因此,考虑年鉴中有原始的县级和市级统计数据,且假定市辖区面积完全在长江流域中,以原始的市级数据减去此市所辖县不在长江流域内的数据,可以得到修正后的市级数据。计算公式为

市级数据 =年鉴原始市级统计数据 -∑[年鉴原始县级统计数据×(1-县级面积占比)]

3)省级数据。省级数据直接由修正后的市级数据汇总得到。计算公式为

省级数据 = ∑市级数据。

3.4 实施步骤

数据填报时采用人工校核和自动演算相结合的方式,采用以下4个步骤对数据进行处理:

1)县级数据填报(人工)。通过手动方式,对年鉴中的统计数据进行填报,录入初始的未经分摊的原始县级统计数据和县级面积占比。

2)县级数据分摊(自动)。使用录入的原始县级统计数据和县级面积占比,自动计算生成调整后的县级数据和由调整后的县级数据向上汇总成的市级数据(市级数据仅作为后续填报和调整的参考)。

3)市级数据调整(人工)。由人工对市级数据进行调整,即通过原始市级数据减去此市所辖的县不在长江流域内的数据获得调整后的市级数据。

4)省级数据汇总(自动)。填报过程中由程序对调整后的市级数据自动汇总,生成省级数据,完成所有数据的填报。

4 方案优缺点分析

使用数据分摊汇总的方法,具有数据来源可靠、操作简便、准确性高等优点,可以获得更符合流域管理要求的社会经济数据。但是,受限于年鉴发布时间较晚、市辖区数据缺失等因素,此方法在数据时效性和数据精度方面还有进一步提高的空间。

4.1 优点

1)数据来源可靠。数据主要来源于统计年鉴。统计年鉴是国家统计局编印的一种资料性年刊,是我国最全面、最具权威性的综合统计年鉴,能全面反映中华人民共和国经济和社会发展情况。方案中通过年鉴采集数据,在保证数据质量的同时,也具有较强的可持续操作性,便于定期对社会经济数据更新,保持数据的生命力。

2)操作方法简单,准确性高。数据分摊和自动汇总功能是通过程序自动计算并生成结果的,因此在输入时只需要填报原始的年鉴数据,并提供适当的分摊比例即可自动生成数据,再经过部分人工校正即可获取最终的填报数据,节省人力投入,减少产生错误的可能性。

3)数据更符合实际情况,逻辑合理性更强。对于流域应用而言,如果直接使用年鉴中的数据,则对部分行政区划与流域交叉较少的省份会出现较大的数据偏差。如浙江省 2005年全省总人口数为4602.11万人,但该省在 2005年流域内的实际总人口数应为 818.57万人,如果不经处理直接使用,则数据相差5倍,在应用时会造成较大偏差。

4.2 缺点

1)数据时效性不高。《中国统计年鉴》一般发行于下半年,年鉴中提供的是上一年的社会经济数据,如果再加上年鉴的获取和数据填报复核的时间,获得最终填报数据的日期至少会延迟1a 半以上,存在一定的迟滞性。但考虑社会经济发展在几年之内变化幅度不大,且社会经济数据仅提供决策评估参考,因此这一点对数据的正常使用影响较小。

2)数据精度有待提高。社会经济发展在地域上存在不均匀性,人口、耕地、工农业等分布会因为各种环境和社会因素而改变,因此如果简单地通过使用面积占比来获取流域内的相关社会经济数据,获得的仅仅是一种理想状态下的均值。而且,计算过程中由于缺乏市辖区数据而假设市辖区面积完全在流域内,与实际情况也会存在一定的差异。因此,需进一步探索并获取更准确的社会经济分布比例和缺失数据,再通过这种比例分摊的方法获得接近真实状况的数据,进一步提高数据精度。

5 结语

使用数据分摊汇总方法对社会经济指标进行填报,使填报的数据更接近真实的区域内社会经济指标数据,对汛情和旱情评估提供更准确的参考数据。使用人工校核和自动演算相结合的方法,不仅提高了效率,也减少了人工填报计算时的错误率,保证了数据质量。目前,此方法已应用于长江流域2008—2009年社会经济数据填报,在获得水利系统内各级领导和长江委防汛抗旱、水资源管理等各业务主管单位认可的同时,保证了数据的准确性,有效地提高了数据的质量和用户的满意度。

[1] 水利部信息化工作领导小组办公室.全国水利信息化规划[S].北京:水利部信息化工作领导小组办公室,2003:51-61.

[2] 罗丽华.社会经济统计时空数据服务系统的设计与实现[D].开封:河南大学,2007: 4.

猜你喜欢

市辖区长江流域分摊
同构视阈下的异构治理:市辖区体制的优化进路*
一种均衡协作配送子联盟满意度的成本分摊方法
走遍长江流域的英国小伙
长江流域园区的府际合作研究
长江流域径流演变规律研究
我国市辖区行政体制改革难点探析
共同配送下成本分摊影响因素的计算实验研究
地级市及市辖区职责划分研究
基于潮流跟踪的网损分摊新方法
河北省城市碳排放责任分摊模型及实证研究