城乡一体化住户调查方法制度改进建议
2015-02-12陈江宁卢君
陈江宁、卢君
(国家统计局宁波调查队,浙江宁波 315000)
工作实务
城乡一体化住户调查方法制度改进建议
陈江宁、卢君
(国家统计局宁波调查队,浙江宁波 315000)
城乡一体化住户调查是国务院批准的重大统计改革,是党和政府统筹城乡发展、促进居民收入增长、建立扩大消费需求长效机制的重要信息保障。本文在分析研究现行一体化住户调查方案的基础上,通过对宁波市本级和所辖县级住户调查的主要收支及样本代表性评估,对抽样方法和数据采集方式等若干问题进行深入剖析,并提出改进设想和有效方法。
一体化;住户;抽样方法;研究
一、引言
住户调查主要反映居民家庭收入和支出状况,是一项十分重要的民生统计。受城乡二元结构的影响,长期以来我国的城乡住户调查是分开进行的,两项调查的指标、口径、范围、标准、方法都不尽相同,农村居民与城镇居民的收支水平和结构等统计数据不完全可比,也难以精确测算全体居民的收入和支出结构。为此,国家统计局对城乡住户调查实施了改革,统一了城乡居民收入指标名称、分类和统计标准,并于2012年12月1日起在全国正式开展城乡一体化的住户收支与生活状况调查。
宁波全过程参与了一体化住户调查改革的试点及正式调查工作,经过近两年的具体实践,可以发现一体化住户调查工作尽管在理论依据及方案设计等方面更具科学性,弥补了以往分城乡住户调查存在的弊端。但是,在实际操作过程中,也出现了一些新问题,如新老数据衔接难、收支结构变动大、县级样本代表性差等。本课题的研究目的旨在从理论与实践相结合的角度,利用抽样原理和调查技能,对现行一体化住户调查抽样方法优劣和数据采集方式等难点进行深入分析,探寻改进途径和有效方法,以推进一体化住户调查工作的开展。
二、抽样方法优劣分析与改进意见
(一)抽样框优劣分析
一体化住户调查以六人普提供的普查小区名录作为抽选调查小区的样本框,主要的优点体现在:一是抽样框资料更加全面完整,六人普资料涵盖了所有城乡地域(主城区及中心镇为U层,农村为R层)及城乡结合部(UR层),弥补了以往分城乡调查抽样范围只限于U层和R层,而缺失UR层的弊端,从而达到样本城乡全覆盖的改革目标;二是六人普没有居民收入方面的内容,以此为抽样框,采用无关标志排序等距抽样方法,增强了抽样的随机性,杜绝了抽样时可能出现的偏向性,避免了人为选择样本与收入高低的关联,理论上可以更真实反映居民的收入情况;三是直接使用六人普资料作为抽样框,资料取得比较容易,在一定程度上减小了工作难度,为基层统计部门开展调查提供了便利条件。
采用六人普资料作为抽样框,虽然优点不少但也存在瑕疵。主要表现在:
1.时效性带来的误差。由于所参照的六人普
资料调查时点为2010年,调查小区的抽选工作在2012年进行,如果不进行仔细核实、校正,就直接选用六人普资料作为抽样框,则两年内的样本变动情况不能反映在抽样框中,从而影响抽样精度。实际情况是,随着近两年城市建设日新月异,调查小区不同程度存在拆迁及新建情况,但由于前期样本框核实的时间较短,纠偏不到位,导致样本框与实际情况出现差异。
2.抽样框城乡分层与住户调查中的城乡分类不匹配。一体化住户调查根据小区城乡属性分别汇总产生分城乡调查数据:U层和UR层合计为城镇,R层为农村。从六人普资料城乡分层情况看,U层和R层分别具有明晰的城或乡特点,而UR层中很大一部分调查小区无论从地域分布、住房情况,还是住户特征等方面都更多地接近甚至等同于农村。造成此划分偏差的主要原因是,随着各地城镇化进程的加快,相当一部分稍微跟城镇沾边的村早早地进行了村改居,但很多只是将名称从村委会改成了社区而已,实质上还是属于农村。如果将这些分层上属于UR层、实际为农村的调查小区纳入城镇统计范围,势必会严重拉低城镇住户调查数据。
从宁波的实际抽选情况看,抽出的289个调查小区中U层102个,UR层92个,R层95个。经重新核实,UR层中32个调查小区实际应属于R层,占34.8%。
(二)抽样方法优劣分析
一体化住户调查抽样工作由国家统计局负责,以第六次全国人口普查资料为住户抽样框,按照统一的抽样方法对所有居民进行分层随机抽样和选取调查户。
该种抽样方法的优势在于:一是调查小区的抽选统一由国家抽选,减少了各级统计部门对抽取样本理解和操作带来的偏差,为调查数据的真实性打牢了基础;二是调查小区的抽选采用对抽样框资料进行无关标志排序等距抽样,理论上能够提高样本随机性,消除人为选择因素,在样本量足够大的前提下保证抽中调查小区对总体的代表性;三是以区域抽样框作为末端抽样框,对抽中调查小区绘制地图,并在抽中区域内进行住宅清查,对所有符合要求的住宅进行摸底调查,做到不重不漏,在此基础上整理形成的住宅抽样框能够确保完整性和全面性,并且区域抽样框具有稳定性强、利于维护的特点。
实行该种抽样方法的弊端:
1.由国家统一抽选调查小区,实行一刀切的做法,一方面会对工作效率有所影响。就宁波而言,所有数据和资料的上报均需通过省总队上报国家局,再由省反馈国家局的信息,而国家局要全面负责全国2000多个县市区的抽选工作,如果遇到因拆迁等原因需要进行样本小区调整的情况,从上报调换小区申请报告,到取得国家局认可或答复,经历的过程繁琐、时间过长,会影响后续工作进度;另一方面,国家局对调查小区的调整把控过严,容易造成虽然抽中的调查小区不符合当地实际情况,但又不能及时调整而引起调查数据偏差。
2.分市县住户调查样本抽选方法不合理。根据浙江省住户收支与生活状况调查方案要求,分省住户调查样本和分市县住户调查样本使用统一的抽样框,在有分省调查样本的区县,在抽样框中剔除分省调查所抽中的调查小区,再使用相同的抽样方法,补充抽取分市县调查所需要的调查小区,与分省调查样本共同构成分市县调查样本。在95%的置信度下,以宁波市为总体的设计样本量为2890宅,按一个调查小区抽选10宅计算,则需抽选289个调查小区,但按照抽样方案要求,以宁波为总体抽选的调查小区为203个,另外86个直接由分省样本中属于宁波的调查小区替代。因此,这2890宅非严格意义上能代表以宁波为总体的市级样本。
3.采用区域抽样框作为末端抽样框,抽样方案设计虽科学,但实际操作存在困难。一体化住户调查在抽宅阶段要求先对抽中调查小区绘制调查小区图并编制建筑物清查表,画小区图工作量大,具体操作难。尽管有人普小区图可供参考,但人普地图普遍存在建筑物位置有偏差、建筑物顺序与实际行走路线不符、遗漏无人居住建筑物标识等问题。同时,对于农村地域、城乡结合部以及城市中的老宅由于分布不规律、排列复杂给绘制
小区图及编制建筑物清查表造成了很大的困难,由此影响末端抽样框的质量。
4.调查小区划分规模较小,样本同质性现象突出,影响了样本代表性。根据方案要求,每个调查小区的住户规模不低于80户。从实际来看,绝大多数的调查小区住户规模在100户左右,在城市中可能就只有5幢相邻的多层居民楼,如果是高层建筑,则可能只有2幢高楼,而随着城市中商品房占比的加大,家庭住房的地段及面积很大程度上代表了一个家庭的经济实力,因此相邻居民楼中住户的家庭住房和收入情况比较相近,样本同质性比较明显,不能全面反映不同收入居民家庭的生活状况。如果以该区域内10户左右居民家庭的收支数据来推算该调查小区所在的社区收入数据,则会影响到调查数据的质量。
(三)样本代表性评估分析
为全面了解一体化住户调查样本抽选质量,切实做好改革前后城乡居民收入数据衔接工作,宁波市分别从市级和县级层面对城乡一体化住户调查样本进行了全面评估分析。评估采用将抽中调查小区及抽中调查户的人员情况、就业结构等方面与六人普资料进行比对。评估结果显示,市级样本在人员的年龄分布、文化程度、就业结构等方面与六人普基本匹配,而县级样本受样本量因素制约,其代表性稍显不足。主要表现在:一是城乡比例失调,不符合客观实际;二是未就业率明显偏高;三是就业结构中从事农业生产的一产比例明显偏高;四是个别县市区外来户比例显著偏高。
(四)改进建议及方法
1.加强对抽样框编制资料的甄别,重新进行分层。建立一个优良的样本框是控制抽样误差的有效途径,因此要加强对抽样框编制资料的甄别,最大限度地降低抽样误差。同时,要根据本地实际情况,重新核对并调整抽中调查小区的城乡分层,尤其要加强对UR层的清查核对,把完全具备农村特征的调查小区划归到R层,确保城乡分层客观准确。
2.加强调查网点的管理,确保调查样本科学合理。调查网点的代表性是抽样调查工作的根本,因此做好调查样本的抽选和日常维护管理显得尤为重要。国家统计局统一抽选完调查网点各地必须结合当地实际,从多方面论证和评估,发现不符合要求的住户样本,要及时按抽样方案所规定的要求进行调整或补充,确保住户调查样本对总体的代表性。要坚持把评估工作做在前面重视并改进样本本身代表性检验的合理性才是确保抽样调查数据准确的有效方法。
3.扩大样本量。从样本代表性评估分析中可以看出,县级样本的代表性较差,如要发布分县调查数据,建议以县级为总体补充抽选样本,纠正现有样本的偏差。针对县级样本中真正意义上的城镇住户严重不足的情况,建议适当增加U层的样本量。
4.扩大调查小区规模。按照现有抽样方案划分的调查小区规模较小,使得抽中调查小区对所在社区(村)的代表性不足,故建议在今后的抽样过程中,可适当扩大调查小区规模,增强所辖样本的多样性,避免同质性过高。
三、数据采集方式分析与改进设想
(一)住户调查数据采集方式分析
这次城乡住户调查一体化改革的内容主要涉及方法制度,数据采集方式变化甚微,只精简了部分调查指标,进行了网络数据采集局部试点。
目前,住户调查采用日记账和问卷调查相结合的方式采集基础数据。其中,居民现金收入与支出、实物收入与支出等内容主要使用记账方式采集。住户成员及劳动力从业情况、住房和耐用消费品拥有情况、家庭经营和生产投资情况、社区基本情况及其他民生状况等资料使用问卷调查方式采集,在季末或年底由调查员对被调查户进行一次性访问调查取得。对集体户和个别不愿记账的调查户(农业生产经营户除外),可以使用收支问卷进行调查。
为减轻调查户记账负担、提高调查对象配合程度,国家统计局从2014调查年度开始,在直辖市省会城市和计划单列市的市辖区居委会中的国家样本户试行缩短消费记账,采用“一半样本记细账,一半样本记粗账”办法缩短调查户消费记账时间。在2年调查周期内,国家样本户先记一年细
账,包括记录家庭所有收入、消费和非消费支出;再记一年粗账,包括记录家庭所有收入和用于计算可支配收入所需的少量非消费性支出项。
如果试行缩短消费记账,每户可以减少约90笔日记账,占整个记账工作量的90%,减负效果明显。但缩短消费记账,也存在一些问题:一是范围过小。宁波市可以试行缩短消费记账的调查网点共计16个,合计85户,仅占全市调查户的2.9%,减负受益面小。二是影响消费支出推算。试行缩短消费记账的16个调查网点都是市辖区居委会,消费支出总体水平相对较高,如果这些网点不登记消费账,势必造成汇总结果比原方案偏小。三是工作连贯性问题。记帐户记一年细账后,已经熟悉并掌握细账登记方法,再改为粗账,需要重新安排记账培训,记账户也需要一段时间适应转变。
总体来看,现有住户调查数据采集方式仍基本延用原有模式,弊端依然存在。记账周期过长,指标体系复杂,记账内容过于繁琐,都容易引发调查户对记账工作的厌烦情绪,影响记账质量。如何实现数据采集方式的创新,已成为住户调查亟需解决的重要课题。
(二)住户调查数据采集方式改进设想
根据抽样调查原理,结合宁波市实际情况,笔者认为有必要对住户调查数据采集方式进行改进,减轻调查户记账负担,提高源头数据质量。
具体改进设想是:将记账户分为不同类型,分别采用不同的数据采集方式,即“分类记账法”。住户调查网点和宅(户)抽选完成后,根据调查户收入高低和劳动力人数等相关指标的变异程度(即方差),将所有样本户分为三类。第一类是常规样本户,采用日记账调查,按原调查方法登记日记账,调查户家庭常住成员自己记录本户所发生的全部现金收支账和实物收支账。第二类是简账样本户,采用日记账调查,按原调查方法登记日记账,但购买食品和烟酒支出指标简化,只需分为谷物、蔬菜、肉、水产品、烟、酒等十六类入账。第三类是台账样本户,采用回忆调查,由调查员采用上门访问或电话(网络)调查方式代为登记现金收支台账,其中消费支出指标精简,按吃、穿、住、用、交通、文教、医疗、其他等八大类指标入账。各类样本户的季末和年末一次性调查表数据采集方式维持不变,仍由调查员对被调查户进行一次性访问调查取得。
从消费支出数据结果分析角度看,单独汇总第一类样本户数据,可以推算至食品烟酒消费三级细项指标,分析人均蛋白质、油脂、热量等摄入量等。第一、二类样本户调查结果合并汇总后,可以推算至购买食品烟酒消费十六大类指标。第一、二、三类样本户调查结果合并汇总后,可以推算消费支出和八大类分项支出指标。
四、结论
通过对现行一体化住户调查方法制度的深入分析研究以及宁波市住户收支数据的实证分析,得出以下结论:
(一)全面、准确的抽样框资料是确保抽样调查数据质量的基础。因此,应在抽样工作开始前对抽样框资料做全面、细致的分析甄别;并且在抽户完成后,要做好抽选样本代表性评估分析,对于发现的问题要及时查找原因并寻找纠偏方法,以切实提高样本代表性。
(二)在现有县级样本量不足、代表性较差的前提下,发布以县级为总体的收支数据时需慎重处理。要根据实际情况分批、分步发布县级数据:各县(市)区独立发布一体化全体居民收支数据;样本量较大(大于300户)的县(市)区独立发布一体化分城乡收支数据;样本量较小(小于300户)的县(市)区暂不独立发布一体化分城乡收支数据,5个区(除鄞州区外)合并发布市区一体化分城乡收支数据。
(三)据测算,现有宁波市级样本规模可以较为准确地推算全体居民和分城乡居民的消费支出总体。从八大类分项支出看,农村居民口径达到抽样设计精度要求,全体居民和城镇居民两个口径尚不能完全满足调查精度需要。因此,有必要改进数据采集方法,减轻食品烟酒类记账,即实行“分类记账法”,在现有工作条件下有效确保源头数据质量。
(责任编辑:王家宁)