对应用PPS抽样方法开展城镇居民问卷调查效果的评估
2018-01-03赵杉
赵杉
摘 要:人民银行城镇居民问卷调查采用PPS抽样方法抽选调查城市和调查银行网点,在选定的银行网点进行现场调查。本文以山东省内5个地区调查结果为研究对象,比较调查样本分布与当地居民实际分布,评估调查样本代表性和调查效果。调查结果显示银行网点调查样本以“中青年”、“大专以上”人群居多,能够较好体现活跃人群的年龄、学历结构。银行网点调查对象年人均消费性支出占收入的比例与当地居民实际情况较为接近。银行性质、所处区域、调查时间、行政区划对调查对象的年龄和学历分布、收入和消费情况、对部分热点问题的判断并无明显影响。
关键词:城镇居民调查;PPS抽样法;样本分布
中图分类号:F830 文献标识码:B 文章编号:1674-2265(2018)10-0046-05
DOI:10.19647/j.cnki.37-1462/f.2018.10.006
一、引言
中国人民银行城镇居民问卷调查自开展以来,为及时了解我国居民的投资、储蓄和消费意向,有效制定货币政策提供了重要的参考依据。该项调查以在商业银行网点开展现场问卷调查为主要特点,开展调查的选点城市和银行网点主要是通过PPS抽样方法抽取的。近年来,随着金融服务电子化水平的提高,到银行网点办理业务的人员减少,与样本方案设计之初的情况有了较大改变,有必要对调查样本的代表性进行评估。本文以山东省内5个地区调查结果为研究对象,将调查样本在年龄、学历、收入等方面的分布情况与调查地区城镇居民的总体分布情况进行比较,评估调查样本的代表性,并且对调查结果进行结构化的分析,得出相关的结论和建议。
二、调查基本情况与调查方法
(一)调查基本情况
中国人民银行城镇居民调查主要针对城镇居民经济判断和感受、收入情况和支出意愿等情况按季度开展问卷调查。调查抽样方案以PPS抽样方法为核心方法,在全国选取50个城市、每个城市选取8个银行网点开展现场调查。在选取银行网点时,以该城市全部银行网点为抽样框,以银行网点的“日均业务金额”、“期末存款余额”等指标为入样指标,通过PPS概率抽样方法抽选出参与调查的银行网点。选择调查银行网点时综合考虑银行性质(国有银行与股份制银行)、区域特征(商贸区、居民区、机关区和工业区)等影响因素。
本文中选用山东省内开展调查的济宁、德州、曲阜、梁山、威海5个地区的调查结果进行分析研究,5个地区共有40个银行网点参与调查,每个网点按随机抽样的方法调查30余份问卷,共调查回收1260份有效问卷。在威海市除采用银行网点现场调查之外,还采用电话调查方式,两种方式分别完成300份问卷,将两种方式的调查结果进行对比分析。为便于分析调查开展时间对调查样本的影响,部分银行网点在工作日开展调查,部分在周末开展调查。各调查地区开展调查的银行网点基本情况如表1所示。
(二)调查方法
在抽样方法方面,城镇居民调查综合运用了二阶段抽样、分层抽样、PPS抽样、等距抽样等抽样方法,其中最为核心的是PPS抽样方法。在调查结果量化方面,问卷调查的初步结果是得到对某一问题选择“好”、“中”、“差”的比例,城镇居民问卷调查使用扩散指数法将调查结果加工成为一系列指数,实现对居民主观定性判断的量化统计分析。
1. PPS抽样方法。PPS抽样法( Probability Proportionate to Size Sampling)是按規模大小成比例概率抽样的简称,是一种使用辅助信息、使每个单位均有按其规模大小成比例地被抽中概率的抽样方式。当单元之间差异非常大时,使用简单随机抽样抽出样本的估计值误差极大,这时有必要考虑使用不等概随机抽样方法,即赋予各单元一个不同的入样概率,使大样本的入样概率大,小样本的入样概率小,从而提高估计量的估计精度。PPS抽样的实施方法主要有累积总和法、拉希里方法、规模累积等距抽选的方法等。PPS抽样的主要优点是:使用了辅助信息,可以减少抽样误差;同时由于总体中规模较大的部分被抽中的概率也较大,样本的代表性也得以提高。在城镇居民问卷调查中,在调查城市的选择和银行网点的选择两个环节都采用了PPS方法,因此该方法是调查方案设计中的关键和核心。
2. 扩散指数方法。扩散指数(DI)又称扩张率,它是在对各个经济循环波动进行测定的基础上,所得到的扩展变量在一定时点上的加权百分比。它是国际上通行的对景气调查中定性数据的量化描述,用于反映该指标所处的状态,指数以%为单位。经典的扩散指数编制方法是首先获得各问题回答的三种结果,即上升、持平、下降各占总数的比重,然后用上升的比重减去下降的比重,用其差额来反映景气状况的水平和趋势,指数数值在-100%到100%之间。城镇居民问卷调查在调查结果基础上编制了若干个调查指数,涉及居民经济感受、居民物价满意度、就业收入感受、消费支出意愿等方面,在计算经典的扩散指数之后,在指数值上再加100%除以2,转化为在0到100%之间、围绕50%波动的指数数值。一般而言,指数在50%以上,反映该项指标处于向好或扩张状态;低于50%,反映该项指标处于向差或收缩状态;等于50%,表示该指标与上季持平。
三、对调查样本分布情况的分析和评估
(一)样本分布情况评估
结合第六次全国人口普查数据和2017年相关统计数据,从年龄结构、学历分布、收入水平和消费支出等方面对德州、济宁、曲阜、梁山4个地区的调查情况进行分析评估。
1. 银行网点调查对象以中青年居多,年龄分布与当地城镇居民实际分布相关性较高。从调查结果看,调查对象的年龄分布主要集中在“25—54岁”年龄段(见表2)。主要是由于年龄偏小(15岁以下)和年龄偏大(65岁以上)的群体较少使用银行服务,以往认为年龄较大人群对网上银行和手机银行接受程度不高,且空闲时间较多,更多会到银行网点办理业务的观点并没有明显依据,银行网点调查样本的主体是中青年人。
由于地区人口统计数据中包含儿童、中小学生、老年人等使用银行服务不活跃的人群,调查样本在“25—54岁”的比例大幅高于当地实际比例。因此剔除“15岁以下”和“65岁以上”两个群体,针对“15—64岁”年龄段参与调查人群进行分析,计算银行网点调查年龄分布序列和当地实际分布序列的相关系数,结果显示,除曲阜外,其他3个地区两序列的相关系数均可达到0.5以上(见表3),表明网点调查较好地体现了活跃人群的年龄结构分布,在年龄结构的代表性上是比较理想的。
2.银行网点调查“大专及以上”学历人群居多,“大专及以上”学历分布与“25—54岁”年龄段分布相关性较高。从调查结果看,各地区调查对象学历以“大专及以上”居多(见表4),这与调查样本年龄分布高度集中于“25—54岁”中青年人群密切相关。计算4个调查地区“25—54岁”年龄段占比序列和“大专及以上”学历占比序列的相关系数为0.763,表明调查样本“25—54岁”年龄段分布与“大专及以上”学历分布具有较高的相关性。
考虑到 “高中及以下”学历人群中有相当比例是在校学生,经济尚未独立,仅针对“大专及以上”学历人群进行分析。剔除“高中及以下”学历人群后,网点调查分布与当地实际分布在趋势一致性上较之前大为改善(见表5)。再分别计算调整后4个地区网点调查分布与当地实际分布的相关系数(见表6),相关性非常显著,反映网点调查较好地体现了“大专及以上”这部分人群的学历结构分布。
3. 银行网点调查对象年人均消费性支出占收入的比例与当地城镇居民实际情况较为接近。从调查结果看,4个调查地区银行网点调查对象年人均消费性支出占收入的比例均与当地城镇居民的实际情况较为接近,但普遍低于实际水平(见表7)。计算银行网点调查年人均消费性支出占比序列和实际情况的相关系数,可以得到相关系数为0.781,相关性较高。
(二)对调查结果的结构性分析
1. 受访者收入水平与调查结果正相关,收入较高受访者的判断更加积极。参考世界银行对我国居民收入水平的研究结论①,将网点调查的1260位受访者划分为低、中等偏下、中、中等偏上和高5个收入群体。调查显示,一是受访者收入越高,则对物价、经济、就业、收入等的判断越积极。比如,低、中下、中、中上和高收入群体的经济判断指数分别为45.76 %、46.51%、47.35%、47.18% 和51.00%,基本按照收入水平梯次分布。二是高收入群体判断明显好于其他收入水平群体,其他4个群体的判断较为接近。比如,低、中下、中、中上和高收入群体就业感受指数分别为42.40%、35.29%、34.55%、36.17%和47.83%。三是低收入群体的储蓄倾向最低、消费倾向最高,高收入群体则相反。据计算,低收入群体的储蓄倾向为18.34%,高收入群体的储蓄倾向为27.69%。消费倾向则与之相反,低收入群体和高收入群体的消费倾向分别为47.22%和37.31%,分别是5个群体的最高值和最低值。
2. 随着年龄递增,受访者对物价和经济的判断呈U形分布,“24岁以下”和“65岁以上”的判断较乐观。由于本次调查中未调查到15岁以下的受访者,同时,1260户受访者中仅有20位年龄在64岁以上,因此将受访者的年龄分布合并为“24岁以下”、“25—34岁”、“35—44岁”、“45—54岁”和“55岁以上”5个群体。调查显示:一是随着年龄的遞增,调查结果呈先降后升的U形分布,“24岁以下”和“55岁以上”居民对物价、经济等的判断较为乐观,而中间年龄段的居民判断较为悲观。以对本季经济形势的判断为例,5个群体的经济判断指数分别为52.74%、48.37%、43.27%、47.67% 和50.00%,“24岁以下”和“55岁以上”的指数达到50%的临界线及以上,而中间3个年龄段的指数均位于50%以下。对物价、就业、收入的判断也都具有这一特征。二是中间3个年龄段的判断较为接近,两端两个年龄段的判断与中间年龄段及平均水平差异较大。以对就业状况的感受为例,5个群体的就业感受指数分别为42.96%、35.29%、35.26%、35.43%和47.85%,1260位居民指数平均值为36.8%,中间3个群体与平均值差异不大,两端两个群体明显偏离平均水平。三是两端两个群体储蓄倾向较高。年龄最低的群体(24岁以下)和年龄最高的群体(65岁以上)储蓄倾向较高,分别为25.91%和23.63%,高于中间3个年龄段的储蓄倾向。“25—34岁”群体的消费倾向为44.5%,高于其他群体。
3.“初中及以下”和“大学及以上”的受访者对物价和经济的判断较乐观,低学历人群对就业和收入的判断较好。由于本次调查中受访者学历为“小学及以下”、“硕士及以上”的人数较少,因此分别将这两类归并进入临近的类别,从而将受访者的学历合并为“初中及以下”、“高中(含中专)”、“大专”和“大学及以上”4个群体。结果显示,一是随着学历递增,受访者对物价和经济的判断也呈现U形分布,学历较高和较低的群体对物价和经济的判断较为乐观,而中间段学历的居民判断较为悲观。以对本季物价情况的判断为例,4个群体居民的物价满意度分别为24.38%、22.63%、22.26%和25.62%,对经济的判断也有类似情况。二是低学历人群对就业、收入的判断反而好于学历较高的人群。学历为“初中及以下”受访者的就业感受指数和收入情况指数分别为43.12%和48.97%,均明显高于其他学历类别。
4. 三种分类方式中,学历差异对调查结果的影响较小,收入差异对物价和房价满意度的影响最显著。与按收入、按年龄的分类结果相比较,不同学历群体的指数之间差异较小,变动比较平稳(见表8)。按学历高低分类计算的指数序列方差都比较小,尤其是物价满意度、房价满意度、收入情况指数和储蓄倾向等指标,序列方差明显低于按收入和年龄分类的序列,反映这些问题对学历的差异并不敏感。按收入分类的物价满意度方差和房价满意度方差分别达到34.68和37.95,这两项指标对收入差异的反应非常敏感。
(三)电话调查与银行网点调查的比较
通过威海市统计局社情民意调查中心的计算机辅助电话调查系统,利用电脑拨号从130多万户城乡固定电话用户中随机选取调查样本,进行电话访问调查获得300份有效问卷。从调查结果看,电话调查结果反映实际年龄分布和学历分布的效果较好,电话调查结果在经济感受、就业感受、物价判断、房价判断等方面与实际情况也更加吻合。
四、其他因素对调查结果的影响
(一)分银行性质看,国有商业银行调查对象对热点问题相对乐观
从调查结果看,国有商业银行与其他银行调查对象的年龄分布和学历分布趋势一致且分布序列较为相近,“25—54岁”年龄段和“大专及以上”学历段尤为明显。国有商业银行调查对象年人均收入和年人均消费性支出分别为52557.04元和28655.22元,高出其他银行调查对象2706.11元和804.29元。对物价水平、经济状况和就业形势等问题的判断,国有商业银行调查对象相对乐观。
(二)分所处区域看,机关区和商贸区调查对象学历较高,机关区调查对象收入状况较好
从调查结果看,4个区域调查对象的年龄分布趋势高度一致,“25—54岁”年龄段最为集中。商贸区、居民区、机关区和工业区调查对象中“大专及以上”学历居多,分别占比64.72%、49.41%、68.55%、52.86%,反映机关区和商贸区受访者文化程度相对较高。4个区域调查对象年人均收入和年人均消费性支出以机关区最高、居民区最低,但各区域相差不大。4个区域调查对象对部分热点问题的感受判断较为相近,商贸区调查对象总体上相对乐观。
(三)分调查时间看,工作日和周末调查对象在样本分布、调查结果方面均基本一致
从调查结果看,工作日和周末调查对象的年龄分布和学历分布高度一致,各区间段占比的差距较小。工作日和周末调查对象收入消费情况非常接近,消费性支出占收入比重分别为54.53%和55.15%,仅相差0.62个百分点。工作日和周末调查对象對部分热点问题的判断一致性较高。
(四)分行政区划看,市区和县域调查对象在样本分布、调查结果上较为一致
市区调查对象收入和支出相对较高。从调查结果看,市区调查对象和县域调查对象的年龄分布和学历分布较为接近。市区和县域的调查对象年人均收入分别为56217.46元、47513.49元,年人均消费性支出分别为29870.16元、27029.21元。市区和县域调查对象消费性支出占收入比重分别为53.13%、56.89%,县域受访者支出收入比反而较高。两类调查对象对热点问题的判断较为一致。
五、结论
根据山东省内5个地区的城镇居民问卷调查情况,通过比较调查居民样本在年龄、学历、收入方面与调查地区人口统计分布情况,可以看出调查样本能够较好代表当地居民情况。具体而言,银行网点调查样本以“中青年”、“大专以上”人群居多,其中作为使用银行服务活跃人群的“15—64 岁”居民的年龄分布与实际分布相关性较高、“大专及以上”样本学历分布与实际分布高度相关,调查样本能够较好体现活跃人群的年龄、学历结构,因此通过PPS方法开展现场调查的方案能够满足调查需求。根据上述结论,建议仍然采用以PPS抽样的现场调查为主的调查方式,在调查中确保抽样方案和调查制度的有效落实,在此基础上,关注银行网点人群分布情况变化,进一步探索通过电话、微信等开展调查的可行性。
调查样本分类分析结果显示:一是收入水平与调查结果正相关。高收入人群对热点问题的判断更为积极;低收入人群的储蓄倾向最低、消费倾向最高,高收入人群则相反;低收入家庭对价格变动比较敏感、对热点问题的判断相对悲观。二是随年龄和学历的递增,对物价和经济的判断呈现U形分布。年龄、学历较低和较高的群体对物价和经济的判断较为乐观,中间段群体的判断较为悲观;年龄最低和最高的群体以及低学历受访者储蓄倾向较高,“25—34岁”年龄段人群和高学历受访者消费倾向较高。三是学历差异对调查结果的影响较小,收入差异对物价和房价满意度的影响最为显著。
注:
①根据世界银行对中国1981—2005年全民收入状况的研究报告,我国最高收入者为处于全民收入序列中前10%的人群,中等为排名40%—60%的人群,最低为最后10%的人群。
参考文献:
[1]郝北平.变量抽样方法中样本代表性的研究[J].财会通讯(学术),2008,(8).
[2]卢宗辉,何诚颖,陶宏.抽样方法的比较研究[J].数量经济技术经济研究,2005,(4).
[3]于颖.PPS抽样方法在“CFLP—PMI”中的运用[J].社科纵横,2007,(12).
[4]张玉.PPS抽样方法在我国出口贸易预测中的应用[J].经济研究导刊,2011,(2).
[5]孟斌,于慧丽,郑丽敏.抽样方法比较研究—以北京市居民通勤时间调查为例[J].北京联合大学学报(自然科学版),2012,(2).