家庭收入测量方法的比较与借鉴
2012-09-26许庆红
许庆红
0 引言
收入是社会科学领域探讨社会现象间关系的重要变量,也是制定和评估社会政策的重要指标,在社会科学调查中总是不可或缺的调查内容。然而对收入,特别是家庭收入的测量总是面临两大挑战。一是家庭收入包括所有家户成员在一定时期内(通常为1年)的全部收入,因此需要调查者详细询问各项收入的来源及准确金额。二是受访者可能不愿意透露自己的真实收入,询问过多有关收入的问题可能会让受访者感觉被侵犯。因此,由于收入的敏感性使得许多调查在收入问题部分都产生了较大比例的项目无应答。一般而言,调查中有大约10~15%的收入数据是由于受访者的拒绝回答或记不清楚而无法获得。因此,如何更准确地测量收入,一直是研究者普遍重视、力求不断改进的问题。
目前国际大型社会科学调查项目对家庭收入的测量主要采取两种方法。一种是综合收入调查法,或称单一问题调查法,即将一定时期内(如年、月)的家庭总收入作为调查内容,以获得一个整体性的家庭总收入数据。包括欧盟民意调查、欧洲社会调查、类似于美国综合社会调查的国际社会调查项目ISSP和英国社会态度调查等。另一种是累计收入调查法,即详细调查家庭及其成员的各项收入来源,通过累加计算出总收入。这主要体现在那些将家庭收入作为重要变量进行数据搜集的全国性家户追踪调查项目中,包括美国收支动态长期追踪调查,英国家户追踪调查和德国社会经济追踪调查等。尽管以往研究者讨论了两种收入调查方法的优缺之处,并倾向于认为累计收入调查法比综合收入调查法更能区分和帮助受访者回忆每项收入的来源和金额,因此其对家庭收入的测量更为准确。但已有研究却很少关注不同社会调查之间,所采用的累计收入调查法自身的差异性,也没有论及由数据搜集方式所产生的问题。而对于全国性家户追踪调查而言,定期追踪家庭收入的变化是其十分重要的内容。那么,进一步的问题是:在那些采纳了累计收入调查法的家户追踪调查中,它们是如何测量家庭收入的?随着调查的开展,家庭收入的测量又是如何不断改进的?
因此,笔者选取了三个有代表性的全国性家户追踪调查项目,即美国收支动态长期追踪调查(The Panel Study of Income Dynamics,以下简称PSID),英国家户追踪调查(British Household Panel Study,以下简称BHPS)和德国社会经济追踪调查(German Socio Economic Panel,以下简称SOEP)自调查开展以来的调查问卷为文本,从数据搜集方式、问题分类、措辞三个层次对该文本进行比较分析,以揭示家庭收入测量中的关键问题,及其对中国家庭收入测量的启发意义。
1 案例介绍:PSID、SOEP与BHPS
表1 PSID、SOEP和BHPS调查进展
在比较研究之前,我们首先对从上世纪60年代末展开调查的PSID,80年代中期开展的SOEP和90年代初期开展的BHPS进行简要介绍。主要从调查起始年、执行机构、调查年份、样本量、调查对象、访问方式、辅助调查工具几大方面进行大致勾勒(见表1)。
迄今为止,PSID已完成了36波调查,BHPS和SOEP分别完成了19波和26波调查,每波调查都问及数百个问题,积累起丰富的、具代表性的全国性多代生命历程数据。
2 数据搜集方式比较
PSID是世界上最早的家户追踪调查,它创立的初衷是了解美国家庭与个人的经济福祉,试图以个人的社会经济条件与心理特质来解释贫穷的现象,并评估‘对贫穷作战’政策的效果”。因此“收入”是PSID最核心的调查内容之一,它通过访问户主来了解上一年的家庭收入状况。进入20世纪80、90年代,SOEP和BHPS进一步扩大了调查对象,对PSID的收入测量方式也进行了大幅的变革。三者的收入数据搜集方式比较如见表2。
表2 PSID、SOEP和BHPS数据搜集方式比较
PSID首创了访员访问户主来搜集户主、配偶、子女等其他家庭成员以及家庭特殊收入的数据搜集模式。后来,SOEP对收入的测量进行了变革,一方面是直接访问16岁以上所有家户成员,以获得更准确的收入数据;另一方面是采用访员访问和自填相结合的方式,即在访问之前由受访者自行选择任意一种方式进行数据搜集。进入20世纪90年代,BHPS对收入的测做了进一步的变革,一方面针对16岁以上成人,通过访员访问与出示卡片相结合的方式来搜集数据;另一方面还增加访问10~15岁的子女,即通过“青少年问卷”采用“听录音自填”(后改为“自填”)方式搜集收入数据。
尽管从初访开始,三项调查就一直延续着各自的数据搜集方式。但由表2可见,相比BHPS和SOEP直接针对受访者本人访问而言,PSID的主要缺陷是“由访员访问,且仅访问户主1人”,户主需要回忆配偶和其他家户成员的过去一年或两年的收入状况,对他人收入的估计和汇报可能会增加测量误差。而BHPS增加出示卡片辅助手段,SOEP则采用访员访问或自填相结合,有利于减少收入这一敏感性问题的测量误差,从而获得较高质量的数据信息。
3 问题分类比较
问题分类在很大程度上决定了信息搜集的维度及详尽程度,因此对数据搜集质量有着重要影响。通常,逻辑清楚、类别完备的问题分类更容易让受访者回忆相应的内容。尽管PSID、SOEP和BHPS的家庭收入都分为“个人收入”和“家庭收入”两大部分,但通过比较其具体的问题分类,发现三者之间存在显著的区别(见图1)。
图1 PSID、SOEP和BHPS“个人收入”问题分类比较
对PSID而言,其“个人收入”是通过访问户主来获得所有家户成员去年的收入信息。相比而言,PSID以搜集户主和配偶的收入信息为主,其他家户成员的信息较为简略。其次,PSID的“个人收入”主要包括四大来源,即去年农民或农场主收入、自雇收入、受雇收入及补贴收入。对于农民或农场主和自雇者都询问了去年的总收入和纯收入;对于受雇者,则询问了工资、奖金/工作补贴、专业交易收入和其它农产品收入;而补贴收入包括临时补贴SSI收入、社会保障收入、退伍军人补贴、养老金、失业保险、劳动者补贴、子女抚养费/赡养费/分居费和亲戚朋友经济支持等。
对SOEP而言,其“个人收入”是通过访问家户中16岁以上家庭成员来获得上个公历年的收入信息。SOEP的收入来源主要包括受雇者上月收入、目前补贴收入、上个公历年收入。对于受雇者上月收入,询问了税前/扣款前收入、税后/扣款后收入、奖金/工作补贴和第二职业收入;对于目前补贴收入,询问了各种补贴类型以及平均月补贴收入;对于上个公历年收入的调查更为详细,包括受雇者的工资和奖金/工作补贴收入、自雇者收入、第二职业收入、各类补贴收入以及退休金的获得的具体类型。
对BHPS而言,其“个人收入”不仅调查了16岁以上家庭成员,还包括10~15岁青少年的收入状况,主要分为自雇收入、受雇收入及青少年工作收入。对于自雇者,BHPS询问了上次收入及时长,并按报税情况分别询问具体收入金额;对于受雇者,则询问了上次税前工资收入及时长、税后工资收入及时长,工资和往常相比是否一致,以及各项奖金/加班补贴;对于10~15岁青少年,则询问上周从事有偿工作所获得的收入。由于BHPS主要从个体视角来测量各家户成员的收入,因此在调查中,BHPS常常需要确认各项收入是个人收入还是和其他人的共同收入,以便能得到准确的整体家庭收入信息。
总之,三项调查从调查初始一直保持自己明确的问题分类,并随着调查的延续而逐渐分类细项,同时对于各类补贴内容还增加询问获得月份。但三者在“个人收入”的问题分类上也存在明显差异。相比而言,PSID的特点是对调查对象的分类比较完备,不仅包括工作群体,还包括农民和农场主群体、经营公司或公司股东群体的收入;不仅包括16岁及以上成人,也包括15岁以下的家户成员收入。SOEP的特点是对“个人收入”的测量维度更多,不仅测量了上个公历年个人收入,还增加了受雇者上月个人平均月收入和目前个人平均月收入两个维度。BHPS的特点是考虑到各种收入来源的计时周期差异,采用询问上次收入及时长的方式进行调查,同时还直接询问了10~15岁青少年的上周收入。
图2 PSID、SOEP和BHPS“家庭收入”问题分类比较
对于“家庭收入”,三项调查都是通过访问户主搜集信息。但三者的问题分类仍然各有侧重。
首先,PSID的“家庭收入”包括去年家庭储蓄与投资收入和家庭特殊收入两项。对于家庭储蓄与投资收入,主要包括房租/租赁收入、股息收入、利息收入、基金/版税收入;而家庭特殊收入则包括保险索赔收入、遗产收入、慈善开支的减税金额和医疗开支的扣减金额。
其次,SOEP的“家庭收入”包括上个公历年家庭补贴收入、目前家庭补贴收入、上个公历年家庭储蓄与投资收入、上个公历年家庭特殊收入和目前家庭平均每月纯收入五项。五项之中的上个公历年家庭储蓄与投资收入和家庭特殊收入与PSID有所不同,家庭储蓄与投资收入主要包括租房/借房收入、储蓄收入、保险/证券收入和农业/公司经营收入;而家庭特殊收入仅包括遗产收入和馈赠/博彩收入。
另外,BHPS的“家庭收入”包括去年家庭补贴收入、去年家庭储蓄与投资收入和去年家庭特殊收入三项。对于去年家庭补贴收入,BHPS不仅详细询问各项收入月份和金额,还再次核对了国家退休金、残疾补贴、子女补贴及住房补贴收入状况。对于去年家庭储蓄与投资收入没有分项,仅询问金额;对于去年家庭特殊收入,则包括保险索赔收入、退休金收入、来自雇主的奖金收入、遗产收入、博彩收入及其它。
相比而言,PSID的“家庭收入”仅有去年家庭储蓄与投资收入和家庭特殊收入两项测量维度,问题分类也较为简单。BHPS有三个测量维度,比PSID增加了去年家庭补助收入;而SOEP的测量维度最多,还包括对目前家庭补贴收入和目前家庭平均每月纯收入的测量。
4 措辞比较
问卷设计中的措辞,是将已确定的内容转化为标准提问,让调查者理解并做出回答的问题。表面看来,这一阶段不过是确定词汇和语气,然而其影响却至关重要。措辞不当往往会使被调查者误解题意或拒绝回答,引起测量误差,从而直接影响数据质量,事后弥补亦非常困难,且成本太高。通过比较PSID、BHPS和SOEP三项调查的措辞风格,可以看出各调查如何不断改善措辞,以提高应答率,减少问卷调查测量误差(见表3)。
表3 PSID、SOEP和BHPS收入问题措辞比较
归纳而言,PSID和BHPS,SOEP三者都有导语解释,并对收入进行了具体的时间标定,并逐一询问收入金额,及获得月份。此外仅有BHPS采用了卡片作为辅助工具。但三者的措辞风格也各具特点。PSID的特点是问题简短直接,对可能引起混淆的收入来源进行深入追问;同时通过收入来源信息与其它工作史相对应,以确保收入信息的可靠性和完整性。SOEP强调对总收入和纯收入,扣税/扣款前和扣税/扣款后等收入概念进行区分,以更准确地获得收入数据;同时对于重要收入来源(如投资性收入),如受访者无法回答具体金额,则追问大概数字。而BHPS则采用灵活的追问策略,设置“无、”“不知道”和“拒绝回答”选项,以明确受访者的回答状态;同时回答“不知道”时,追问金额区间,以获得较为完备收入信息。
5 结论和讨论
转型时期中国居民的收入来源一直处于复杂多变的状态,这导致了中国家庭收入调查的难度所在。
随着市场化、城镇化进程的不断推进,工业、农业、户籍制度、土地制度各方面体制改革的不断深入,总体上城市和农村家庭居民收入呈现波浪式的增长,但家庭收入结构则处于调整和变化之中。对城市居民而言,市场经济的繁荣增加了城市居民的收入来源,工资性收入在居民总收入中的比重下降,各种经营性收入、财产性收入和转移性收入所占的比重上升。对农村居民而言,一方面,随着农村经济的繁荣,部分地区的农村家庭从事第一产业、第二产业、第三产业的经营性收入可能增加;另一方面,中国城市化进程使大量农村劳动力向城市流动,农村人口流动率的地区,生产经营活动的收入比重可能下降,而其他如外出务工所得工资性收入比重上升。而随着国家在农村逐步推行各项政策补贴,使得某些地区的转移性收入也可能上升。总体而言,中国家庭的收入来源不断增加、收入结构日趋复杂,地域性差异十分显著。这给家庭收入调查造成了一定程度的困难,主要表现在以下几个方面:
(1)家庭成员人员地域流动性较大,追踪调查难度增大;
(2)收入来源不断增加,隐性收入难以测量;
(3)居民隐私保护意识增强,收入问题的拒访率增高。
本文通过比较PSID、SOEP和BHPS在数据搜集方式、问题分类和措辞三个方面采取的不同收入测量方式,来探讨如何通过改进调查方法来减少收入调查过程中的非抽样误差,提高应答率和获得较高的数据质量,对中国家庭收入调查具有一定的借鉴意义。
在数据搜集方式方面,应采用多样化的数据搜集方式,以获得更具可靠性的收入信息。其一,尽量访问所有家户成员,包括16岁以上的成人以及16岁以下的青少年;其二,应考虑受访者无法直接接受访问的情况,采用电话调查、代答人调查和入户调查相结合的混合模式展开调查;其三,为降低收入调查的敏感性,如果采用自填式问卷,需要保持简明、友好的界面。
在问题分类方面,与个人收入和家庭收入的基本结构相联系,注重问题设计的逻辑性与严密性。其一,尽量将“个人收入”和“家庭收入”设置为独立模块,所有涉及“个人收入”或“家庭收入”的问题应完全集中在相应模块之中;其二,除了分项统计“个人收入”和“家庭收入”,还要增加一定时期内的“家庭总收入”和“个人总收入”,以便两个维度能相互对应检验。其三,增加“其它收入”选项,以便补充可能存在的特殊收入项目。
在措辞方面,应把握语义清晰和用词适当的原则。其一,从受访者的思维反应过程来设计便于受访者回忆的时间跨度;其二,使用引导词和导语对问题的时间或内容跨度进行准确界定,鼓励受访者回答收入问题;其三,在无法获得的情况下需要采用灵活的追问策略,比如减弱受访者对问题的敏感度,改为访问金额区间。其四,对于仍然无法获得收入金额的情况下,在选项中增加“不知道”、“拒绝回答”等选项,以确定受访者的拒访原因,以便后期对居民收入调查结果进行评估校正。
[1]Duncan,G.J.,Hill,D.H.Assessing the Quality of Household Panel Data:The Case of the Panel Study of Income Dynamics[J].Journal of Business&Economic Statistics,1989,7(4).
[2]Essig,L.,Winter,J.K.Item Non-Response to Financial Questions in Household Surveys:An Experimental Study of Interviewer and Mode Effects[J].Fiscal Studies,2009,30(3~4).
[3]Gouskova,E.,Schoeni,R.F.Comparing Estimates of Family Income in the Panel Study of Income Dynamics and the March Current Popula⁃tion Survey,1968~2005[C].Working Paper,2007.
[4]Jörg-Peter,Schrapler.Explaining Income Nonresponse-A Case Study by Means of the British Household Panel Study(BHPS)[J].Quality&Quantity,2006,(40).
[5]Kai-yuen Tsui.Measurement of Income Mobility:A Re-Examination[J].Soc.Choice Welf,2009,(33).
[6]Michael Davern,Holly Rodin,Timothy J.Beebe,Kathleen Thiede Call.The Effect of Income Question Design in Health Surveyson Family In⁃come,Poverty and Eligibility Estimates[J].Health Services Research,2005,40(5).
[7]Micklewright,J.,S.V.Schnepf.How Reliable are Income Data Collect⁃ed with a Single Question[J].Journal of the Royal Statistical Society Se⁃riesa-Statisticsin Society,2010,(173).
[8]Moeller,J.,Mathiowetz,N.Problems of Screening for Poverty Status[J].Journal of Official Statistics,1994,10(3).
[9]Moore,J.,L.S.Loomis.Reducing Income Nonresponse in a Top⁃ic-Based Interview[J].Paper Prepared for the 2001 AAPOR Meetings,2001.(5).
[10]Moore,J.,L.L.Stinson,E.J.Welniak Jr.Income Measurement Error in Surveys[J].Journal of Official Statistics,2000,16(4).
[11]Riphahn,R.T.,O.Serfling.Item Non-response on Income and Wealth Questions[J].Empirical Economics,2005,30(2).
[12]Schrapler,J.P.Respondent Behavior in Panel Studies-A Case study for Income Nonresponse by Means of the German Socio-Eco⁃nomic Panel(SOEP)[J].Sociological Methods&Research,2004,33(1).
[13]Schrapler,J.P.Explaining Income Nonresponse-a Case Study by Means of the British Household Panel Study(BHPS)[J].Quality&Quantity,2006,40(6).