社会质量测量指标的信度与效度分析*
——以社会经济保障维度为例
2014-06-22孙秀林梁海祥
孙秀林 梁海祥
社会质量的概念与测量
为了更加全面衡量社会发展状况,20世纪90年代中期以后,欧洲学者开始使用社会质量(Social Quality)的概念,重新审视人类社会的发展。与传统依赖经济标准测量生活质量的理论与方法不同,社会质量是以“社会”为导向,强调人们在团体、社区和社会中的相互依存关系,强调社会关系的质量提升与个人发展的关系相协调,通过消解社会发展与个体发展的矛盾,达到改善社会状况、提升个人的福利和潜力的目的。①
从概念上来说,社会质量是一个关于人们日常社会生活质量的综合性概念与理论,是指民众在提升他们的福祉和个人潜能的条件下,能够参与社区的社会、经济与文化生活的程度。社会质量概念的提出,为社会发展提供了一种新视角,这一概念强调通过重新审视社会政策的基础和目标,重视“社会”内涵,强调经济发展和社会发展之间的平衡,为社会模式的可能内涵及发展提供一种新的指导,为政策制定者和普通民众提供一个理解社会变化的分析工具和评估国家政策有效性的标准。②
具体而言,社会质量的理论概念包含四个维度:(1)社会经济保障(socio-economic security),指个人获取物质资源和环境资源的可能性,反映了公民获取必要的、促成其互动的物质资源和非物质资源等基本需求保障的机会和途径,如收入保障、教育、健康照顾、社会服务、环境、公共卫生、个人安全等;(2)社会凝聚(social cohesion),指社会整合和社会团结,关注基于共享的价值和规范的社会关系,考察社区层面的、集体认可的价值基础和规范,以及一个社会的社会关系在何种程度上能保有整体性和维系基本价值规范;(3)社会融入(social inclusion),主要指公民身份和权利,考察社会的结构和制度性因素,反映这些制度和结构框架对公民而言是否具有可及性,人们在何种程度上可以获得来自制度和社会关系的支持;(4)社会赋权(social empowerment),指个人全面参与社会互动的能力,聚焦于个体的潜能(知识、技能、经验等)及其可以实现的程度,关注社会关系能在何种程度上提高个人的行动能力。③
社会质量是作为一种标准被提出的,用以衡量公民的日常生活质量达到社会可以接受的水平。这样,社会质量研究实际上就成为社会发展具体状况的度量尺度和测量工具,社会质量在实证层面可以通过大规模的调查来收集资料并进行统计分析,不但可以进行不同时段的比较,也可以同时进行不同区域的跨区域比较。所以近年来,不仅仅是欧洲学者对这一概念非常关注,包括日本、韩国、菲律宾、中国台湾、中国香港等东亚国家和地区也开始使用这一概念进行了大量的研究,并试图开展一种基于亚洲社会事实的社会质量研究。④
社会质量由一系列内在关联的指标构成完整的体系,在社会质量的四个基本维度中,每个维度下又有一系列次级维度,每个次级维度又可以操作化为一系列测量指标。在欧盟的社会质量指标体系中,共包含了95个指标,现在亚洲各个国家和地区进行的社会质量调查,基本上是遵循欧洲学者提出的社会质量理论框架与测量指标的。但是,由于欧洲与亚洲在文化与发展路径方面的差异,对于西方的测量指标在东亚地区的适用性,需要进行严格的反思与检验。⑤
在过去的几年中,韩国、日本、中国台湾等国家和地区已经进行了社会质量的调查以及调查指标在本土地区适用性的讨论。遗憾的是,在中国,因为社会质量的研究刚刚起步,对于测量指标的适用性缺乏必要的讨论。本文使用2010年上海大学上海社会调查中心在上海地区进行的社会质量调查数据,首先从社会质量的第一个测量维度——社会经济保障来对社会质量测量指标在中国的信度与效度做一个实证检验。
本文的结构安排:首先简单介绍本文使用的数据,然后进行一个因子分析,最后分别进行信度检验和效度检验。
社会经济保障的因子分析
2010年6~8月,上海大学上海社会调查中心进行了上海地区的“世博与上海社会质量调查”。根据概率与规模成比例抽样(PPS)的方法,在上海抽取12个区作为初级抽样单元,在每个抽选出的初级抽样单元(区/县)中抽出4个村委会/居委会作为二级抽样单元,在每个抽选出的二级单元(村委会/居委会)中抽出28个家庭作为最终抽样单元。最终的被访者为个人,由调查员在进入家庭之后按照生日法(即在家庭成员中抽取生日距离7月1日最近的作为被访者)现场确定。最终完成1128份有效问卷。
从调查样本情况来看,男性占49%,女性占51%;被访者的平均年龄为44岁;已婚者占74.7%;71.7%的被访者有孩子;79.7%的被访者为上海户籍;从就业情况来看,62.7%的被访者全职就业,24.7%的被访者是离退休状态;个人年平均收入为37376.5元;家庭年平均收入为80252.8元。
从欧盟与东亚各国(地区)的经验来看,对于社会经济保障的测量,一般从金融资源、住房与环境、健康与照顾、工作、教育等几个方面展开,其中每个次级维度又可以细分为多个更具体的维度与测量指标。金融资源包括收入充足性、收入保障;住房与环境包括住房保障、住房条件、居住环境;健康与医疗包括健康供给保障、健康服务、就医满意程度、照顾服务;工作包括就业保障、工作环境;教育包括教育保障、教育质量。二级指标下面又细分为三级指标、四级指标。
同时,因为社会质量的测量指标有两种类型:一种是问卷测量指标,另一种是二手资料测量指标,本文仅集中于第一种问卷测量指标的分析。因为工作与教育两个方面的指标更多应该从汇总数据或者二手文献数据产生,所以,在本文的分析中,没有纳入这两个社会经济保障的次级测量维度。
在此次调查中,对于上海市居民的社会经济保障方面的测量,从金融保障、住房与环境、医疗、社会保障等几个方面,设计了四十多道题目,这些题目包含了多个具体的量表与分散的题目。
首先进行一个因子分析,考察我们调查题目所产生的因子与前面的理论框架是否一致。因子分析采用最大似然法进行估计,从因子分析的结果可以看出,有6个因子的特征值大于1,因此我们提取6个因子。这6个因子共解释了92.24%的差异,说明这6个因子对于四十多道题目的代表性是非常强的。
在对因子负荷矩阵进行正交旋转之后,可以发现:因子1主要包括“就诊困难度:到诊所的距离”、“就诊困难度:预约”、“就诊困难度:等候”、“就诊满意度:医生态度”、“就诊满意度:医生水平”、“就诊满意度:医生医德”、“就诊满意度:医院环境”、“就诊满意度:医院设备”、“就诊满意度:就医秩序”等变量,与我们理论框架设计的“健康与医疗”的维度吻合,命名为“医疗因子”。
因子2主要包括“医疗保险”、“养老保险”、“失业保险”、“工伤保险”、“生育保险”、“住房公积金”等变量,与我们理论框架设计中的“社会保障”的维度吻合,命名为“社会保障因子”。
因子3主要包括“家庭收支平衡情况”、“教育费用”、“照顾费用”、“日常开销”、“医疗费用”、“住房费用”、“人情费用”、“旅游费用”、“图书费用”、“总支出”等变量,与理论框架设计中的“金融资源”的维度吻合,命名为“金融资源因子”。
而理论框架设计中的“居住与环境”维度,则出现了3个因子,进一步分析这3个因子,可以发现分别代表“住房稳定性因子”、“住房条件因子”、“居住环境因子”三个不同方面的情况。住房稳定性因子主要代表“现住房:是否自有住房”、“现住房:是否租房”、“现住房:搬离的可能性”等变量。住房条件因子主要包括“住房问题:缺乏室内冲水洗手间”、“住房问题:缺乏浴缸或淋浴间”、“住房问题:居住空间太小”、“住房问题:三代人以上挤在一起”、“住房问题:产权不明晰”、“住房问题:建筑质量”等变量。居住环境因子主要包括“居住小区:噪音”、“居住小区:空气污染”、“居住小区:休闲地点或公园”、“居住小区:水质污染”、“居住小区:犯罪/暴力行为/破坏公物”、“居住小区:街道垃圾处理情况”等变量。
这一结果说明,我们调查中所使用的调查题目与社会经济保障的理论框架在逻辑上是非常吻合的。唯一与理论框架略有差异的是在家庭负担中关于“住房费用”的题目,这一题目最大的因子负载没有在“金融保障因子”上面,而更多地体现在“住房稳定性因子”方面,因此在后面的分析中,将这一题目移至“住房稳定性”维度中。同时,因为“住房与环境”这一理论维度表现出非常强烈的内部异质性,我们在后文的分析中将之拆分为3个不同的维度:“住房稳定性”、“住房条件”、“居住环境”。
信度与效度分析
信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。检视信度的方法有很多种,包括:(1)再测法(Retest Method),对同一群受测者,在不同的时间,前后测试两次,求出两次测量的相关系数,即稳定系数(Coefficient of Stability);(2)复本相关法(Equivalent-Forms Method),对同一群受测者,使用2份内容类似的测量,得到的相关系数为复本系数(Coefficient of Forms)或等值系数(Coefficient of Equivalence);(3)折半法(Split Half Method),将同一量表中测验题目(项目内容相似),折成两半(单数题、偶数题),求这两个各半测验的相关系数得到折半信度系数(split-half coefficient);(4)Cronbach α系数,是目前社会科学研究最常用的信度分析方法:
使用Cronbach α系数对本次调查中社会经济保障的各个维度进行分析,可以发现,金融资源的Cronbach α系数为0.7347,住房稳定性的Cronbach α系数为0.7156,住房条件的Cronbach α系数为0.6845,居住环境的Cronbach α系数为0.8004,医疗的Cronbach α系数为0.8267,社会保障的Cronbach α系数为0.844。除去住房条件的Cronbach α系数在0.7以下之外,其他各项的Cronbach α系数都在0.7甚至0.8以上,这说明各个维度上的指标不但具有逻辑上的一致性,而且测量也是非常稳定的。
从整个测量量表来看,社会经济保障测量的Cronbach α系数为0.8155。这一数值的含义是:个体在这一量表的测定得分与询问所有可能项目的测定得分的相关系数的平方,即这一量表能获得真分数的能力。社会经济保障测量的Cronbach α系数为0.8155,意味着对于“社会经济保障”这一概念而言,我们的问卷测量题目涉及了81.2%的内容,仅有不到20%的内容未曾涉及,这一数字是非常高的。
效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度,即所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。效度分为三种类型:内容效度、准则效度和建构效度。⑦
因为内容效度(Face Validity)主要依据调查设计人员的主观判断,判断测量所选择的项目是否“看起来”符合测量的目的和要求,本文对这一效度分析不进行展开。
建构效度(Construct Validity)是指测量结果体现出来的某种结构与测值之间的对应程度。建构效度分析所采用的方法是因子分析,通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。⑧前面进行的因子分析可以视为建构效度的一种分析,通过因子分析的累积解释度反映出我们提取的6个公因子对于问卷的累积有效程度是非常高的,而且,提取的6个公因子分别与理论框架中的某一群特定变量高度关联,这些公因子即代表了量表的基本结构,而这样的问卷结构与社会经济保障的理论框架是非常一致的。这说明我们这次调查的建构效度是非常高的。
准则效度(Criterion Validity)是指测量所得到的数据和一个指定的准则变量相比是否有意义。准则效度分析是根据已经得到确定的某种理论,选择一种指标作为准则(效标),分析问卷测量题项与准则的联系,若二者之间存在显著的关联,则认为测量有效。在实际操作中,对于准则效度的研究,最难的是选择这样一个“准则”。本文选取被访者对于自己生活满意度的回答作为“准则”,看我们问卷调查中社会经济保障的各个测量维度对于居民的生活满意度是否具有显著的解释力。
表1 对于个人满意度的OLS回归结果
注:括号内为标准误;***p<0.01,**p<0.05,*p<0.1。
在对于个人满意度的回归分析中,为检验结果的稳健性,方程(1)只加入社会经济保障的6个分析维度变量;方程(2)加入控制变量(具体结果未显示),包括性别、年龄(及平方)、婚姻状况、是否有孩子、户籍状况、教育水平、个人收入(及平方)、单位性质、就业状况,以及家庭变量包括家庭人口、家庭收入(及平方);方程(3)加入区县的虚拟变量(具体结果未显示)。
从回归结果来看,在所有3个方程中,不管是否加入其他变量,测量社会经济保障的6个维度,包括金融资源因子、住房稳定性因子、住房条件因子、居住环境因子、医疗因子、社会保障因子,都是非常显著的,说明社会经济保障的这几个维度对于解释个人满意度是非常有作用的。
既然社会经济保障的6个维度,包括金融资源因子、住房稳定性因子、住房条件因子、居住环境因子、医疗因子、社会保障因子,对于居民的生活满意度具有显著的解释力,说明我们的社会经济保障的测量是效度很高的。
小 结
社会质量的概念提出之后,引起了世界各国学者的重视,中国学者也开始使用这一概念进行一种基于本土化的社会质量研究。但是,对于西方测量指标在中国的适用性,需要进行严格的反思与检验。本文使用在上海地区进行的社会质量调查数据,对于社会质量的第一个测量维度:社会经济保障,进行了实证的信度与效度分析。
因子分析的结果表明,社会经济保障这一概念可以分为“金融资源”、“住房稳定性”、“住房条件”、 “居住环境”、“医疗”、“社会保障”等六个次级维度,与社会经济保障的理论框架在逻辑上是非常吻合的。从信度分析的结果来看,各个维度上的指标不但具有逻辑上的一致性,而且测量也是非常稳定的。从准则效度的结果来看,社会经济保障的六个维度,对于居民的生活满意度具有显著的解释力,说明社会经济保障的测量具有很高的效度。
虽然本文仅仅对社会质量的第一个维度做了信度和效度检验,但实证分析的结果非常支持这一指标体系在中国情境下的测量。然而,我们需要看到的是,社会质量的“社会经济保障”这一维度的测量指标,多数是非常客观的经济指标构成,而其余三个维度,如“社会凝聚”、“社会融入”、“社会赋权”的测量指标,则由很多主观方面的题目组成,如个人的主观感受、主观评价等,在这种情况下,这三个指标也应该进行相应的信度与效度检验,以验证这一指标体系在中国地区的完整的适用性。
从学术研究的角度来看,通过比较社会质量指标体系的不同测量指标在不同国家、不同地区之间适用性的差异,本身就是一个非常有意思的研究题目。从这种比较中,我们不仅可以发现不同国家、不同地区在社会质量发展水平上的差异,更可以发现不同制度、不同文化背景下社会质量实质内涵组成的差异。揭示这种差异,对于未来中国的和谐社会建设以及社会发展,都可能具有某些启发作用。[本文受到上海市教育委员会科研创新项目“上海市新白领移民的社会支持网络与社会信心研究”(项目号:12ZS097)、上海市浦江人才计划“上海市新白领移民的社会支持网络与社会信心研究”资助]
①沃尔夫冈·贝克等:《社会质量的理论化:概念的有效性》,载张海东主编《社会质量研究:理论、方法与经验》,社会科学文献出版社2011年版,第1~40页。
②艾伦·沃克:《社会质量取向:连接亚洲与欧洲的桥梁》,《江海学刊》2010年第4期。
③张海东:《从发展道路到社会质量:社会发展研究的范式转换》,《江海学刊》2010年第3期。
④王卓祺、冯希莹:《治理视角下的社会质量与社会和谐的比较分析》,《江海学刊》2010年第3期。
⑤Wang, Lih-Rong, “The social quality indicator in Asia: What is unique?”DevelopmentandSociety,2007,2, pp.297~337.
⑥Cronbach, L.J., “Coefficient alpha and the internal structure of tests”,Psychometrika, 1951,16, pp.297~334.
⑦袁方:《社会研究方法教程》,北京大学出版社1997年版,第187~198页。
⑧吴明隆:《问卷调查统计分析实务》,重庆大学出版社2010年版,第157~265页。