居住隔离论:理论与方法的比较研究
2016-03-03MichaelWhiteRebeccaWang张月飞
Michael J. White Rebecca Wang 著 朱 格 张月飞 译
(布朗大学 社会学系,美国)
居住隔离论:理论与方法的比较研究
Michael J. WhiteRebecca Wang 著朱格张月飞 译
(布朗大学 社会学系,美国)
[摘要]隔离是指不同类别的社会群体差异分布的程度;居住隔离关注人群在特定地域空间(如城市)中分布的不均衡。本文重点回顾美国居住隔离的研究理论和测量方法。文章首先探讨居住隔离研究中的几个主要理论问题;其次重点介绍几类广为人知的测量指标,包括变异指数、暴露指数、熵指数、空间邻近指数等,分析各自的优势与局限,并简要介绍其他(如地理信息系统,GIS)新方法技术的运用。随后,文章讨论将西方式的隔离测量和分析方法应用于其他社会环境(尤其是中国)的前景和困难。我们认为,中等收入国家的居住隔离研究无需重走过去的路径;相反,转型时期的当代社会及不断涌现的数据或许能为未来相关研究指明方向。
[关键词]隔离;居住隔离;隔离测量;变异指数
隔离是指不同类别的社会群体差异分布的程度。居住隔离关注人群在区域间——通常是城市内——分布的不均衡,其测量与分析在社会科学研究中有着悠久的历史。这篇综述文章主要关注居住隔离,探讨居住隔离分析的理论背景,考察几个关键测量维度,并讨论将西方式的隔离分析方法应用于其他社会的可能性与局限。隔离的界线一般由社会学和人口学特征来划定,这些特征包括但不限于种族类别、语言或出生地,以及生命周期和家庭结构。值得注意的是,隔离亦可以由一些非居住性特征加以概念化和测量,如职业或学校的隔离。
以居住模式来展示的人口分布提供了一个考察社会组织形式的窗口。居住的集中和隔离程度可揭示出社会群体关系的结构,反过来,居住隔离也有助于理解社会互动。隔离可如即时快照般展示出一个或多个可同时产生作用的社会过程,包括市场力量、社会歧视、自我选择、政府干预及它们之间的相互作用等。这些指标目前已经发展得十分成熟,在政策文件乃至新闻媒体中都经常被引用。
一、隔离测量方法的演变与发展
在社会学领域中,居住隔离问题受到普遍关注。整个20世纪,美国和其他国家的城市社会学文献中均强调了居住隔离的重要性。早在20世纪中叶,已有研究尝试建立起一套反映城市居住模式的汇总统计数据,并开展了广泛的人口分布和人口差异测量工作。
(一)隔离测量的历史回顾
就测量隔离的方法论而言,1955年发表的《隔离指数的方法论分析》是一个分水岭①Duncan, O. D., & Duncan, B. (1955). A methodological analysis of segregation indexes. American Sociological Review, 210-217.。这一经典文献考察了六个主要的指标,指出了其数学特性、优势和局限,以及它们与隔离曲线间的关系。隔离曲线类似用于衡量收入不平等的洛伦兹曲线。大概正是归功于这一文献和邓肯的实证研究,变异指数(D指数)成为隔离分析的重要工具。
在20世纪70年代,有研究开始批判D指数并寻求这一指数的替代方法。虽然仍有部分人支持该理论,但变异指数的方法论基础还是遭到了批判。比如,D指数在几个关键统计标准上不合理,“地图效度”也偏弱。所谓“地图效度”,是指在根据人口构成特征绘制出的地图上,人们是否能够获取其中反映出的全部信息。对D指数及其他的测量维度最严厉的批判来自于参照经济学中的福利理论对这些维度进行的系统评价。与此同时,D指数仍然被广泛使用,且仍然具有通俗易懂的特点。
这一时期也产生了一些测量隔离的新方法,有的甚至完全脱离了传统的测量维度。例如,经济学家亨利·泰尔应用信息论对学校隔离的“不确定性”维度的评估*Theil, Henri and Anthony J. Finizza. 1971. "A note on the measurement of racial integration of schools by means of informational concepts." The Journal of Mathematical Sociology 1:187-193.。杰姆斯·科尔曼和他的同事们也创新了衡量学校隔离的指标*James, David R, and Karl E Taeuber. 1985. "Measures of segregation." Sociological Methodology 15:1-32.。其他人口学、社会学和地理学方面的研究人员,仍在探究概括人口差异化或居住模式的替代方法;地理文献则独立生成了测量空间自相关的指数。隔离的方法论最常用于研究种族居住的情境中,但也有其他应用形式,如用于测度社会经济地位的差异、土著分布、语言,甚至生命周期与家庭结构的研究。还有一些研究从多个维度考察隔离,如研究不同社会经济组群内的种族居住分布。
在非居住隔离的研究中,存在着并行的方法论争论,如职业类别间的性别隔离*Grusky, David B, and Maria Charles. 1998. "The past, present and future of sex segregation methodology." Demography 35:497-504.Watts, Martin. 1997. "Multidimensional indexes of occupational segregation: A critical assessment." Evaluation Review 21:461-482.。收入不平等和产业集中度指数(如基尼系数,阿特金森的收入不平等指标,反映行业集中度的赫芬达尔指数)现已被拓展用于测量工人人口、家庭或企业间的资源分配。事实上,关于如何测量隔离的争论一直持续到了今天。
在居住隔离方面,在早期关于指数争论的余波过去之后,很多研究者采取了一种使用多重指数的策略。一篇典型的此类文章可能会同时涉及D指数以及若干其他指标。在2003年的一项研究中,美国人口普查局在1980到2000年间十年一次的人口普查报告中,记载了19项反映美国大都市隔离情况的指标*Iceland, John, Daniel H. Weinberg, and Erika Steinmetz. 2002. Racial and ethnic residential segregation in the United States: 1980-2000. Washington, D.C.: U.S. Census Bureau, Series CENSR-3.。同一领域的其他研究则致力于进一步识别出隔离的维度。为了达到这一目标,研究者们通过多变量分析——往往是因子分析——检验了大量的指标以找出潜在的维度*Massey, Douglas S, and Nancy A Denton. 1988. "The dimensions of residential segregation." Social Forces 67:281-315.Massey, Douglas S., Michael J. White, and Voon-Chin Phua. 1996. "The dimensions of segregation revisited." Sociological Methods and Research 25:172-206.。
(二)目前的研究热点
目前关于隔离研究的讨论除了关注上述问题之外,还关注其他问题。其中,一个重要的主题是,将隔离看作一个动态过程,以便更好地了解隔离的起源及其延续或减弱的方式*Paez, Antonio, Fernando A. Lopez Hernandez, Manuel Ruiz and John Logan. 2014. “Micro-geography of Segregation: evidence from historical US census data.” Pp 91-110 in Socio-spatial Segregation.。研究者倡导思维的转换,即从静态“快照”的方式转换到一种更动态的方式来研究居住模式。隔离是一个过程(而非一种即时形态或结果)的观点早已存在,但近期的文献通过研究移民的种族、健康和社会剥夺方面的人口过滤效应进一步促进了人们对它的认识*Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).。
一些强调隔离是过程而非结果的研究认为,不能继续将“隔离”和“整合”这两个概念视为简单的对立。利用南欧的数据,他们发现了一种反隔离的趋势,而这一趋势并不与移民的社会整合齐头并进*Arbaci, Sonia and Jorge Malheiros. 2010. “De-Segregation, Peripheralisation and the Social Exclusion of Immigrants: Southern European Cities in the 1990s.” Journal of Ethnic & Migration Studies 36(2):227-55.。相反,隔离的消减被视作社会排斥过程的结果。
沿着这条思路发展,一些研究者开始挑战居住隔离和社会整合之间假定的关联。在许多以往的研究中,居住隔离的弱化被视作社会整合的初步证据,并被归于“空间同化”之下。研究表明,鼓励分散的政策(如住房分配体系)会削弱隔离,但实际上对(社会)整合没有积极的影响。相反,其结果可能是造成个体与社会网络的进一步隔离。人们主要是与他们附近的邻居互动,而即使是在混合居民区,这些邻居也和他们有类似的社会地位*Bolt, Gideon, A. Sule Ozuekren, and Deborah Phillips. 2010. “Linking Integration and Residential Segregation.” Journal of Ethnic & Migration Studies 36(2):169-86.。反过来看,Murdie和Ghosh利用多伦多的个案展开的研究挑战了少数民族的空间集聚代表着整合的缺乏或整合功能不足的观念。他们呼吁用更主观的视角(特别是用关于生活满意度的指标)来看待整合,并对空间同化模式下的传统观点产生了质疑*Murdie, Robert and Sutama Ghosh. 2010. “Does Spatial Concentration Always Mean a Lack of Integration? Exploring Ethnic Concentration and Integration in Toronto.” Journal of Ethnic & Migration Studies 36(2):293-311.。
Ruiz-Tagle致力于建立一个解释社会空间整合的框架,且认为社会空间整合是社会排斥的对立面,而不同的社会群体之间的空间距离的接近程度只是社会排斥中的一个维度。进而,整合不应被视为一个线性的过程,而应表示为一种可能在不同领域起作用的多维关系(包含物理的、功能的、相关的、符号的)*Ruiz-Tagle, Javier. 2013. “A Theory of Socio-Spatial Integration: Problems, Policies and Concepts from a US Perspective.” International Journal of Urban and Regional Research 37(2):388-408.。
早期的居住隔离及对相关现象的研究并没有被当下这些关注隔离过程(而非仅仅是对结果的快照)、规模和多维度的理论所遗忘。如今,新的技术方法和更丰富的数据使研究人员得以对这些问题开展经验研究。
(三)关于隔离的更多话题
基于社会学视角下隔离研究的长期传统,一些跨学科、研究领域更广泛的研究开始关注隔离成为一种建构不平等的重要社会力量的机制。因此,基于民族和种族隔离(隔离理论的起源)建立起来的居住隔离的经验和概念成果已被扩展到其他多个领域中。许多研究都考察了隔离与教育、就业和健康之间的相关关系。下面将给大家提供一个近期的扩展应用例子,重点关注居住隔离研究能否解释人群之间的健康差异。
美国的大量研究表明,房地产市场歧视是造成种族隔离的主要原因之一,而且种族隔离要比收入隔离更加严重。此外,非裔美国人和白人之间的隔离要比其他种族间的隔离更加普遍*Acevedo-Garcia, Dolores, Theresa Osypuk, S. .. Subramanian, and Kimberly Lochner. 2003. “Future Directions in Residential Segregation and Health Research: A Multilevel Approach.” American Journal of Public Health 93(2).。健康方面的研究则旨在探讨种族隔离对少数族群健康状况的影响,如隔离和传染病之间的关联*Acevedo-Garcia, Dolores, Theresa Osypuk, S. .. Subramanian, and Kimberly Lochner. 2003. “Future Directions in Residential Segregation and Health Research: A Multilevel Approach.” American Journal of Public Health 93(2).Bolt, Gideon, A. Sule Ozuekren, and Deborah Phillips. 2010. “Linking Integration and Residential Segregation.” Journal of Ethnic & Migration Studies 36(2):169-86.以及与老年人的健康、患病情况之间的关联等*Sudano, Joseph, Adam Perzynski, David Wong, Natalie Colabianchi, and David Litaker. 2013. “Neighborhood Racial Residential Segregation and Changes in Health or Death among Older Adults.” Health and Place 19.。总的来说,这一研究领域的情况表明,更深层的隔离与更差的健康状况相互关联,尽管少量研究显示,少数种族的聚集对其群内成员的健康状况可能起到一定的保护作用*White, Kellee and Luisa Borrell. 2011. “Racial/ethnic Residential Segregation: Framing the Context of Health Risk and Health Disparities.” Health and Place 17(2):438-48.。
Williams和Collins是最早对隔离和健康关系的文献进行评述的学者*Williams, D. R., & Collins, C. 2001. Racial residential segregation: a fundamental cause of racial disparities in health. Public Health Reports, 116:404.;而近期的评述则更加关注这一主题下目前的研究趋势,并为未来的发展方向提供建议。Acevedo-Garcia等呼吁,应发展一个更强大的理论框架,把对隔离的测量和健康状况联系起来;其后的文献评述则更加关注隔离的作用机制*Acevedo-Garcia, Dolores, Theresa Osypuk, S. .. Subramanian, and Kimberly Lochner. 2003. “Future Directions in Residential Segregation and Health Research: A Multilevel Approach.” American Journal of Public Health 93(2).。Landrine和Corral的研究表明,许多研究根植于邻域效用理论。调节隔离和健康之间关系的机制在很大程度上源于这样一个社会学假定,即生活在不同的地区会导致不同的社会状况。Landrine和Corral尤其关注医疗保健质量、环境暴露和所处环境在社区层次的变异,正是这些因素铺就了隔离过程引起不同健康问题的路径。由于少数民族居住区的医疗保健设施达不到平均水平,且被暴露在更高水平的可能导致慢性病的污染物之下,加之接触到社区娱乐设施和超市的机会也少,少数民族群体更易处于不良健康状况之中。这些作者认为,上述机制都对健康有直接和间接的影响*Landrine, Hope, and Irma Corral. 2009. "Separate and unequal: residential segregation and black health disparities." Ethnicity & Disease 19: 179.。
White和Borrell认为,居住隔离反映了居住区在经济、医疗、环境、政治资源可得性方面的差异,但直接检验假设机制的研究却相当缺乏*White, Kellee and Luisa Borrell. 2011. “Racial/ethnic Residential Segregation: Framing the Context of Health Risk and Health Disparities.” Health and Place 17(2):438-48.。在对39个种族隔离与健康关系的定量研究的评述中,Kramer和Hogue发现,大多数研究提供的证据都一致表明,隔离与健康之间存在相关关系。然而,在大多数情形下,研究设计并没有点明因果关系。这些研究在很大程度上依赖于跨区域数据,因而无法真正解释社区的动态特性,也无法建立因果关系的解释路径。由于健康本身是一个复杂多变的概念,隔离与健康之间的关系也变得更加复杂。对于某些健康维度,如出生婴儿缺陷,也许环境污染物水平——与地域空间直接相关——才是罪魁祸首。而对于其他健康维度,如精神健康,可能普遍的歧视才是主要原因*Kramer, Michael R., and Carol R. Hogue. 2009. "Is segregation bad for your health?." Epidemiologic Reviews 31:178-194.。总体而言,既需要强化隔离对健康差异有独立影响的假设,还需要更多研究来提供纵向数据,进行多层次的建模。
此外,也有一些研究重点关注隔离与成人、婴儿的死亡率之间的关系*White, Kellee and Luisa Borrell. 2011. “Racial/ethnic Residential Segregation: Framing the Context of Health Risk and Health Disparities.” Health and Place 17(2):438-48.。与其他研究相比,这一领域的重要方法论差异在于,认为隔离对健康的影响贯穿于整个生命过程之中。还有少数研究关注居住区的种族构成对未来生活健康状况的影响*LaVeist, T. A. (2003). Racial segregation and longevity among African Americans: An individual‐level analysis. Health Services Research, 38: 1719-1734.Postmes, T., and Branscombe, N. R. (2002). "Influence of long-term racial environmental composition on subjective well-being in African Americans. "Journal of Personality and Social Psychology, 83:735.。目前,仍有许多问题有待解决,如隔离是否与生命过程中关乎健康状况的某一阶段有交互作用。因此,阐明隔离与生命不同阶段健康状况之间的潜在动态关系以及隔离的累积效应,可能是在该领域进一步深入研究的一个方向。
二、隔离测量中的方法论问题
最基本的隔离测量一般试图通过某种方式寻找出其居住模式,且有两个共同的特点:汇总数据和表格的使用。每个指标提供一个汇总统计量或一个最终的测量值,用来描述不同类别的子群体的隔离状况。这些类型的指标还要求将数据按类别分组。通常,数据表是按照地理位置排列的。
(一)基本原则
理解隔离这个概念最简单的出发点也许就是如下所示的二维表:
群体A群体B群体C区域1区域2区域3区域4区域5
利用这种类型的二维表,我们可以生成大多数现用的居住隔离指数。这些行列的数据可以直接从普查表中获得。比如,“群体”可以是民族、语言或受教育程度的不同类别。“区域”则是地理单元,如普查区或其他小的城市区划。在一般情况下,任何可以在这种表格中加以排列的数据都能构成我们下面要讨论的测量隔离的某种方式。不过,这种表格特指但不仅仅指这种“群体”是一个社会经济特征,而“区域”是一个地理单元的表格。很多传统的(非空间点)隔离测量方法的出发点是二维表,这一点在我们的讨论中具有基础性作用。原则上,概括总结二维表格的方法可以延用到居住隔离的测量。这一简单事实往往在隔离文献中没有受到足够重视,而隔离领域似乎已独立于一般的社会统计领域之外。下面要讨论的具体的空间测量则需要采用不同的方法。
从社会科学的角度看,一个具有统计意义的好的指数,需要具备以下特质:适用于三个及以上多群体的测量;能够在地图上具有真实性;允许跨时间、空间的对比;可用于个体数据。然而,实际情况是,很难有一个单独的指数可满足上述所有标准。在居住隔离指数方面,学者们也提出了众多评价标准,它们包含却不限于以下五点:
1.相关性的测量。即是一种对可解释性方差所占比例的测量。
2.可赋值。例如取值在0到1之间,0代表无隔离(即空间地域和群体身份间没有关系);1代表完全隔离(即从空间地域即可判断出群体身份)。
3.可分解性。首选的测量方法应当在地理空间和群体上可聚合加总。
4.成分无涉。一些学者认为,一个好的隔离测量指标不应随着整体区域内少数群体比例的变动而发生改变;另一些学者则偏好随着构成比例变动的测量方法。
5.具有社会福利保障的指向。标度不变性、转移性原则(即当富人将一部分收入转移给穷人时,度量结果应当降低或至少不变)、系统规模不变性、洛伦兹标准等已在收入不平等的研究中不断发展,也已在隔离研究中有所运用*Schwarz, Joseph, and Christopher Winship. 1980. "The welfare approach to measuring inequality." Sociological Methodology 11:1-36.。
各个隔离指数在以上五个方面各有所长,但很少有测量能够满足所有标准。一些学者出于理论方面的考量,可能更倾向于其中的某个方面。同样,有关隔离指数效用的争议与其在以上标准方面的表现也有关系。
下面将对一些有关隔离的测量方法进行回顾,我们尽量选取那些有代表性、在文献中出现次数最多的测量方法。讨论分为两部分:一是非空间性的测量。其中大部分可以通过上面提到过的群体与单位分布的列联表直接计算得出。二是空间性的测量。由于在居住模式的空间分布方面已有大量研究,本文希望综述一些新的方法。大体而言,采用空间性测量的数据主要源于两类:一是为各“区域”加上了空间分布信息或坐标的列联表;二是有点坐标的个体数据(点模式数据),即附上位于这些坐标上的个体或家庭的相关特征数据。当然,空间点数据在地理上的集聚可以实现第二类数据向第一类数据的转化。
(二)非空间性的测量
有关隔离程度的测量存在很多维度的指标*James, David R, and Karl E Taeuber. 1985. "Measures of segregation." Sociological Methodology 15:1-32.Massey, Douglas S, and Nancy A Denton. 1988. "The dimensions of residential segregation." Social Forces 67:281-315.White, Michael J. 1986. "Segregation and diversity measures in population distribution." Population Index 52:198-221.。不同指标间存在两点共性:统计量和列联表的运用。每一个指标都会提供一个统计汇总或最终的测量值,用来描绘不同类别间子群体的隔离情况。这些指标要求数据满足列联表分布或其群体可按照类别分组,必要时需要将其转化成微观或个体层面的数据。
下面将从最广泛使用并具有悠久传统的隔离指数开始,描述一些研究中最常使用的测量指标,包括它们的特性及应用。
1. 隔离指数或变异指数(Index of Dissimilarity,D)
k,l:参照特征组
nik:在第i个区域内的第k组的人数
Nk:总人口中第k组的人数
变异指数是居住隔离研究中的基石。它使用最广泛,用于比较城市内部和城市间不同种族和族裔群体的居住隔离水平。通过计算区域内每个群体与总体差异绝对值加总后的一半得出,取值在0到1之间,可以理解成少数群体需要通过改变类别或迁移以达到平均(非隔离)分布的比例。当城市中每个区域的群体结构均可以看作是城市整体结构的缩影时,方实现了平均分布。从公式中很容易看出,如果每个区域i中每个群体人口所占的比例相同,此时D指数为零。
变异指数的优缺点都很明显。就优点而言,一是悠久性。该指数从20世纪初便开始使用,在很多早期的居住隔离研究中起到了奠基作用,故存在一个长时间序列的相异性测量历史:如城市中的种族居住隔离、职业隔离等。二是它具有一些理想特性。比如,当它取值为0时,表示在每个区域内各群体成比例分布(即不存在隔离);另外,该指标不会受到群体规模大小的影响;换言之,即使每个区域内群体A的成员数目翻倍(这将提升城市的碎片化),该指数仍不会发生变化;又如,它的直观易于解释性:变异指数表示的是需要通过迁移来达到平均分布(非隔离)的群体成员比例。
变异指数的局限也显而易见,且众多研究对此已有详细解读*James, David R, and Karl E Taeuber. 1985. "Measures of segregation." Sociological Methodology 15:1-32.Reardon, Sean F, and Glenn Firebaugh. 2002. "Measures of multigroup segregation." Sociological Methodology 32:33-67.Schwarz, Joseph, and Christopher Winship. 1980. "The welfare approach to measuring inequality." Sociological Methodology 11:1-36.White, Michael J. 1986. "Segregation and diversity measures in population distribution." Population Index 52:198-221.。同时,该指数也未能满足所有的社会福利研究指向中的标准*Schwarz, Joseph, and Christopher Winship. 1980. "The welfare approach to measuring inequality." Sociological Methodology 11:1-36.;这主要体现在转移性原则(the principle of transfers)上,即不同区域间超过或低于平均值的人员重新分配并不会改变指数值,这是多数学者都不希望看到的结果。变异指数在分解方面也存在不足,但对于现代研究,该指数最大的局限仍在于其二分类方法。当城市中只研究白人和黑人的隔离情况时,两分法的局限微不足道。但当考虑三个及以上群体的居住模式时,若要使用变异指数,则需要计算一系列成对发生的变异值。此情形下,若学者想要用一个简单的指数来描述居住情况的种族差异,变异指数就不符合标准了。然而,鉴于其易于计算、与其他指数密切相关*Massey, Douglas S., Michael J. White, and Voon-Chin Phua. 1996. "The dimensions of segregation revisited." Sociological Methods and Research 25:172-206.White, Michael J. 1986. "Segregation and diversity measures in population distribution." Population Index 52:198-221.、易于理解解释等优点,变异指数在城市统计数据为主的研究中仍占据重要地位。相当一部分学者将变异性作为隔离研究重要维度之一的均衡性分布(evenness)的关键指标。
下面以来自中国的一个有关变异性研究的例子为例,进一步阐明变异指数的用途。这是我们正在进展中的一个研究*Wong, David WS. 2014. "Using a general spatial pattern statistic to evaluate spatial segregation." Pp 45-64 in Lloyd et al. Social-spatial Segregation: Concepts Processes and Outcomes.. Bristol: Policy Press.,使用2010年全国人口普查数据,考察北京地区分年龄组人群的隔离情况。分年龄的列联表来自324个街道,为方便计算,仅仅区分三个大的年龄组:儿童、成人、老人,并进行全区域的两两配对,计算变异指数。如图1所示,最大程度的隔离发生在年轻人和老年人之间,数值接近0.2。利用变异指数的易解释性,可以说,大约20%的老年居民需要迁移才可以实现北京城的人口均衡分布,即每个街道拥有与全北京市相同的老少比(由于该指数具有对称性,在上述假设中,20%的儿童也需要按照与上面相同的区域调动进行重新分布)。同时,我们也注意到,在这十年间,年长—年幼者的空间隔离情况略有提升,且区域地理情况也发生了一定的变化。
图1 北京地区2000年和2010年间大组距年龄组的分龄隔离情况
2. 熵指数
熵指数(Entropy Index)也称信息指数(the information index),1971年由heil和Finezza引入隔离研究,用于测量学校间的种族隔离程度。该指数由每个类别与总体差异的加权平均离差计算标准化后得来;与变异指数相同,熵指数的取值介于0到1之间。虽然该指数可被计算赋值,但却不如变异指数那样易于解释。其取值的含义是,取值越接近0,则每个类别的平均变异和总体的变异水平越类似;反之,取值接近1时,则表示更大的离散水平;当取值等于1时,表示每个类别都只有一个子群体构成,各类别间不存在差异。对熵指数来说,一个吸引人的方面在于它可以用于定类变量间关系的标准化测量。
熵指数的最显著的优点在于地理上和组别间的易分解性。因为K的取值不仅限于2,该指数也会经常用于多组别的情形。例如,在美国的都市圈中,可以同时比较盎格鲁人(非西班牙裔白人)、黑人、拉丁美洲人、亚洲人和其他种族人之间的隔离情况。人们经常希望看到不止一方面的隔离情况,比如种族和阶级的维度*Fischer, Mary J. 2003. "The relative importance of income and race in determining residential outcomes in U.S. urban areas, 1970-2000." Urban Affairs Review 38:669-696.以及对空间地理情况的分级检验*Lichter, Daniel T., Domenico Parisi, and Michael C. Taquino. 2015. “Toward a New Macro-Segregation? Decomposing Segregation within and between Metropolitan Cities and Suburbs.” American Sociological Review 80(4):843-73.。
熵指数也可用来测量不同类别的定类变量(例如语言、种族、职业)间的人口学变异,进而通过计算每个区域或邻近地区的变异程度来查看整个组别间的情况。当两两群体所占的比例相同(pi=pj)时,组间变异达到最大(接近K值)。相比之下,只有唯一一个群体构成的单位的值将接近于0。从实际意义上来说,变异代表着隔离的反面;故邻里间的变异使得整个城市处于一种非隔离的状态。
3. 曝光指数或暴露指数(Exposure Indices,P)
Nik:在区域i中k组的人数;
Ni:全部区域的人数;
Nk:k组在城市中的规模大小。
该指数分为交互指数和隔离指数,测量公式如上所示,即通过纳入城市中的地理分布情况,来测量群组间的隔离或交互水平。隔离指数描述在少数群组k中的成员与他(她)组中其他成员碰面的可能性,该指数也因此得名,取值从0到1,值越高表示隔离程度越高。
交互指数,Bkl描述了一组群体与其他群体碰面的可能性,同样也是取值越高,表示两个群体间成员碰面的可能性越高。若该地区人群只有两个子群体或交互指数对这两个子群体之外的其他群体均有估算,那么对一个少数群体来说,隔离指数和交互指数加总值为1。
暴露指数在有关种族和民族居住隔离的社会科学研究中受到相当多的追捧。主要原因如下:其一,该指数可通过已有的普查表格数据很方便地计算出来;其二,这两个指数拥有易于解释的字面含义——其中,交互指数代表一个群组中的成员在其所在社区中碰见另一群组成员的可能性;隔离指数则表示在同一群组间的上述可能性。
暴露指数最具争议之处在于它对构成成分的敏感,该指数不符合上文中提到的成分无涉(第4条)的标准,会受到更大地区内整体构成的限制*White, Michael J. 1986. "Segregation and diversity measures in population distribution." Population Index 52:198-221.,如扩展到整个都市范围内。然而,虽然有学者认为该指数的成分相关性具有缺陷,但也有学者视其为理想特性——即认为暴露指数对成分构成的敏感具有社会学意义。这意味着K-L暴露指数的取值会随着区域内少数群体K的增加而降低;故此,都市中少数种族的暴露指数,相较于变异指数或熵指数,的确表现出与整体少数民族构成更高的相关关系。
三、空间测量及相关问题
现在,我们再来看看具有空间显著性的居住隔离测量。首先,我们关注在综述中提到的空间指数,然后再讨论在地理中基本的可塑性面积单元问题,最后将讨论近年来较为热门的地理信息系统(GIS)。
(一)空间接近性
空间接近性指数由White于1983年首次提出;为解决居住隔离测量过程中的棋盘问题(checkerboard problem),White在1986年对此做了轻微修订*White, Michael J. 1986. "Segregation and diversity measures in population distribution." Population Index 52:198-221.,将其赋值标准化为0到1之间,公式如下所示:
其中,
nik:在区域i中K群体的成员数量;
f(dij):有关区域i和j之间距离的函数。
尽管上文中的变异指数、熵指数、暴露指数均涉及到少数群体在地理区域内的分布,但它们均未考虑到这些群体的相对空间位置。
If f (dij)= dij
若上述公式成立,那么P就等于可被解释空间方差的比例,这种测量与在地理研究中使用的方法类似。若f(d)采取另一种函数形式,那么P则可代表由此函数反映出来的相关区域内的方差比例。
由于上述空间接近性公式涉及到了明确的地理距离,只要分类别的表格数据可以加上(社会)距离的测量,那么该指数就可运用。近期,学者仍然从理论和方法论的视角进行空间隔离的研究工作*Hong, Seong-Yun, David O’Sullivan, and Yukio Sadahiro. 2014. “Implementing Spatial Segregation Measures in R.” PloS One 9(11). e113767. Eardon, Sean and David O’Sullivan. 2004. “Measures of Spatial Segregation.” Sociological Methodology 34.Paez, Antonio, Fernando A. Lopez Hernandez, Manuel Ruiz and John Logan. 2014. “Micro-geography of Segregation: evidence from historical US census data.” Pp 91-110 in Socio-spatial Segregation.。
(二)可塑性面积单元问题(The Modified Areal Unit Problem,MAUP)
传统上,隔离研究在很大程度上依赖官方统计体系中被聚合到一个个地理区域单元上的人口数据。例如,作为人口普查中的基本地理单元——街道,是美国隔离研究中常见的数据统计单位,很多研究据此确定个体所处的社会环境(如邻里社区)。虽然被广泛使用,这种方法却未能解决众所周知的可塑性面积单元问题;其后果就是,隔离测量是被选作研究之用的特定地理区域的一个函数。具体来说,可塑性面积单元问题既包含了规模效应——面积单元的聚合水平,也包含了分区的影响——特定面积边界内的结构配置*White, Kellee and Luisa Borrell. 2011. “Racial/ethnic Residential Segregation: Framing the Context of Health Risk and Health Disparities.” Health and Place 17(2):438-48.。这意味着,有关隔离的计算会因所选分区的规模及特定边界的定义而有所不同。
建立在事先定义好的区域单位上的隔离研究有很大的价值。人口普查中的区域作为近似的小面积区域,在表现隔离的不同维度中十分有用,经常被认为是邻里社区在统计上的近似替代*White, Michael J. 1988. American Neighborhoods and Residential Differentiation. NY: Russell Sage Foundation.。然而,更高或更低聚合水平下的隔离模式则十分模糊。可塑性面积单元问题及其与隔离研究的相关性在有关综述中被广泛提及。尤其是 Lee 等人在2008年提出的著名反对意见,即不同意将个体所处的邻里区域简单地直接等同于其所属的官方地域单元,而不考虑个体可能居住在临近地区一系列地理规模均不相同的环境中的惯常做法*Lee, B. A., Reardon, S. F., Firebaugh, G., Farrell, C. R., Matthews, S. A., & O'Sullivan, D. (2008). Beyond the census tract: Patterns and determinants of racial segregation at multiple geographic scales. American Sociological Review, 73(5), 766-791.。因此,规模应被视为一个变量而非常量。另一个相关的情形是将个体作为数据的参考框架,消除了根据普查中的传统地理单元来加总数据的必要。这时就需要研究者自己对邻里区域做出有意义的定义。
2014年,Paez等人在关于1880年间美国三个城市微观层面上的种族隔离研究中对上述观点进行了阐释。作者使用了城市转型历史GIS项目中的地理编码数据,计算了每个个体“m-1”的最近邻里区域,并派生出对于邻里区域的“m-周边”定义。作为结果的Q(m)统计量表明,美国人、爱尔兰人、德国人间的集群和接触情况在奥尔巴尼城、水牛城和辛辛那提人之间也很常见。作者因此提出,隔离过程在微观地理层面的显著并不能反映到传统的行政边界上*Paez, Antonio, Fernando A. Lopez Hernandez, Manuel Ruiz and John Logan. 2014. “Micro-geography of Segregation: evidence from historical US census data.” Pp 91-110 in Socio-spatial Segregation.。 Osth等人在2014年的研究中也提出使用个体化的邻里区域来避免可塑性面积单元问题。他们运用带有地理坐标信息的人口登记数据来建构邻里区域,这样就在每个住宅周围扩展了一个缓冲区,之后再统计出来自不同群体的人住在缓冲区中的数目。然而用这种方法测量隔离有着类似于可塑性面积单元问题的缺陷,就是对缓冲区边界选择的敏感。另一个对邻里区域的替代性选择的例子是地方的属性。Lloyd 等人和Wong在2014也对当地的空间单元按顺序做了细致检查,试图更好地理解社会环境*Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).。
上述研究值得关注的地方在于对个体层面上地理数据的运用。目前,在很多国家存在一种新兴的趋势,即在个体层面上获取空间数据的机会不断增加*Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).,这为提高隔离调查研究的精度指出了一条康庄大道。并且,由于将隔离测算从个体上的国家地理统计数据中解放出来,这也将促进跨国间的比较研究。此外,更为个体化的地理数据有助于加深对隔离研究在微观动力学和宏观模式间相互作用的理解*Fossett, Mark. 2005. “Urban and Spatial Demography.” Pp. 479-524 in Handbook of Population. New York, NY: Springer.。这种微观和宏观上联系的显著性在Schelling1978年开创性的研究中已经得到充分认可,即个体层面上的行为与总体层面的隔离模式相互关联*Schelling, Thomas C. 1978. "Micromotives and Macrobehavior." New York: Norton。
(三)地理信息系统方法
近年来,地理信息系统方法的使用呈现出爆炸式的增长,这使人对理解和分析隔离现象充满了期待,这种期待是多方面的。首先,地理信息系统方法的技术和软件大体上已经成熟,为获取数据以及整合社会和地理信息提供了有效的算法。这种连接让使用比之前更为复杂的数据结构成为可能。
第二,地理信息系统提供了方便快捷的地图映射功能。虽然对隔离数据的处理能力不断发展(这点很重要),可以将居住模式提取成数值指标,但具备快速地图映射的能力,包括可变换的数据构造,才能允许分析者验证地图的有效性,并同时呈现隔离的快照及其在一个直观的平面上的进程。
第三,地理信息系统有其自身的一套测量方法,在居住隔离分析中也很有用,值得引进。例如,Moran’s I,一种空间测量方法,表明在空间中相对较高或低的特征集聚(接近性)。当I是空间显性时,与传统的隔离测量方法有很高相似度。在一篇评论中,Paez指出了在隔离研究中由地理新技术的运用带来的美好前景,说到,“延续White 早期的研究,很多学者已经意识到将位置信息充分包含在人口数据中的测量方法的重要…现在已有几种测量存在,能够更好地描绘出需要区分的分析单位之间的空间关系…因此现在技术上可以做到在测量隔离时加入地理信息”*Paez, Antonio, Fernando A. Lopez Hernandez, Manuel Ruiz and John Logan. 2014. “Micro-geography of Segregation: evidence from historical US census data.” Pp 91-110 in Socio-spatial Segregation.。
(四)空间与非空间测量方法比较
很多对隔离现象的传统测量往往将个体的社会环境等同于其所处的组织或单位单元(如学校或普查中的街道),而未考虑到在社会空间中这些单元的构成模式。这些非空间的测量方法往往将特定普查单元内的个体视作处于相同的社会环境中,且这一社会环境的构成与邻近单元的构成相互独立。传统的隔离测量,如变异指数,是非空间化的,试图测量人口在不同区域内的分布,但忽视了这些区域间的空间联系。因此,若使用这样的测量,就等于默许了区域之间没有关系的假设,更确切地说,是设定人口均居住在同一个区域内。空间和地方上的测量由于考虑到了区域间可能存在的互动关系,从而使得标准的非空间测量在概念上有所提升。很多空间和地方上的测量要么建立在临近权重(给定区域内的邻居需要囊括在计算中)上,要么建立在距离衰减函数上*Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).。总而言之,这些新方法都有利于我们更有效地将地理变量纳入研究中。
四、隔离测量的维度
现存有关隔离测量的文献中相关指数已有二十余种。如上文所说,这些相互间或许存在矛盾的指标数目不断扩展,使得一系列探究隔离维度的调查研究不断涌现,试图在每个维度上找到一个代表性的指标*Massey, Douglas S, and Nancy A Denton. 1988. "The dimensions of residential segregation." Social Forces 67:281-315. Douglas S., Michael J. White, and Voon-Chin Phua. 1996. "The dimensions of segregation revisited." Sociological Methods and Research 25:172-206.Iceland, John, Daniel H. Weinberg, and Erika Steinmetz. 2002. Racial and ethnic residential segregation in the United States: 1980-2000. Washington, D.C.: U.S. Census Bureau, Series CENSR-3.。维度与指标的对应关系如下:平均性(Evenness)涉及到变异指数、熵指数、基尼指数、阿特金森指数;暴露性(Exposure)涉及到交互指数、隔离指数、相关比率指数;集中性(Concentration)涉及到Delta指数、绝对集中指数、相对集中指数;中心性(Centralization)涉及到绝对集中、相对集中;聚集性(Clustering)涉及到空间接近性、绝对集聚、相对集聚、距离衰减交互、距离衰减隔离。这些指数的计算公式可在 Iceland, Weinberg和Steinmetz 2003年的研究、White 1986年的研究以及 Massey和Denton 1988年等研究中找到。
平均性测量的是经过一般调整后的构成,具体来看,变异指数和熵指数的计算并不会受到整体城市中少数民族构成的直接影响,这点在大部分关联测量中都很重要,例如可以得到消解了边缘分布影响的统计汇总量。暴露性指标包含隔离和交互指标,如上文讨论所述,会受到人口构成的决定性影响。一些研究者却认为这是长处,因为这些指数包含了在组内或组间人口变动假设的行为概念。集中性指数计算了在居住单元内,群组在人口密度方面的分布。中心性测量了邻近地区内的利益相关者居住在接近城市中心的程度。集聚性则明确包含了有关空间定位方面的信息,例如空间接近指数。
上述有关隔离维度的划分已足够惯常,因此一些研究开始尝试多维度的测量,最著名的一个系列是有关“超隔离”的研究,其中,隔离在多个维度上均具有高值。
五、超越西方——21世纪隔离研究的机遇与挑战
占统治地位的隔离理论主要是针对北美,同时在一定程度上也针对西欧的境况提出的;其中的几种理论发端于20世纪前期,基本上是基于美国大城市的特征建构出来的*Grigoryeva, Angelina and Martin Ruef. 2015. "The Historical Demography of Racial Segregation." American Sociological Review 80(4):814-42.,但未必一定适用于世界上的其他地方。Maloutas和Lloyd及其同事已经证实,在世界不同城市,社会隔离模式存在巨大差异。Maloutas进而认为,在与隔离有关的都市理论中,占主导地位的解释模型并未考虑情景性的差异性,故在解释地区独特的隔离差异性方面显得比较苍白无力*Maloutas, Thomas. 2012. Residential Segregation in Comparative Perspective Making Sense of Contextual Diversity. Farnham.Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).。
虽然美国强调种族和族群模式,我们在前面也看到,任何特征,无论人口还是社会,都可以从居住隔离的视角来分析。因此,在世界其他地方,居住隔离的呈现方式或特征可能也会有别。同时,无论是概念还是理论,都可能需要进行相应的调整,以便更有效地分析地区的特殊性。现有文献已经注意到,在非洲、亚洲和拉丁美洲,居住隔离现象日渐普遍。在更广的层面上,尽管大部分研究者认同居住隔离社会情景的重要性,但将情景差异纳入指数计算之中,尤其是对隔离程度和趋势的解释将是一个更大的挑战和障碍。
那么,我们能从西方以外的地区得到哪些启示呢?援引情景的多样性不应该成为避免地区比较、总结提炼、理论提升的借口。相反,Maloutas提出,考察隔离是否因类似的原因而起,是否有类似的机制在此过程中起调节作用,是否出现类似的结果,不同情景下隔离是在增长还是在消减,是否应作为一个政治问题而提出,是否提出公共政策对此进行调节等或许更有意义。作为一种结果,隔离不可避免地嵌入于具体的情景之中(即情景依赖)*Maloutas, Thomas. 2012. Residential Segregation in Comparative Perspective Making Sense of Contextual Diversity. Farnham.。
变化中的城市人口:在世界范围内,城市人口的转变马上就会给居住隔离的研究理论和研究方法带来巨大的挑战,而其中最大的挑战是在日益多样化的城市环境中,测量隔离的方法问题。受到国际移民和国内流动人口的驱动,全球城市接纳了来自不同地区、操着不同口音的新人群,但与此相关的不仅仅是种族语言的多样性。在都市研究领域,长时间的研究传统已经发现,城市化本身就伴随着人口成分的多样化,表现为从一个地区到另一个地区的地域性的流动,职业、社会经济地位、家庭结构和生命历程的多样化等众多领域。
中等收入社会:低收入国家进入中等收入国家行列(如中国、巴西)对研究者提出了新的挑战,即如何理解社会模式的空间呈现。在这些国家中,居住隔离的关键特征及测量隔离的详细数据等与高收入社会是不同的。
都市规模:现代社会城市化进程的一个重要特征是,中等收入和处于都市化中的社会——中国、印尼、尼日利亚、巴西——都市的规模都大于历史上西方社会的城市定居点;换言之,与此前的都市居民相比,现代社会的都市居民居住在更大的都市圈中。因此,都市生活也值得考虑。但问题是,都市规模如何影响测量、计算和解释?
地理空间:在新的时代背景下,居住隔离研究将会受益于与空间资料的整合,将空间资料纳入隔离的计算和指数之中。开发更多的基于地理空间测量的需求——回应MAUP问题、联合GIS的优势——意味着隔离指数需要整合更具社会意义的空间变量,如邻里片区、距离函数等。
代理模型:探究隔离动态的代理模拟模型(agent-simulation models)迄今持续发生作用。Crooks提出了一种关联代理模拟与空间信息系统的新方法。虽然传统模型也可利用一系列的空间片块(或地理单元)来代表空间,但在Crooks的新途径中,都市系统有两个表示环境的层次:一系列的多边形和表示个体的层次点。他将都市系统表示为一系列的空间物体:点、线、多边形等,它们各自都有用来描述所处位置的空间参照,而非仅仅是一系列的空间元素。Crooks使用欧氏距离界定半径,在点的周围生成缓冲区,作为邻里社区。据此,该模型便可纳入地理特征(如河流),而基于该模型的模拟显示出清晰的隔离模式*Crooks, A. T. 2010. Constructing and implementing an agent-based model of residential segregation through vector GIS. International Journal of Geographical Information Science, 24(5): 661-675.。Dahal和Chow利用同时考虑数据模型和操作的矢量地理信息系统环境,也提出了一个都市扩展的整合性模型,即代理-整合不规则自动超控模型,用来模拟都市土地利用的动态状况。该研究致力于建立这样一个模型,它能够在地籍水平上使用矢量多边形表示土地单元,还能捕捉到在土地利用动力学中的个体行为因素,以及在城市发展过程中涉及到的不同因素所起到的决定和交互作用*Dahal, Khila R. and T. Edwin Chow. 2014. "An Agent-Integrated Irregular Automata Model of Urban Land-Use Dynamics." International Journal of Geographical Information Science 28(11):2281-2303.。
六、结论
过去有关指数的讨论,通常关注的是基本的数学性质以及概念标准问题。在计算很多指数后,进行求同或剔选以达成妥协。现在,我们需要留意一些可以促成对于指数选择更深层次思考的因素,并且时常重新思考有关指数特征的一些问题。与此同时,数据开发和分析技术都偏爱有更复杂人口学结构和指数规范的研究。虽然指数的选择会受到计算负担等实际问题的影响,但新的计算方法不应因此受阻。此外,居住隔离在其他特性(如家庭构成、职业)上的显著性也要求使用和发展可以同时处理几个组别的测量方法。上文提到的一些方法(如熵指数、空间接近性)已经可以处理多分支问题,进行多组别及组内隔离分析的成熟发展将指日可待。一个相关发展就是对对照组价值的关注。只有明确指出存在一个对照或对比组,有关隔离的二分法计算才行得通。因此,在传统西方对种族隔离的研究中,通常是以加拿大人(拥有英国和法国血统)或盎克鲁人(非西班牙裔白人)为对照组。一旦破坏了这个定位,研究者就需要寻找新的方法来总结各组之间的相对位置,或者一种在所有群组之间测量隔离的方法。对照组问题最关键地表现在用隔离指数来测量社会距离或社会融合之时,这种情形在美国和西方研究中尤为常见。当不存在明确的对照组时,利用数据降维精简技术,如多维标度或聚类分析,在展示群组之间的相对位置时起到很大作用。另外,多分类的多元指标在这方面也很有用。
隔离分析领域一个普遍的挑战在于如何控制住其他变量特性的问题。例如,研究者想要计算不同社会经济群体间的隔离现象,就需要控制住年龄和其他生命周期变量。虽然有学者也曾进行过这方面的研究,却鲜有人使用一套完整的有多个控制变量的形式。新的数据生产和处理技术的发展将会促进相关研究,如多层次和微观层面上的数据库为我们提供了一些进行探索研究的机会,数据开发、管理和计算的技术也会帮助研究者跨越相关挑战。另外,一些统计机构拥有的包含多层次地理信息的众多数据表格很快也会不受版权限制地投入使用。在这些数据中,研究者可以直接使用多元回归或模拟不同辅助变量的值来进行邻近或隔离的测量。
与之相关紧密的最大挑战在于如何进行跨时间和空间的比较。隔离已成为社会福利的关键指标,虽然还没有像失业率,测量收入水平的基尼系数那样广为流传,但对居住隔离的测量常被用来作为社会状况的指示。现在的挑战就在于,利用这些改进后的指数和数据管理技术,重新展开对隔离的分析。学界似乎存在一种强烈的共识,即对隔离的比较研究极难开展*Lloyd, Christopher D., Ian G. Shuttleworth, and David W. Wong. 2014. Social-Spatial Segregation Concepts, Processes and Outcomes. Bristol: Policy Press. Retrieved October 12, 2015 (http://public.eblib.com/choice/PublicFullRecord.aspx?p=1778794).,其原因如下:首先,不同社会间的空间单位鲜有可比性。因此,稍大或稍小的空间单位(或者根据稍有不同的空间标准划分的单位)将会导致计算出的指数与实际内在真实的居住模式存在进一步的偏差。这当然也是上面讨论过的可塑性面积单元问题一种跨国界的版本。
再次重申,对中等收入国家及新兴经济体国家的居住隔离研究没有必要炒过去西方研究的剩饭,亦步亦趋,照葫芦画瓢。新兴的当代社会以及随之出现的数据也许将引领该领域的研究走向新的未来。
(责任编辑:陆影)
朱格,中国人民大学人口学系硕士研究生。张月飞,中国人民大学人口学系硕士研究生。
[中图分类号]C912.6
[文献标识码]A
[文章编号]1003-4145[2016]01-0096-11
基金项目:本文系教育部重大课题攻关项目“中国流动人口社会融合研究”(项目号:13JZD024)的阶段性成果。
作者简介:Michael J. White,美国布朗大学社会学系教授。Rebecca Wang,美国布朗大学社会学系博士研究生。
收稿日期:2015-12-02