人口普查中捕获?鄄再捕获方法的历史发展
2017-09-04蒋耀萱
蒋耀萱
【摘要】对于准确的人口普查的重要性不能被过分强调。随着人口在测量过程中遇到持续不断的问题,更多的创新技术被用于调整初始人口普查中的不完全统计。本文借助国外学者相关文献,回顾了捕获-再捕获方法在人口普查中的历史发展,以期对国内传统的人口普查质量的提高提供策略。
【关键词】人口普查;捕获-再捕获;质量
引言
世界上大多数国家通过直接登记的人口调查,行政系统或者结合上述方法的部分或全部的混合方案,进行定期的人口普查。人口普查的质量取决于对人口调查的覆盖面。然而历史的经验表明,实现高覆盖率是相当困难的。当调查和普查存在相对较低的覆盖水平时,捕获-再捕获方法的估计精度面临着人口漏报的困难。近几十年来,许多国家在进行传统的人口普查时遇到了过少登记的问题,这也成为西方国家一直以来面临的挑战。
本文希望借助国外学者相关文献,将其对捕获-再捕获方法在人口普查中历史发展的研究引入到国内,以期对国内传统的人口普查计数提供经验,进一步提高人口普查的质量。
一、捕获—再捕获方法的起源
捕获-再捕获估计的模型和方法起源于人口数量的测量,最早可以追溯至18世纪拉普拉斯试图测量1786年法国的人口。但是由于其直观的吸引力,始终在生态学上有着坚实的基础。捕获-再捕获方法主要用于估计生态种群,Petersen(1896)和Lincoln(1930)的工作集中在用此方法估计生活在自然和野生栖息地的鱼类和水禽种群的规模。1949年,Chandrasekar和Deming利用人口登记和调查将该方法应用于出生率和死亡率的估计中,对于将捕获-再捕获方法用于人口测量,后来被证明是一个重大的进步,人们将其方法定名为双系统估计,应用于人口普查估计中,来调整从人口普查和事后调查中获得的总数。
1950年美国人口普查局在人口普查中已经开始使用一项特别的调查来测量人口普查中的誤差。但是,双系统估计方法被明确使用是在1980年。通过产生一组事后可以被组合起来的数据得到过少登记人数的估计量,这也是第一次指出人口普查过少登记是非随机的,并因社会阶层和种族不成比例而变化。然而1980年人口普查估计量没有调整。因为过少登记变得在政治上很重要并且不可避免,一些对普查结果存在质疑的州政府把美国人口普查局告上法院,最初的判决有利于原告。不管怎样,必须承认的是尽管人口普查局设置了详细的程序,但是在大城市登记人口方面存在一些问题,这既需要统计上可靠,也使其成为“政治上稳健”的要求。
二、捕获—再捕获方法的发展
1980年后,学者们开始意识到实现完全覆盖几乎是一项不可能的任务。他们主张用一个统计上更加可靠的调整方法,将实现“完全覆盖”变为“接近全覆盖”。1990年的评估方案是基于人口估计和事后登记调查(PES)。PES是按照类似于以前的人口普查方式设计的,但是更加具体侧重于取样。根据1980年人口普查过少登记的分布对国家层面上的区域种族和年龄以及性别分层后,选取了国家的样本群。Hogan(1993)认为操作上1990年事后抽样调查是成功的且切实可行的,因为它在规定的时限内完成了数据处理。但是,各州的同质性假设还存在争议。例如在加州,州登记人口数是根据对国家中不同事后抽样层的综合估计,但是相同的事后抽样层可以适用于一个完全不同的州,如北卡罗莱纳州。因此,发现该综合调整具有的一些缺点归因于PES没有一个足够大的样本以促进对国家总量的直接估计。1990年人口普查后,人口普查进一步改进了普查估计方法。因为评估1990年人口普查时发现某些人口次级组更容易错过人口普查,这就是被称为有偏的或有差异的不完全统计。Hogan(1993)表明测量有差异的不完全统计量的唯一方法是大规模事后抽样调查后再进行双系统估计。因此,2000年的人口普查涉及一个初始的人口普查登记,紧随其后的是一个独立的覆盖率测量调查。在考虑了有差异的过少登记同时也产生了小范围人口估计量是相对无偏的。
据美国人口普查局在以往经验表明,人口普查过少登记的估计是完全可行的。一个被设计过的大规模事后调查应该独立于初始人口普查,这使得初始人口普查可以根据过少登记的估计进行调整,因为调查的样本不仅有利于人口普查中漏报的估计,也有利于人口普查错误登记的估计。
三、总结
目前,双系统估计方法,使用初始的人口统普查和一个事后登记调查(普查覆盖调查)。这个调查基本上是对一个小样本地区的人口的密集重复登记。调查的目的是为了评估普查中人口登记的优劣,并告知过少登记、过多登记以及响应准确性的程度。双系统方法的一个基本假设是,人口普查和调查过程是独立的,当缺乏独立性时,将偏差引入到人口估计中。然而,没有办法确定偏差的程度,除非通过一些附加信息。此外,通过人为重复或错误发生的过多登记被认为是微不足道的。因此,一个来自三方资源(一个管理记录系统)的数据被提出,作为一种增大这种偏差的方式,这也是的三系统估计的定义,相当于在生物种群应用的一个三系统捕获-再捕获方法。
参考文献:
[1]Baffour-Awuah B.Estimation of population totals from imperfect census,survey and administrative records[J].University of Southampton.2009
[2]Hogan,H.The 1990 Post-Enumeration Survey:Operations and Results[J].Journal of the American Statistical Association.1993,88:1047-1060endprint