APP下载

非概率抽样在隐藏人口研究中的应用

2018-10-21魏慧楠

科学导报·学术 2018年11期

魏慧楠

摘 要: 隐藏人口通常是像吸毒者、无家可归者、同性恋以及艺术家这样的特殊人群,在实际调查中,调查者几乎无法直接接触到这类人群。 隐藏人口的一大特性是缺乏抽样框,通过传统的抽样方法几乎不能找到隐藏人口的成员,因此需要引入非概率抽样。目前,应用于隐藏人口研究的抽样方法有滚雪球抽样、同伴驱动抽样、捕获再捕获抽样等。

关键词: 隐藏人口;滚雪球抽样;同伴驱动抽样;捕获再捕获抽样

【中图分类号】 D569 【文献标识码】 A 【文章编号】 2236-1879(2018)11-0038-01

一、研滾雪球抽样在隐藏人口研究中的应用

滚雪球抽样是一种非概率抽样方法,先对总体中少数成员开始调查,再通过这些成员寻找他们所知道的符合要求的新的总体成员,样本就这样像滚雪球一般越来越大。滚雪球抽样在1959年首次被Coleman提出,也被称为链式推举抽样法,他认为传统的调查研究方法忽视了社会结构和个体之间的联系,并基于此提出了重视个体关系的滚雪球抽样。

在国内,陈怡在广西壮族自治区多个市县设立HIV监测哨点,每年4月和7月由统一培训的工作人员通过滚雪球抽样及连续采样(强戒所)的方法对吸毒人员开展面对面访谈,获取一般人口学、行为学等信息,并采血3-5ml检测 HIV、梅毒及丙型病毒性肝炎(丙肝),分析了2007-2012年广西壮族自治区吸毒人群人类免疫缺陷病毒阳性率及相关危险行为的变化趋势。

二、同伴驱动抽样在隐藏人口研究中的应用

RDS方法是一种由滚雪球法改良而来的近似概率抽样方法,是由调查对象从其社会网络中招募同伴参加研究,并通过获得的社会网络特征对总体特征做出渐进无偏估计和推断。RDS方法源自于传统的滚雪球抽样方法,不同于以往的方法,RDS采取双重激励机,即对象参加调查获得初级激励,作为因调查而耽误的时间的补偿;每介绍一个符合条件并完成调查的同伴,还会获得一定的额外补偿,即次级激励。此外,每个前来领取次级奖励的对象还将接受一个有关联系卡接受者和拒绝者的问卷调查,以评估招募过程中存在的选择和无应答偏倚。

RDS最早于1994年由Heckthom在美国康涅狄格州的IDU人群中对传统的链式推举法改良而来。目前,RDS已在包括中国在内的20多个国家、100余项有关HIV和其他生物或行为学研究中被应用。研究涉及的危险人群有静脉注射吸毒人群、男同性恋人群、性工作者和有高危行为的异性恋男性。

李婧于2009年10月至2010年1月,在广西壮族自治区柳州市女性性工作者(female sex worker,FSWs)人群中应用RDS方法,由7名种子开始,利用FSWs人群的社会网络由同伴招募研究对象,共招募到583名合格的FSWs,而RDS发现了更为隐蔽的只通过电话招揽客人的FSWs。此外,鲍宇刚等在全国大中城市中按整群抽样法抽取了14个城市,然后采用同伴推动抽样法(RDS)征募调查对象,问卷设计参考国家艾滋病综合监测调杏问卷,由经过培训的调查员严格按操作规程在私密房间进行调查,共选取了6101例MSM进行问卷调查。运用RDSAT软件、SPSS13.0对调查数据进行统计学分析,对男男性行为人群的艾滋病感染状况及艾滋病知识、态度、行为进行了深入研究。

三、捕获再捕获抽样在隐藏人口研究中的应用

捕获再捕获的思想源于对生物种群规模的估计。早在 1786 年,Laplace 就已使用捕获再捕获抽样方法估计法国人口总数;1895 年,Petersen 使用捕获再捕获抽样估计鱼的总数;1930 年 Lincoln发展了 Petersen 的捕获再捕获抽样估计量,即为Lincoln -Pete rsen 估计量(简称为 LP 估计量), 并较好估计了野鸭总数;由于LP估计量在特殊情况下无法满足估计要求,Chapman对LP估计量进行了改进,提出了Chapman估计量。目前,在捕获再捕获抽样的实际应用中,采用的捕获再捕获抽样估计量主要有两种:LP 估计量和 Chapman估计量;同时,还有很多学者根据实际需求对估计量进行了改进。

目前,捕获再捕获抽样在隐藏人口的研究中得到了广泛应用。

在国外,Brittain探讨了捕获再捕获抽样方法在人口规模的应用,运用两个资源的注册人口数据,根据捕获再捕获估计量对流行病人群总体规模进行了估计。Marinus提出的B图采样设计可以看做是一个多重捕获再捕获抽样过程,对荷兰乌特勒支地区的吸毒人员规模进行了估计。

在中国,张高辉等应用捕获再捕获方法评价了山东省居民 2012-2013 年死因登记漏报率水平。首先,采用分层整群随机抽样法,在山东省所有县(市、区)按照 2012 年死因登记系统报告死亡率进行分层抽样和简单随机抽样,共抽取 10 个村(居委会)。然后,从以上地区所在公安、民政和村(居委会)搜集人口死亡情况,作为数据来源一;山东省居民 2012-2013 年死因登记系统已报告的死亡资料,作为数据来源二。最后,按照捕获再捕获原理,基于两个数据来源,计算出死亡总数的 Chapman 估计量,进而得出漏报率。

参考文献

[1] 李婧.《同伴推动抽样法在性病艾滋病防治目标人群研究中的应用》[J].中国艾滋病性病.2009.

[2] 鲍宇刚.《我国14城市男男性行为人群艾滋病感染状况及艾滋病知识、态度、行为研究》[J]. 中华预防医学杂志.2009.

[3] 杨贵军.《捕获再捕获抽样估计量的模拟研究》[J]. 统计与信息论坛.2011.

[4] 寇庆河.《捕获再捕获法及其在流行病学研究中的应用》[J].中国卫生统计.2006.

[5] 李姚矿.《隐藏人口的抽样方法综述》[C].软科学国际研讨会. 2012.

[6] 张高辉.《应用捕获再捕获方法评估山东省死因登记漏报率水平》[J].中国慢性病预防与控制. 2015.

[7] 吴艾琳.《基于同志网站利用捕获-再捕获法对重庆市男男性接触者人群规模估计的研究》[J].中国预防医学杂志.2014.