双重差分模型在社区干预研究效果评价中的应用
2013-12-04刘小宁高文龙
刘小宁 高文龙 颜 虹△
在以人群为研究对象的社区干预研究(community intervention trial)中,干预人群和对照人群有时无法随机选择,例如,在地甲病高发区实施碘盐干预,自来水加氟干预等。这种无随机安排测试对象,在较为自然的情况下进行实验处理的研究方法,称为准实验研究(semi-experimental study)。双重差分法(difference in difference approach,DD)在经济学和社会学领域中应用较多,是政策分析和工程评估中广为使用的方法,通常用于估计一项政策或工程给作用对象所带来的净效益的一种计量经济学方法〔1-2〕。本研究运用DD法的原理,用于社区干预准实验研究的效果评价。
研究资料
本研究资料为西安交通大学医学院完成的“农村初级卫生保健项目(2001~2005周期)”中家庭问卷调查资料〔3〕。该调查于2001年在西部9个省区45县展开,以“提高农村孕产妇住院分娩”为核心内容,选定了孕产妇卫生保健服务利用水平较低的10个县作为项目干预县(干预组),实施4年,于2005年进行了评估。以分别在2001和2005年均接受调查的非干预县作为对照组,进行干预效果评价。
模型原理
采用固定效应估计方法,DD模型的基本设定为:
假设i=1为干预,i=0为非干预;t=1为干预后,t=0为干预前;yit为在干预措施下某时间点上结果变量的平均值。那么,干预组与非干预组某个指标的差异(y11-y01)为干预后干预措施的效应;在考虑到干预前两组间的差异时,干预措施的效应则应是(y11-y10)-(y01-y00),即为双重差分的干预效应。在上述模型中,虚拟变量group×time项的系数β就是在控制了时间效应和其他协变量后干预效应的估计值(differencein-difference estimator),Xit为可以观察到的影响因变量的控制变量,εit是随机误差项,代表了因时而变且影响因变量的那些非观测因素。
本研究数据结果见表1。以产前检查为例,在干预组,干预前后的差异为15.7%,对照组干预前后的差异为9.7%,这个差值反应了两组在干预前后产前检查率的变化,为一次差分值;而两组产前检查率变化的差异值6.0%反应了干预措施的效应,为二次差分值。但是该值为一点估计值,是否由干预措施促进了产前检查率的提高,需要做假设检验。其次,产前检查受到妇女人口社会学特征及就医环境的影响,而这个差值并没有考虑到这些因素的影响。所以,这个估计值存在着误差。
表1 2001~2005年西部农村地区孕产妇卫生保健服务利用状况
分析结果
采用stata version 9.2(Stata/SE 9.2 Stata Corporation,College Station,TX,USA)软件拟合模型,分析结果如下。
1.模型一:拟合无协变量模型
从表2看出,在不考虑影响产前检查因素的情况下,干预措施的实施使得干预地区的产前检查率提高了5.8%,孕早期检查率提高了13.4%,住院分娩率提高了23.1%,动员住院分娩率下降了5.0%。这个结果与表1中经二次差分的结果一致。
2.模型二:拟合含协变量模型
纳入模型的协变量有妇女年龄(连续性变量);妇女家庭人口数(连续性变量);妇女文化程度(连续性变量);妇女民族(二分类变量,0为少数民族,1为汉族);家庭经济状况(连续性变量);调查村与乡镇距离(连续性变量)。表3结果显示,在考虑到妇女社会人口学特征和居住地理环境等因素对产前检查的影响后,干预措施的实施使得干预地区的产前检查率提高了5.2%,孕早期检查率提高了12.0%;住院分娩率提高了22.5%;对动员住院分娩率无影响。
表2 无协变量的DD模型估计值
表3 含协变量的DD模型估计值
讨 论
由于干预措施实施后的效应有滞后性,本研究设计选择了在干预措施实施后4年进行评估,减小了对估计干预效果的偏误。此类含有时间序列的截面数据在不同时期上的数据来自不同样本,是对同一截面单元集的重复观测〔1-2〕,DD法很好地解决了时点上个体不对应的重复测量问题。本研究中干预措施的实施可以类比于自然科学实验中对实验对象施加的某种“处理”,使得社会中个人的环境发生改变的外生事件,这相当于是一个“自然实验(natural experiment)”的过程。DD法的主要思路就是利用一个外生的公共政策所带来的横向单位和时间序列的双重差异来识别公共政策的“处理效应”,在本研究中,即为干预措施实施的效果。
影响准实验方法用于政策评估的有效性的一个主要方面是“随机性”问题,如果干预的对象不是被随机分配的,则双重差分估计会存在一定的偏误〔4〕。由于受干预的地区和对照地区在干预前就存在系统性的差异,两类地区在变化趋势上不同,会使得干预组与对照组在没有干预的情况下的增长趋势不同,从而使得双重差分估计量产生偏误。在拟合模型时,加入了其他控制变量(调查妇女人口社会学特征和就医地理环境因素),并取差分,在一定程度上可以解决这一问题。也有研究在模型中加入了因变量的滞后项期望控制因变量差异及增长趋势差异对差分估计量的影响〔5〕。
1.周黎安,陈烨.中国农村税费改革的政策效应:基于双重差分模型的估计.经济研究,2005,8:44-53
2.东梅,王桂芬.双重差分法在生态移民收入效应评价中的应用——以宁夏为例.农业技术经济,2010,8:87-93.
3.Liu XN,Yan H,Wang DL.The evaluation of“Safe Motherhood”program on maternal care utilization in rural western China:a difference in difference approach.BMC Public Health,2010,10:566.
4.Mayer,Bruce D.Natural and quasi-experiments in economics.Journal of Business & Economic Statistics,1995,13(2):151-161.
5.孙志军,杜育红,李婷婷.义务教育财政改革:增量效果与分配效果.北京大学教育评论,2010,8(1):83-191.