不同模型设定下SFA模型的Stata实现
2018-09-01
(天津财经大学 天津 300222)
StataimplementationofSFAmodelunderdifferentmodelsettings
Abstract:The problem of estimation of technical efficiency is often encountered in reality,and the stochastic frontier model is one of the parametric models widely used for this problem.This article uses Stata to estimate the SFA model under different model settings,and compares the differences in estimation results.
Keywords:stochastic frontier model;model settings;panel data;stata software
一、引言
前沿生产函数测算技术效率的方法两大类,分别是非参数法和参数法。非参数法以DEA为代表;参数法以SFA为代表。DEA方法的不足之处有两点:(1)模型缺乏统计特性,不能做出更多统计分析;(2)缺乏风险考虑,将所有的对生产边界或成本边界的偏离都归因于低效率,包括数据统计上的误差。因此,在考虑投入和产出的数据选择时,要求非常严格。这样一来,研究创新效率的影响因素的难度就大大增加了。SFA方法较DEA方法有两大优点:(1)体现了随机误差项的存在,消除了估计技术效率时出现的潜在偏差;(2)可以再深入分析技术效率的影响因素,因此拓宽了SFA方法应用的适用范围。本文后续实证部分选用的方法就是SFA方法。
Stata软件是Statacorp在1985年开发的统计软件,逐渐得到了全球范围内学者的广泛应用,主要的应有领域有经济学、社会学及流行病学等[6]。目前,诸多学者做随机前沿分析(Stochastic Frontier Analysis,SFA)模型所用的软件多为frontier4.1。随着SFA模型的不断发展,frontier4.1有时并不能完全解决学者所要研究的问题。1981年Pitt和Lee第一次将SFA应用到面板数据[7],自此面板数据SFA渐渐取代了截面数据SFA成为了SFA理论和应用研究的重要组成部分。众多学者对于SFA模型的贡献在Stata软件中得到了充分的体现。
二、随机前沿模型简介
根据Kumbhakar和Lovell(2000)[1]所得的结论,实际产出、前沿产出、相对前沿技术效率三者之间有如下关系[2]
yit=f(xit;β)exp(vit-uit)
(1)
将(1)式两边取对数,得到
lnyit=lnf(xit;β)+vit-uit
(2)
随机前沿分析的目的之一就是为了预测技术无效效应,技术效率测算的是地区实际产出与生产完全有效时地区使用相同投入所能得到的产出之间的相对差异。给定方程(2),技术效率(TE)被定义为
(3)
技术效率在0~1之间,当uit=0时,TE=1,技术是有效的;当uit<0时,TE<1,技术是无效的。
关于SFA方法的模型设定参见文献[4]。本文仅展示通过具体数据利用Stata软件实现不同模型设定下的随机前沿模型。
三、Stata实证结果
本文接下来主要介绍一下Pitt和Lee(1981)、Battese和Coelli(1988)、Schmidt和Sickles(1984)、Cornwell等人(1990)、Lee和Schmidt(1993)、Kumbhakar(1990)、Battese和Coelli(1992)、Greene(2005)以及Wang和Ho(2010)的模型在Stata15软件中的实现。所有可用选项的完整说明参见对应的帮助文件。
为了更具体地看出不同SFA模型对各个决策单位效率大小估计结果的差异,我们选取了2009-2015年中国30个省份的大中型工业企业研发面板数据为样本,所用数据均来自《中国统计年鉴》和《工业企业科技活动统计年鉴》,实证估计各地区工业企业的研发创新效率,其中研发投入数据采用R&D资本存量[5]和R&D人员全时当量数据,研发产出数据采用新产品开发项目数。在具体选择生产函数时,本文选择柯布-道格拉斯生产函数形式
Y=AKαLβeZ,
(4)
其中A是R&D活动效率,Z是影响R&D活动效率的因素。取对数后,(4)式写为
lnY=lnA+αlnK+βlnL+λZ+u+ε,(5)
其中K和L分别表示研发的资本投入和研发劳动投入,误差项u表示非观测效应,ε表示特异性误差。
表1 不同模型设定下估计的的描述性统计结果