中国上市公司股权激励效应再评估来自PSM+DID的新证据
2018-02-28屈恩义朱方明
屈恩义 朱方明
摘要:关于股权激励与公司业绩关系问题,文章从方法论视角进行了审视,提出正确认识并使用处理内生性问题的方法,是精确评估股权激励效应的前提。传统PSM无法实现不可观测因素的匹配导致样本自选择偏误仍部分存在,文章采用改进的PSM+DID,评估发现:股权激励总体上提升了以净资产收益率和总资产收益率衡量的公司业绩,提升幅度分别达到22.22%和19.51%;从动态视角看,随着年份的推移,公司业绩提升速度逐渐放缓,股权激励呈现出边际效应递减规律。而通过对比PSM+DID与传统PSM评估的结果,文章证实PSM的确高估了股权激励效应,PSM+DID的评估结果更加精确和稳健。此外,文章还证实,宏观经济形势并不会对股权激励效应产生影响,因担心宏观经济形势拖累股权激励效应而中断实施股权激励的思维存在一定的误区。
关键词:股权激励;公司业绩;倾向得分匹配法;基于倾向得分匹配的双重差分法
中图分类号:F272.923 文献标志码:A 文章编号:1008-5831(2017)06-0049-11
一、研究背景与问题
作为一项协调股东与高管间利益冲突,缓解代理问题的公司内部治理机制,股权激励最近十年来广为中国上市公司采用,截至2015年,共有18个行业共计715家上市公司公布了股权激励方案。2016年7月13日,证监会正式发布《上市公司股权激励管理办法》,对已有股权激励相关政策文件进行了整合和修正,自此,中国上市公司实施股权激励的制度环境趋于完善。然而,实践中,仍然存在着大量上市公司在实施股权激励后业绩大幅下滑的案例,激励方案中断实施的现象也多有出现。股权激励与公司业绩的真实关系成为一个备受关注的问题。对此,学者们展开了大量研究,并出现了三种观点:第一种认为股权激励正向促进了公司业绩的增长,表现为利益趋同效应;第二种认为股权激励与公司业绩无关或呈负相关关系,表现为壕沟效应;第三种观点认为,股权激励与公司业绩存在区问效应,利益趋同效应和壕沟效应交替出现。对于实际评估结果存在的分歧,从方法论上看,可能与研究方法的选择有关,不同研究方法在解决股权激励内生性问题方面存在差异。特别地,当研究方法存在缺陷或被不当使用,股权激励与公司业绩的关系可能被高估也可能被低估。因此,正确认识并使用处理内生性问题的方法,是精确评估股权激励效应的重要前提。
已有研究表明,股权激励受到来自公司治理结构、股权结构、所处行业特征等因素的影响,同时公司业绩会反向决定股权激励,此外,一些不可观测的因素也会对股权激励产生影响,股权激励因而呈现内生性特点。为解决股权激励效应评估中的内生性问题,除传统的面板数据方法、两阶段最小二乘法、三阶段最小二乘法等方法外,近年来,有越来越多的学者尝试使用宏观政策效果评估领域应用广泛的倾向得分匹配法(PSM)。PSM方法通过多维匹配,克服了传统匹配方法的维数“诅咒”,一定程度上降低了样本自选择偏误(sample-Selection Bias)。
然而,我们认为,PSM方法自身的局限以及现有研究在实际应用PSM方法中存在的误区,将导致采用PSM评估的结果仍然存有部分误差。从原理看,PSM方法是通过对影响股权激励的变量进行Logit回归,计算每家公司实施股权激励的概率(PS值),并基于PS值进行匹配分析。然而,正是由于Logit回归中只能纳入可观测变量,基于PS值配对的样本组仅仅实现了可观测变量的无显著差异,而在不可观测因素上仍然存在差异,因而,样本自选择偏误仍部分存在。当前研究大多忽视了这一点。除PSM本身的缺陷外,当前研究在对PSM方法的使用上也值得商榷。在构建Logit模型的环节,某些研究并未控制年份变量,这就导致PS值中缺少年份信息,并由此造成“跨年匹配”。“跨年匹配”的问题在于,当激励公司相对匹配的未激励公司处于宏观经济形势较好的年份,股权激励效应可能被高估;而当激励公司相对处于宏观经济形势较差的年份,股权激励效应则可能被低估。此外,某些研究在计算Ps值时,把激励公司实施激励当年之后的各年样本也算作激励样本纳入了Logit回归,但由于多数激励公司在此之后并未再公布新的激励计划,而PS值定义的是新实施股权激励计划的概率,这就导致计算的PS值存在误差。
有鉴于此,本文将在现有研究基础上作如下改进:对于PSM方法本身的缺陷,在PSM基础上引入双重差分法(DID),以消除不可观测因素对公司业绩的影响,提高股权激励效应评估的精确性。在具体应用PSM方法环节,以激励实施前一年的样本作为推断第二年股权激励实施概率的样本,并删除激励实施后的各年样本。在进行了Logit回归并计算得到PS值后,采用“同年匹配+同年检验”的方式,以消除“跨年匹配”带来的样本自选择偏误。
二、研究设计
在自然科学领域,评估一项技术的试验效果可以通过自然实验(Natural Experiment)的方法,由于处理组和控制组样本是随机选取的,因此该项技术试验实施后处理组与控制组的差异即可归结为技术试验的效果。然而在社会科学领域,评估一项政策实施效果前很难做到处理组与控制组样本的随机分配,为此,实验者往往需要采用某种规则(Criterion)对样本进行处理,为处理组样本找到一个“反事实”的比较组,以消除参与的选择性偏差(selection Bias)。考虑到现实中只能观察到一个对象处于处理组或控制组一种状态的结果,要找到绝对的“反事实”样本没有可能,所以往往需要通过配对的方法来控制两组样本的差异。但是鉴于同时影响政策决议和政策效果的变量并非唯一,并且存在配对维数“诅咒”:即配对维数越多,配对效果越差,传统方法匹配的两组样本仍然存在较大差异。
不同于传统方法的逐一匹配,倾向得分匹配法通过将多元变量浓缩成一个倾向得分(PS值)来选择配对样本,实现了多元匹配。以股權激励为例,PSM方法的匹配步骤如下。
第一步,获取倾向得分值。endprint
所谓“倾向得分”,就是在给定样本特征X的情况下,某公司实施股权激励的概率,即:
其中,D是一个指标函数,若公司实施股权激励则D=1,未实施则D=0。
在实证分析中,倾向得分通常采用Logit或Probit等概率模型进行估计:
第二步,选择匹配方法。
上述步骤得到的Ps值是一个连续变量,因此我们很难找到两个倾向得分完全相同的样本进行匹配。为解决这一问题,有多种匹配方法可供选择:最近邻匹配法(Nearest Neighbor Matching)通过寻找与处理组样本Ps值差值最小的控制组样本实现匹配;半径匹配法(Radius Matching)首先预设一个常数作为匹配半径,再寻找与处理组样本Ps值的差值小于匹配半径的控制组样本实现匹配;核匹配法(Kernel Matching)的基本思想是在控制组样本中选取与处理组样本相同或相近的一个或几个特征,生成虚拟样本,实现匹配。
第三步,共同支撑假设检验和平行假设检验。
在完成第2步的初步匹配后,分别计算两组样本的平均Ps值,并检验有无显著差异,即共同支撑假设检验(Common Support Assumption Test)。然后检验两组样本各公司特征变量的均值是否存在显著差异,即平行假设检验(Balancing Assumption Test)。两个假设检验都通过则说明两组公司除股权激励实施与否这一差异外,在公司特征层面无显著差异。
然而,如前所述,PSM的原理决定了其存在一定的缺陷:通过概率模型筛选出的只能是公司可观测变量,事实上,股权激励决策还受到两类公司不可观测因素的影响,因而,基于PS值配对的两组样本仍然存在着一定的样本自选择。在这种情况下,除实施股权激励与否会产生两类公司的业绩差异外,不可观测因素差异也会带来业绩差异,因此,通过比较配对公司的业绩差异评估的股权激励效果并不准确。为提高评估结果的精确性,本文将DID引入PSM,原理如图1所示。
由图1可知,激励公司(D=1)在激励前后的业绩变化包含三部分:(1)激励效果;(2)宏观环境作用公司可观测变量带来的业绩变化;(3)宏观环境作用公司不可观测因素带来的业绩变化。对于未激励公司(D=0),业绩变化包含两部分:(1)宏观环境作用公司可观测变量带来的业绩变化;(2)宏观环境作用公司不可观测因素带来的业绩变化。由于在基期(T=0)进行了PSM同年匹配,且配对样本的时间跨度相同,因此宏观环境作用可观测变量带来的业绩变化在两类公司间无显著差异。又因为不可观测因素在短期内不变②,且其对公司业绩的影响程度短期内不变,因此,对两类公司而言,宏观环境作用不可观测因素带来的业绩变化均为零。最终,二次差分的结果即为股权激励效果。
考虑到本文的数据结构中激励公司样本数较少,在对两类公司进行匹配时,如果采用半径匹配会进一步牺牲激励公司样本,进而出现小样本偏误;而核匹配由于要将所有的控制组样本都赋予权重纳入匹配,其原理决定了核匹配更适用于控制组样本数远小于处理组样本数的数据结构以充分利用控制组信息,而本文激励公司数远小于未激励公司数,如果采用核匹配会因为未激励公司的很多无用信息导致匹配误差较大。因此,本文的匹配方法选用最近邻匹配法。
另外,由图1可知,对配对公司二次差分的前提是两类公司所处年份一致、时间跨度一致,因此配对时需采用“同年匹配+同年检验”的方式,即不能出现类似“2012年的激励公司匹配2014年的未激励公司”的情形。
基于上述分析,PSM+DID的具体操作步骤如下。
第一步,先保留每家激励公司实施股权激励上一年度(基期)的样本(比如2007年实施激励的公司就保留其2006年的数据,2008年实施激励的公司就保留其2007年的数据,以此类推)和所有未激励公司。
第二步,进行逐步Logit回归,选出显著影响股权激励决策的变量,并计算PS值。
第三步,为每一个激励公司样本匹配一个同年的未激励公司样本,保留配对成功的样本。匹配完成后,对每年的配对样本进行共同支撑假设检验和平行假设检验,保留通过检验的配对样本。
第四步,DID分析。用于DID分析的模型如式(3)(4)(5)所示,各式中,△Performanceiit代表配对公司的业绩相对基期的增量,为研究股权激励效果的时间趋势,本文的业绩观察时点从激励当年一直延伸到激励第三年,Incentiveit为是否实施股权激励的虚拟变量,ControlVariable为一系列控制变量,系数A1是本文关注的焦点:如果A1显著大于0,表明股权激励有效地提高了公司业绩,如果A1不显著或显著小于0,则表明股权激励失效。
三、數据描述及统计分析
(一)变量的定义与设计
按PSM+DID原理,首先需要确定可能影响股权激励决策的变量。考虑到股权激励作为一项公司内部治理机制,与其他治理机制可能相互影响,而公司财务状况、现金流等也可能是其实施的客观条件,同时高管个人特征也可能会影响激励决策,本文将公司上期业绩、股权结构、治理状况、现金流、成长性、高管年龄、所处行业等因素纳入Logit回归模型。考虑到不同年份的宏观环境可能会对股权激励决策产生影响,回归还加入了年份虚拟变量。待回归变量的含义及统计结果如表1所示。而对于公司业绩的衡量,本文选用扣除非经常性损益后的加权平均净资产收益率(ROE)和总资产收益率(ROA)。与已有研究不同,本文并没有选用托宾Q值衡量公司业绩,主要原因在于托宾Q值的构造以公司股票价格为基础,主要反映远期投资机会,而本文的研究区间相对较短,更适宜选用反映短期业绩的指标。本文也没有使用一些文献采用的每股净收益来衡量公司业绩,因为每股净收益是绝对指标,不能反映投资回报和资产营运效率高低。endprint
(二)数据来源及处理
本文机构投资者持股数据来自锐思数据库,公司所在地区信息来自Wind数据库,市场指数由《中国市场化指数2011》及互联网资讯副汇总而成,其他数据均来源于国泰安数据库(CSMAR)。本文以2007年到2015年公布了股权激励方案的上市公司作为处理组样本,并剔除中途取消方案的公司。对于首次公布激励方案后若干年又再次实施新的激励方案的公司,仅保留首次激励的样本。对同一年采用不同激励方式的公司,仅保留其中一种激励方式的样本。与此相对,以2007年至2015年从未实施股权激励的公司作为控制组样本。
对于原始样本,(1)剔除金融类公司和ST、S类公司;(2)剔除B股、H股;(3)删除数值缺漏的样本;(4)对全体变量进行Winsorized缩尾处理以降低离群值的影响。
四、模型估计与实证分析
(一)匹配结果
通过Logit回归从表l筛选出显著影响股权激励决策的变量,限于篇幅,Logit回归结果未在文中展示。根据回归结果计算每个样本的Ps值,并为每一家激励公司匹配一家同一年的未激励公司,保留配对成功的样本,并分年进行共同支撑假设检验和平行假设检验。最终2014年、2012年、2011年、2010年的配对样本通过检验,检验结果以2014年为例说明。由图2可知,经配对后的样本问的Ps值分布情况基本无差别,通过共同支撑假设检验;而由表2可知,配对样本问股权激励影响变量无显著差别,通过平行假设检验。由此可进行下一步DID分析。
(二)股权激励效应评估
DID回归前首先需要通过F检验、LM检验、Hausman检验,从式(3)(4)(5)中选择合适的回归模型,限于篇幅,检验过程省略。回归结果如表3所示。当以净资产收益率衡量公司业绩,表3中第(1)列INCENTTVE系数为0.016,在1%水平显著为正,表明股权激励显著提高了激励当年的净资产收益率。第(2)列INCENTIVE系数为0.021,在1%水平显著为正,表明股权激励显著提高了激励第二年的净资产收益率,公司业绩在前一年基础上有了进一步提升。而到了激励第三年,股权激励效果有所减弱,表现在第(3)列INCENTIVE系数为0.020,只在10%水平显著,无论是系数大小还是显著性都不及激励第二年。从这一回归结果我们收获了两点认识:(1)股权激励的实施总体上有助于公司业绩的提升;(2)从动态视角看,在实施股权激励后,公司业绩的增长随着年份的推移,速度逐渐放缓,股权激励呈现边际效应递减特点。
改用总资产收益率衡量公司业绩。由表3第(4)列可知,INCENTIVE系数为0.009,在l%水平显著,表明股权激励的实施显著提高了激励当年的总资产收益率。第(5)列INCENTIVE系数为0.011,在1%水平显著,相较前一年,激励效果进一步增强。第(6)列INCENTIVE系数为正,但不显著,说明股权激励效果已经衰减。由此可知,同净资产收益率一样,以总资产收益率衡量的公司业绩在股权激励实施后总体上有所提升,并且随着年份的推移,公司业绩的提升速度逐渐放缓,这一现象依旧反映了股权激励的边际效应递减规律。
五、进一步分析
(一)PSM+DID是否降低了不可观测因素带来的样本自选择偏误
从原理上看,传统PSM因为只能实现可观测变量的匹配,故而仍存有部分样本自选择偏误,而PSM+DID通过二次差分,剔除了不可观测因素对公司业绩的影响,将进一步降低样本自选择偏误。那么,是否同原理预期的一样,PSM+DID有效降低了传统PSM存在的样本自选择偏误?本部分将对二者的评估结果进行对比。为使结果具有可比性,两种方法所选用的原始数据与样本预处理过程均一致。不同之处在于,PSM+DID在采用Logit模型筛选出变量并计算得到PS值后,进行了分年匹配与检验,并进一步采用DID方法进行了回归分析;而PSM在利用Logit模型筛选出变量并计算得到PS值后,直接进行了匹配与检验,紧接着计算出ATT(平均处理效应)。
采用传统PSM评估得到的结果如表4所示。表4中,ROE在匹配前的ATF为0.053,而匹配后的ATT为0.023,说明未经PSM处理前,处理组和控制组的业绩差异包含了股权激励效应和样本自选择偏误两部分;而经PSM处理后,样本自选择偏误一定程度上得到了削减,两类样本的业绩差异已经接近真实的股权激励效应。此外,经PSM处理后,股权激励效应的t值也明显降低,评估结果更加稳健。对ROA的解释与ROE类似。
然而,与PSM+DID的评估结果对比,可以发现,PSM评估的结果中仍然含有部分的样本自选择偏误。如表3所示,当用ROE衡量公司业绩,PSM+DID评估的股权激励当年的效应为0.016,无论系数大小还是显著性,均小于采用PSM评估的结果(表4中ROE系数为0.023,t值为4.26);当改用ROA衡量公司业绩,表3中第(4)列的股权激励效应系数为0.009,t值為2.90,表4中ROA的ATT系数为0.010,t值为3.28,PSM+DID评估结果的系数和t值仍然较小。PSM+DID相对PSM评估系数及t值的降低正是样本自选择偏误被进一步剔除的结果。
因而从两种方法评估结果的对比中,我们看到,正如方法原理所预期的,传统PSM由于无法实现不可观测因素的匹配,将导致评估的结果存在一定的样本自选择偏误,股权激励效应被高估⑧。而PSM+DID通过剔除不可观测因素对业绩的影响,降低了样本自选择偏误,提高了评估结果的精确性和稳健性。
(二)宏观经济形势是否会影响股权激励效应
如本文开篇所述,中国上市公司股权激励实践中出现了不少激励方案中断实施的情形,而公布的理由多是对宏观经济形势不乐观,进而对股权激励能否达到预期效果缺乏信心。因而,在潜意识里,这些上市公司将宏观经济形势与股权激励效应联系在一起,认为宏观经济形势不好将对股权激励效应产生负面影响。那么,这样的判断是否正确?宏观经济形势是否对股权激励效应产生了影响?本部分将对此进行检验。endprint
对于本文回归所用的2014年、2012年、2011年、2010年配对样本,考虑到2010年配对样本所在年份GDP增长率相对较高,如果宏观经济形势对股权激励效果产生了明显的影响,那么剔除2010年配对样本后回归得到的股权激励效应将明显下降。基于此,本文以2011、2012、2014年配对样本组成的混合样本再次评估股权激励效应,并与前文的评估结果进行对比。表5展示了剔除2010年配对样本后的回归结果。可以发现,表5中各列INCENTIVE的系數相比表3中各列INCENTIVE的系数并没有明显的改变,说明,剔除掉宏观经济形势较好年份的配对样本,股权激励效应并没有明显降低,宏观经济形势未对股权激励效应产生显著影响。这提示,不乐观的宏观经济形势不应成为上市公司实施股权激励的阻碍,相反,上市公司还应积极利用股权激励对公司业绩的提升作用走出业绩泥潭。
六、结论
本文从方法论视角探究了中国上市公司股权激励与公司业绩关系问题,提出,正确选择和使用处理内生性问题的方法是精确评估股权激励与公司业绩关系的前提。针对传统PSM在评估股权激励效应中存在的无法实现不可观测因素匹配,导致评估结果仍然存在一定的样本自选择偏误,本文进行了研究方法的改进,采用PSM+DID重新审视了股权激励与公司业绩的关系。
研究发现,股权激励的实施总体上有助于公司业绩的提升,表现为公司净资产收益率(ROE)和总资产收益率(ROA)在股权激励实施后均有不同程度的增长。以ROE为例,激励实施当年,ROE增长了0.016个单位,如果以全行业平均ROE作为基期数据,则ROE的增幅达到了22.22%。另一业绩指标ROA在激励实施当年的增幅也达到了19.51%。而且由于剔除了样本自选择偏误,这样的业绩增长均是由股权激励带来的。除此之外,本文还发现,随着年份的推移,股权激励对公司业绩的边际提升效应递减。这说明,与生产要素的投入具有边际产出递减规律类似,制度创新同样也具有边际效应递减规律。这就要求我们在实施相关制度的时候,一方面考虑制度的时效性,另一方面动态优化制度设计,以提高制度的长效性。
为了证明PsM+DID相对于传统PsM的先进性,本文还对PsM+DID和PsM评估的股权激励效应进行了比较。结果发现,传统PsM高估了股权激励效应,根源在于PsM无法实现不可观测因素的匹配,导致评估结果仍然存有部分样本自选择偏误。相比之下,PsM+DID评估的结果更精确也更稳健。
此外,针对当前中国上市公司股权激励方案中断实施的现象,本文认为,因担心未来宏观经济形势拖累股权激励效果而停止实施股权激励的思维,存在一定的误区。检验证实,宏观经济形势并不会对股权激励效果产生明显的影响。因而,宏观经济形势不佳不应成为上市公司实施股权激励的障碍,相反,上市公司还应积极利用股权激励,助力公司业绩走出泥潭。
(责任编辑 傅旭东)endprint