APP下载

内生变量和从属断尾偏差下的FIT社会福利效应的参数与非参数估计
——基于中国光伏产业(2010-2013)的实证研究

2017-08-07沈曦常州天合光能有限公司江苏常州213001

产业经济评论 2017年4期
关键词:断尾参数估计补贴

沈曦(常州天合光能有限公司,江苏,常州,213001)

内生变量和从属断尾偏差下的FIT社会福利效应的参数与非参数估计
——基于中国光伏产业(2010-2013)的实证研究

沈曦
(常州天合光能有限公司,江苏,常州,213001)

由于非随机抽样导致的内生变量和从属断尾问题是困扰产业组织研究的两个计量难题。传统的参数模型受制于模型形式的设定和参数估计过程的复杂性,在解决这两个问题时遗留了大量的不确定因素。本文对比了参数和非参数估计方法,发现非参数模型无论是在稳定性还是估计效率上都更胜一筹。基于这一计量方法针对中国光伏产业相关企业数据(2010-2013)的实证分析证明了FIT补贴确实存在相当规模的社会净损失,但是在过去四年中,这一损失已经大大减小,补贴的使用效率得到了显著的提高。与此同时,光伏产业已经迅速成长,自身内在的成本优化和效率提升已经取代外部的FIT补贴成为这一产业继续发展的主要动力。

非参数估计 ;从属断尾;净损失;光伏

一、引言

近年来非参数估计技术在计量经济学中起着越来越重要的作用。不受函数具体形式约束这一巨大优势,使得模型的灵活性和适用范围大大扩展。尽管缺乏一个显性的模型结构,非参数模型却能包含大量的变量,其解释力远远超过参数模型。尤其在结构模型存在争议巨大的领域,如需求结构(Hausman&Newey, 1995)、生产函数(Olley&Pakes, 1996),非参数模型提供了一个富有弹性而又便于操作的设定和估计框架。本文依托2010年以来中国光伏行业的数据①由于涉及到最新数据的授权和保密要求,本文从IHS处获得了2010-2013年的行业数据。,结合世界实行上网电价(Feed-in-tariff, FIT)的主要国家政策变化,实证估计了财政补贴在光伏组件市场需求端和生产企业之间的福利分配效应,分析了通过财政补贴形式鼓励太阳能产业发展的社会效率。

政府补贴的社会效率问题自从马歇尔时代起就一直是经济学领域一个备受争议的话题。古典经济学派基于最简单的供求曲线模型分析了政府补贴在消费者和生产者之间福利分配原理。古典模型还论证了由于补贴的存在,一部分无效率的企业免于被竞争机制淘汰,而另一部分原本处于边际状态的消费者有幸以低价买到了商品;结果导致市场配置偏离了最理想的帕累托最优状态,造成了所谓的“净损失”(deadweight loss,DWL)。②由于财政补贴,无论是针对消费者还是生产者,会同时使得消费者享受到更低的价格,企业得到额外的收益,因此补贴的一部分转化为消费者的收入,另一部分转化为企业的收益。然而由于无效率状况的存在,消费者所得加上企业所得总是小于政府补贴的支出总额,差额即构成净损失。一个详细的讨论可以参见Samuelson经济学第十八版,第8章的论述。

在过去的30多年中,针对这一理论进行的实证分析不胜枚举。Willig (1976)利用马歇尔供求模型构建了福利分析的计量经济学框架。具体的模型操作方法主要来自于Hausman(1981)和Vartia(1983)的贡献。前者建议使用一个具体的函数形式模拟供求关系,从而推导出消费者的支出方程,在估计出模型中的参数以后可以利用等价变化(equivalent variation)或是补偿变化(compensation variation)模型来计算由于外生变量冲击导致的个人福利的变化。Vartia则批评这种方法过于拘泥于函数形式的设定,同时推荐使用一种迭代的方法直接估计消费者支出的变动。然而这种方法需要预先设定一个先验的迭代函数,其中的参数设定很大程度上依赖于研究者的经验而不是客观的数据。Deaton (1986)进一步完善了Hausman的模型,通过使用泰勒展开式(Taylor-Type Approximation)来进一步精确模型的估计,但依然无法避免模型形式的争论。Newey(1994)将非参数模型引入供求模型之后,这一问题得到了有效的解决。Hausman和Newey (1995)构建起了一个非参数估计框架,实证分析了美国消费者由于汽油价格波动承受的福利损失。对比其他参数模型,该方法无论是在稳定性(Robustness)上还是精确性(accuracy)上都更胜一筹,这一估计方法很快在经济政策分析中得到了广泛的应用。Pakes et al. (1997) 将这一分析模型应用到了电信行业的分析中,研究了政府的行业管制政策对于企业效率尤其是产品升级的影响;Abadie et al. (2002)利用这一分析框架研究了美国政府对于失业者提供培训项目的社会效益;Hausman和Leibtag(2007)针对零售业竞争的社会影响力分析同样利用了非参数估计这一技术;这一框架还辅助Mercatanti(2013)研究了信用卡的发展对美国家庭消费的影响。

本文将基于这一实证模型框架,利用2010年-2013年中国光伏产业出口主要光伏国家的数据,估计各国FIT补贴的社会效应,尤其是在生产者和消费者之间的福利分配结构。相比现有的文献,本文在以下三个层面上做出了贡献:

1.在经济学理论上,Hausman和Newey提出的计量模型在应用到汽油市场的实证分析中仅仅研究了消费者剩余的变化,而没有讨论对于生产者福利的影响。鉴于这四年中,光伏行业经历了一个由快速扩张转为产业重组的背景,有必要研究生产者在贸易争端和FIT调整中受到的福利影响。一些学者(杨帅,2013)指出光伏行业过于依赖政府补贴政策,自身的生产效率提升过于缓慢,导致了在外部环境发生动荡时极为脆弱。通过估计FIT对生产者的福利效应可以实证检验这一论断。

2.在计量经济模型上,本文将对比非参数模型和参数模型的估计效率。受限于部分不可直接观察的变量,如各国消费者的习惯,各地的气候特点,参数模型受到测量误差(measurement error)、内生变量(endogenous variable)、从属断尾(Incidental Truncation)等问题的困扰。其中第一个是由于模型的设定偏误导致,后两个则源自样本的非随机性,这两个问题均会导致参数估计的偏差(Bundell et al., 2007)。由于避免了具体函数形式的设定,非参数模型有效解决了模型设定偏误的问题。同时计量模型整合了工具变量和从属断尾修正,对于参数的估计效率和精确性是一个巨大的提升。本文的实证检验将证明非参数模型的这一优势。

3.对于政策制定者或是企业决策者,本文提供了一个理想的效率衡量标准,政府可以考察政策的有效性和效率,企业则可以通过了解自身对政策补贴的依赖程度来衡量自身的竞争力水平。

本文其余四节将作如下安排:在第二节,用于测度FIT补贴下消费者、生产者剩余和净损失的非参数估计模型将被建立。第三节对光伏产业背景做一个简单的介绍,同时概括地讨论样本数据的情况,以及一些预处理技术。实证分析结果的讨论将放在第四节。第五节将讨论模型的延伸和进一步研究的发展方向。

二、基于非参数估计的计量模型

简单的经济学模型可以解释补贴的福利效应。图1源自一个基本的供求模型,值得注意的是,组件市场的需求者是电站的建设方、FIT的直接受益者,而不是终端电力消费者,而供给方来自于组件生产者。当FIT补贴降低了电站投资者的运营成本时,对于组件的需求将会上升,反映在图中原先的市场均衡价格为P,但是政府的补贴使得消费者支付的价格下降到了Pc,而企业得到的价格上升到了Pf。此时的市场均衡交易量也高于补贴前的水平。

值得注意的是,单位补贴幅度等于两根需求曲线之间的垂直距离,而政府的总支出由图中B+C+F+E+G部分代表。三角形部分G即为社会净损失。从图形的直观上看,效率净损失是因为补贴额大于了消费者所得加企业所得而导致的。进一步的解释则可以指出:由于补贴,使得消费者需要承担的价格低于原来的水平,而企业得到的价格高于原来水平,结果一部分原来成本偏高的企业(原先成本高于价格)现在有了利润空间,而原来支付意愿低于价格的消费者,也具备了参与市场的条件。然而这部分社会资源的利用在总体上是以更大幅度的政府补贴为代价的,社会所得超过了为之付出的成本,从而导致了无效益的结果,也就是模型中的三角形D——净损失。其中C+E转化成了消费者的福利;B+F成了生产者的剩余。

图1 补贴的社会福利分析

针对太阳能产业的研究随着各国政策的深入而逐渐涌现,很多针对太阳能补贴政策效率的实证研究已经为政策制定者提供了有力的依据。Van Benthem, Gillingham和 Sweeney (2008)通过检验太阳能产业的“干中学”(learn-by-doing) 来考察该产业是否可以通过暂时的补贴来培育未来高水平的生产率。数据实证结果证实了产业成本递减现象的存在。Gowrisankaran, Reynolds和Samano (2013)扩展了这项研究,他们计量了大型公共事业级电站的社会成本,检验了过去几年中政府补贴对于太阳能产业生产率水平提升的效果。相比生产成本端的计量研究,更多的论文将注意力投向消费者需求端的分析,检验政府补贴对消费者福利的影响。Bollinger和Gillingham (2012)利用了美国33个城市的数据分析了税收减免政策对于鼓励个人和企业安装太阳能电站的激励作用,Jonathan和Molly(2013)利用加州的数据验证了这一论断,并且进行了更为详细的量化分析。除了税收抵免,太阳能补贴政策还有安装补贴、上网标杆电价等多个形式。Burr(2012)研究了各种补贴对于消费者的激励作用,结果发现政策之间的差异并不明显。对于补贴可能存在的无效率性,不少学者也进行了较为深入的分析。Chandra等(2010)讨论了为鼓励家庭安装太阳能电站而采用的税收减免政策的实际效率,结果发现政府因此付出的补贴要远远高于带来的能源节约,对于社会来说是缺乏效益的。Boomhower和Davis (2013)分析了墨西哥太阳能扶持政策中的搭便车(free ride)现象,以及潜在的解决方法。

然而,已有文献很少利用标准经济学理论框架计量政策的福利分配效应和社会效益。这一部分原因是由于数据集的不完善导致的,更重要的是缺乏一个完备的理论框架和计量模型来衡量这样的分配效率。这一节将基于上文阐述的模型,勾画一个可以用于计量的统计模型。论文同时提供一个参数形式和一个非参数形式的模型。其中参数形式模型更加形象具体,且便于计量,但是却暗含了很多难以解决的统计问题,如内生变量、测量误差等等。一些已有的计量技术虽然能帮助解决一部分问题,却不如非参数模型计量结果那么精确。首先需要讨论的是消费者福利的衡量方法。

(一)理论模型框架

源自早期福利经济学的社会福利效应依托的就是图1的模型。在设定了参数模型以后,通过求解三角形区域A+B+C+E和D+C+B+F就可以测度在补贴条件下的生产者和消费者的福利状况;而社会净损失只需要测度三角形G的面积就可以得到。尽管这样的方法在图形上直观,而且便于操作,在实证研究中被大量使用(Notton, 2010),但是最大的问题在于如果需求曲线不是线性的,那么曲边三角面积的计量对于研究者来说是一个不小的挑战。特别是当供求模型完全摒弃线性的函数而采取抽象函数的时候,简单的微积分方法根本无法测度出上述区域的面积。由于在拟线性效用的框架下,消费者剩余和补偿变化CV以及等价变化EV是一致的,Willig(1976)针对计量的问题提出了基于等价变化和补偿变化的福利测度方法,得到了研究者的重视和关注。

这一模型的理论框架源自罗伊恒等式(Roy’s identity)。等式构架起了终端需求和个人效用的函数转换关系,如果将间接效用函数(indirect utility function)假设为抽象函数的形式v(p,y)③P代表价格,y代表收入水平。,那么需求函数则可以表示为:

当在时期t,价格从p(0)变化到p(t),为了维持个人效用水平V不变,收入相应的也需要从y(0)调整到y(t)。表现在函数中为:

对时间t求全微分可得:

简单代数处理可以发现:

根据等价变化的定义,消费者福利的变化可以表示为:

因此,再对t求导,在代入需求函数等于:

在本文的模型中,需要对比非参数和参数模型在测度光伏市场FIT补贴的效率,因此需要同时构建具体参数形式和抽象非参数形式的供求结构模型。

(二)结构模型和简化形式

这篇论文并不是第一个计量能源补贴福利效应的文献,Panos等(2013)就利用了Quadratic Almost Ideal Demand System (QUAIDS)模型测算了天然气补贴对于西班牙家庭的福利效应。但是AIDS模型对于数据覆盖面有很高的要求,需要了解家庭各项支出的结构。在本文的模型中则要求收集国民经济各项支出的份额,对于已有的数据集来说是不现实的。

本文的参数模型采用了两种类型的需求曲线:线性模型和双对数模型,市场j中企业i在时间t面临的需求曲线有如下形式:

其中Pijt和Qijt为企业i在该市场上的定价与销售数量,是这一时期行业的平均价格,由于在过去的四年中,几乎所有企业的价格都出现了显著的下降,通过引入一个能代表行业价格水平的pt可以控制平均价格下降的趋势,减少这一事实对个体企业回归函数的干扰。GDPjt用于控制收入效应,理论上绝对GDP水平和环比GDP变动都可以起到这一效果,但是前者在15个季度中的变异性不够,从而给参数估计带来困难,因此选用的是环比GDP增长率。FITjt则是引入了政府补贴的作用⑥在这篇论文中,被考察的市场仅仅是组件市场,因此需要将度电补贴FIT转化为对光伏组件的补贴,具体的方法见下文。,εit和∈jt分别为企业和市场层面的随机干扰项。

考虑到企业之间的差异性(李园红、高明,2010),市场结构的设定模型采用了垄断竞争模型。企业i的利润最大化问题可以表示为:

其中,Cit为边际成本,且假设在时间t内,企业的生产处于规模经济不变的状态,与之相对应的一阶条件可以写成:

值得注意的是,线性模型可以直接应用于实证分析,但是双对数模型中,针对成本Cit的回归是非线性的,需要采用非线性估计模型的迭代法,依托Stata中的Newton-Raphson工具即可实现。

(三)内生变量、断尾偏误和参数识别

传统的参数识别技术即通过对简化形式的(5)式进行回归估计。在得到然后对比(4)、(5),通过简单的代数关系即可识别所有的。

然而简单的最小二乘估计(OLS)却难以避免诸多问题的干扰,使得参数估计值在统计上无法实现理想中的无偏性和一致性。具体在这个模型中,主要面临的问题有三个:一是异方差性,二是源自Cit的内生变量;三则是由于非随机样本带来的从属断尾偏误。

异方差性源自模型随机干扰项中包含的θit和µjt,企业间和市场间的差异导致了不同观测个体ij的干扰项θit+µjt之间存在差异,尤其是方差的差异。结果导致各个参数估计的显著性大受影响。解决异方差性的计量技术已经比较成熟,通过利用样本信息对OLS加权回归的GLS技术已经被证实能有效解决异方差性。

由于数据样本涵盖了不同企业在不同时间段上的表现,而关于企业的信息在回归模型中仅仅包含了成本因素Cit,诸如技术水平、劳动力成本、原材料成本这些决定Cit的因素由于无法直接被自变量囊括考虑,全包含在了随机干扰项θit。因此变量Cit和θit就建立起了显著的相关关系,而这一问题导致的结果是β4估计的非一致性。对于这一问题的修正最常用的方法是工具变量(IV)。通过找到一个或几个和Cit相关但独立于随机干扰项的工具变量,通过一个间接回归估计就可以解决内生变量带来的非一致性问题。这一解决途径最大的障碍在于能否找到这样一个理想的IV。幸运的是,光伏企业的季度财报中包含了两个这样的指标:转换效率和存货规模。作为一个长期的技术指标,转换效率和企业即期的劳动力成本、原材料等相关性大大减弱,但是能实现高转换率的企业往往能更好地控制成本,因此转换效率和Cit的关系就建立了起来;而另一个工具变量——存货规模——则是由前几个季度的生产决定的,和当期没有直接的关系,但是却左右了当期的供应能力,从而影响到当期的产品销售成本Cit。

如果说前两个问题是源自模型设定,那么第三个问题,从属断尾,则是由于样本采集中的问题。模型估计采用的样本来自于IHS提供的每季度22家企业在各个分市场⑦包含了澳大利亚、加拿大、中国、德国、印度、美国、日本、拉美、中东、欧洲其他国家和亚太其他国家,共计12个分市场。的销售数据。然而这22个企业并不是来自于随机抽样,而是22家处于行业领先地位的生产商。由此产生的问题被称作样本选择或从属断尾(incidental truncation),即由于非随机抽样导致的选择性偏差。大量的针对非随机抽样的计量经济学研究[Heckman (1990),Manski (1989; 1990; 1992),Newey,Powell and Walker (1990)]已经证实了从属断尾问题会导致参数估计的严重偏误。问题的根本在于样本中的个体所具备的特性无法代表需要考察的群体。针对这一问题使用最为广泛的方法是Heckman(1997)提出的两步估计方法(Two-step estimation),核心思想是通过一个概率模型找出决定个体进入非随机样本概率的因素,然后将这些因素的决定作用构建一个变量加入到回归模型中,从而控制了原本不可观测的变量,修正了参数估计的结果。

从以上的讨论中不难看出,参数模型受困于太多的问题和缺陷,而为了解决这些问题则需要施加太多的修正方案,结果使得模型估计变得更为复杂。更重要的是,参数模型还有一个无法克服的弱点:模型设定问题。无论研究者使用如何高端的估计技巧,在设定模型具体形式的时候就已经决定了这项研究效率的优劣,一个失败的模型形式可能直接导致估计结果的严重偏误。而这些问题的解决则需要放弃参数模型,幸运的是Robinson(1988)提出并由Newey(1994)发展的非参数模型成功解决了这一问题。

非参数模型的基本思想是通过一个抽象函数定义一个自变量(Xs)和应变量(Y)的映射关系,如Y=f(X)。然后对于自变量X 的每一个取值定义一个邻域(X0-σ,X0+σ),在模型估计的时候,X0处的Y值由邻域内除Y0以外的点加权估计,其中权数由这个点与X0的距离决定,离X0越近的Y被赋予更大的权重,反之则被赋予较小的权重。统计表达式则可以写成:

其中Kσ为X的密度函数。

可以发现,非参数估计方法在本质上是通过“参考”邻近点的应变量值,来模拟估算该点的Y值水平。这样的方法最大的优势在于不需要一个提前设定的函数形式,在使用弹性上大大增强了,改善了估计的稳定性。但是与此同时产生了两个新问题:一是如何确定邻域的窗宽(bandwidth)——σ。过大的σ会导致过多的“邻近点”被加权,导致影响模型估计的精确性;过小的σ会使得估计结果“过分不平滑”,影响趋势分析的意义。Hardle和Linton(1994)提出了一个标准:cross validation,类似于最小二乘法中的残差平方和:CV。yˆ|为选定iσ窗宽σ时的估计量,但是需要尝试多个不同的σ来选择CV最小的一个⑧Verardi和Debarsy(2013)基于stata开发的程序已经可以自动实现CV最小化了。。

非参数估计的另一个问题是估计值容易受到离群点的影响。由于应变量的估计借助其他Y值,因此,特别是在窗宽比较小的情况下,一个离群点会导致估计值较大的偏差。针对这一问题,Hausman(1995)提出直接使用加权回归,赋予高杠杆点0权重就可以实现修正。在具体的回归操作中,以线性模型为例,模型5可以写成如下的非参数形式:

在得到了需求曲线估计以后,代回到通过罗伊恒等式推到的等价变化微分方程中:

对时间t求积分就可以算出消费者的支出函数S(t,p')⑨在这个模型中,需要考察的自变量只剩下了价格p。。在不同的价格水平下,消费者剩余的变化等于ΔCS=S(t,p)-S(t,p')。其中p'是假设不存在FIT补贴的市场价格,为推算变量(counterfactual)。

非参数模型最大的挑战在于估计的实现方式,在Robinson(1988)正式提出这一方法以后,各类统计软件一直没有能自动实现这一估计。Verardi和Debarsy(2013)通过了多项式拟合使得stata能自动实现非参数估计。研究者只需要给定应变量和自变量,同时为拟合多项式选择一个阶数,软件就可以自动实现这一估计。

不难看出,由于采用了完全抽象的方式估计,非参数方法成功规避了模型设定可能存在的偏差,同时不影响引入工具变量,将成本、残差与其他变量独立起来,从而规避了内生变量的影响。但是Robinson的非参数估计模型依然没能摆脱从属断尾问题,而针对这一问题的修正需要研究的是X的概率分布。

正如Heckman方法中提倡的,通过自变量X可以观察到任何一个个体进入随机样本的概率值,而这恰好可以帮助模型修正传统的非参数估计框架。传统模型中Kσ是根据观察到的样本变量自动拟合的,而现在Kσ则成为一个条件概率的密度函数,除了从非随机样本中观察X的分布,还需要结合样本以外的信息。具体而言,假设样本中X的密度函数是f(X),而给定一个个体的特征,该个体进入非随机样本的概率为p ,那么非参数估计中的概率密度函数应该为Kσ=p∗f(X)。通过这一改进就可以在传统非参数模型中实现从属断尾的修正。

基于以上的讨论,表1总结了实证分析中模型估算的问题以及在参数和非参数框架下的解决途径。

表1 参数和非参数模型分析框架对比

三、产业背景和样本概况

受困于高出火电数十倍的成本,太阳能发电长期依赖于政府的补贴。各国的补贴政策不尽相同,大体上可以分成两类:一是针对初装规模的补贴,如美国的税收减免优惠(tax rebate)和中国的金太阳项目⑩具体的补贴额取决于安装的时间,但是所有备案项目,只要在2014年6月之前完成安装,都可以得到每瓦4元到5.5元不等的补贴。;另一类补贴则是针对发电量,即所谓的标杆上网电价(FIT)。基本方法是通过设定一个保证电站投资人收益的上网电价来补贴太阳能发电成本与常规上网电价的差额,使技术尚未成熟和开发运营成本仍然较高的太阳能供电项目能够有长期稳定的合理回报,从而吸引部件、系统和运营商及投资人的积极参与,进而推动整个行业的持续发展。这一点在欧洲很多国家,如捷克、德国、意大利等,得到了广泛的使用。然而近年来,尤其是2012年后,受制于财政危机等因素,绝大多数欧洲国家开始大幅削减FIT,而这一行为很快导致了欧洲各国对于光伏的需求锐减。与之相对应的是亚洲两大新兴市场在FIT政策下的崛起,一个是中国,另一个便是日本。图2选取了8个主要的国家,汇总了每个国家月度的FIT水平、新增安装量和从中国进口的光伏产品数量的数据。很容易注意到,欧洲六国的市场(德国、法国、意大利、捷克、英国和希腊)都在一轮又一轮的FIT削减下急剧萎缩,而中国和日本则持续膨胀。这一直观的现象给出了至少两项启示:一是消费者确实从FIT补贴中获利巨大,而且在目前状况下,光伏市场的供求双方依然依赖于政府补贴而生存;二是每一个国家都在FIT宣告下调的前一个月或当月出现显著的“抢装潮”,因此将FIT引入需求函数是必要的。

由于FIT针对的是发电量,而模型中的标的物是太阳能组件产品,因此补贴数据首先需要通过计算电站预计发电量来折现到目前,从而估计FIT对光伏组件的间接补贴幅度。简单的例子,假设一个1MW的光伏电站预计运营寿命为20年,考虑到系统输出可能的衰减(比如15%),平均每年的发电量为150万千瓦。FIT政策使得光伏电站电力的售价比传统能源要高出0.5元/KWh,那么电站每年可以得到政府补贴75万元。假设银行利率为5%,20年每年75万元的年金现值等于935万元。这就可以将政府的FIT等价转化为对系统的补贴。根据当期市场的组件价格和系统价格之比,r,就可以算出935*r万元最终被补贴到了组件产品上。而这一过程中最为重要的工作是估计电站在设计寿命中的发电量。

图2 各国FIT、月安装量和进口数量走势(2010-2013)

(一)估计模型

随着全球光伏电站的迅速建设和发展,光伏电站发电量的预测方法成为近几年分布式电源技术研究的一个热点问题。然而,不同于传统能源的发电模式,光伏电站由于太阳能资源具有能量密度低、稳定性差、调节能力差等劣势,而且电站的效率受气象因素变化及地域的影响较大,发电量具有较大的不确定性。所幸的是数学统计理论、人工智能等技术的相继引入,负荷预测技术得到了极大的提高。当前被广泛使用的光伏电站发电量预测模型多达十余种,如原理预测法(Radziemska,2003)、统计预测法(丁明、徐宁舟,2011)、智能预测法(Hammer et. Al,2003)、不确定性理论预测法(Voyant,2009)等等。

不同的方法由于受限于各自所需的假设和数据有不同的适用环境。王少义等(2013)在综合讨论了各种方法的模型构建和数据需求之后建议:对于负荷稳定且运营环境变化不大的中短期预测较适用统计预测法,不确定性的智能预测则更擅长于处理瞬时输出功率的预测和模拟,且这两种方法都需要相同或是相似环境下电站的历史数据作支撑。对于新建电站的长期发电量预测,由于缺乏真实系统运行数据,原理预测法是相对而言比较合适的选择,但是另一个层面上看,原理预测法过多依赖于理论模型,对于该地区实际的气候随机因素和光伏在该地的历史发电效率缺乏必要的考虑。实证模型旨在对新建电站的整个生命周期发电量作出估计,进而估计FIT的总量,为了确保结果的稳定,本文综合了原理预测和统计预测两种方法的结果①如上文所述,原理预测法依托Radziemska(2003)的文献和相关模型可以得到实现,统计预测法依托的是该地区已建电站的历史数据,通过不同年限历史电站发电量作为新电站发电量的参考依据,再根据发电效率的技术进步水平做适当的调整。BNEF的新能源项目统计数据库提供了各国主要光伏项目的运营数据,为本文的统计提供了重要的依据和支持。,把两者的平均值作为该地区发电量的估计预测值。

原理预测法针对太阳能发电过程中在光电转换环节和逆变环节存在能量损失的现象,建立经验公式和经验系数,预测光伏发电量,此方法的原理和计算都非常简单,预测效果主要取决于光电转换效率模型、逆变效率模型和辐射预报的准确性。

模型设定为一个简单的函数,光伏组件输出瞬时功率(直流)为:

P(t)=ηsAG(t)

其中ηs为光电转换效率②ηs在现实中不仅仅取决于光伏组件的质量和性能,还受到诸如温度、湿度、大气质量等诸多因素的影响。除射强度以外,其他环境变量对我们来说无法观察,为了简化模型,本文将ηs假设为一个常数。完整的模型可以参考Notton(2010)。,A为极板面积(m2),G(t)为斜面辐射(W/m2)。

在得到P(t)估计以后,光伏系统直流发电量为:

t1,t2分别代表日出和日落时间。

最后,光伏系统的发电量E=θEA,θ为逆变器的转化效率。

各国的太阳辐射数据来自于Martín等人(2010)的统计和发布,数据集提供的是月度离散数据,而非模型中采用的连续函数G(t)。因此,一年中第i个月的系统直流发电量可以用一个简化的模型直接估计得到:

如上文所阐述的,为了确保发电量这一估算变量的精确性和统计稳健性,本文综合了原理预测法和统计预测法两个方法的结果。统计预测法,依托一个地区历史光伏发电数据做出估算,主要来自于BNEF的项目数据库对于各国代表性光伏项目年发电量数据的统计。

(二)各国光伏电站发电量估计

基于以上的讨论,太阳辐射程度数据来自于Martín(2010)的测量和估计。为方便计算,模型选取以单位容量为1MW的电站发电量作为参照标准,设定电站系统总效率为77%,全使用寿命(20年)中系统衰减15%,目前市场逆变器的效率介于85%-95%之间,模型区中间值90%。从而预计出各国1MW电站的年发电量和全生命周期发电量。

表2对比了采用两种发电量估算方式对主要国家光伏发电量的估算结果,从统计上看,两种方法的估算结果在绝大多数样本国家中没有显著的区别。

表2 1MW电站发电量估算结果(万KWh)

FIT是针对发电量的补贴,在得出每IMW电站的预计发电量以后,就可以很容易地得出政府通过FIT向这一电站的补贴总额S。由于当期电站的平均造价和组件产品的价格都是可以观察到的,因此将这一总补贴S乘以组件占电站成本的百分比,就可以算出FIT中有多少转化为了对组件的补贴,从而构成模型中的FITjt。

(三)样本概况

除了估计各国太阳辐射水平的数据,模型实证分析的数据还来自于另外四个数据库:企业层面的出货量(shipment)、区域内的平均销售价格(ASP,average selling price)以及组件的生产成本(cost)来自于咨询公司IHS提供的季度数据库,其跟踪了22个主要的太阳能企业每季度在全球9个分区域的销售量、平均价格以及组件的制造成本和效率。中国海关数据库提供了2010年以来国内所有太阳能企业的出口数据,使得模型可以计算出各个企业的季度和年度出口规模。关于企业的产能情况则来自于另一家咨询公司(PVinvestor)提供的截面数据(2013年9月),提供了超过200家企业的产能估计。最后是各个企业的系统规模(在建和建成)来自于Bloomberg的数据库。表3提供了样本中各个变量的基本信息。尽管前四行给出的仅仅是产能、项目规模、出口额和企业营运时间的一个初略概况,从表中依然可以看出企业之间的显著差异,而且中位数小于均值的现实说明了四个变量均是显著的左偏分布,大企业占据着显著的优势。随后的两个部分分别展示了22家大企业在FIT国家和非FIT国家市场上的销售数量(MW)、平均价格水平($/W)和他们的成本状况。值得注意的是尽管FIT市场的销量要显著高于非FIT市场,但是两个市场的平均销售价格并没有显著的区别。④由于样本结构上看是一个面板数据,而企业在这4年时间里都经历了显著的成本下降,因此成本变量的讨论没有意义。

表3 样本概况

图3反映的则是变量之间的关系,分别选取了价格和销售量以及成本和价格这两组关系进行讨论。前者有利于构建模型结构,而后者则是识别市场结构的一个显著信号和标识。很容易发现的是尽管没有经过任何的统计处理,价格(ASP)依然和销售数量呈现出显著的负相关关系,趋势线勾画了一个标准的向右下方倾斜的需求曲线。对比FIT国家和非FIT国家的样本,除了FIT国家出现了更多疑似离群点以外,两者的斜率差异并不明显。价格和成本的相关关系在两组样本之间的相似度更高。除了显著的正相关关系,趋势线还反映出了凸型,这一点提示模型应该考虑市场势力的存在⑤完全竞争市场企业的价格等于成本,当成本上升的时候价格应该表现出一个正的线性相关关系。。鉴于这两点,先前假设的垄断竞争市场结构无疑是合理的。

图3 ASP、出货量和cost的相关关系■

四、实证分析结果

在这一节主要讨论分析的是数据实证的结果。在讨论了参数和非参数估计结果以后,重点要讨论三个问题:1. 需求弹性在FIT国家和非FIT国家是否有显著的区别呢?2. 数据结果是否支持微观经济理论预测的在存在补贴政策的前提下,需求弹性和消费者剩余份额成正相关关系?3.在过去的4年时间里,FIT的效率是否得到了提高?社会净损失的变动又是怎么样的?光伏产业对于FIT的依赖有没有发生改变?

(一)参数模型和非参数模型的估计

表4和表5分别总结了参数模型(线性模型和双对数)的估计结果,其中Panel A是对FIT国家样本的回归结果,而Panel B则是对非FIT国家的分析。为了对比各个模型,实证结果一共列出了九种回归模型的结果,其中第二、三列为OLS回归,第四列则使用了GLS已修正异方差的可能,专门用于面板数据处理的Within回归模型结果在第五列被讨论,而工具变量IV估计量则占据了六、七、八三列,最后的两列为修正断尾问题的Heckman模型。⑦Heckman模型基于的是一个两步估计法(Two-Step estimation),第一步的离散模型在表4中列出。

正如等式(2)中定义的,β0、β1、β2、β3和β4分别是常数项以及行业价格、该国GDP增速、FIT补贴和企业成本等变量的系数。先验地可以认为,除了β4<0以外,其他的系数符号后应该显著为正。

首先可以确定的是,无论是针对FIT国家还是非FIT国家,参数回归模型各项系数都表现出了理论预测中的正负方向,这在很大程度上肯定了模型结构的设定。对比Panel A和B的Model 1、2可以发现引入季节性因素并没有对模型的参数估计产生显著的影响,这说明尽管存在类似中国这样季节性变动很大的市场,市场的反应并不显著,而背后的原因则要归于企业的理性预期的作用,通过提前的产能部署和存货调节,在很大程度上能抹平季节性波动的影响。同样可以注意到,修正了异方差问题的GLS估计来那个和OLS也没有显著的区别,这一点则证实了22个大企业之间并不存在显著的差异,至少在市场势力和影响力上基本处于势均力敌的状态,而选择的Cournot竞争模型也是合理的。

面板数据下的Within估计主要克服的是不随时间变动的个体差异性,尤其是源于各个市场的消费者习惯的差异。正如前文提到的,如果一个国家的消费者更倾向于使用太阳能,FIT政策在该国应该能起到更大的影响作用,和忽略消费者偏好这一因素导致了FIT变量和随机变量的相关性,从而带来了内生变量问题。值得注意的是,在Panel A中对于第五列和OLS以及GLS的估计结果,Within估计法得出的β3不到线性估计模型估计结果的一半、从而证实了市场之间的差异是显著的,而且这样的差异和FIT政策的确呈正相关关系⑧太阳能更受欢迎的国家FIT政策更为积极。。因此,OLS和GLS的估计存在较为严重的右偏性。但是Panel B中Within估计法的表现并不理想,尽管没有FIT这一变量,作为GDP系数的β2却被提高了一倍多。从计量理论上这说明随机变量和GDP的增速呈负相关关系,在OLS和GLS模型中,被忽略的随机因素抵消了一部分GDP的贡献。而在经济学上这一现象则被解释为越穷的国家发展太阳能的积极性越高,无疑是有悖常理的。

另一项可能存在内生变量问题的参数是成本的系数β4,因为参数模型几乎没有包含任何除成本外的企业信息,而这些被随机变量涵盖的内容极有可能和成本变量存在相关关系(可能为正,也可能为负)。因此,β4的无偏性存在较大的风险。IV估计选用了各个企业当期组件的转换效率和当期的存货水平作为工具变量。前者作为一个技术指标由企业客观的技术水平决定,在短期内稳定性较强,而后者则是完全由上一期的生产和销售决定,和当期的成本水平相关关系更弱。Model 5、6、7之间的区别源自是否控制季节因素和市场变量。但是和前四个模型对比不难发现,在IV框架下,β4的绝对值显著降低了,说明成本因素的冲击对于市场的影响在前三种模型中都被高估了。其实工具变量存货本身给提供了一个最为合理的解释。由于企业的行为存在一定的前瞻性,无论是应对成本的变动还是需求的冲击,企业都可以通过存货调节来缓冲外生的影响。尤其是对于大企业,更是可以通过和下游客户的提前谈判来安排未来很长时间的生产计划,一旦这一因素被忽略,模型就要求企业对于成本的上升做出立刻的回应,成本冲击的影响就被无形中放大了。基于存货水平的工具变量恰恰解决了这一问题。同时,如果对比模型5、6、7,系数之间的差异依然很小,这再一次验证了一开始的论断:季节性的影响并不显著。

最后一项参数模型是对断尾问题的Heckman两步估计。正如第二节提出这一问题时候就认识到的,IHS提供的22个企业并不是随机来自于行业,而是根据企业的行业地位给出的龙头企业。基于这22个公司数据的回归有很大的误导性,几乎所有的参数都会出现高估或是低估的问题。为了让模型能代表整个行业,Heckman估计方法首先将样本选择过程纳入讨论范围。表4讨论了企业产能、项目规模和营运时间在企业市场地位⑨市场地位则表现为入选者22个企业的名单。方面的影响,一共有6个备选的离散模型被讨论和列举。前三个模型用的是一般回归方法,在不考虑企业之间差异的前提下一次增加自变量,结果不难看出,企业的产能和承接的项目规模都反映出了显著的影响,而出口额的影响并不显著。后三列添加了稳健性约束,考虑企业之间的差异性,得出的结论基本和前三列类似:产能和项目规模对于企业的影响较大。

通过使用Heckman两步估计法,理论上模型的行业代表性大大增强。回到表4的模型8和9上,第8列是单纯的Heckman估计结果,而第9列是综合了Heckman和IV的估计。首先对比Panel A中的参数估计结果:对比前四个模型,β2显著降低了,这说明GDP对于大企业影响更大,或者说龙头企业的产品是各个市场的首选。而作为FIT系数的β3则变小了,这进一步证实了小企业对龙头企业的冲击力。当FIT发生变化时,小企业产量的变化无形中分摊了这样的影响,因此在施加了断尾修正以后,行业对于FIT的反应要小于单纯以大企业为样本的估计结果。单纯的Heckman回归下β4为-20.29,绝对值略小于前三个模型,而和IV的估计结果差异并不明显。而在综合了IV方法的第9列估计结果上,β4显著提高了。由于β4客观上衡量的是企业对于成本冲击的调整,相比Heckman修正的估计结果,其他仅仅基于22家龙头企业的估计结果无疑低估了成本的影响力。同样的结论可以在非FIT国家样本中得到,β4在Heckman估计下要高出其他模型30%,这一点说明无论是在哪一类市场上,大企业的调整能力更强,速度更快。

表4 参数模型回归结果(线性模型)Panel A: FIT国家样本

Panel B: 非FIT国家样本

(续表)

Panel C:Heckman Two-steps Logit-model(线性模型)

表5 参数模型回归结果(双对数模型)Panel A: FIT国家样本

(续表)

Panel B: 非FIT国家样本

Panel C:Heckman Two-steps Logit-model(双对数模型)

(续表)

传统计量理论普遍认为,双对数模型由于在函数形式上更有弹性,对于计量结果的拟合优度有显著的提升作用,但在本文的样本中,通过对比表4和表5结果可以发现,双对数模型结果并未和预期的一样体现出双对数模型的优越性。结合产业背景,本文给出了两点解释:

一方面,在使用了双对数模型以后,估算结果没有像预计的那样出现显著的提高,从产业层面上看,可能和光伏行业自有的政策性驱动有较大关系;

另一方面,无论是线性模型还是双对数模型都可以发现,补贴因素的系数β3是最为显著的,甚至远远超过光伏产品的价格和成本因素。这很好地解释了第一点问题,无论是线性模型还是非线性模型,一定程度都将消费者选择的行为定为一个固定的模式,用函数来描述,但实际上,光伏行业的需求极大程度上是政策驱动的,而补贴政策有一定的不确定性:在欧美国家,议会会根据过去一段时间全国发放的补贴结合财政支出能力确定是否减少补贴(如意大利和西班牙就由于财政问题,在几乎毫无征兆的情况下停止了补贴),在中国,政策往往提前半年才发放征求意见稿,3个月前正式落地,因此行业对于政策的反应也缺乏缓冲时间,表现在市场上就是需求相对随机。而这一点也证明采用参数形式的需求模型确实会对计量结果带来误导,非参数在光伏市场应用上更具有优势。

表6总结的是非参数估计模型的估计结果。正如第二节提出非参数估计方法时假设的,成本变量被引入非参数部分,作为一个整体估计,因此,在表5中仅仅报告出了FIT、GDP和行业价格三个变量的估计结果。

延续Verarfi和Debarsy (2013)的论述,传统的非参数模型可以通过高阶多项式来模拟。借助他们开发的stata运算程序,模型验证了从一阶到四阶四种模型的估计结果。每一种非参数都对比了施加断尾修正前后结果。

首先横向比较模型1、4、7和10,不难发现,尽管引入的多项式阶数不同,但无论是FIT国家样本还是非FIT国家样本,参数估计的结果都很接近。同样的结论可以通过对比模型2、5、8和11得到。这证明了非参数模型优良的稳定性特征。然后对比同一阶数下的两种模型(是否施加断尾约束),不难发现,在施加了断尾修正以后,β2在两类国家样本中都降低了,而且在非FIT国家中几乎降低了一半⑩值得注意的是,这一点在参数模型中并没有反映出来,我们怀疑是受到了模型设定形式的约束和局限。。这在很大程度上再次证实了企业之间行业地位的不平等,而且这一不平等在非FIT国家更为明显:在缺少政府现金补贴的市场中,行业的龙头大企业更容易成为消费者的首选。

作为行业价格变量和FIT变量系数的β1和β3并没有因为断尾修正估计值出现过大的波动。对于β1相对容易解释,行业价格在很大程度上受到龙头企业的左右,小企业即便不直接,也会无形中充当价格跟随者的角色,因此是否修正断尾问题并不是很重要。β3的变动相对难以捉摸,因为在参数模型中,引入断尾修正以后FIT的影响力大大下降了。但是解释是小企业的竞争力缓冲了一部分FIT调整带来的影响。值得注意的是在参数模型下Heckman 两步法下的β3相比OLS下降了60%,即便和IV相比也降低了30%左右,这样的幅度极不符合常理①这意味着小企业的冲击会侵蚀龙头企业至少三分之一、最高达到三分之二的市场份额。,而一阶非参数模型报告的β3仅仅下降了5%。在产品存在一定差异性的前提下,这样的降幅虽然略显偏小,但相比参数模型无疑更加合理。

最后是模型3、6、9和12,在从属断尾的基础上又增加了针对内生变量的修正,基本结论与参数模型类似,但是值得注意的是,和参数模型相比,经过工具变量的调整,其他变量的参数尤其是β2有了较为显著的降低,这说明企业的成本变量和各个市场GDP数据存在一定的关联性,而这一关联性在线性模型中被忽略了。这一点的有力解释是企业的海外设厂行为。在经历了欧美双反的影响以后,很多中国大企业纷纷采用目标当地化生产的策略,这导致企业的生产成本和市场当地的经济水平有了较为密切的关系。这也间接导致了内生变量问题对GDP参数的估计产生了影响。

表6 非参数回归结果Panel A: FIT国家样本

Panel B: 非FIT国家样本

作为针对非参数估算结果的计量检验,本文采用了均方误差MSE作为指标,依照MSE的定义,MSE=计量结果如表7所示,不难看出无论是单纯的回归分析(OLS对比单纯的非参数)还是在工具变量或是从属断尾修正下的估算,非参数模型确实表现出了一定的优势。

表7 非参数回归模型的MSE

(二)需求模型和弹性估计

在得到了简化形式模型的估计结果以后,通过参数识别技术可以很容易地估计出需求曲线,进而计算弹性。参数模型的需求曲线直接由表8给出。作为对比,模型依然选择了GLS、Within、IV②同时施加季节波动和市场虚拟变量的模型7。和Heckman③混合工具变量的模型9。四种模型。结论很显著:在FIT国家样本下,需求曲线的斜率参数a1在GLS和Within下都被低估了,同样被低估的还有行业价格的影响力a2和GDP的影响a3。而FIT的系数a4则被未施加断尾修正的模型高估了。在非FIT国家组成的样本中,情况不尽相同。a2和a3依然被低估,GLS对于a1的估计效果要比FIT样本理想很多,但是相比Heckman断尾修正模型,Within的估计结果依然偏低。

另一点值得注意的是,交叉比较FIT和非FIT国家样本计算出的a1(Heckman估计量)可以发现,FIT国家的a1在绝对值上要稍高出非FIT国家,尽管这并不等同于需求弹性上的差异,却是怀疑两组国家之间存在需求差异的证据。

表8 需求曲线估计

非参数估计的参数结果无法直接用表格形式给出,表6展示了非参数估计的相应均值、标准差等信息。

直观起见,图4勾画出了需求量和价格的非线性关系。横向的比较难以看出施加断尾修正以后的模型相比单纯的非参数计量有显著的差异,但是纵向的比较却明显可以看出非FIT国家的逆需求曲线要更加陡峭,一定程度上反映了非FIT国家的需求对于价格更加敏感。

图4 非参数需求曲线

尽管需求曲线可以在一定程度上揭示FIT和非FIT国家需求上的差异,但是这样的判断依旧局限在主观判断上,而且即便是同一根需求曲线,各点的弹性依然是不同的。因此,通过计算各个点上的需求弹性能更完整地了解市场间的差异。模型将尝试根据观察到的市场价格和销售数量计算每一个点的需求弹性,通过描绘各个市场的需求点弹性的密度分布图,可以更进一步观察到细节上的差异。

对于参数模型,因为已经有了需求函数的斜率a1,根据弹性的定义:即可求解。对于非参数模型则要稍显复杂一些,需要对非参数模型求解不同点上的斜率:,然后再根据弹性的定义求解。幸运的是Verardi和Debarsy提供的stata程序已经可以实现这一过程。

图5 FIT和非FIT国家需求弹性分布比较

图5 一共提供了六种不同计量方法下得到的弹性密度,为了方便比较,图中均加入了正态分布的密度图。首先值得注意的是,所有的密度分布都表现出了明显的右偏性,这一点与预期是符合的,一个弹性过大的市场是不稳定的。其次,相比前四种参数模型的结果,非参数模型得出的是多峰分布,也就意味着消费者之间存在聚类的现象。由于光伏市场存在民用、商用和公共事业三种终端需求,各种需求的主体差异很大,而这样的差异势必会导致不同类别之间需求弹性的巨大差异。结果,各个需求端消费者的需求弹性会集中在不同的水平上,也就出现了一个以上的峰态,而像参数模型那样的单峰密度分布就难以解释这样的情况了。

从估计值上讨论,结论依然倾向于非参数模型。因为参数模型计算出的需求弹性集中在0-1的范围之内,而经典经济学理论预测,拥有市场势力的企业,在其利润最大化的区域中需求弹性应该大于1,即富有弹性的区域(Stigler, 1965)。参数模型的结果显然和这一理论相违背,而非参数模型的估计结果则很好地吻合了这一结论:峰值都在1以上。

最后,参数模型的估计结果相比非参数模型的另一个优势是离群点较少。如果仔细考察各个密度分布图不难发现:参数模型估计出的密度分布在0到10之间,甚至会高达20,这意味着价格1%的变动最多可以撬动需求20倍幅度的变动,无论是从常理上还是经济学上都是难以接受的;反观非参数模型的估计结果则相对稳健很多,基本处于1-1.6之间。

更重要的结论依赖于FIT和非FIT国家之间的横向比较。在密度曲线的对称性上除了OLS模型,其他五个模型都反映出了一定的差异,其中Within、IV和Heckman模型都发现非FIT国家的需求弹性密度曲线要比FIT国家略微左偏,也就意味着更大的需求弹性。这一点和上文提到的斜率测度结果是吻合的。非参数模型的结论相对复杂一些,参照第三行的两张图可以发现:无论是单纯的非参数估计还是施加了断尾修正的模型,在第一个峰值处非FIT国家要略微右偏,而在后几处的峰值上,非FIT国家的需求弹性出现了左偏。投资主体上的差异应该是对这一现象的一个解释。如果可以认为公共事业电站的需求弹性在三类电站中是最小的,那么相比FIT国家,非FIT国家大型公共事业电站的投资主体是国家或是投资银行,这样的主体相比私人投资者对于价格的敏感性要较弱一些,而民用和商用项目在非FIT国家由于缺少政府的财政补助,对于价格的敏感性则更强,反映在密度曲线上则是在第一个峰值处的右偏,而在以后的分布中则出现左偏。

(三)福利分配效应

这一部分主要讨论FIT的效率问题,以及各因素,主要是FIT和成本削减,动态中驱动作用的变化。因此,数据分析将完全集中在FIT国家的样本组上。

根据传统的经济学理论,消费者从补贴中得到的份额与弹性的绝对值成正比,也就是说,越大的需求弹性能使得消费者从政府补贴中受惠更多。由于模型已经测算出了需求弹性,为了验证这一论断,只需要算出每个价格水平下消费者获得的补贴份额的大小。再次需要提醒的是,模型仅仅分析的是组件市场,而FIT的补贴目标是终端的电力市场,在估计政府补贴这一变量的时候需要借助发电量预测模型先将FIT等效地转化为对组件的补贴,然后计算社会福利效应。

社会福利的测度在这里是一个比较复杂的问题,因为时间序列中不仅存在FIT的调整,同时企业还在经历成本的下降,精确估计消费者从补贴中获得的份额需要分离这两个因素。参数模型的消费者剩余延续Jonathan和Molly(2013)的方法:根据已有的需求函数,在控制价格、GDP等因素以后,推算当FIT等于0的时候消费者剩余CS|FIT=0。然后利用同一函数计算存在FIT时的消费者剩余CS|FIT。两者的差值就是消费者从FIT中受惠的部分。得益于数据集中包含了企业的成本数据,FIT下的生产者剩余可以通过简单地求解价格和成本之间的差额来测度PS|p,FIT=0。同样的,不存在补贴情况下的生产者剩余可以通过需求函数估计出FIT=0时的均衡价格减去成本来实现PS|p(FIT=0)简单的总结,消费者和生产企业各自从FIT中得到了:

为了更清晰地讨论需求弹性和消费者福利的关系,需要定义一个比例变量:补贴中消费者剩余的比重。它可以被定义为:消费者因为补贴而增加的福利与社会总共增加的福利的比值。而后者除了消费者获得的利益外还包括了企业的获利。符号定义可以表示为:

图6清晰地描述了需求弹性和补贴中消费者剩余比重的关系。值得欣慰的是所有的模型都证明了弹性和CS%的正相关关系。很显然的是,在参数模型中,IV和Heckman测度出的正相关性要远远强于GLS和Within估计法的结果。非参数模型也反映出了强烈的正相关趋势。另一点值得注意的细节是六张图形都反映出了一个上凸的趋势线,这说明尽管弹性的增大有助于提高消费者剩余在政府补贴中的比重,但这一影响是逐渐递减的,这也和经济学原理相吻合。

和参数估计方法相比,非参数模型的估计的优势体现在两个方面:一是上文提到的弹性的测度值普遍大于1,这与模型设定的垄断竞争市场结构是吻合的;其次是散点的集中度相比参数模型大大提高了。

相比最后两张图,在施加从属断尾修正以后估计的消费者剩余比重显然要高于单纯的非参数估计,这证明了企业之间的差异。对于样本中的大企业而言,较高的市场势力使得他们能追求到更大的价格加成和利润空间,因此,单纯利用这些企业的数据所做的回归会低估消费者剩余的比重。其实这一点通过对比Heckman和其他模型也可以发现:Heckman估计的消费者剩余比重分布点要更为集中,而且聚集在Y轴比较高的水平上,而其他三种参数模型的估计结果在Y值比较低的位置出现了更多的散点,这说明了在考虑断尾问题以后的估计提高了消费者剩余在补贴中占的比重。

图6 弹性和消费者剩余的关系

在证实了弹性和消费者剩余的正相关关系之后,下一个任务是比较FIT和成本因素对于消费者剩余和生产者剩余的影响。这一部分的回归分析中使用的消费者剩余来自于模型7、8和9的估计,分别为施加工具变量的Heckman估计和非参数模型⑥生产者剩余可以直接通过价格减去成本观察到。。

表9中Panel A为消费者剩余部分,前三个模型是基于的参数Heckman模型,IV和V则是对非参数模型估计结果的应用。很容易观察到的是,在系数的符号上,五个模型都表现出了良好的性状。其中FIT的符号为正,成本变量的符号为负,符合常理的预判。对比模型I、II和III不难发现,在增加了季度性和地域性虚拟变量以后FIT和Cost的系数在绝对值上都出现了下降,这说明不同地区和时间上的差异。模型IV和V之间的差异在于:前者的消费者剩余源自单纯的非参数估计,而后者则是修正了断尾问题以后的非参数模型估计结果。相比之下,模型V的估计系数比IV在绝对值上要略高一些,这也正说明了仅仅依赖于大企业样本的估计高估了FIT的作用。

对于生产者剩余的回归分析可以得到类似的结论,FIT和成本因素的影响和Panel A中基本类似:FIT正向作用于生产者剩余,而成本则反响影响这一变量。添加了季度和地区虚拟变量以后FIT的系数显著下降了,但是成本的变化并不大。这主要是因为成本变量在这里不包含运输成本,因此并不随地域波动。

表9 FIT和成本对社会福利的影响Panel A:消费者剩余

Panel B:生产者剩余

由于在回归分析中可以注意到季度因素对于FIT和成本的系数估计有显著的影响,当分季度逐个回归以后图7⑦图7的消费者剩余仅仅使用了模型9的估计结果。反映出了更多的动态信息。

Panel A和B都反映出了一个同样的信息:FIT的作用在不断递减,而成本因素的作用在不断递增。在2010年,无论是消费者福利还是生产者剩余都主要是由FIT贡献的,成本因素的影响很小,但是随着产业的成长,以及各国FIT不断的下调,政府补贴的作用在不断减少,而成本的推动力在不断加大。分别在2011年第四季度和2012年第一季度,成本的作用超过了FIT,在消费者和生产者福利中开始起主导作用。到2013年第三季度,模型估计的结果显示,在生产者福利中,FIT的贡献仅为成本因素的50%,而在消费者剩余中,不及成本影响力的30%。这一变动一方面说明了FIT下调确实导致了政策的促进作用大大弱化,另一方面,更应该注意到的是产业的快速成长足以弥补这一不利,而且当今市场上,成本不断下降,已经能够取代FIT成为推动市场继续发展的主动力了。

图7 FIT和成本对社会福利的动态影响

实证分析的最后一个任务是FIT的利用效率问题,不少学者(Boomhower, 2012)批评FIT利用率的不足导致了这一市场运行的低效率。得益于前文计算出的消费者剩余、生产者剩余和补贴幅度,图8展示了市场效率的动态变化。

很明显的趋势是柱形图的顶端部分,代表净损失的部分,随着时间的推移迅速减少,这是FIT利用率提高的有力证据。虽然在2010年初,净损失占了78%,但至2013年已经降至23%。与此同时还可以注意到,消费者剩余和生产者剩余占的比重均得到了提高,尤其是消费者剩余,从15%增长到了59%,在结构上主导了社会福利。由此看出,作为鼓励消费端的FIT政策经过一段时间的发展基本实现了目标,同时效率得到了极大的提升。

图8 社会福利结构动态变化

五、结论和延伸

总结以上的分析,本文针对过去四年光伏产业的实证研究得出了以下三点结论:

1. 通过修正数据集的从属断尾和内生变量问题,结论发现FIT对于消费者的需求弹性有着重要的影响。有FIT的国家需求弹性要小于没有FIT的国家。这恰恰说明了FIT存在的重要性,而也正是这样的影响导致了补贴的低效率。

2. 对从属断尾问题的修正可以发现,企业之间的地位是不平等的。基于非随机样本中大企业的回归分析测度到的各个因素对需求的影响和通过修正从属断尾以后的估计值存在明显的差异。其中收入效应、FIT和成本的冲击都被高估了。这说明大企业虽然在成本上有一定的优势,但是小企业对于大企业的冲击是不应该被忽视的。

3. 通过对动态时间轴上的子样本分析发现:FIT的使用效率在不断提高,这项补贴的社会净损失已经降低到了可以接受的水平;而经过四年时间的发展,光伏产业显著成熟,在这一市场中,FIT起到的推动作用正在不断减弱,而产业本身,通过降低成本激励需求的作用已经成为市场发展的主导力量。

尽管从计量层面上看,本文采用的非参数模型已经能有效解决内生变量和从属断尾问题,并且在实证分析中取得了理想的效果,但依然有两个问题值得继续研究和讨论。

首先是模型施加的市场结构约束。本文的结构模型是建立在一个垄断竞争假设之下的,企业之间的差异仅仅通过成本来体现。而在现实中,企业之间的差异不仅仅在于大企业有更大的成本优势,在市场准入、技术指标甚至政府关系上都能体现出在位的优势。对于新进入的企业来说,更适合的产业地位定义应该是大企业的追随者而不是直接竞争者。这样的模型需要更多市场竞争结构的数据信息来支撑。

其次,模型建立在一个局部均衡的分析框架内,所有的竞争只来自于光伏产业内部。其实作为一种新能源,太阳能发电在全球总发电量中占的比重不到5%,更多的竞争来自于煤炭等化石燃料,即便在新能源内部,风能、地热、光热技术的竞争作用也是不容忽视的。一个更加完备的全局模型不仅要求考虑光伏产业内部,更需要考虑其他可能的发电技术,补贴效率真正正确的考察需要定义在成本最小化的发电形式之下,而不是提前定义为光伏产业。

以上问题的解决不仅要求更加高端的计量模型,更多要依赖的是数据源的更加完备,作为非参数估计方法的讨论和社会福利的计量分析,本文提供的讨论已经足够了。

[1]丁明,徐宁舟.基于马尔可夫链的光伏发电系统输出功率短期预测方法 [J].电网技术,2011,35(1) : 152-157

[2]冯烽. 解释变量内生假定下非参数空间计量模型的局部线性工具变量估计[J]. 预测, 2015, 34(3):57-60.

[3]李园红,高明. 基于产业链视角的中国光伏产业发展思路. 亚太经济[J]. 2010(04). 103-106

[4]王少义,李英姿,王泽峰. 太阳能光伏并网系统发电量预测方法 [J]. 北京建筑工程学院学报,2013,29(1): 64-69.

[5]姚海祥, 李仲飞. 基于非参数估计框架的期望效用最大化最优投资组合[J]. 中国管理科学, 2014, 22(1):1-9.

[6]周先波, 盛华梅. 信息化产出弹性的非参数估计分析[J]. 数量经济技术经济研究, 2008(10):130-141.

[7] Abadie, Alberto, Joshua Angrist, and Guido Imbens.“Instrumental variables estimates of the effect of subsidized training on the quantiles of trainee earnings.” [J] Econometrica 70.1 (2002): 91-117.

[8] Boomhower, Judson, and Lucas W. Davis. “Free riders and the high cost of energy-efficiency subsidies.” [J] draft manuscript, University of California, Berkeley, March (2013).

[9] Burr, Chrystie. “Subsidies, Tariffs and Investments in the Solar Power Market.” [R] URL https://econ. arizona. edu/ docs/JobMarket/burr_jobmarket12. pdf (2012).

[10]Chandra, Ambarish, Sumeet Gulati, and Milind Kandlikar. “Green drivers or free riders? An analysis of tax rebates for hybrid vehicles.” [J] Journal of Environmental Economics and management 60.2 (2010): 78-93.

[11]Diamond, Peter A., and Daniel L. McFadden. “Some uses of the expenditure function in public finance.”Journal of Public Economics 3.1 (1974): 3-21.

[12]Gowrisankaran, Gautam, Stanley S. Reynolds, and Mario Samano. “Intermittency and the value of renewable energy.”[J] Journal of Political Economy 124.4 (2016): 1187-1234.

[13]Hausman, Jerry A. “Exact consumer's surplus and deadweight loss.”[J] The American Economic Review 71.4 (1981): 662-676.

[14]Hausman, Jerry A., Ariel Pakes, and Gregory L. Rosston.“Valuing the effect of regulation on new services in telecommunications.” [J]Brookings papers on economic activity. Microeconomics 1997 (1997): 1-54.

[15]Hausman, Jerry, and Ephraim Leibtag.“Consumer benefits from increased competition in shopping outlets: Measuring the effect of WalMart.” [J]Journal of Applied Econometrics 22.7 (2007): 1157-1177.

[16]Hausman, Jerry A., and Whitney K. Newey.“Nonparametric estimation of exact consumers surplus and deadweight loss.”[J]Econometrica: Journal of the Econometric Society (1995): 1445-1476.

[17]Hughes, Jonathan E., and Molly Podolefsky.“Getting green with solar subsidies: evidence from the California solar initiative.”[J]Journal of the Association of Environmental and Resource Economists 2.2 (2015): 235-275.

[18]Mercatanti, Andrea, and Fan Li.“Do debit cards increase household spending? Evidence from a semiparametric causal analysis of a survey.”[J] The Annals of Applied Statistics 8.4 (2014): 2485-2508.

[19]Newey, Whitney K., and James L. Powell.“Instrumental variable estimation of nonparametric models.”[J] Econometrica 71.5 (2003): 1565-1578.

[20]Notton, Gilles, V. Lazarov, and L. Stoyanov.“Optimal sizing of a grid-connected PV system for various PV module technologies and inclinations, inverter efficiency characteristics and locations.”[J] Renewable Energy 35.2 (2010): 541-554.

[21]Pashardes, Panos, Nicoletta Pashourtidou, and Theodoros Zachariadis.“Estimating welfare aspects of changes in energy prices from preference heterogeneity.”[J] Energy Economics 42 (2014): 58-66.

[22]R Radziemska, E.“The effect of temperature on the power drop in crystalline silicon solar cells.”[J]Renewable Energy 28.1 (2003): 1-12.

[23]Van Benthem, Arthur, Kenneth Gillingham, and James Sweeney.“Learning-by-doing and the optimal solar policy in California.”[J]The Energy Journal (2008): 131-151.

[24]Vartia, Yrjö O.“Efficient methods of measuring welfare change and compensated income in terms of ordinary demand functions.”Econometrica: Journal of the Econometric Society (1983): 79-98.

[25]Verardi, Vincenzo, and Nicolas Debarsy.“Robinson's square root of N consistent semiparametric regression estimator in Stata.”[J] Stata Journal 12.4 (2012): 726-735.

[26]Voyant, Cyril, et al.“Predictability of PV power grid performance on insular sites without weather stations: use of artificial neural networks.”[J] arXiv preprint arXiv:0905.3569 (2009).

Parametric and Nonparametric estimations of FIT’s social welfare effects under endogenous variable and incidental truncation adjustments——Sample based on Chinese PV industry (2010-2013)

SHEN Xi
(Changzhou trinasolar Ldt, Changshu, Jiangsu, Changzhou 213001, China)

Endogenous variable and incremental truncation are two problems due to non-random sampling, which trouble econometric industrial researching. Traditional and classical parametric methodology, limited by its pre-assumed functional forms, suffers lots of weakness and incompleteness in these two problems’ solution. Through comparing parametric and non-parametric estimation strategies and their estimation result, this paper concludes and claims the advantage of later in both accuracy and statistical operation. Applying this methodology to the empirical analysis of Chinese PV industry, the result dose find some evidence to claim the inefficiency of FIT. However, through dynamic sample, paper finds that this inefficiency is greatly improved. Furthermore, the growth of industry enables the costreduction has already replaced subsidy policy to be the dominant driver to support the development of solar industry.

Non-parametric estimation; incremental truncation; deadweight loss; PV

F062.9

A

2095-7572(2017)04-0034-31

〔执行编辑:刘自敏〕

2017-3-22

沈曦(1987-)男,常州天合光能有限公司市场战略部高级分析师,美国东北大学产业经济学博士,研究方向:产业经济学、能源市场竞争结构分析、反垄断实证分析、福利经济分析。

④y 为实际的收入水平,e(p(t),u1)为支出函数,衡量了在价格调整到p(t)时,为了维持效用水平U1需要的支出水平。

③中国发电量受到政策性因素的影响,在西部地区有相当规模的限发,因此统计估算法结果偏低。

⑥上方两张图来自于FIT国家样本,下方两张描述的是非FIT国家。

④由于在模型设定中,a1之前的符号已经被设定为负,因此大于零的a1估计量意味着向下倾斜的需求曲线。

⑤其中CS|FIT=0和PS|p(FIT=0)在统计上成为不可观测的变量(counterfactual),需要通过模型测度。

猜你喜欢

断尾参数估计补贴
为什么壁虎的断尾能再生?
《断尾的狐狸》新编
壁虎的独白
基于新型DFrFT的LFM信号参数估计算法
新增200亿元列入耕地地力保护补贴支出
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
小花猫与老鼠
“三清一改”农民能得到哪些补贴?
“二孩补贴”难抵养娃成本
Logistic回归模型的几乎无偏两参数估计