基于阶层线性模型的集聚经济实证分析

2014-12-02徐小靓田相辉

技术经济 2014年10期

徐小靓，田相辉

（1.武汉大学中国中部发展研究院，武汉 430072；2.青岛农业大学经济与管理学院，青岛山东 266109）

1 研究背景

区域环境对经济行为主体的集聚产生较大影响。本文以城市和行业为分析样本，验证城市异质性在行业集聚过程中的独特作用。这里所提到的城市异质性主要是指城市环境的差异性和多样性。本文借鉴Cronon的观点，将城市异质性归结为先天差异（first nature）和后天差异（second nature）两个方面。其中，先天差异主要表现为地区自然禀赋的差异，如原料、气候和地理等方面的差异；后天差异主要表现为城市在经济、文化层面的特征差异和规模差异等［1］。

集聚经济具有不可观测性，一直被当作“黑箱”。采用计量经济学方法对集聚经济的识别和估计也因学者们所用数据和方法的不同而没有一致结果，如有关地方化经济和城市化经济的持久争论。Van Oort、Burger和Knoben认为，对集聚经济认识的不明确（ambiguity），一方面源于集聚经济测度方法的不同，另一方面在于集聚经济本身并不是同质的，它在不同维度上有不同的变化，而既有文献缺乏从宏观层次到微观层次的全面分析［2］。

图1简要地显示了从微观到宏观层面的集聚经济的行为主体。图1不仅展现了企业、行业和城市3个横向层面，而且突出了企业嵌套于行业、行业嵌套于城市的纵向结构。这种嵌套结构决定了各个层面行为主体的异质性。比如，行业层面的集聚经济不仅受行业自身特征的影响，而且受行业所嵌套的城市经济社会环境的影响。Saxenian认为，美国加利福尼亚“硅谷”地区和环波士顿128号公路地区的关键区别在于两者的组织文化环境不同：前者是灵活（flexible）和创新（entrepreneurial）；后者是僵化（rigid）和等级（hierarchical）［3］。Florida 和Gates运用同性恋指数反映区域高科技产业的集中度及高科技产业的生长情况，城市的同性恋集中度越高，其社会多样化和开放度越高，越能吸引和发展高科技产业［4］。可见，城市异质性是考察集聚经济时不可忽视的重要因素。

传统线性回归（classic linear regression）分析的基本假设是线性、正态、方差齐性以及独立分布。对于嵌套数据而言，前两个假设对于分层数据较易保证，但方差齐性和独立分布两个假设却很难满足。这就决定了需要采取不同于传统回归分析的工具——如在社会科学中日益被广泛应用的阶层线性模型（hierarchical linear model，HLM）——研究集聚经济各维度行为主体的异质性和嵌套结构，它能实现从宏观层面到微观层面的全面分析［2］。就本文而言，虽然可以假设不同城市的样本数据是相互独立的，但是却很难保证同一城市内不同行业的数据是相互独立的，这主要是因为同一城市内的不同行业受相同城市环境变量的影响。要有效解决嵌套数据面临的异方差难题，一方面需要利用随机效应模型捕捉不可观测的异质性，另一方面需要合理解释多层次模型回归系数的变异。

具体来看，利用阶层线性模型分析集聚经济具有两方面的独特优势：一方面，阶层线性模型是捕捉各维度间内在联系的天然分析工具，这主要基于一个简单的事实——共享集聚经济的外部性使得处于同一地区的不同微观个体处于相同的外部环境中，其行为特征与其他地区个体的行为特征相比具有更高的相似度；另一方面，阶层线性模型能够捕捉到不可观测的城市异质性——这主要通过分析随机效应来实现。Corrado和Fingleton认为，采用多层次分析方法（阶层线性模型）不仅能够有效识别内生和外生的同群效应，而且在一定程度上能够有效避免遗漏变量而产生的内生性（endogeneity）问题［5］。鉴于此，本文采取阶层线性模型和集聚经济的间接估计策略，利用全国第一次和第二次经济普查中城市和行业的相关数据，验证集聚经济的存在形式，有效捕捉集聚经济行业维度的不可观测的异质性，揭示集聚经济各维度间内在联系。

图1 集聚经济的维度①在图1中，企业（或劳动力）是第一层中微观个体的代表。

后文的结构安排如下：设定模型并说明相应的估计策略；分析和构造阶层线性模型；运用阶层线性模型对集聚经济进行实证分析；进行总结评论并提出相关的政策建议。

2 模型设定与估计策略

2.1 模型设定

在假设外部效应是希克斯中性（Hicks neutral）的前提下，企业i的生产函数可表示为yl=g（Al）f（xl）。

式（1）中：x为通常的土地、劳动力和资本等投入要素；A为企业面临的环境要素，是刻画集聚经济外部性的关键。通常情况下，集聚经济不仅取决于相互作用的各企业的生产规模，而且取决于企业间的“距离”。这里的“距离”主要包括地理维度上的距离dGlk、产业维度上的距离dIlk和时间维度上的距离dTlk。那么，企业i所获取的所有集聚经济为：

式（2）中：K为与企业i有相互作用联系的其他所有企业的集合；函数q和函数a分别表示上述集聚经济所取决的两个方面。那么，通过估计式（1）可得集聚经济在地理维度、产业维度和时间维度上的生产效应。从实际情况来看，集聚本身是一个复杂的、系统的经济社会现象，涉及产业、地理、时间和社会等多个维度，而关于集聚的大部分实证分析只涉及其中的一个或两个维度，目前基本上没有囊括所有维度的系统分析［6］。

由于直接估计存在诸多挑战，因此间接估计方法在现实的实证分析中得到了广泛运用。下文将结合就业增长的间接估计方法进行简单介绍［7-8］。

2.2 内生性问题与估计策略

基于就业增长的间接估计方法的核心理念是：集聚经济提高了生产力，从而促进了就业增长。但是，采用这种估计方法需要重点处理测量偏误和内生性的问题，具体表现在如下两个方面：

第一，前期要素投入（各种类型的固定资本投入）在较大程度上影响企业就业增长。解决方法是：考察足够长时间段内的就业变化，从而排除这些固定要素对就业增长的影响。例如：Glaeser、Kallal和Scheinkman等考察了1956—1987年美国170个城市较大行业的就业变化情况［7］；Combes 考察了1984—1993年法国341个地区工业和服务业的就业变化情况［8］。本文考察的是第二次全国经济普查相对于第一次全国经济普查的就业变化情况，时间跨度为5年。相对于国外学者的研究，虽然这一时间跨度有些短，但是考虑到目前中国仍为发展中国家的实际情况，该时间跨度基本上能满足分析的要求①根据《中国民营企业发展报告2005》蓝皮书：“据统计，全国每年新生15万家民营企业，同时每年又能死亡10万多家，有60%的民企在5年内破产，有85%的在10年内死亡，其平均寿命只有2.9年”；“有抽样调查显示：中国民营企业的平均寿命仅为3.5年，远远低于美国企业的8.2年和日本企业的12.5年”。。

第二，就业增长与集聚经济互为因果关系。工具变量法（instrumental variable，IV）是控制内生性的常用方法，一个好的工具变量应与误差项无关但与解释变量高度相关。本文的主要解决方法是用第一个方面时间段中的初期情况作为工具变量。比如：Glaeser等用1956年美国的集聚经济情况解释1956—1978 年期间的就业变化［7］；Combes 采用1984年法国的集聚经济情况解释1984—1993年期间的就业变化［8］。

3 研究方法和数据

3.1 阶层线性模型（多层次分析）

阶层线性模型②阶层线性模型的英文简称为HLM，这也是分析软件的名称，所以现在都将之称为多层次分析模型（multilevel modeling）。是基于社会研究中的阶层（hierarchical）或嵌套（nested）数据结构，综合考虑组间（总体层次）信息的一种回归分析方法［9-10］。最一般且最典型的阶层线性模型是以截距和斜率为结果的回归模型，又称随机变动系数模型或完整模型［9］。两个层次分别设定为：

第一层为行业维度：

第二层为城市维度：

式（3）～式（5）中：j（j=1，2，…，J）表示城市维度；i（i=1，2，…，n）表示行业维度；Xij表示行业维度中的集聚经济变量，Zj表示城市维度中的集聚经济变量和控制变量；εij表述第一层回归的误差项，服从经典回归模型的零均值同方差（σ2）的正态分布假设；第二层的两个误差项u0j和u1j服从二元联合正态分布，两者的均值为0，u0j的方差为τ00、u1j的方差为τ11。将式（4）和式（5）式带入式（3），整理后可得随机系数的跨层级模型，也称混合模型：

式（6）中等号右边的前4项属于模型的固定效应部分，后3项包含模型所有的误差项，属于模型的随机效应部分。阶层线性模型与一般回归模型的最主要区别在于组间差异不同，需要设计如下零模型（null model）来辨别两者：

计算组内相关系数ρ（intra-class correlation coefficient，ICC），用以衡量组间方差与组内方差的相对关联程度，ρ的计算公式如下：

Cohen［11］建议判断相对关联程度的准则如下：0.01≤ρ＜0.059，为低度关联强度；0.059≤ρ＜0.138，为中度关联强度；0.138≤ρ，为高度关联强度。

在具体的实证分析中，可以通过考察第一层（L1）和第二层（L2）的变量系数符号来判断第二层自变量对第一层自变量的调节效应（moderate effect）或交互作用。如果L2中变量的系数符号与相应的L1 中变量的系数符号相同，则说明L2层的变量能加强L1层的对应变量对L1层的被解释变量的作用，影响方向与变量系数符号的方向相同；两层变量的系数符号相反，则说明L2 层的变量会削弱L1层的对应变量对L1层被解释变量的作用，影响方向与L1层的该变量系数符号的方向相反。

3.2 模型设定和变量选择

基于本文的研究主题，将阶层线性模型设定为如下形式：

第一层行业维度：

第二层城市维度：

下文将具体介绍因变量和自变量的界定。为了避免内生性问题，本文将所有解释变量的初期都界定为2004年，以便可以捕捉到集聚经济及其对行业就业变化的真实影响。

Hoover［12］和Isard［13］将集聚经济划分为内部规模经济和以地方化经济、城市化经济为存在形式的外部规模经济。据此，本文用行业专业化指数、行业多样化指数和内部规模经济3个指标测度行业维度的集聚经济。根据本文对城市异质性的界定，用资源型城市、城市多样化、城市历史和文化特征以及城市相对规模来捕捉城市异质性。具体变量说明如下：

1）被解释变量（Y）。

根据2.2节集聚经济的间接估计策略，本文将被解释变量设定为2004—2008 年期间城市i中s行业的就业增长与全国该部门就业增长的差异，即

式（14）中：empi，j，t为t期城市i中行业j的就业量；t=2004，2008；empj，t为t期全国行业j的就业量，t=2004，2008。

2）行业专业化指数（SPE）。

行业专业化指数的计算公式为：

式（15）中：empi和emp分别为城市i和全国的就业总量；empi，j和empj分别为城市i和全国中行业j的就业量。

3）行业多样化指数（DIV）。

本文采用赫希曼-赫芬达尔指数（Hirshman-Herfindahl index，HHI）的倒数作为行业多样化指数。HHI是对所有部门的就业份额平方的加总，用全国数据对用其倒数衡量的行业多样化指数进行标准化处理：

式（16）中：j表示产业部门的数量。从式（15）和式（16）可以看到，产业部门j的专业化指数和多样化指数并不一定负相关。

4）内部规模经济（SCALE）。

将内部规模经济设定为①Glaeser等将该变量的倒数作为衡量企业间竞争程度的指标［7］。本文采用Combes的处理方法，将之设定为内部规模经济［8］。：

式（17）中：nbri，j和nbrj分别为城市i和全国范围内属于行业j的企业数量，本文使用企业法人单位数。

5）资源型城市（NATURAL）。

本文将资源型城市作为城市异质性中第一天性的代理指标。资源型城市是指因自然资源的开采而兴起或发展壮大且资源性产业在工业中占有较大份额的城市。根据国家计委宏观经济研究院课题组在《我国资源型城市的界定与分类》［14］中的界定范围，本文的研究样本中共有40个资源型城市，主要分布在山西、辽宁、吉林、安徽、江西、陕西、广西、广东和福建等省区。

6）城市多样化（DI）。

城市多样化是城市文明的鲜明特征，是城市异质性中第二天性的重要表现，符合经济学中消费者消费偏好多样化。本文以Duranton等［15］的城市多样化指数作为城市多样化的代理变量，其计算公式为：

式（18）中：sij为城市i中行业j的就业占城市i的总就业的份额。与行业专业化指数和行业多样化指数一样，也对城市多样化指数进行标准化处理：

式（19）中：sj为行业j的就业占全国总就业的份额。如果一个城市完全专业化于一个产业，那么其多样化指数为1。

7）城市历史和文化特征（OPEN）。

在中国改革开放历程中，各城市的最大区别就是开放时间和开放程度不同。开放是当代城市发展的鲜明特征，开放城市通过与世界市场在经贸、文化等领域进行沟通往来，率先融入全球化，这进而促进了城市内部一系列的制度变革。基于此，本文将城市间差异化的历史和文化特征界定为城市的开放时间和开放程度，用虚拟变量表示。具体来看，直辖市、经济特区、沿海开放城市以及内陆省会城市的该值为1，其余城市的该值为0。

8）城市就业密度（DEN）。

关于城市就业密度，本文用总就业变量代替部门就业变量，主要是考虑到总就业变量能够合理反映城市经济规模，可以有效避免地方化经济被过高估计。

式（20）中，empi为城市i的劳动力就业总量；areai为城市i的建成区面积。

3.3 数据来源和描述性统计分析

阶层线性模型的第一层行业数据来自第一次和第二次全国各省（自治区和直辖市）的《经济普查年鉴》，共包括151个地级市和30个制造业行业，其描述性统计结果如表1所示。

表1 行业数据的描述性统计结果

被解释变量Y的均值均为负值，说明2004—2008年期间所考察制造业样本的就业总体上是下降的。阶层线性模型的第二层城市数据来自《中国城市统计年鉴2005》，具体的统计信息如表2所示。

表2 城市数据的描述性统计结果

4 实证分析

根据第2节的理论分析和第3节的模型设定，本节利用阶层线性模型分析城市异质性对行业层面集聚经济的影响。

首先，采用极大似然估计中的迭代过程估计零模型即式（7），并利用式（8）计算得出被解释变量Y的组内相关系数ρ为0.084。根据Cohen建议的判断准则，这属于中等关联强度，属于是不可忽略的组间差异。所以不能只用一般的回归模型进行分析，必须考虑到组间差异的特性［11］。

然后，构造随机系数模型。在HLM 中只有第一层有自变量，第二层或以上为零模型，也就是不存在第二层自变量的设定，此时将第一层回归模型的回归系数均设定为随机效应。再次，构造完整模型，将城市异质性的代理变量引入模型的第二层。HLM 的估计结果见表3。

表3 HLM 的估计结果——制造业

比较随机效应模型和完整模型的估计结果，可发现：第二层截距项的随机系数均在0.10的水平下统计显著，而且τ00的值由随机系数模型中的0.030降为完整模型中的0.029，减少了约3.3%；完整模型中第一层误差项的方差降为0.086，比随机效应模型中的方差略小；相对于随机效应模型，完整模型在第一层误差项方差的改善幅度R2为1.1%。这表明城市异质性变量的引入对第一层行业维度的集聚经济变量的影响较大。

具体分析如下：在随机效应模型中，行业专业化（SPE）和内部规模经济（SCALE）的系数均统计显著但均为负值，行业多样化（DIV）的系数为正值但统计不显著，可见利用随机效应模型无法验证制造业中的集聚经济；当引入城市异质性变量后，完整模型的回归结果显示，行业专业化（SPE）和行业多样化（DIV）的系数和系数符号均发生了较大变化，其中，行业多样化（DIV）的系数符号由正变负但不是很显著，行业专业化（SPE）的系数符号由负变正、其系数绝对值由0.009提高到0.036，且在0.05的水平下显著。这表明，在引入城市维度变量后，地方化经济在制造业中得到了验证。

纵向来看，表3可分成上下两个部分：固定效应与随机效应。前者表示层级一与层级二的自变量对城市就业相对变化的影响效应；后者表示模型中的这些自变量没有解释的城市就业相对变化的差异。从表3可以看到：完整模型中所有变量的随机效应均统计显著。表的最左端列出的自变量分为两个层级，其中层级一的行业维度自变量通过加粗的方式以示区分。需要说明的是：所有层级一自变量的回归系数表示行业维度变量对就业相对变化的影响效应，层级二自变量的回归系数表示城市异质性变量对行业维度变量影响就业相对变化的调节效应。我们重点关注城市异质性变量对得到验证的地方化经济的调节效应。

具体分析如下：城市异质性的代理变量——资源型城市（NATURAL）的系数为正值但统计不显著，表明在样本条件下以自然资源为代表的城市先天差异对行业集聚经济有正向影响，但作用不显著；城市多样化变量（URBAN）和城市规模变量（DEN）分别在5%和10%的水平下显著为负，表明城市多样化和城市规模对行业集聚经济有负面影响；城市历史和文化变量（OPEN）的系数为正值且在1%的水平下显著，表明城市历史和文化对制造业的地方化经济具有显著的正向调节效应。

5 结语

共享集聚经济外部性使得同一地区的不同微观个体共享相同的外部环境，因此其行为特征比其他地区的个体具有更高的相似度。基于这一简单事实，本文采用阶层线性模型和集聚经济的间接估计策略，重新验证集聚经济的存在形式，进而捕捉集聚经济行业维度不可观测的异质性，揭示集聚经济各维度间内在的密切联系。实证结果表明：行业层面的集聚经济不仅受行业自身特征的影响，而且深受行业所嵌套的城市经济社会环境的影响。在引入城市异质性变量后，地方化经济在制造业中得到验证。

在中国，一个很有意思的现象是，当要发展某种产业时，从中央到地方的各级政府部门首先想到的是“园区”和“新城”——各类开发区、科技新城（园区）、大学科技园区、低碳园区、产业转移园区以及创意产业园区等。这一现象背后的核心问题是集聚经济。如果不能科学、全面地认知集聚经济，那么轰轰烈烈地再造“硅谷”或“新城”也只不过是一场“圈地运动”［16］。基于本文的研究结论，当今世界比较出名的产业集聚区如“硅谷”和“第三意大利”等因其所处环境的异质性是不可能被完全“再造”的。如果各地区不顾资源禀赋和比较优势等自身实际情况［17］而大搞“产业集聚区”建设，那么最终肯定事与愿违。集聚经济的产生一方面源于自发的纯外部效应，另一方面需要通过市场机制来实现。中国政府在对产业发展和城市发展进行干预时，首先要根据上述两方面的客观经济规律进行调控，不仅仅要关注企业规模，更要重视培育开放、竞争的市场环境，根据企业产品生命周期和行业特征来促进产业集聚经济的可持续发展。特别是在当前城市化快速发展的背景下，中国各级政府应深刻认知各个维度的集聚经济，促进工业化与城市化的良性互动，鼓励企业参与地区和国际产业分工，科学培育集聚优势。

［1］CRONON W.Nature＇s Metropolis：Chicago and The Great West Norton［M］.New York：W.W.Norton &Company，1991.

［2］VAN OORT F G，BURGER M J，KNOBEN J，et al.Multilevel approaches and the firm—Agglomeration ambiguity in economic growth studies［J］.Journal of Economic Surveys，2012，26（3）：468-491.

［3］SAXENIAN A L.Regional Advantage：Culture and Competition in Silicon Valley and Route 128［M］.Cambridge：Harvard University Press，1996.

［4］FLORIDA R，GATES G.Technology and Tolerance：The Importance of Diversity to High-Tech Growth［M］.Washington D.C.：Brookings Institution，2001.

［5］CORRADO L，FINGLETON B.Where is the economics in spatial econometrics？［J］.Journal of Regional Science，2012，52（2）：210-239.

［6］ROSENTHAL S S，STRANGE W C.Evidence on the nature and sources of agglomeration economies［J］.Handbook of regional and urban economics，2004（4）：2119-2171.

［7］GLAESER E L，KALLAL H D，SCHEINKMAN J A，et al.Growth in Cities［J］.Journal of Political Economy，1992，100（6）：1126-1152.

［8］COMBES P P.Economic structure and local growth：France，1984-1993［J］.Journal of Urban economics，2000，47（3）：329-355.

［9］温福星.阶层线性模型的原理与应用［M］.北京：中国轻工业出版社，2009.

［10］GARSON G D.Hierarchical Linear Modeling：Guide and Applications［M］.Thousand Oaks：SAGE Publications，Inc.，2013.

［11］COHEN J.Statistical power analysis for the behavioral sciences［M］.Lawrence Erlbaum Associates，1988.

［12］HOOVER E M.The Location of Economic Activity［M］.New York：McGraw-Hill，1948.

［13］ISARD W.Location and space-economy［M］.Cambridge：MIT Press，1956.

［14］国家计委宏观经济研究院课题组.我国资源型城市的界定与分类［J］.宏观经济研究，2002（11）：37-39.

［15］DURANTON G，PUGA D.Diversity and specialisation in cities：why，where and when does it matter？［J］.Urban studies，2000，37（3）：533-555.

［16］王缉慈.超越集群——关于中国产业集聚问题的看法［J］.上海城市规划，2011（1）：52-54.

［17］罗能生，张文波.我国区位优势对制造业集聚影响的实证研究［J］.技术经济，2012（4）：26-31.