APP下载

基于商品编码信息的浙江省经济复杂性分析

2020-09-23黄鑫伟韩筱璞章剑林

关键词:复杂性复杂度适应度

黄鑫伟,韩筱璞,2,章剑林,2

(1. 杭州师范大学阿里巴巴商学院,浙江杭州 311121; 2. 浙江省数字经济与全球编码研究院,浙江杭州 311121)

近年来,经济学家和物理学家引入了各种非货币指标定量评估国家的经济多样性和竞争力,这使得经济的发展潜力能够被量化,甚至可以实时地、低成本地揭示当前的经济现状和预测未来的经济增长.对于经济复杂性的量化,国内外许多学者对国家层面的数据进行了详细分析与研究.研究者通过国际贸易数据量化了各国经济复杂性[1-2],发现各国经济增长与经济复杂性之间是紧密关联的.文献[3]通过中国上市公司数据量化了中国各省的经济复杂性,也指出经济复杂性与经济发展有关.那么,经济复杂性能否适用于省一级的尺度上,在更细一层的样本上量化出的结果与经济发展之间是否有联系?为此,本文将研究范围缩小至省一级,通过新商品的标准化编码注册数据,采用最小复杂度方法量化浙江省各地区的经济复杂性,探究经济复杂性与经济发展的关系.

1 经济复杂性

最近一系列基于复杂性科学方法的研究[1]发现,国家之间的收入差异可以被国家之间的经济复杂性差异所解释,而经济复杂性可以通过一个国家现有的非贸易竞争力的多样性所衡量.这种非贸易的能力可以通过构建“国家-产品”二部图网络提取网络中的结构信息来刻画.对于经济复杂性的量化,Hidalgo和Hausmann等人进行了开创性的尝试[1,4],提出了反射法和经济复杂性指数,该方法通过一组线性迭代方程耦合国家的多样性和产品的普遍性表征出网络结构,他们发现各国产品多样化程度不同,出口产品存在差异,能力更强的国家能够生产出不那么普遍的产品[5].随后,Tacchella等人提出了一种新的非线性迭代方法[2,6]:适应度-复杂度方法,并提出了适应度指数和产品复杂度,该方法将国家竞争力或者说适应度和产品的复杂度联系起来,迭代产生一组关于适应度和产品复杂度的不动点,相较于反射法,该方法考虑了产品的复杂度应该是以适应度较低的国家为界的.Mariani等人[7]将反射法和适应度-复杂度方法运用于国际贸易数据,定量地比较了两种方法的度量能力,结果表明:在国家排名和产品排名两方面,适应度-复杂度方法都优于反射法;并且他们进一步将适应度-复杂度方法进行了泛化.文献[8]提出了最小极值度量,在没有噪音的数据中,最小极值度量能比适应度-复杂度方法产生更好排名.文献[9]从理论和数据两方面指出了适应度-复杂度方法的内在不稳定性.进一步的研究,Hartmann等人发现出口复杂产品的国家收入不平等程度较低[10],经济复杂性指数(ECI)在解释收入不平等方面表现优于GDP.Cristelli等人将适应度这一非货币指标与货币指标——如国内人均生产总值进行比较[11-12].为此,他们定义了适应度-人均GDP二维空间.在空间上他们发现国家经济的动态演化呈现出强烈的异质性:存在“流层”区域的国家和“混沌”区域的国家.处于“流层”区域的国家演化轨迹清晰,表现出很高的可预测性,而处于“混沌”区域的国家演化轨迹比较混乱,可预测性很低[12].基于这样的观察,他们认为回归并不适用于处理这种异质情形下的经济发展预测问题,并进一步提出一种数据驱动的方法——选择性可预测方案,该预测方法在准确率上要比国际货币基金组织发布的五年预测高出25%[13].文献[14]以贸易额、平均复杂度和适应度的时间演变为研究重点,对荷兰不同行业的出口进行了比较.他们发现高科技相关的行业平均复杂度高,但适应度低,而依赖原材料的能源和园艺等行业恰恰相反.文献[15]从行业层面量化了中国地区经济复杂性,并研究了与经济增长之间的关系,结果表明,地区经济的复杂性与经济增长存在明显的正相关关系,而且结论不受控制变量和内生性问题的影响.文献[3]基于企业注册信息构建了“省份-产业”二部图网络,定量地刻画了中国区域的经济复杂性,进一步说明经济复杂性框架是适用于一个国家内部的.文献[16]发现服务总体上比产品具有更高的经济复杂性.服务出口的复杂性和多样化可以为发展中国家和发达国家的经济增长提供额外的途径.

目前大多数研究采用国际贸易数据进行经济复杂性的研究[1-2,7-8,17-19],也不乏针对单一国家层面的研究[3,14-15,20].然而,在更小尺度上对经济复杂性的研究仍然缺乏,经济复杂性能否在更细一级的尺度上进一步地推广仍然未知.本文基于GS1编码体系的商品编码注册信息构建“地区-商品”二部图网络,通过最小复杂度方法对2007-2017年浙江省商品编码注册数据进行分析,来研究浙江省内的经济复杂性与经济增长之间的关系.

2 数据与方法

一个地区新商品注册的量可以通过商品编码信息得以体现,而商品和地区之间的关联又与地区的经济复杂性有着密不可分的联系,因此本文通过挖掘浙江省商品编码注册信息来研究区域经济的复杂性.数据集包含了1992-2017年浙江省除宁波市之外的10个地级市在各个年份所注册的新商品的分类、条码、地区、注册时间、企业等信息,所有年份数据中所包含商品类目包括有一级类目55个、二级类目308个、三级类目1257个、四级类目4598个,总共100万条数据,为数据库全量的10%随机抽样.各年份数据中所涉及的注册数量、各级类目数如表1所示,全部数据所涉及的所有一级类目信息如表2所示.

表1 商品数量、商品类目年度统计Tab.1 The statistics of commodity quantity and commodity classification for each year

续表1

表2 商品一级类目Tab.2 Commodity primary classification

我们对全数据进行了数据清洗工作,删除了外省数据.由于浙江省统计年鉴只有2007-2017年各地区的GDP数据,这里我们只选取了省内2007-2017年的商品注册数据.

为了计算地区的经济适应度和其商品的复杂度,我们采用了和文献[6]类似的方法,构建了“地区-商品”二部图网络,其中网络的连边为属于该类商品的且位于相应地区的商品注册数量.该二部图网络的邻接矩阵如图1所示.

图1 浙江省的“地区-商品”二部图网络,颜色代表不同地区Fig.1 City-products bipartite networks of Zhejiang province, and colors show the products of different cities

该二部图可以用邻接矩阵MA,P表示,如果地区A在商品P中具有显性比较优势(RCA)[21],即RCAA,P≥ 1,那么MA,P=1,反之则MA,P=0.在本文中,我们将RCA定义为一个地区某类注册商品量占其注册总量的比重与整个省该类商品注册总量占全省商品注册总量的比重这两者之间的比值.地区A中商品P的RCAA,P可定义为:

(1)

则邻接矩阵MA,P可定义为:

(2)

Hidalgo和Hausmann等人首次尝试用多样化程度定义竞争力[6].但是,他们的方法只是计算了国家出口的多样性和产品的普遍性,产品的复杂度并没有被量化.Tacchella等人在经济复杂性框架的基础上,改进了Hidalgo和Hausmann等人提出的反射法,提出适应度-复杂度方法,并指出反射法是基于某次迭代时产品普遍性与国家出口多样性之间的线性关系,普遍性和复杂性可通过算数平均求得[2,22].如果用产品的普遍性去代表产品的复杂度,仅仅用多样性的算数平均值去评价一个产品的复杂程度是不合理的[11].他们认为应该用一个高度非线性的关系来定义产品的复杂度,这些复杂度由国家的适应度的加权所给出.因为发达国家几乎出口所有产品,一件产品由发达国家出口,其所能给出的产品复杂度很有限;而不发达国家出口一件产品,表明生产该产品并不需要很多技术含量,复杂程度并不高.出于这样的考虑,产品的复杂度主要取决于竞争力较弱的出口国家的适应度.并且文献[7]指出适应度-复杂度方法在国家排名和产品排名上都优于反射法.然而,适应度-复杂度方法也存在缺陷.他们将复杂的产品限制在最先进的国家,这就直接否定了生产数量少的国家的产品复杂度,而且所提出的迭代过程放大了这种效应,使得那些没有生产足够独特产品的国家的适应度随着迭代次数的增加而收敛到零.

在本文中,针对这一问题,我们采用了最小复杂度方法,并假设每个注册商品都均匀地被销售至每个地区.一个商品注册多样化的地区能提供的产品复杂度十分有限,一个多样化程度低的地区拥有复杂度更低的商品.那么,非线性的迭代可以通过适应度较低的地区约束商品的复杂度,并且产品的复杂度将会被赋予一个下限.对于适应度来说它是注册商品数量的加权总和,权重为每类商品的复杂度;对于注册商品的复杂度来说,应该与其所注册的地区数量成反比.此外,如果一个地区的适应度较高,那么它应该对该商品有着较小的复杂度权重,而适应度较低的地区对该商品的复杂度权重会增加.地区A的适应度FA与商品P的复杂度QP之间的耦合关系由以下非线性迭代过程获得:

(3)

3 实证分析结果

3.1 地区经济复杂性分析

在分析中所用的基础经济指标,包括人均GDP(GDPpc)、各市的相对人均GDP (R)、适应度指标(FI)以及总体适应度指标(FT)均取对数处理.其中人均GDP等数据均取自《浙江省统计年鉴》[24].下面给出R、FI和FT的定义式:

R=log10(GDPpc_city/GDPpc_province),

(4)

(5)

(6)

3.2 适应度排名分析

(7)

浙江省经济在总体适应度-GDP空间内的路径如图2所示,整体上该路径呈现为总体适应度与人均GDP同步增长的趋势.

图2 浙江省2007-2017年在总体适应度——人均GDP空间中的轨迹图Fig.2 Trajectory of Zhejiang province from 2007 to 2017 in Total Fitness-GDPpc space

进一步我们观察了浙江省各个地区的适应度在各个年份的排名,如图3(a)所示.我们发现金华、杭州、温州等这些位于浙江省中部的地区的适应度较高,而湖州、丽水、舟山等这些位于浙江省外围的地区的适应度较低,表明浙江中部地区比外围地区表现出了更强的经济多元化.排名最高和最低的两个地区在大部分年份分别是金华和舟山,其中金华的高适应度可能和其发达的小商品市场有关,而舟山则受制于自身体量经济较为单一化.一些排名位于中游的地区,如绍兴、台州等,其适应度随年份的波动比较大,而如杭州、温州、嘉兴等地的适应度则相对稳定.相比人均GDP的排名(如图3(b)所示),适应度排名有着较为剧烈的波动,反映出适应度指标在挖掘经济特征变化方面有着较高的敏感性.

(b) 各地区在适应度-相对人均GDP空间的演化路径

(a) 适应度排名

(b) 人均GDP排名

3.3 经济复杂性演化的地区差异

为了进一步研究经济发展是如何依赖于适应度,我们将2007-2017年的静态适应度-人均GDP空间转化成了动态的演化图.为了增强对各地区经济趋势差异的识别,在量化浙江省各地区经济适应度时,并没有采用如式(7)所示的对数形式的归一化处理方法,而是采用适应度-复杂度方法中原有的归一化方法(见式(3)),这是因为我们所提出的最小复杂度方法是基于适应度-复杂度方法,而且在上述的地区适应度排名分析中可以看出适应度的波动性大,能更有效地捕捉经济差异.各地区在适应度-人均GDP空间中的演化路径图如图4(a)所示.总体而言,除了金华,其他大部分地区呈现出适应度略有下降的趋势,反映出各地区在区域分工中更多趋向于专门化.结合浙江省整体的适应度增长的趋势,这一地区内的单一化趋势反映出浙江省经济结构正在向大规模的区域分工发展.同时,图4(a)还显露出各地区的路径明显分布在两个区域:虚线右方各地区有着相对较高的适应度,以沿海城市为主体;而虚线左方区域所包含地区包括经济体量很小的舟山以及丽水、衢州两个内陆地区,显示出这些地区经济的较强单一性.

(a) 各地区在适应度-人均GDP空间的演化路径

进一步我们观察了各地区的演化路径.相对人均GDP剔除了省内经济增长的宏观趋势,更能凸显各地区经济水平的相对差异.如图4(b)所示,发现各个地区的路径在适应度-相对人均GDP空间中所散布的区域基本上互不重叠,暗示出各地的经济发展已经形成了较为稳定的模式,而且这种模式有着较为明显的地区差异,显露出了区域经济的异质性.

4 结论

本文以浙江省10个地区多类行业的商品编码数据为基础,研究了浙江省区域经济的复杂性.由于数据缺失,对于宁波市经济复杂性并未进行量化,但这并不影响结果.通过提取“地区-商品”二部图网络的适应度和产品复杂度,各个地区经济差异被适应度明显区分开.我们提出了最小复杂度方法,改进了适应度-复杂度方法,降低了低复杂度商品的惩罚权重,并进行了量化.我们将各个地区每年的量化结果适应度进行了排序,发现浙江中部地区的适应度明显高于浙江西南地区以及浙江外围地区,排名最高和最低的地区每年的排名十分稳定,排名中游的一些地区波动程度较大.通过与人均GDP排名的对比,适应度指标显露出对经济结构变化较强的反应能力.进一步,我们通过观察各地区在适应度-人均GDP空间内的演化路径,发现在浙江省的适应度增加的同时,各地区的适应度趋向于下降,从而挖掘出浙江省经济的区域分工深化趋势.以上这些结果显示出本文所用的经济复杂性分析方法的有效性.

最后值得一提的是,由于本文所采用的数据是新商品的标准化编码注册信息,因此该信息也部分程度地关联到所注册商品的创新性和创业性活动.从这个意义上说,本文所得各项结论,也可在一定程度上反映出各个地区在产品创新与创业性活动方面的发展趋势.

猜你喜欢

复杂性复杂度适应度
改进的自适应复制、交叉和突变遗传算法
新时代城乡学前教育均衡发展的复杂性挑战与路径优化——基于复杂性理论
复杂性背后
PFNA与DHS治疗股骨近端复杂性骨折的效果对比
简单性与复杂性的统一
非线性电动力学黑洞的复杂度
一种低复杂度的惯性/GNSS矢量深组合方法
一种基于改进适应度的多机器人协作策略
求图上广探树的时间复杂度
某雷达导51 头中心控制软件圈复杂度分析与改进