基于熵值法的省域数字经济发展空间分化格局
2020-07-16张海鹏张宝兵朱家明
张海鹏,张宝兵,朱家明
(1.安徽财经大学 国际经济贸易学院,安徽 蚌埠 233030;2.安徽财经大学 统计与应用数学学院,安徽 蚌埠 233030)
0 引言
数字经济作为一种新的经济社会发展形态,最早在20世纪90年代由经济合作组织提出,是指以数字化的知识和信息为基础,以互联网作为载体,依托信息技术提升效率和优化产业结构的一种经济形态[1].近年来,数字经济迅速发展,凭借其发展快、创新率高、渗透力强等特点,已经成为全球经济发展的重要引擎,是未来世界各国的重点发展方向.在数字化浪潮的席卷下,我国各省域陆续出台专项数字经济发展战略规划及相关政策举措.综合相关研究发现,各省份数字经济发展水平差异较大,其空间分化特点有待研究.
自从Tapscott[2]第一次提出数字经济概念以来,学者们从多角度对数字经济的基本内涵、影响、统计制度、制度优势、资源配置、发展动因等方面进行了研究.已有文献对数字经济进行了多方面研究,如:张辉[3]从理论上对数字经济的基本内涵,包括基本定义、发展历程、传导机制和发展规律等进行分析;续既、唐琪[4]认为发展数字经济带来的福利提升在现有核算体系中难以衡量,且与实际产出水平相比往往被低估;赵曦、陈静[5]认为数字化的影响并没有充分体现在经济统计中,应建立统计制度,更好地衡量数字经济;张新红[6]论述了我国发展数字经济的制度优势;龚晓莺[7]基于技术统治生产、供需市场精细化、产权交易壁垒消减和全要素生产率攀升等方面阐述了数字经济的发展动因.
目前对于数字经济的重要性还缺乏清晰直观的认识,大部分文献是关于数字经济的定性或定量研究,有关我国省域数字经济现状、整体特征和空间分化格局的文献报道较少.王彬燕等[8]基于腾讯研究院公布的数字经济指数,对2016年我国数字经济发展的空间分异特征进行了分析;钟业喜等[9]基于数字经济指数,采用空间计量模型、数理统计分析等方法,探讨了长江经济带数字经济水平空间格局及其影响因素;张雪玲等[10]从数字化基础设施、数字化应用、数字化产业变革三个维度重构省域数字经济发展测评体系,并采用自然间断点分级法,客观地揭示省域间数字经济发展空间分化格局及制约均衡发展的主要因素.
本文从数字技术发展和数字技术融合两方面构建评价体系并进行综合测评;利用变异系数和K-Means聚类等方法研究了我国省域在数字技术发展和数字融合方面的特点;利用ArcGIS绘制得到的两张数据地图,研究了省域数字技术发展水平与数字融合水平的关系.
1 研究方法
数字经济在当代社会越来越重要,其对每个省的GDP有突出贡献.关于影响数字经济因素的研究,可以从数字技术和数字融合两方面来讨论.从其内涵可以看出,数字技术对数字融合有着重要的影响,但其之间具体是什么关系还不清晰.因此,可以从这两方面出发,用软件与信息技术服务业来代表数字技术发展水平,用影响数字技术应用的因素代表数字融合水平.基于熵值法对我国各省域的数字技术发展水平和数字技术融合水平作出评价,将评价结果作为数字技术发展指数和数字技术融合指数,并根据这两个指数从分级和空间分化等角度研究我国各省域数字经济的发展现状.
熵值法是一种客观赋权法,其根据各项指标观测值所提供信息的大小来确定指标权重[5].本文采用改进的熵值法对我国各省域的数字技术发展水平和数字技术融合水平进行评价.设有m个样本,n个指标,构成原数据矩阵(xij)m×n,则xij表示第i个样本第j个指标的值,步骤如下:
1)采用极差标准法对原数据进行归一化,将所有数据转换为均是正值的标准化指标.对于正向指标:yij=(xij-minxij)/(maxxij-minxij),对于逆向指标:yij=(minxij-xij)/(maxxij-minxij).
2)计算第j项指标下第i个方案指标值的比重pij.
(1)
注意,当pij等于0时,用0.000001代替,避免计算时出现ln0的错误.
3)计算第j项指标的熵值ej.
(2)
其中,k>0,k=1/ln(m),ln为自然对数,0≤eij≤1.
4)计算第j项指标的差异性系数gj.
gj=1-eij
(3)
对于给定的j,若xij的差异性越小,则gj越小.
5)对差异性系数进行归一化,可计算出权重wij.
(4)
6)计算出综合得分,即数字技术发展指数或融合指数vi.
(5)
2 实证研究
2.1 指标体系的构建
运用相关用软件和信息技术服务业的相关数据构建数字技术发展水平的评价体系.选取了2016年28个省域(不包括西藏、宁夏和新疆)3个一级指标,16个二级指标.数据来源于《中国电子信息产业统计年鉴》和《中国高技术产业统计年鉴》.参考浙江省数字经济统计监测指标体系并考虑数据的可获得性,择优选择2016年31个省域影响数字技术融合水平的4个一级指标和19个二级指标.数据来源于《中国信息年鉴》和EPS数据库,个别缺失数据用相关方法填补.利用熵值法计算出每个指标的权重.指标和权重值详情见表1.
表1 部分跨境电商产业竞争力相关数据
2.2 省域数字经济在两个指数上的分级分析
利用熵值法计算出每个省域在数字技术发展水平和数字技术融合水平上每个一级指标上的得分,运用软件绘制出堆叠图,如图1所示.
图1 各省域数字技术发展水平(a)和数字技术融合水平(b)的堆叠图
从图1中可以看出,数字技术发展水平和数字技术融合水平均存在明显的分级现象,并且前者的分级现象较后者严重.为了更加准确地衡量分级的程度,可以使用变异系数来衡量分级程度的大小.经计算,数字技术发展指数和数字技术融合指数的变异系数分别为1.3963和0.7538;前者的变异系数是后者的1.85倍.说明数字技术发展水平的离散程度比数字技术融合水平更加严重,其程度已达到了数字技术融合水平的1.85倍.
2.3 对两个指数的两极化和空间分化格局分析
2.3.1 基于K-Means聚类分梯度
运用Sklearn库中的K-Means算法来解决如何对省域分梯度的难点.可以使用总的轮廓系数来衡量聚类结果的优劣程度,其值介于[-1,1],越接近于1代表内聚度和分离度都相对较优.基于数字技术发展指数和融合指数,利用K-Means算法对各省域进行聚类,发现分为5个梯队较为合适,其总的轮廓系数分别为0.61和0.64.针对数字技术发展水平和数字技术融合水平,我国省域第一梯队至第五梯队的省域个数比分别为2∶3∶5∶4∶14和2∶4∶10∶9∶6.
2.3.2 空间分化
为研究我国省域在数字技术发展水平和数字技术融合水平上的空间分化特点,根据K-Means对省域的分级结果,运用ArcGIS软件绘制出可视化地图(图2).从图2中可以看出,在数字技术发展方面,处于发达地位的是粤和苏,处于较高水平的是浙、鲁、京,处于中等偏上水平的是闽、辽、鄂、渝,处于中等偏下水平的是津、陕、湘、云,其他省域处于落后水平(新疆、西藏和宁夏不在统计范围内).值得注意的是上海市,由于上海在规模与效益和技术创新能力方面落后于浙江,在规模与效益、技术创新能力和信息技术传播水平方面落后于北京和山东,导致上海市下降至第三梯队.总体呈现的分化特点是:沿海省域水平高、中部少数省域水平中等、大部分省域水平低(特别是西部省域).第一至第五梯队的均值比为38.06∶18.64∶9.48∶4.16∶1,存在较为严重的发展不均衡问题.
图2 省域数字技术发展水平(a)和数字技术融合水平(b)的空间分化格局
从图2中还可以看出,在数字技术融合方面,比较发达的省域是粤和京,处于较高水平的是苏、浙、沪、鲁,处于中等偏上水平的省域是川、鄂、闽、辽、皖、豫、冀、湘、陕、津,处于中等偏下水平的省域是渝、赣、桂、黑、云、晋、贵、内蒙古、吉,其他省域处于落后水平.值得注意的是4个直辖市中只有重庆处于第四梯队,这是因为相对于第三梯队的省域,重庆在网络基础设施和数字网络普及方面水平偏低.结合图2和上述分析发现,数字技术融合水平的省域分化特点是:由东向西递减,由中向南北递减,沿海省域水平高,西部省域水平低.第一至第五梯队的均值比为9.40∶6.69∶3.24∶1.78∶1,存在发展不均衡问题,但远没有数字技术发展水平不均衡程度高.
2.3.3 数字技术发展水平和数字技术融合水平之间的关系
对比图2中的a、b两幅图发现,相对于数字技术融合水平,有些省域在数字技术发展水平上的梯队层次低于其数字技术融合水平,在数字技术发展水平上出现“降级现象”,具体情况见表2.
表2 省域数字技术发展水平相对于融合水平的梯队变化情况
从表2中可以看出,相对于数字技术融合水平,各省域的数字技术发展水平只有2个省域上升了一个梯队,10个省域保持不变,其余省域都存在降级现象,甚至有4个省域连降两级.为了研究这个现象背后的原因,对各省域数字技术发展水平的每一个二级指标进行聚类,并将其之分为5个梯队(经验证的轮廓系数都在0.6以上),然后与该省域所在的数字技术融合水平梯队进行比较,发现所得结果与此现象一致.
从表2中还可以看出江苏和重庆的情况比较特殊.根据计算结果可知,江苏省在规模与效益、信息技术传播上处于发达水平,优于数字技术融合水平第二梯队的省域.而重庆则因为就业人数、研发经费、信息技术服务收入和软件产品收入相对较高,导致数字技术发展水平比数字技术融合水平梯队高一个层次.由此可见,相对于其他省域江苏和重庆更加重视数字技术的发展.
在数字技术发展和融合水平上处于同一梯队的省域共有10个,说明其相对于其他省域,在这两方面发展得较为均衡.值得注意的是,其中有半数是沿海省域,其在这两方面都处于较高的水平,说明在一定程度上均衡发展是制约省域发展数字经济的重要因素.
根据计算结果对河北、河南、安徽和四川这4个连降两级的省域进行分析,发现河北和安徽在数字技术发展水平方面17个二级指标上都处于下降状态(相对于数字融合水平而言,下同);而河南和四川除了在技术创新方面的一个二级指标上仍保持着数字融合水平上的梯队,其余二级指标也处于下降状态.这说明相对于其他同等级数字融合技术的省域,河北、河南、安徽和四川在数字技术发展水平方面全面落后,这会对其发展产生不利影响.
综合上述分析可知,江苏和重庆更加重视数字技术发展,广东、浙江等10个省域在两个方面呈现均衡发展,半数左右的省域其数字技术发展水平落后于融合水平一个梯度,而河北、河南、安徽和四川4个省域的数字技术水平甚至落后了两个梯队.数字技术发展水平落后于数字技术融合水平呈现普遍现象.
3 结论与对策建议
根据上述分析,可以得出初步结论:我国省域数字技术发展水平和数字技术融合水平两个方面均存在分级现象,这种现象在数字技术发展水平方面表现更为突出,其程度为后者的1.85倍,同时发现数字技术发展水平落后于数字技术融合水平表现为普遍现象;在数字技术发展水平方面呈现出大部分省域水平低,中部少数省域水平中等,沿海省域水平高的特点;数字技术融合水平的省域分化特点是由东向西递减,由中向南北递减,沿海省域水平高,西部省域水平低.
根据所得结论,提出如下针对性建议:
1)政府可以出台一些相关政策,给予数字技术落后省域补贴和奖励.促进其对数字技术特别是软件和信息技术服务业的发展,提高其数字技术融合水平.同时也应根据实际情况,在数字技术发展方面,对每个省域提出一定的要求,促成缩小数字技术发展水平和数字技术融合水平间的差距,促进各省域数字经济的均衡发展.
2)沿海省域应继续保持数字技术发展水平上的引领地位.加强人才保障,吸引高端技术人才;做好资金保障,提高数字经济企业的融资能力.另一方面,沿海省域可以加大对数字技术发展水平落后省域的技术支持,开发市场,扩大需求,这样既能增加沿海省域的信息产业产值,又能促进落后省域数字经济企业的发展.
3)西部和南北部省域应加强数字技术的引进.多支持那些采取数字变革政策、进行数字转型的传统企业,促进数字经济新业态的产生.加强网络基础建设,大力培育数字经济平台,打造数字产业生态.沿海省域应继续保持数字技术融合水平的领先地位,加强战略顶层设计,推动核心技术突破.