APP下载

中国省域数字经济发展水平测度研究

2022-02-02李顺勇张睿轩张佳璇赵冠婕

生产力研究 2022年12期
关键词:权法马尔可夫灰色

李顺勇,张睿轩,张佳璇,赵冠婕

(山西大学 数学科学学院,山西 太原 030006)

一、引言

近年来,数字经济发展规模不断扩大,很大程度上促进了我国整体经济规模稳步向前。2016 年在杭州召开的G20 峰会重新定义数字经济[1]:以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重要载体、以信息通讯技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动。现今中国经济正处于高质量发展阶段,并逐步向数字强国迈进[2-3]。加快合理评价数字经济发展的步伐,提高我国各省份数字经济发展水平迫在眉睫。

徐小凡(2021)[4]通过对比国内外不同研究方法之间的共性与差异,总结出两种基于数字经济测算角度的统计口径和测算方法。张媛媛和周春应(2021)[5]使用熵权法建立评价体系,研究长三角等三大都市圈的数字经济发展状况。高露静和姚正海(2021)[6]主要从数字基础设施、数字创新能力、数字产业化三个维度运用熵权法研究华东地区2013—2018 年的数字经济发展状况。李英杰和韩平(2022)[7]基于熵值法测度了中国2010—2018 年数字经济水平发展趋势,并建立灰色预测模型对2019—2028 年的数字经济发展走向进行预测。盛斌和刘宇英(2022)[8]研究了数字经济发展指数的测度与空间分异特征之间的关系,认为不同空间的数字经济发展水平不均衡,且省域差异逐年减小。王娟娟和佘干军(2021)[9]在对数字经济的研究中,创造性地引入地区发展新指标,评估各地区差异化发展状况,将我国区域经济发展水平划分为三大梯度。

本文在建立数字经济测度体系的基础上,采用熵权法、层次聚类、灰色马尔可夫模型等方法深入研究我国各省市数字经济发展水平的差异,对完善、延申数字经济理论知识和制定地方性政策具有现实意义。

二、模型原理介绍

(一)熵权法

信息熵[10]表示特征包含信息量的期望,用于衡量信息量大小。表达式如下:

式(1)中,U 表示所有可能事件的集合,pi为事件Ui发生的概率。

信息熵越小,表示指标包含的信息量越大,熵权法赋予该指标的权重则越大[11]。

熵权法[12]步骤如下:

(1)确定指标体系:设原始数据的第i 个特征为xi,第i 个指标的第j 个值为xij(1≤i≤n,1≤j ≤m);

(2)数据归一化公式如下:

(3)计算第i 个指标第j 个值的比重:

(4)计算第i 个指标的信息熵:

(5)计算第i 个指标的权重:

(6)根据指标权重计算样本评分:

熵权法能够根据各指标的区分能力确定权重,具有较高的合理性和可信度[13]。

(二)层次聚类

层次聚类[14]利用树形结构反映聚类结果,常采用欧氏距离计算两样本点之间的距离,平均值距离计算类间距离,用dij表示第i 个样品与第j 个样品之间的距离,dmean(ci,cj)表示簇间距离,公式如下:

其中,mi、mj分别表示两簇的中心点。

(三)灰色马尔可夫模型预测

灰色预测[15]是对灰色系统所作的预测,可以有效处理小样本、信息不确定的预测问题,被广泛应用在股票价格、电力负荷预测等领域。灰色马尔可夫模型[16]引入马尔可夫链预测修正残差,利用其状态转移概率矩阵二次拟合,提高模型预测精度。灰色马尔科夫模型的步骤如下:

首先,建立GM(1,1)灰色模型:

1.可行性分析

定义级比σ(k):

原始序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),级比满足:

则序列X(0)可作GM(1,1)建模。

2.数据变换

若序列未通过级比检验,则需要利用对数变换、平移变换等方法对序列进行处理。

3.模型预测

模型预测表达式为:

4.模型检验

本文主要采用预测精度等级对照的方法进行精度检验,等级对照表如表1 所示。

表1 预测精度等级对照表

5.建立灰色马尔可夫模型

(1)划分马尔可夫状态区间

其中,[a1i,a2i]为状态Ei的区间。

(2)计算状态转移矩阵

式(14)中pij=pij(k)=,ni(k)表示k 时刻状态i 发生状态转移的总次数,nij(k)表示k 时刻状态i 转移到状态j 的总次数。

(3)求解预测模型

当预测值高于实际值时取负,反之取正。

(4)模型修正与精度检验

灰色马尔可夫模型根据模型残差,计算平均残差对模型预测值进行修正,提高模型的拟合精度,再进行灰色模型的精度检验。

三、数字经济评价指标体系构建

(一)指标体系构建

本文综合考虑现有数字经济评价指标体系,遵循科学性和简明性原则,从数字终端设施、网络资源、数字产业规模、技术创新投入、数字经济可持续发展、数字金融发展水平6 个维度选取22 个评价指标构建数字经济发展水平评价体系[17-18],评价指标如下:

(二)数据来源

数据主要来自《中国统计年鉴》《中国信息产业年鉴》《中国数字经济发展白皮书(2020)》等。考虑到新疆和西藏两地区数字经济发展水平有待提高,且部分指标数据不完整,本文选择其余29 个省、自治区、直辖市2013—2020 年的各项指标数据进行分析。

(三)数据预处理-数据标准化

图1 为部分评价指标数据的箱线图,可以发现各指标间存在量纲差异,应首先对指标数据进行标准化处理,标准化后的箱线图如图2 所示。

图1 标准化前4 个评价指标的箱线图

图2 标准化后4 个指标的箱线图

(四)确定各指标权重-熵权法

在数据标准化的基础上,利用熵权法对构建数字经济评价体系中的评价指标赋予权重。由于熵权法确定的权重对样本具有依赖性,会随着样本的变化而波动。故本文用熵权法对2013—2020 年的评价指标赋权,每个指标得到8 个权重,将所得权重取平均作为该评价指标最终的权重,结果如表3 所示。

表3 各评价指标熵权法结果及最终权重

根据权重计算29 个地区数字经济发展水平评分,计算公式如下:

式(16)中,xij表示第i 个指标在第j 个地区的统计数据,wi表示第i 个指标的权重值。上述29 个省、自治区、直辖市2013—2020 年数字经济发展水平的评分取值如表4 所示。

表4 2013—2020 年各地区数字经济发展水平评分

(五)数字经济发展水平分析

1.数字经济发展水平总体分析。首先,对全国29 个地区的总体数字经济发展水平进行分析,数字经济发展水平随时间的变化趋势如图3 所示。

图3 2013—2020 年各省份数字技术层发展评价值变化趋势

广东、浙江、江苏、北京、山东、上海数字经济优势明显,与其他省份地区有较大的差距。华东地区整体发展较好,华北华中处于中间位置,西北、东北、海南、内蒙古数字经济发展始终处于末位。

2.数字经济水平省域差异分析。根据上述2013—2020 年各地区数字经济发展水平评分,对29 个地区的数字经济发展水平进行聚类分析,以便进一步分析全国各地的数字经济发展水平的异同点。本文采用层次聚类分析的方法,29 个地区的数字经济发展水平聚类结果如图4 所示。

图4 层次聚类分析结果

由图4 可以看出,根据数据经济发展水平,可以将上述29 个省、自治区、直辖市分为不同类别。

山东、上海、浙江、北京、广东、江苏六地区数字经济发展水平较高,发展态势稳定,这主要得益于政策引导、地理优势以及人才引进。以山东省、北京市例,山东省[19]将数字经济与实体经济融合发展,具有大规模的高技术产业,聚集大量科研人才;北京市[20]不断完善人工智能和区块链等产业体系,推进数字化转型发展。

四川、山西等23 个地区为数字经济发展水平相对较低的地区。这些地区需要进一步夯实数字基础设施建设,可以借鉴长三角城市群和一线城市数字经济的发展路径和经验,结合自身特色,借助数字经济改变地区生产和消费方式。

四、灰色马尔可夫预测

根据2013—2020 年各地区的数字经济发展水平评分,建立灰色马尔可夫模型测度2021 年评分。

首先对各项指标数据进行级比检验。样本量n=8,级比σ 的允许取值范围为σ(k)∊(0.801,1.249)。经过计算,各地区2013—2020 年数字经济评分序列基本都无法通过级比检验,因此需要平移变换,即:

结合原始数据情况,a 取1 时各地区的数字经济发展水平评分序列均可通过级比检验,可以建立GM(1,1)模型。

利用GM(1,1)模型预测各地区2021 年数字经济发展水平评分,MSE 为0.002 6。经过检验发现,部分地区的灰色模型不能通过精度检验,因此引入马尔可夫模型,利用其状态转移概率矩阵二次拟合,重新测度2021 年数字经济发展水平评分,结果如表5 所示,灰色马尔可夫模型相应的MSE 为0.000 09。相较于灰色模型,灰色马尔可夫模型有更好的预测表现。

表5 2021 年各地区数字经济发展水平评分预测结果

以山东省为例,对比灰色预测值、灰色马尔可夫预测值与真实值之间的差异,预测折线图如图5、图6 所示,具体情况如表6 所示。

图5 灰色模型GM(1,1)预测

图6 灰色马尔可夫预测

表6 山东省数字经济发展水平评分真实值与预测值

对比图5 和图6 发现,灰色马尔可夫模型拟合精度明显高于灰色模型。通过计算可知,灰色模型的均方误差值为0.000 09,灰色马尔可夫模型的均方误差值为0.000 01,再次证明灰色马尔可夫模型的预测优势。

五、结语

(一)总结

本文通过熵权法、层次聚类、灰色马尔可夫模型定量分析29 个地区的数字经济水平,主要得到以下结论:

1.不同地区的发展水平存在较大的差异,同一地区的数字经济年增长速率也有显著变化。以2020年为例,广东省的数字经济发展程度最高,利用熵权法得到的数字经济评分达到0.744,而宁夏地区的数字经济得分仅有0.013。以山西省为例,山西省2016—2017 年数字经济水平增长27.55%,2017—2018 年、2018—2019 年分别降低8.8%、22.8%,2019—2020 年数字经济快速增长,发展指标增长37.5%。

2.通过时序差异演化分析和聚类算法可以发现,2013—2020 年全国数字经济发展水平总体呈现先上升后下降的趋势,数字经济水平发展第一梯队:广东、江苏、浙江、北京、上海、山东,发展较好,发展态势稳定。相比较而言,四川、湖北、山西等23 个地区数字经济发展缓慢。

3.本文采用灰色马尔可夫模型预测各地区数字经济发展水平,可以有效把握各地区数字经济发展方向,为上述29 个省市自治区推动数字经济发展提供决策依据,丰富定量评价数字经济的方法和内容。

(二)展望

本文所引入的指标同时包含线性和非线性数据,后续研究中可以尝试构建灰色神经网络模型,结合灰色模型预测小样本的优势以及神经网络处理非线性数据能力强的优点,提高预测精度。

猜你喜欢

权法马尔可夫灰色
基于熵权法的BDS钟差组合预测模型的建立
浅灰色的小猪
BP神经网络结合熵权法优化甘草皂苷提取工艺
基于熵权法*的广西能源安全评价
灰色时代
她、它的灰色时髦观
保费随机且带有红利支付的复合马尔可夫二项模型
感觉
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测