APP下载

基于SVM的高质量省区类型研究

2020-06-18

山东农业工程学院学报 2020年5期
关键词:低质量省区指标体系

(安徽大学商学院,安徽 合肥230601)

一、引言

十九大中指出我国社会主要矛盾转化为了人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,为解决这一矛盾政府工作报告中指出中国经济发展将向高质量发展阶段转变。2018年作为高质量发展元年,政府以及学术界对于这一话题给予了广泛关注,随之而来的是对高质量发展指标体系的热烈讨论。

近两年国内学者对于高质量的经济发展指标体系进行了不同方向的研究。徐瑞慧[1]构建了改革开放、政府治理、金融发展三个角度在内的经济发展指标体系并判定中国已经进入高质量发展阶段;李金昌[2]紧扣高质量发展的内涵和新时代社会主要矛盾的变化构建了涉及五大发展理念共27项指标的高质量发展评价指标体系。高质量发展是新发展理念的体现,建立高质量发展指标体系应紧密联系该理念,兼顾好不同因素之间的相互协调,而目前尚无权威研究统一高质量发展指标体系,仍等待学者们继续探讨。魏婕[3]构建涉及6个维度的质量指标体系对30个省区的经济发展质量水平进行测度,为地区经济提供发展意见;詹新宇[4]通过涉及五大发展理念的质量指标体系,使用主成分分析法估算各指标情况,为五大发展理念的贯彻实施指引方向。现有文献通过构建省区经济发展指标体系,运用实证研究等分析方法对省区进行分类等处理,帮助分析省区发展现状,为省区高质量发展出谋划策,但现有研究尚未对涵盖“五大发展理念”的指标体系进行分类研究,故本研究通过构建高质量发展指标体系,运用SVM对城市省区相关数据进行分类,从而帮助探讨高质量发展指标。

通过综合文献中其他学者对于国内各省区经济发展质量水平的测算,本次研究选取了类别较为明确的北京、上海、广东、山东、安徽、四川、甘肃、贵州、青海作为训练以及测试样本,其中北京、上海、广东地区的数据样本作为高质量发展地区样本,山东、安徽、四川地区的数据样本作为中质量发展地区样本,甘肃、贵州、青海地区的数据样本作为低质量发展地区样本。

二、指标选取与数据来源

2.1 指标选取

十九大报告中再次强调 “贯彻新发展理念,建设现代化经济体系”,通过“五大发展理念”的贯彻实施,优化现代化经济体系,实现更高质量的发展。因此在高质量发展过程中,我们要协调好新发展理念之中五大理念之间的关系,建立与之相对应的指标体系。

创新是新发展理念的核心,注重解决的是高质量发展中的动力问题。本次研究针对创新理念选取了四项二级指标:研发强度、万人发明专利拥有量、技术市场合同成交额占地区GDP比重、全员劳动生产率。

绿色是高质量发展的重要体现,注重解决的高质量发展过程中的可持续问题。本次研究针对绿色理念选取了三个二级指标:单位GDP能耗、空气质量优良率、建成区绿化覆盖率。三项指标一定程度上体现了发展与民生的统一。

开放理念对增强我国对外开放质量提供了行动指南。本研究针对开放理念选择了三项二级指标:实际利用外资金额占GDP比重、对外贸易依存度、国际旅游收入占地区GDP比重。

协调理念是高质量发展的标尺,关系着经济与社会全方位的发展。本研究针对协调发展选择了三项二级指标:第三产业增加值占GDP比重、就业人口占常住人口比重、亿元GDP生产安全事故死亡人数。

共享理念是社会主义的核心价值追求,注重解决的是将高质量发展成果惠及广大人民群众。本研究针对共享发展选择了三项二级指标:人均可支配收入、千人拥有床位数、教育支出与地区人口比值。

2.2 数据来源

由于数据标准以及可得性等原因,本次研究选取了国内30个省区进行数据分析,暂未包括港澳台藏四个地区。根据上述指标选取,对应指标数据源自2013~2017年 《中国统计年鉴》、《中国火炬统计年鉴》、《中国科技统计年鉴》、《中国环境统计年鉴》以及相关省区年份统计公报等有关数据。

三、高质量省区分类模型构建

3.1 缺失值预测

由于少量数据缺失,因此实验第一步就是对缺失值进行预测,本次研究采用了增长率来预算缺失年份的数据,即使用上一年数据乘以上一年的增长率得到近似数据从而尽量保证数据的客观性。

3.2 样本选择

补齐数据后,挑选出北京、上海、广东、山东、安徽、四川、甘肃、贵州、青海九个省区五年的数据,以60%/40%的概率划分为测试集和训练集,其中测试集21个,训练集24个。

3.3 数据标准化

分别对训练集和测试集数据进行Z-score标准化以消除不同指标(特征)之间的量纲和取值范围差异对模型准确度的影响。具体步骤是对每个特征维度上的数据求标准差和均值,然后用原始数据减去均值除以标准差,即在matlab中利用zscore(x)函数将数据标准化,核心思想是:

其中x为指标体系中某一项数据,μ为均值,σ为标准差。

取得标准化数据后,对数据进行分类,其中北京、上海、广东地区代表高质量发展地区的数据样本标注为高,山东、安徽、四川地区代表中质量发展地区的数据样本标注为中,甘肃、贵州、青海地区代表低质量发展地区样本标注为低。

3.4 训练模型

实验中核函数的选择是构建良好性能的SVM模型的关键,本次研究选取了多项式核函数、线性核函数、Sigmoid核函数、高斯核函数将标准数据映射到高维空间从而使数据线性可分。

调用不用参数的核函数对向量进行处理,设φ(x)为X映射后的特征向量,则划分超平面的模型为:

运用拉格朗日乘子引入与求导化简,可以得到

公式中 k(xi,xj)就是不同种类的核函数,这个模型通过训练样本的不同核函数求得高维空间中不同类别之间的最优间隔超平面。

使用不同核函数的SVM对训练集进行训练,所得模型在惩罚参数C=100的情况下测试结果为线性核函数准确率为85.71%,多项式核函数准确率为100%,高斯核函数准确率为85.71%,Sigmoid核函数准确率为85.71%,因此最终选择惩罚参数C=100的多项式核函数模型进行分类。

3.5 样本分类

确定使用惩罚参数为100的多项式核函数后使用相同的训练方法和训练参数,对全部45个样本进行训练得到模型。特征标准化时,保存相应的方差和均值。然后使用该模型将未知21个城市的数据分类。这些未分类数据标准化时所使用的均值和方差是之前保存。

3.6 分类结果及分析

表1 30个省区高质量发展分类结果

由表1可得,2013年~2017五年里中国30个省区中有五个省区属于高质量发展地区,三个省区属于低质量发展地区,三个省区由低质量过渡到中质量发展,其余省区属于中质量发展地区。

高质量省区共有5个,占考察省区总量的16.7%,其中北京、上海、广东地区发展指标数据作为已有高质量标签样本参与训练以及测试,这三个地域作为中国经济发展最为活跃的地域,分别引领着京津翼城市群、长三角城市群以及粤港澳大湾区建设,是整个中国高质量发展的中心。低质量省区共有6个,占考察省区总量的20%,其中青海、贵州、甘肃地区发展指标数据作为已有低质量标签样本参与训练以及测试,这三个地区作为中国西部代表性省区,经济发展质量水平暂时处于落后状态;宁夏、新疆、广西三个省区同属西部地区,经济发展相比其他地区暂时落后,但近几年发展类别从低质量发展转化为中质量发展。余下19个省区均属于中质量发展地区,占考察省区总量的63.3%。

四、结论与启示

本文通过构建涵盖“五大发展理念”的省区高质量指标体系,借用使用多项式核函数的SVM模型对2013年~2017年五年间中国30个省区的相关指标数据分类,分析其分类特征,主要得出以下结论:五大高质量省区均属于东部地区,而六个低质量省区均属于西部地区,部分东部地区、西部地区和全部中部地区均属于中质量省区,呈现出了明显的区位分布差异;经济总量较强的江苏、山东等地域被模型判定为中质量发展地域,说明了根据“五大发展理念”构建的高质量发展指标体系对于经济发展质量的判定不局限于经济总量的增长,同时重视各省区关于创新、绿色、开放、协调以及共享五个方面的全面发展指数。

根据以上研究结论,对中国促进高质量发展提供了以下启示:

第一:中国促进经济社会高质量发展应以理念为先,坚持“五大发展理念”为指导,探寻科学、合理的高质量发展路径,做好高质量发展的宏观调控,根据各省区实际情况因地制宜的制定政策,保证好创新、协调、绿色、开放、共享五大理念的共同发展;

第二:注重解决中国不同省区之间的发展差异问题,国家应对各个省区发展做好统筹规划工作,协调好高质量、中质量、低质量地区之间的发展平衡问题,充分发挥高质量地区的发展溢出效应,帮助中质量发展地区和低质量发展地区早日实现发展类别转变以及高质量地区发展模式的进一步优化,从而早日打赢脱贫攻坚战,让改革开放的福利惠及更广大人民。

猜你喜欢

低质量省区指标体系
低质量实用新型专利申请授权对经济秩序的影响
开年第一会,11省区打响“当头炮”
真抓实干,为这26省区点赞!
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
低质量的婚姻不如高质量的单身,是真的吗?(一)
破解学前教育低质量现象
省区城乡居民收入差距的比较分析与协调发展对策
阈值随机共振及其在低质量浓度气体检测中的应用
测土配方施肥指标体系建立中‘3414