基于多模型融合的济南市制造业产业竞争力研究
2022-07-13徐石玉王娟娟刘晓宇
徐石玉 王娟娟 刘晓宇 房 莹
(山东师范大学数学与统计学院,250358,济南 )
1 引 言
制造业是国民经济的主体,也是强国之器、立国之本.从十八世纪到现在的历史发展来看,国家的强弱兴衰与制造业的发展密切相关.一个繁荣昌盛的国家,不能没有强健有力的制造业背景[1].中国在世界制造业领域中处于领先地位,改革开放40多年来,制造业在增加就业、稳定社会秩序和提升国家综合实力等方面发挥了举足轻重的作用.山东省是我国经济排名第三的大省,更是我国制造业的中流砥柱.济南市作为山东省的省会,是山东省的制造中心.如今,济南市制造业保持平稳向好的发展态势,据济南市第四次经济普查显示,在工业企业法人单位中制造业有19 772个,占比为96.89%;在工业企业法人单位从业人员中,制造业占比为92.47%.
国民经济和社会发展的“十四五”规划与2035年远景目标纲要对制造业高质量发展做出了重大布署,明确提出要坚持巩固实体经济发展.由此可见,大力发展制造业经济是我国的重要任务.在分析探究地区制造业经济发展时,可从产业竞争力入手,产业竞争力包括比较优势和竞争优势两部分[2].比较优势是指地区内各制造行业的优劣势情况,通过比较优势分析,地区可向外输出更具有竞争力的产品,实现更高的产品收益,从而增强区域经济发展.竞争优势则体现了不同区域同一行业之间经济发展的差异,通过分析经济发展相近城市的竞争优势,可以更好地吸取不同城市优势产业的发展经验,弥补地区内的产业发展短板,同时还可以加强地区的产业竞争力.
比较优势和竞争优势是侧重点不同的评价指标,但本质都是产业经济的相互比较,目的在于提高产业竞争力.两者的差异性主要在于分析的范围不同,比较优势强调了地区产业优势的潜在信息,竞争优势则强调了不同地区的现实状态.此外,两者在一定程度上也可以相互转化,具有比较优势的产业加速发展后很容易形成地区的竞争优势,而具有竞争优势的产业也更容易吸引外来资源,从而加大比较优势产业的发展.本文以多模型融合框架为中心,融合近年来比较经典和先进的数据分析方法,对制造业中的每个行业进行评估得分,并以特征选择的方式挑选出具有代表性的优势产业,重点分析济南市制造业的比较优势与竞争优势,旨在为促进济南市制造业经济发展提供一定参考.
2 研究设计
2.1数据指标与预处理本文采用的数据来自济南、徐州、长沙、泉州、青岛、南通、合肥和大连八个城市的2020年统计年鉴,同时参考了每个省市的第四次全国经济普查报告.这8个城市的国内生产总值(GDP)处于相近的地位,可认为这些城市之间经济发展具有可比性,因此选取这8个城市进行竞争优势比较.衡量制造业产业竞争力发展的指标很多,这里选择的指标主要包括三个部分:产业实力、产业效益和产业发展趋势.
产业实力是概括制造业行业的重要依据,它能从整体上展示出哪些产业拥有较多的劳动力和资金,从而可以反映出该产业的市场竞争力.法人单位数、规模企业占比和资产总计是体现产业实力的相关指标.
产业发展趋势是判断一个行业是否具有优势的关键因素,它包括亏损企业比例、负债合计和R&D经费支出三个指标.亏损企业比例、负债合计与营业收入一同决定了行业的存亡,能够从侧面反映行业能否成为城市的优势产业,对行业发展的影响巨大.R&D经费支出是指试验研究的发展经费,在一定程度上决定了企业的未来发展.
总的来说,影响制造业产业竞争力的指标包括法人单位数、规模企业占比、亏损企业比例、从业人员、资产总计、负债合计、营业收入和R&D经费支出.这些指标涵盖了制造业的大部分信息,是影响制造业各个行业经济发展水平的主要因素,因此选择这些影响因素对产业竞争力进行分析是比较可靠的.所选取的制造行业共31个,这些制造行业在各个领域都有所涉及.因为收集的数据的规模大小有显著的差异,所以需要对这些数据进行标准化处理,标准化处理可将所有的数据放缩到统一的范围内,从而减少数据规模不同带来的分析误差.有些城市的行业指标在经济普查报告和统计年鉴中没有显示,对于缺失数据采用“-”代替,在计算行业得分时,缺失数据的行业得分记为“-”,不参与分析.
2.2理论模型在分析济南市比较优势时,本文提出了多种特征选择算法相融合的方法.使用的特征选择算法包括因子分析[3]、信息熵、Multi-Cluster Feature Selection (MCFS)[4]、Laplacian Score[5]、非负矩阵分解[6]、Robust Spectral Learning Framework for Unsupervised Feature Selection(RSFS)[7]、Subspace Clustering Guided Unsupervised Feature Selection(SCUFS)[8、Robust Neighborhood Embedding(RNE)[9]、Unsupervised Discriminative Projection for Feature Selection(UDPFS)[10]和Coupled Dictionary Learning Method(CDLFS)[11].这些特征选择算法从原理上可分为计算信息量、学习图结构和低维映射三种,其性能的优异性在其它领域已经证明,具体分类如图1所示.
图1 特征选择算法的层次结构图
2.2.1 因子分析评价指标 本文使用了十种特征选择算法,这里以因子分析算法和非负矩阵分解模型为例展示得分过程.使用因子分析之前,首先进行KMO和Bartlett检验,结果如表1所示.显著水平小于0.05,因此可以做后续的因子分析.
表1 实验数据的KMO和Bartlett的检验结果
根据因子分析计算的成分得分系数矩阵,可得到因子表达式如下:
(1)
其中Fi为第i个因子的计算得分,n为影响因素,aj和xi,j分别为每个相关因素的成分得分和输入数据,因子i的选择是根据因子方差的贡献率来计算的.济南市制造业的前两个因子累积贡献率达到了90.495%,因此选择两个因子即可.然后,根据因子的方差贡献,构建基于因子分析的综合评价模型如下:
根据计算所得限额值,首先将工程投资按照专业分配到设计单位内部各专业,明确各员工对限额设计所负的责任,根据限额确定奖惩制度,最终保证在工程达到其技术指标的同时,不超过限额。
(2)
2.2.2 非负矩阵分解模型评价指标 非负矩阵分解模型旨在探究如何将原始矩阵X分解为低秩矩阵U和V乘积的问题,其数学表达式如下所示:
X=UV+E,
(3)
这里矩阵E表示原始数据矩阵的噪音值.假设原始数据X中的每一行表示一个行业,每一列表示该行业的相关统计数据,那么U矩阵是相关统计数据特征学习的结果,V矩阵是所有行业特征学习的结果.由于本文想要分析的是每个行业的权重值,即将每个行业的相关统计数据进行特征学习得到权重值,因此采用U矩阵作为最终的输出矩阵.
非负矩阵分解需要指定降维数,考虑降维的数目与数据中的主要成分一致,因此将原始数据进行奇异值分解后计算其主要成分,分解后前三个主要成分的贡献率已经达到了81.69%,结合Wang D等人的研究经验[6],本小节将降维数设置为3.计算得到U矩阵后,每个行业可获得3条权重值,然后,将这3条权重值进行相加可获得每个行业的最终权重值,即
(4)
2.2.3 多模型融合框架 上述引入的十种方法都能对31个行业的特征进行计分,但方法的优劣没有固定的评价标准,难以确定哪种方法更适合评估制造行业.确切地说,没有一种方法能在所有领域达到最优.因此,本文采用算法集成的方式来融合不同的特征选择方法,每个特征选择方法作为一种学习器.定义一种新颖的权重融合标准来确定每个行业的特征得分,其数学表达式如下:
(5)
这里Wk,i表示第k个学习器在第i个行业特征上所获得的升序排序结果,排名越靠后其重要程度越高,分配的权重也就越大,m为制造业的行业总数,f(x)为权重分布函数,表示x行业所具有的权重值,S为每个行业得出的最终分数,其分值越高表示行业的重要程度越高.根据式(1)可以发现,该融合标准对于排名较高的行业特征会有更多的奖励分数,从而增加了特征值之间的得分差异性.
2.3系统框架本文采用基于多模型融合的特征选择方法分析济南市制造业产业竞争力,流程框架图如图2所示.
图2 济南市制造业研究分析框架图
3 结果分析
3.1济南制造业优势产业分析本小节对济南市制造业的31个行业以及8个相关因素进行详细分析,采用十种特征选择方法对济南市制造业行业进行评估,结果如表2和表3所示(只显示排名前十的特征).由表2与表3可以看出,每个特征选择方法的结果不尽相同.维恩图可以表示结果的相同和不同之处,多个模型的特征选择结果维恩图如图3所示,这里每个模型选择前十个特征进行比较.从图3可以发现许多模型所选择的行业特征具有相似性,如因子分析、非负矩阵分解、RSFS、SCUFS、RNE和CDLFS算法所选择的前十个行业有三个行业是相同的.而MCFS、Laplacian Score、RSFS和UDPFS不仅与其他算法有交集,而且还有各自独特的选择结果,如在UDPFS算法选择的前十个行业中,有两个行业其他算法没有选择.
表2 模型的特征选择结果(一)
表3 模型的特征选择结果(二)
图3 多模型的特征选择维恩图
表4 济南市制造业因子分析结果
表5 济南市制造业多模型融合评分结果
下面以因子分析为例详细解释评分结果.
因子分析结果如表4所示,通用设备制造业和汽车制造业相对其他产业具有明显的比较优势.通用设备制造业、汽车制造业、金属制品业、专用设备制造业、黑色金属冶炼和压延加工业、非金属矿物制品业、计算机通信和其他电子设备制造业、电气机械和器材制造业、化学原料和化学制品制造业、医药制造业、农副食品加工业是济南市相对有优势的行业.
不同特征选择模型得到的选择结果不同,难以为所有数据集做一个统一的评价标准.因此,将所有模型统一分析,采用式(1)提出的多模型融合方法对所有模型的结果优化评分,其评分结果如表5所示.
由表5可以得出,汽车制造业、通用设备制造业、计算机、通信和其他电子设备制造业、纺织服装、服饰业、金属制品业、黑色金属冶炼和压延加工业、专用设备制造业、废弃资源综合利用业、烟草制品业和医药制造业是济南市比较优势的前十个产业.具体分析如下:
1) 2020年济南市统计局报告称,汽车制造业、计算机、通信和其他电子设备制造业、黑色金属冶炼和压延加工业、医药制造业为全市经济发展做出了巨大贡献.制造业是山东省经济发展的重要支柱,其中汽车制造业、通用设备制造业更是制造业领域中的龙头行业.目前济南市的经济发展逐渐从石油、钢铁等行业向汽车制造、机械制造、医药等行业转型.
2) 纺织服装、服饰业、烟草制品业和金属制品业是与民生相关的行业,这些行业的崛起与济南市人口以及自然资源的分布密切相关.在山东省第七次人口普查报告中,济南市常驻人口达到920.24万人,人口数量较多带来的是日用品消耗较大,上述行业是济南市经济发展中比较优势的产业,为济南市经济发展贡献的力量不可忽视.
3) 近年来,随着济南市经济的发展转型,计算机、通信和其他电子设备制造业、专用设备制造业和废弃资源综合利用业是济南市大力发展的新兴产业,这些新兴产业的发展与济南市投入的大量资金和相关的扶持政策密不可分.
3.2济南市制造业竞争优势分析除了分析济南市的优势产业外,本小节将济南市与其它发展相近的7个城市做了经济发展对比,旨在找出济南市经济发展的核心竞争力.这些城市包括徐州、长沙、泉州、青岛、南通、合肥和大连.
3.2.1 城市竞争力分析 在计算城市竞争力时,仍采用融合模型计算不同城市下每个行业的竞争力得分.竞争力评分结果如表6所示,加粗的内容表示该城市在该行业处于领先地位,“-”表示该城市该行业缺少某些特征元素,无法进行公平的评分,因此删除其评分结果.
在所有的行业评分中,长沙市的非金属矿物制品业评分最高,为8.837 6分,南通的仪器仪表制造业评分最低,为1.970 1分.从整体来看,济南、徐州、长沙、泉州、青岛、南通、合肥和大连8个城市的平均得分分别是5.327 7分、5.202 8分、5.070 6分、5.254 7分、5.048 2分、4.126 1分、5.104 2分和4.898 3分,济南市的制造业评分最高,比第二名泉州要高出0.073分,比最后一名南通要高出1.201 6分.因此,济南市制造业与其他发展相近城市相比处于较高发展水平.
为分析济南市的竞争优势,根据表6所得分数,将济南市31个制造行业得分及排名整理在表7中,在8个城市中,若城市制造业竞争力得分排名前三,则认为该城市制造业具有竞争优势.表6中加粗排名表示该行业具有竞争优势,因此,济南市具有竞争优势的产业主要有黑色金属冶炼和压延加工业、通用设备制造业、汽车制造业、废弃资源综合利用业、酒、饮料和精制茶制造业、纺织服装、服饰业、皮革、毛皮、羽毛及其制品和制鞋业、医药制造业、非金属矿物制品业、食品制造业、印刷和记录媒介复制业、有色金属冶炼和压延加工业、文教、工美、体育和娱乐用品制造业、仪器仪表制造业.这些制造行业与其他7个经济发展相近的城市相比处于竞争力优势地位.此外,表7的竞争优势结果与济南市的优势产业分析十分相似,大力发展优势产业将有助于提高济南市的经济发展水平.图4是所有城市的行业竞争力得分,横轴所标出的文本数据为竞争力平均得分前十的行业.关注并发展竞争力前列的行业将有助于提高济南市经济发展水平,使其从同等水平的城市中脱颖而出.
图4 城市竞争力行业综合得分前十
表6 城市竞争力评分
表7 济南市评分排名
3.2.2 聚类分析 为进一步分析这些城市之间的差异性,根据表6所计算的城市竞争力得分进一步进行聚类分析,聚类分析可以找到与济南发展相近的城市,吸取这些城市的发展经验,为济南市发展提供更多的帮助.在聚类前,首先根据手肘法确定最佳聚类数目,即根据聚类结果的误差平方和来确定聚类数,结果如图5所示.由图5可以看出,在聚类数目为4时曲线达到第一个拐点.以4为聚类数目,其聚类结果如图6所示,可视化工具为t-distributed Stochastic Neighbor Embedding(t-SNE)[12].根据图6,徐州、长沙和合肥与济南市的制造业发展水平相近.徐州和长沙的专用设备制造业,合肥的计算机、通信和其他电子设备制造业是最具有优势的产业,这些产业也在济南的未来发展规划之中.从发展的角度来看,济南可从这3个城市中吸取发展经验,促进自身经济快速转型.
图5 手肘法选取最佳聚类数
图6 t-SNE可视化
3.3济南市制造业行业总体分析通过以上分析结果,可以得到济南市制造业比较优势与竞争优势评价矩阵,如表8所示.
表8 济南市制造业比较优势和竞争优势
第一象限中的产业同时具有比较优势和竞争优势,分别是黑色金属冶炼和压延加工业、通用设备制造业、汽车制造业、废弃资源综合利用业、酒、饮料和精制茶制造业、纺织服装、服饰业、皮革、毛皮、羽毛及其制品和制鞋业、医药制造业、非金属矿物制品业.这些企业有着明显的行业优势,济南市政府应更加关注这些企业,提高其产品竞争力.
第二象限中的产业具有竞争优势但不具有比较优势,分别是食品制造业、印刷和记录媒介复制业、有色金属冶炼和压延加工业、文教、工美、体育和娱乐用品制造业、仪器仪表制造业.对于这些行业,济南市政府可以适当地给与政策倾斜,促进企业的发展.
第三象限中的产业具有比较优势但不具有竞争优势,分别是计算机、通信和其他电子设备制造业、金属制品业、专用设备制造业、烟草制品业、家具制造业、农副食品加工业、造纸和纸制品业.这些具有比较优势的产业有潜力发展成具有竞争优势的产业,因此济南市政府要给与足够的关注,促进此类产业的发展.
第四象限中的产业同时不具有比较优势和竞争优势,分别是木材加工和木、竹、藤、棕、草制品业、化学纤维制造业、橡胶和塑料制品业、电气机械和器材制造业、纺织业、化学原料和化学制品制造业、金属制品、机械和设备修理业、石油、煤炭及其他燃料加工业、铁路、船舶、航空航天和其他运输设备制造业、其他制造业.对于这些产业,济南市政府可以采取发展与放置等操作.
4 结 论
本文利用多模型融合框架对济南市制造业产业竞争力进行分析和探究,采用的数据为全国第四次经济普查报告以及统计年鉴.经过分析,发现汽车制造业、通用设备制造业、计算机、通信和其他电子设备制造业、纺织服装、服饰业、金属制品业、黑色金属冶炼和压延加工业、专用设备制造业、废弃资源综合利用业、烟草制品业和医药制造业是济南市比较优势的前十个产业.对于这些产业,济南市政府可大力发展、推广和吸引外资来推动经济发展更上一个层次.此外,通过分析还发现济南市经济发展与徐州、长沙和合肥三个城市十分相近,这三个城市又各有优势产业,济南市政府可以通过学习发展这些优势产业来弥补自身不足,从而提高整体产业竞争力.