基于深度学习的我国就业结构发展趋势研究
2022-06-15李永政
摘 要:文章针对我国人均国内生产总值和三次产业的就业结构之间的关系进行了分析和研究,并利用长短期记忆网络(LSTM)模型进行了拟合,大大提高了拟合精度。该模型基于时间序列数据对就业结构进行了研究,总结出我国三次产业就业结构发展的一般规律,并对我国未来一段时间内就业结构的发展趋势作出了预测。
关键词:人均国内生产总值;就业结构;LSTM模型;发展趋势
中图分类号:TP273+.4 文献标识码:A文章编号:2096-4706(2022)02-0150-04
Abstract: This paper analyzes and studies the relationship between Chinas per capita GDP and the employment structure of the three industries, and uses LSTM model to fit, which greatly improves the fitting accuracy. This model studies the employment structure based on time series data and summarizes the general law of the development of China's three industrial employment structure, and forecasts the development trend of China's employment structure in the future.
Keywords: per capita GDP; employment structure; LSTM model; development trend
0 引 言
本文就我国人均国内生产总值、三次产业结构以及三次产业的就业结构数据之间的关系进行了详细分析和研究,还对就业结构的演变而建立了(Long Short-Term Memory, LSTM)模型,以求在实证分析中分析和验证研究结论。
1 就业结构及深度学习算法相关概念介绍
就业结构[1]是指社会劳动力在国民经济各部门、各行业、各领域的分布、构成和联系。根据这些部门的分布特点,可以将其分类为就业的城乡结构、地区结构、性别结构以及技术结构等。
关于产业化的变动规律,经济学家克拉克[2]曾详细地阐述了劳动力相关的变动规律,指出其变动状态应该以第一产业向第三产业按顺序变动,这被称作是经济结构的“高度化”。之后,库茨涅兹[3]等人通过对全球数十个国家产业结构的发展趋势和产业结构对就业结构的影响程度进行研究,得出了发展中国家产业结构转换快于就业结构转换的规律,由此奠定了在这之后对此类课题研究的理论基础。
1990年以来,国内学者针对产业结构和就业结构之间的关系进行了大量研究。一方面研究出了产业结构与就业结构具有内在一致性。产业结构被认为是促进经济增长的关键因素,而劳动力则是影响产业结构演变的关键要素;产业升级需要劳动力流动,劳动力流动引起产业结构变动;就业结构与产业结构的协调发展是经济良性运行的必然要求。另一方面对产业与就业结构不协调的原因进行了一些相关的研究,即使我国产业结构与国际标准模式基本一致,但就业结构转换滞后于产业结构。喻桂华、张春煜等人研究了中国就业结构和产业结构的偏离问题。苏远琳分析了四川省产业结构与就业结构的动态关系,从就业弹性和结构偏离度分析了两者之间的关系。蒋文昭运用结构偏离度法进行分析后得出了河南省的产业结构和就业结构存在失衡现象的结论。江小涓、李辉[4]探讨了人均收入和服务业的就业比重之间的关联关系。目前,有关于数据挖掘方面的科研论文快速增长,从理论和应用上对数据挖掘进行研究,获得了大量成果。
在深度学习中所获得的信息对学习样本数据的相关解释有很大程度的帮助,而当中诸如文字以及声音图像等的出现为的是让机器人能够像人类一样有分析学习的能力,可以识别文字以及声音图像等相关数据。
1.1 BP
科学家鲁梅尔哈特和麦克莱兰在20世纪末期提出了神经网络(Back Propagation, BP)的概念,指出此神经网络是多层前馈神经网络,是按照误差进行逆向传播训练的最广泛神经网络。BP神经网络可以解决一些简单感知器所不能及的抑或(Exclusive or, XOR)等问题,其模式分类能力和多维函数能力都是任意且复杂的。
另外,按BP神经网络的结构原理来分析,它具有3个数据层,分别是输入层、隐藏层和输出层,而从本质上看,它的目标函数是以网络误差平方为基础的,最小值的计算则是采用梯度下降法来实现[5]。
1.2 LSTM
LSTM是具有记忆长短期信息的能力的神经网络[6,7]。1997年,Hochreiter&Schmidhuber提出了LSTM并于十五年后得以兴盛,当中经历了多代大牛(Felix Gers,Fred Cummins,Santiago Fernandez,Justin Bayer,DaanWierstra,Julian Togelius)的融合发展,目前已经形成了较为成熟的LSTM框架。目前LSTM已在很多领域得到了广泛的应用。
LSTM的核心概念在于细胞状态以及“门”结构。细胞状态相当于信息传输的路径,让信息能在序列连中传递下去。因此,即使是较早时间步长的信息也能携带到較后时间步长的细胞中来,这克服了短时记忆的影响[8,9]。信息的添加和移除通过“门”结构来实现,“门”结构在训练过程中会去学习该保存或遗忘哪些信息。FDF709A5-904C-4717-8E91-126731B2A384
2 LSTM模型的构建及实验结果对比
2.1 研究概况及数据来源
中国地处亚洲东部、太平洋西岸,拥有23个省、5个自治区、4个直辖市、2个特别行政区,总面积达960万平方千米。据统计,2019年末中国居民达到140 005万人,生产总值实现990 865.1亿元,人均地区生产总值为70 724.6元。
本实验的数据以1980—2020年中国及各省份的数据统计年鉴为基准,面对着部分数据统计缺失的问题,本文采用的是插值法对数据进行扩充。
2.2 研究方法
本研究首先采用基于文献分析的基础理论研究方法,广泛收集国内外有关就业结构与就业的产业结构领域的研究文献,认真分析,试图找出一种更好的分析方法,使得对于就业结构的分析和预测更为精确。与此同时,密切关注机器学习技术的最新研究动态,增加本次研究的科学性、可行性、准确性。之后,初步设计LSTM模型,以就业结构及就业的产业结构数据为依托,进行分析及预测。最后,对此方案进行大量测试和优化,使研究更加严谨和缜密。
长短时记忆(Long short-term memory, LSTM)是一种特殊的循环神经网络,目标是缓解长序列训练过程中的梯度消失和梯度爆炸问题[10]。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。LSTM的结构如图1所示。
从图1中可以看出,LSTM网络在节点中有一些信息过滤门,从而实现增删信息的功能。这些门是由sigmoid函数来进行控制的,因为sigmoid函数值在0到1之间,这样可以确定哪些信息可以通过该门。具体流程如下:
本文的输入设为人均GDP,输出是三大产业的就业结构。通过建立BP神经网络模型和LSTM长短时记忆模型,将1980年到2019年我国31个省级行政区划的相关数据作为训练样本,训练所建立的模型对我国就业结构的产业结构的发展情况进行仿真和预测。
本文模型在WINDOWS系统上基于开源框架TensorFlow实现,分别用人均国内生产总值与对应的三次产业的就业结构作为输入层和输出层神经元,隐含层神经元采用tanh型传递函数。采用可变学习率的梯度下降算法和LSTM模型。每隔20个epoch,学习率减小为原来的1/10。
2.3 实验结果
为了验证本文使用方法的效果,分别在BP和LSTM模型上进行实验对比,最终显示LSTM模型上的拟合度远高于BP模型。实验结果如表1所示。
2.4 预测
根据已得出的模型,我们可以利用人均国内生产总值来预测未来我国三次产业的就业结构的发展趋势,结果如表2所示。
通过预测结果,我们可以得到未来中国3大产业的就业结构发展趋势的一般规律。在人均国内生产总值不断上升的背景下,第一产业的就业结构逐渐下降,但下降速度逐渐减缓,因为第一产业是国家的基础产业,是14亿人赖以生存的物质基础,之后将维持在一个基本恒定的数值区间内。而第二产业在经过下降后再次上升到恒定值,符合二次函数拟合曲线。工业是一个国家国际竞争力的关键,中国作为世界上工业门类最为齐全的大国,未来将成为工业强国,拥有更多更好的核心技术,为我国的可持续发展注入源源不断的动力。第三产业的就业结构占比则逐渐上升,在改革的大背景下,服务业在我们的日常生活中扮演着越来越重要的角色,互联网等新科技手段的使用也成为第三产业不断发展壮大的“燃料”,助推中国经济更好更快发展。因此,在向第二个“一百年”奋进的当下,我们更要把握好三大产业结构及其就业结构的发展趋势。
针对以上结论,我们可以对于我国如何更快完成经济转型对提出一些建议和对策:
(1)加快产业升级,促进第一产业的发展。我国作为农业大国,第一产业的发展对整体经济的提升作用不容忽视。我国目前农业水平较低,利润模式较为落后。对此,可以发展一些特色农业、养殖业,实现差异化配置,能够更好地发挥土地种植的优势,实现更高的产品附加值,从而推动第一产业增加值的稳步提高。在此基础上,可以实现第一产业的平稳有序发展,同时将过剩的劳动力向二、三产业输出,有针对性地对一些就业人员展开培训,实现劳动力素质的提升和生产效率的提高。
(2)加速产业转型升级,形成第二产业再突破。我国一直积极探寻经济转型,对第二产业的投入持续加大。引入了富士康等一批技术密集型企业,吸纳了大量劳动力。但是中西部个别地区工业实力提升缓慢,劳动力结构关联程度也较低,亟须提高生产效率,扶植或引入一些相关企业从而提高城镇化水平。第二产业的产值与就业结构存在比较严重的不平衡问题。第二产业的就业是城镇化的基础,工業化的转型升级决定着人民生活质量的高低。
(3)引导好第三产业,促进劳动力持续流入。经济越发达的国家,第三产业占比越高,因为第三产业的快速发展带动了人民对美好生活的向往。党的十九大报告指出:“中国特色社会主义进入新时代,我国社会的主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。”而我国的第三产业就存在着不平衡发展的问题。因此,实现第三产业的转型升级,离不开政府的引导。政府应加大对教育的投入力度,全面提高居民素质,并加大人才引进力度,实现科技的飞速发展,从而带动整个第三产业的腾飞,为经济的发展提供活力。
3 结 论
本文运用两种模型对我国就业结构的发展趋势进行了研究对比,得出了利用LSTM对就业结构进行拟合精度更高的结论。但是,LSTM模型仍有一些局限性,它的精度有待进一步提高。此外模型的参数如何优化才能得到更好的效果也是下一步需要研究的课题。
参考文献:
[1] 何盛明.财经大辞典 [M].北京:中国财政经济出版社,1990.FDF709A5-904C-4717-8E91-126731B2A384
[2] CLARK C. The Conditions of Economic Progress:3rd [M].London:Macmillan,1957.
[3]库兹涅茨.各国的经济增长 [M].北京:商务印书馆,2021.
[4] 江小涓,李辉.服务业与中国经济:相关性和加快增长的潜力 [J].经济研究,2004(1):4-15.
[5] 黄洪钟,孙道恒,陈新.结构优化与分析的神经网络计算原理 [EB/OL].[2021-12-01].https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=SNAD&dbname=SNAD&filename=SNAD000000021357&uniplatform=NZKPT&v=TjRX_0fSS4sAet85v4sdLXRBhcWN8PQjxtIi3vwL8fibWfuTwnZvIKvJMAd2Daf7f3noMlfsQRI%3d.
[6] 姜凡.基于长短期记忆神经网络的短期电力负荷预测研究 [D].湖北:湖北工业大学,2021.
[7] 易礼秋,谷云东.基于长短期记忆神经网络的短期电力负荷预测 [J].中州大学学报,2021,38(4):109-116.
[8] CHRISTOPH J,BERKENBRINK C,BRITTA S. Prediction and reconstruction of ocean wave heights based on bathymetric data using LSTM neural networks [J/OL].Ocean Engineering,2021,232:[2021-12-08].https://www.sciencedirect.com/science/article/abs/pii/S0029801821004819?via%3Dihub.
[9] CHENG N,KUO A. Using Long Short-Term Memory(LSTM)Neural Networks to Predict Emergency Department Wait Time [J].Studies in health technology and informatics,2020,270:1425-1426.
[10] 陳亮,王震,王刚.深度学习框架下LSTM网络在短期电力负荷预测中的应用 [J].电力信息与通信技术,2017,15(5):8-11.
作者简介:李永政(1994—),男,汉族,山东济宁人,硕士研究生在读,研究方向:大数据处理与分析FDF709A5-904C-4717-8E91-126731B2A384