关于国家各地区城镇就业情况的实证分析

2018-01-19龙艺

南方企业家 2018年2期

龙艺

摘要：随着我国国家改革开放以来，我国经济不断发展，我国包分配的就业制度也逐渐被更加适应国情的体制所取代。但是近几年来，不仅是毕业本科生就连研究生都面临着与日俱增的就业压力，让我们不得不去认真思考该如何解决这一重大难题。无论是在决定大学就读专业的时候，还是毕业选择工作地点和职业方向都值得我们重视。笔者认为，在如今大数据背景下，首要任务是对原始数据进行分析。因此本文笔者将对全国各地区城镇的就业数据进行整理以及研究选取的影响因素，通过聚类分析方法、主成分分析方法以及回归分析方法分析数据，希望能从分析结果向广大就业者提供结论和相应的借鉴。

关键词：聚类分析；回归系数；树状图

引言

近几年来，高校毕业生就业领域取向明显向大城市、经济发达地区集中，地域结构性矛盾相当突出。以上海海事大学2016年研究生调查问卷为例，“毕业后最理想的就业城市”的结果仍然是上海、深圳以及北京等一线城市。根据这一现状，本文针对就业情况，先用聚类分析方法中的系统聚类法进行分类，将全国各地区进行划分。然后再对原始数据进行回归分析，得出各变量与就业人数的回归关系。

就业情况影响因素实证分析

数据及其来源

本文选取国家统计局、中国统计年鉴2015年的国家级相关统计数据，是我国部分省市自治区2014年末的城镇就业情况及相关指标（变量）数据。

变量选取

Y：城镇就业人数总和

X1：城镇居民可支配收入

X2：城镇平均工资指数

X3：城镇居民消费价格指数

X4：城镇居民人均消费支出

X5：城镇人口密度

X6：城镇失业率

分析方法

聚类分析简述

聚类分析方法有很多，包括系统聚类法、动态聚类法、有序样品聚类法等。在本文中，由于笔者能力有限仅运用系统聚类法进行分析。系统聚类的基本思想是：距离相近的样品（或变量）先聚成类。距离相远的后聚成类，过程持续进行下去，直到将所有的样品（或变量）聚成一类。

回归分析简述及假设

简略地说，回归分析主要研究客观事物变量间的统计关系，是通过建立统计模型研究变量间相互关系的密切程度、结构状态、模型预测的一种有效工具。由于实际问题中，影响因变量y的自变量往往不止一个，一元回归模型往往也不适用，就需要建立多元回归模型。本例假设城镇就业人口数Y与相关变量X1，X2，X3，X4，X5，X6之间存在线性关系：

分析过程

本文利用软件SPSS 13.0进行实证分析，分析过程如下：

聚类分析过程

将2014年我国31个省、市、自治区就业状况作为样品聚类分为3-6类时的各样品所属类别。

（ 1 ）第一类包括2个样品，分别为：北京市和上海市。从地区分布和地区经济发展状况来看，这一类的特点是：北京作为中国首都周边资源相对丰富，工作岗位需求不仅广度大深度也很大；上海作为一个沿海城市，不仅是中国的金融中心还是中国的交通枢纽中心，与外界交流相当方便，这也就形成了人才济济的局面；二者作为中国的首要一线城市，交通网络发达，经济发展状况良好，高校较多、人才较为集中、气候四季适宜、工业发展蓬勃等优势不断吸引着一批又一批的人前去寻找心仪的工作。

（ 2 ）第二类包括4个样品，分别为：天津市、江苏省、浙江省、广东省。从地区分布和地区经济发展状况来看，第二类所包含的省、市、自治区主要分布在我国沿海地区，这些地区高校林立、人才人口集中，工业高度发达、科学技术引入便利，海陆交通四通八达，既有外资投入又有内政支持鼓励，又有中国尖端技术又有国外先进管理文化渗入。得天独厚的地理位置和环境优势不仅为求职者提供了舒适优异的居住环境，更是提供了一系列的水上作业工作。近年来，这些地区更是吸引了大量的“孔雀东南飞”、“民工潮”此起彼伏，众多社会现象不仅向我们说明了这些地区对人才和劳动力的吸引力；也让人们意识到了这些地区丰富的就业机遇和个人发展前景；更重要的是，国内外先进的技术和人才以及眼界开阔的海归们也积极投入到了这些地区的经济发展中，促使这些地区的经济蓬勃发展。

（ 3 ）第三类包括21个样品，分别为：河北省、山西省、吉林省、黑龙江省、安徽省、江西省、河南省、湖北省、湖南省、广西壮族自治区、海南省、重庆市、四川省、贵州省、云南省、西藏省、陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区。从地区分布和地区经济发展状况来看，相对于前两类，第三类所包含的省、市、自治区就远远没有那么幸运了。他们大多数主要分布在我国自然气候较为恶劣的地区，人才缺乏、各方面资源有限，交通线路不丰富，地理位置较偏远、我国社会政治治安不穩定，少数名族聚集，民俗民风差异大、多自然灾害、人口相对较稀少等等特点导致这些地区对求职者们的吸引力不算很大，大多数都是本地人在当地就业。

（ 4 ）第四类包括4个样品，分别为：内蒙古自治区、辽宁省、福建省、山东省。这一类是具有个别特殊性的省、自治区，当地特殊的旅游业、工业或者的奶制品业等等拉动了当地的就业情况，促进当地的各个方面的发展。

回归分析过程

采用所有解释变量即X1、X2、X3、X4、X5、X6对被解释变量Y用SPSS进行回归分析。

变量Y和X1、X2、X3、X4、X5、X6的均数（Mean）、标准差（Std. Deviation）和例数（N）。

居民人均消费者支出和居民可支配收入的相关系数是0.989，单尾单侧检验P=0.000，相关度相当的高。

模型摘要中相关系数R=0.544，判定系数R Square=0.296，调整判定系数Adjusted R Square=0.120，估计值的标准误差Std. Error of the Estimate=609.33131。

表1是偏回归系数结果，常数项（Constant）=3062.279，居民可支配收入回归系数=0.201，回归系数的标准误差（Std. Error）=0.093；平均工资指数回归系数=64.222，回归系数的标准误差=58.338；居民消费价格指数回归系数=-95.924，回归系数的标准误差=287.033；居民人均消费支出回归系数=-0.245，回归系数的标准误差=0.131；人口密度回归系数=-0.038，回归系数的标准误差=0.098；失业率回归系数=62.694，回归系数的标准误差=186.003。求得回归方程为Y=3062.279+0.201X1+64.222X2-95.924X3-0.245X4-0.038X5+62.694X6+ε。

结语

首先运用聚类分析，可以从分析结果看出全国各地中，相对于我国华中地区以及一些自然环境较为恶劣或者是少数民族地区的就业情况，北京、上海、浙江、广东、江苏等沿海地区或者靠近首都、沿海地区的就业情况较为优异，从这一结论可以提供广大择业者选择就业地区。但是同时，如果按照大多数人的择优心理，我国必将会出现两极分化逐渐加重，导致我国经济结构严重失衡，进而可能影响我国在国际上的影响，这后果是相当严重。由于笔者能力有限，模型中存在一定问题，需要具有更加完备的知识去修改并完善模型。

（作者单位：上海海事大学）