APP下载

对应用大数据建立就业形势监测预警体系的初步探索——以上海市浦东新区为例

2014-12-06周示莹付佳

统计科学与实践 2014年7期
关键词:浦东新区浦东形势

周示莹、付佳

(上海市浦东新区社会统计调查中心,上海 200136)

浦东新区就业相关大数据的数据源主要可分为政府数据和社会数据两大类。政府数据一是政府数据平台,指政府部门建立的包括所有工作对象相关数据的大型数据库;二是部门统计数据,指政府部门经过一定统计方式处理、筛选、汇总的经济社会发展重要指标的数据。社会数据则主要是各类互联网站所记录的与浦东就业相关的数据。

一、应用大数据建立就业形势监测指标体系方案

(一)建立指标体系的基本思路

应用大数据的处理方法从浦东新区就业相关大数据的数据源中提取能够反映就业形势各方面的指标数据,从而形成监测就业形势的指标体系。

(二)指标体系的基本框架和主要指标

根据就业统计理论和实践,就业形势主要包括劳动力资源状况、就业人口状况、失业人口状况和就业市场供需状况四个方面。本文根据这四个方面建立指标体系的基本框架,从相关大数据的数据源中提取相应主要指标(图1)。

1.劳动力资源状况:劳动力资源状况指的是劳动年龄段人口情况。劳动年龄段人口是就业、失业人口的基本来源,是影响就业市场供需状况的基础因素。

通过浦东新区公安分局的实有人口信息平台,可以提取劳动年龄段人口总数、劳动年龄段人口结构(包括性别、年龄、户籍、外来劳动力的来沪时间等)指标,从而监测实际居住在浦东新区的劳动力资源状况。

2.就业人口状况:就业人口状况指的是当前处于就业状态的人口状况,它直接反映着就业形势。

通过浦东新区统计局和浦东新区人力资源和社会保障局数据平台及统计调查可提取全面监测就业人口状况的指标。

通过统计局的劳动工资统计直报平台,可以提取规模以上企业就业岗位总量、就业岗位分行业结构、就业岗位收入结构等指标,从而能监测在浦东大中企业就业人口状况。

通过统计局的劳动力调查,可以推算常住人口中就业人口总数、比例、结构(性别、年龄、学历、户籍、行职业分布、收入)等指标,从而能监测浦东常住人口就业状况。

通过人保局的社会保险金缴纳信息系统和企业招退工及劳动合同备案登记系统,可以提取缴纳社会保险金或签订劳动合同的就业人口总量、就业人口基本结构(性别、年龄、户籍)、企业新增招工人数等指标。通过以上指标能监测大部分浦东新区就业人口总量情况。

通过人保局的劳动保障信息系统,可以提取浦东户籍就业人口总量、就业人口结构(性别、年龄、学历等)指标,从而能监测浦东户籍就业人口状况。

通过人保局的应届毕业生就业信息系统可以提取浦东户籍应届毕业生就业人数、结构(性别、学历、就业去向等)指标,从而能监测应届毕业生就业情况。

3.失业人口状况:失业人口状况是指当前处于失业状态的人口状况,它直接反映着失业情况。

通过浦东新区统计局和浦东新区人力资源和社会保障局数据平台及统计调查,再加上互联网数据,可提取全面监测失业人口状况的指标。

通过人保局劳动保障信息系统,可以提取浦东户籍登记失业人数、领取失业保险金人数以及浦东户籍失业人口总量、结构(性别、年龄、学历、失业时间等)指标,从而监测浦东户籍失业人口状况。

通过人保局企业招退工与劳动合同备案登记系统,可以提取企业裁员总数、裁员行业结构指标,从而监测企业裁员状况。

通过人保局应届毕业生就业信息系统,可以提取毕业后未找到工作的浦东户籍失业应届毕业生人数、结构(性别、学历等)指标。

通过统计局劳动力调查,可以推算常住人口失业率、常住人口中失业人口总量、结构(性别、年龄、户籍、学历、失业前行职业等、失业时间等)指标,从而监测浦东常住人口失业状况。

通过互联网数据,主要是通过对各类社交网站上反映个人就业的信息进行语义分析,从中提取能判定处于失业状态且居住在浦东的人数及其基本结构(年龄、性别、学历以及原工作行职业)。这也是监测浦东新区失业人口状况的重要参考数据。

4.就业市场供需状况:就业市场供需状况指的是就业市场上企业招聘需求和求职者求职需求状况。该状况反映了影响就业形势的劳动力供求因素。

通过浦东新区人力资源和社会保障局的数据平台以及互联网数据可提取全面监测就业市场供需状况的指标。

通过人保局12303招聘网站和公益性职业介绍所信息系统,可以提取其中发布和登记的企业招聘岗位总数、结构(行职业、薪酬、年龄要求、学历及专业技能要求等)指标、求职者总数、结构(性别、年龄、薪酬意向、岗位意向等)以及求职者投递简历总数、结构(简历投向的企业行业及岗位分布)指标。

通过互联网数据,可以提取在各大求职网站上发布和登记的浦东企业招聘岗位总数和结构、求职者总数和结构,求职者投递简历总数和结构指标;从各类社交网站的信息中还可以提取浦东企业招聘岗位数和结构、求职者数量和结构指标;从各大搜索引擎中还可以提取浦东新区就业岗位、招聘信息的搜索量指标。

图1 应用大数据建立就业形势监测指标体系示意图

(三)指标体系的应用与改进

通过挖掘就业相关大数据,可以提取出指标体系中各指标的不同时间维度的数据,从而能实现对浦东就业形势的动态监测。在实际应用中,将以月度、季度和年度为主要的时间维度。

通过对上述指标数据的观测,还可以进一步探索这些指标之间的相互关系,并相互校正,从而进一步提高指标数据的精度,使指标体系能更准确地监测浦东新区就业形势。

而随着浦东就业相关大数据的进一步扩展,可以根据大数据的发展情况,同时也根据政府关注的重点问题,不断扩充、完善监测浦东就业形势的指标体系。

二、应用大数据建立就业形势预警体系方案

(一)建立预警体系的基本思路

应用大数据分析处理方法,在就业相关大数据中筛选出一组与反映就业形势关键指标最密切相关的影响指标,用这组指标构建拟合和预测关键指标的模型,使这组指标成为 “风向标”。通过观测“风向标”来预测关键指标的未来走势,从而建立起就业形势预警体系。

(二)用于建立预警体系的大数据

用于建立预警体系的大数据一是直接反映就业形势的大数据,这些数据与关键指标之间存在互相影响,因此应作为筛选的对象;二是反映影响就业因素的大数据。主要包括:反映浦东经济社会发展各方面情况的各类政府数据平台数据和部门统计数据(反映经济形势、社会形势、人民生活、政府政策、信心因素等的各类数据和统计指标)以及互联网数据(主要指各类社交网站的信息关键词和各类搜索引擎的搜索关键词)等。

(三)建立预警体系的具体步骤

1.选取关键指标。首先选取反映就业形势的关键指标。关键指标可选取最能反映浦东新区就业、失业以及就业市场供需总体情况的指标,也可选取与当前社会热点或政府工作重点相关的指标。

2.数据整理和处理。其次要对关键指标数据和相关大数据进行整理和处理。根据时间维度将关键指标数据和相关大数据整理成月度、季度和年度数据,从而便于探索对应的相关关系。随后应用大数据的分析处理方法对数据进行处理,分别筛选出与关键指标月度、季度和年度数据密切相关的指标。

3.模型构建和验证。运用筛选出的指标,构建拟合关键指标的模型,并用历史数据进行验证。通过模型来探索筛选出指标对关键指标的具体影响。然后再建立筛选出指标的时间序列模型,用时间序列模型来预测筛选出指标的未来走势,根据其未来走势运用拟合模型拟合关键指标走势,从而实现对关键指标的预测,并也用历史数据进行验证。

4.应用与改进。对验证证明效果良好的模型,即可用来建立关键指标的短期(月度)、中期(季度)和长期(年度)预警体系。通过对预警体系中各指标的观测,来预测关键指标的短期、中期和长期走势。在实际应用中,不断检验预警体系的效果,并经常应用最新的大数据对指标和模型进行改进,从而不断改进预测的效果。

图2 应用大数据建立就业形势预警体系示意图

三、就业形势监测预警体系的具体应用方案

(一)监测就业形势热点

通过对就业形势监测指标体系中的相关指标数据的观测,可以对就业形势的重大变动以及社会经济热点问题对就业形势的影响进行监测,从而为政府更有针对性的决策提供数据支持。

1.监测年末年初就业形势变化。每年年末年初都是企业集中招退工的时期,就业形势会发生较大波动。可以通过观测年末年初数月的企业就业岗位,常住人口和户籍人口中的就业、失业人口,互联网信息反映的失业人口,企业裁员和新增员工,企业招聘和求职者需求等指标数据的变动情况,来监测年末年初就业形势变化的具体情况。

2.监测应届毕业生就业形势。每年应届毕业生就业都是社会广泛关注的问题。可以通过观测浦东户籍应届毕业生就业状况,企业招聘应届毕业生状况、应届毕业生求职需求等指标数据来监测当年应届毕业生就业形势,并通过分析这些数据来准确判断形势,为新区政府采取相应对策提供数据支持。

3.监测重大项目和重要决策对就业形势的影响。经济建设和社会发展的重大项目、党和政府做出的重要决策(重要的改革措施、政策及法规等)都对就业形势有着重要影响。可以通过观测相关行业、相关地区企业就业岗位状况、企业新增员工和裁员状况、企业招聘状况以及相关类别、相关地区常住人口和户籍人口就业和失业状况、求职者求职状况等指标数据的变动情况,来监测重大项目和重要决策对就业形势的具体影响。

4.监测全国和世界经济波动对就业形势的影响。浦东新区与国内外经济联系紧密,因此全国和世界经济形势的波动也必将对浦东的就业形势产生影响。可以通过观测和分析经济波动前后就业状况、失业状况及就业市场供需状况各项指标数据的变动情况,来全面评估经济波动对浦东就业形势的影响。

(二)充分发挥预警作用

通过观测就业预警体系中的“风向标”指标,能够对反映失业状况、就业状况和就业市场供需状况的关键指标进行预测,从而对就业形势的变动及时发布预警,为政府及时采取相应对策提供数据支持。

1.对失业状况实现预警。将常住人口失业率和浦东户籍人口失业率作为关键指标,从就业相关大数据中筛选出与这两个指标密切相关的若干指标来建立模型,作为“风向标”对失业率进行拟合和预测。

2.对就业状况实现预警。将各类企业就业岗位数量作为关键指标,从就业相关大数据中筛选出密切相关的若干指标来建立模型,作为“风向标”对就业岗位数量进行拟合和预测。

3.对就业市场供需状况实现预警。将各类别招聘岗位数与各类别求职者数量、求职者各类求职意向数量等作为关键指标,从就业相关大数据中筛选出密切相关的若干指标来建立模型,作为“风向标”对就业市场供需数量进行拟合和预测。

(三)通过挖掘数据为政府提高管理水平提供数据支持

通过对就业形势监测预警体系中大数据的深入挖掘,可以找出各种数据分布规律和数据之间的联系,从而能为政府提高管理水平提供数据支持。

1.对失业人群进行细分,帮助提高帮扶工作效率。对掌握的失业人员数据进行聚类分析,并结合就业市场供需数据、政府帮扶记录等,对失业人员进行细分,总结出各类失业人员特点,从而可以为政府促进就业部门对失业人员采取针对性帮扶措施提供数据支持。

2.找出隐性就业者,避免社会保障资源被滥用。将登记失业数据、领取失业保险金数据、领取低保金数据与劳动合同备案数据、社会保障金缴纳数据、劳动者求职信息、社交网站信息等进行比对,分析其中互相矛盾的记录,可以找出隐性就业的劳动者,从而能为有关部门鉴别冒领失业金或低保金人员,避免社会保障资源被滥用提供数据支持。

3.根据政府部门的需要,还可开发出更多数据应用来为提高管理水平服务。

[1] [英] 维克托·迈尔-舍恩伯格,[英] 肯尼思·库克耶 .《大数据时代》,浙江人民出版社, 2013年

[2] 郭晓科主编《大数据》,清华大学出版社, 2013年

[3] 程开明,陈龙.大数据时代的统计挑战与应对,中国统计,2013(8)

[4] 杨皓,肖云,陈朗,黄婧.我国就业的影响因素分析,数学的实践与认识,第40卷第15期

猜你喜欢

浦东新区浦东形势
为“浦东新区法规”开启众筹模式
三十年的浦东
“三不”工作:打造人民调解浦东模式
行业协会在科技创新中的政策选择
浦东新区公立综合性医院医疗质量控制体系现况分析
对上海浦东新区政府职能转变的定量评价
浦东公路养护管理信息系统
“浦东好人”黄宁
2011年中亚形势回顾与展望
适应形势 增强特色