基于人社行业的大数据分析及应用
2017-08-24
易联众是福建本地的一个上市公司,专注于人力资源和社会保障行业,现在在社保行业大概有十个省的覆盖。目前,我们覆盖的可以访问到数据的人群大概是4.5亿人,可以访问到数据的企业大概是600万元,专注于像医疗卫生以及就业和社会保障行业。
关于人社大数据的一个平台的整个建设思路和应用。为什么人社大数据,特别是社保大数据的数据价值会比较高呢?
因为,在社会保障领域,它提出来了一个理念叫记录一生、管理一生、服务一生,这个理念事实上把我们整个人一生的信息都记录下来。现在大家都是参保人,从小孩一出生开始,就参加了医疗保险,这块儿整个业务领域把整个人的一生,从出生信息到你的家庭信息,到你的教育信息,到你的工作信息,所有工作变动以及工作的一些收入情况,一个人的退休信息都记录下来,我们行业内认为,社保数据是偏难的一个信用。
所以,人社大数据在整个行业的规划,首先是顶端,顶端有一个互联网+人社。事实上,已经把行业的整个大数据归纳上去了。目标是身份认证、监管决策以及业务服务能力。然后,应用场景是身份核验。身份核验公安部最准,人力资源和社会保障局这个行业在全国发了10亿张社保卡,我们福建现在3600万张。
社保卡这块儿的数据有一个特性,发社保卡时都跟公安部比对。另外,照片会比公安部的更准确。如果原来公安部那边的照片不够,会有二次采集,这是身份核验。在信用评价方面,我们构建了基于人社领域的一个个人信用分和单位信用分。关于产品和服务,也是按照比例。
目前,我们推出的就业领域、劳动纠纷领域、精准扶贫以及社保预警决策,对于我们提供的身份证智能服务以及我们提供的个人画像,一方面是为我们的政府提供更好的服务,另一方面也能对外提供一些赋能。
一个行业的数据,不管为了自己的绩效和管理,还是为了提供更好的服务,都需要外部的服务。对于互联网数据,包括我们现在对于互联网舆情,包括就业招聘数据,以及其它社会数据源,通过外部的数据源补充,能更好地预测和更好地分析。
现在,在各个地方落地分三个阶段:
第一阶段实现数据管理平台。人社领域的数据会非常多,比如社保,可能大大小小分15个子险种。我们还有其它的外部数据,因此我们首先要构建一个基础的数据管理平台,实现各个方面数据的汇集。
第二阶段建设数据共享平台。共享平台不仅是跟外部交换,也是对外输出一个赋能,最后才落实到具体的应用。
第三阶段落实大数据应用平台。实现精准识别、信用评价、需求感知等基础能力,以及管理服务创新能力和社会协作發展。
一个政府部门内部,要把它关联上,要经过一个数据的信息转化、数据存储、数据分析、管理系统。另外,对外展现是通过可视化系统,以及服务的管理系统。服务的管理系统,更多的是提供分析平台,可能有对外的一个赋能进行使用。
分享几个具体落地的案例。目前,深圳人社行业的大数据平台,是政府领域的一个大数据平台。深圳经济高度发达,户籍人口只有300万,但是整个流动人口加起来有2000万,所以政府的编制远远不够。大大小小企业数统计下来260万,现在实体经济不好的情况下,政府最担心的是发生拖欠工资或者老板跑了这种事件。因此,深圳市政府下发了一个维稳的文件。
但是,260万个企业怎么排查呢?因为企业数太多,我们基本上通过我们的人社数据、互联网数据、企业数据、企业法人信息以及其它政府的数据进行排查。我们每周筛查100家单位,预测出我们现在大概的准确率为:排查这100家单位,可能20%已经发现有问题了,60%下去检查发现可能会出现问题,然后还有20%可能是错误的,准确率基本上能达到60%以上。
信用评估是我们跟人社部联合,研究了两个模型,第一个是基于人社行业领域的企业信用模型,第二个是个人信用模型。包括我们的保险,像养老、医疗、工伤、生育、失业以及就业,包括人社人才,包括我们求职岗位等的信息。目前的信息,我们在这块儿的信用,第一个是内部,内部在一些公共服务领域,还有单位的一些管控领域已经在实施。
目前,我们构建个人画像,包括我们个人特质的信息,包括从人社数据已经能够构建的覆盖全民的基本的健康画像,包括信用历史,能涵盖到整个家庭信息。
同时,就业领域是大家比较关注的,而现在往往出现的一个矛盾,是很多用人单位招不来人,但也有很多人找不到工作。这也存在一个信息匹配的问题,或者从政府发布的一些就业的扶植政策,这也是一个导向。因此,我们一方面有自己的行业信息,一方面有教育信息,一方面通过跟外部的合作,甚至招聘网站的信息,也为政府做了相关的就业预测,包括指导性工资的评测。