人才大数据综合架构及应用研究
2016-12-02江勇
文/江勇
人才大数据综合架构及应用研究
文/江勇
本文作者江勇
2015年,全球产生约8.6ZB的数据,该数据量正在以每年约50%的速度增长。以领英(LinkedIn)为例,该机构全球会员数已超过4亿人,《财富》世界500强中每个公司均有高管加入该平台。构建聚集效应下的人才机制,合理化配置人才资源,已成为国家创新、产业联动和组织协同发展的必备要素。
人才大数据的内涵和外延
人才大数据的内涵。人才大数据,一般是指人才成长过程中产生大量有价值的信息,这些信息构成特定的成长轨迹。运用现代信息技术,将人们在成长和受教育阶段中产生的各种有效信息以结构化或非结构化数据的形态进行采集和存储。
人才大数据的外延。人才大数据一方面通过科学模型和人工智能来帮助组织机构进行职位匹配,另一方面构建动态机制下的人才服务系统,从关键词筛选到精准匹配,同时引导用户通过手机移动端,参与在线考评和个人信息更新。
人才大数据系统结构
人才大数据来源。人才大数据来自各种渠道,其数据的格式和起源各不相同,拥有结构化、半结构化或非结构化的各类数据,数据到达的速度和传送速率都会因数据源不同而不同,收集数据的位置或直接或间接,分别以实时或以批量模式进行收集。以下列举人才大数据的主要来源:组织遗留系统属于组织内部应用程序,执行业务需要的分析并获取需要的洞察,其中包括客户关系管理系统(CRM)、用户结算操作和企业资源规划(ERP)系统等,这些系统中包含各种类型的人才数据。人才数据管理系统(HDMS)存储逻辑数据、流程、策略和各种其他类型的文档,具体包含各种文档和电子表格,这些文档可以转换为可用于分析的结构化数据,在某种程度上也可以公开为领域实体。人才数据存储包含数据仓库、操作数据库和事务数据库,此数据通常是结构化数据,可直接使用或轻松地转换来满足需求。
人才大数据分布式存储。包含改动和存储两个动作,主要是从各种数据源获取数据,并在必要时,将它转换为适合数据分析方式的格式。
人才大数据分析和使用。分析层的主要作用是读取数据改动和存储层整理(digest)的数据。设计分析层需要认真地进行事先筹划和规划,进而制定系列决策保证如何从海量的人才大数据中获得洞察、并且找到所需的实体,进而有效理解并执行分析需要哪些算法和工具。
人才大数据应用及研究展望
基于广泛适用性的人才数据的应用平台,能够从社交网站、学术平台以及研究机构进行分门别类的数据采集,实施有效的数据管理。包含数据合并、数据提取和智能分析。智能分析环节,人才数据平台可以进行用户、年龄、社会关系识别,并依照研究能力、创新能力、创业能力对各级人才进行打分,以准确、实时、有效的人才机制为组织机构和社会提供深度服务。
针对专家学者的人才大数据管理及应用服务,能够实现学术内容搜索、学术空间架构和学术推荐等系列服务。随着科技不断成熟,人才大数据会成为常态,以跨界合作、模式创新为切入点,分享国内外联合研发的智慧和经验。
未来研究中,能够通过个体信息的规模化收集、结构化分析、数据化整合和深度挖掘,构建真实有效的人才画像,为各类组织机构提供基于个性化信息的搜索、挖掘与人才应用,实现用户洞察、市场分析和个性化客服等诸多服务。
(作者单位:清华大学深圳研究生院)