基于大数据的电信协优人员画像研究与应用
2020-06-28曹芳
摘 要:随着大数据技术的日益成熟,以数据为支撑进行科学决策得到普及。该研究用数据画像的方法,通过对电信协优人员的管理平台数据及其网上学习数据进行分析,从大量的员工基本信息、工作信息、考证信息、在线学习信息中筛选隐藏数据,发现不同类型员工特征,提出并建立协优人员画像的标签体系,从而构建员工画像,用于对协优人员进行科学化管理。
关键词:大数据;在线学习;员工画像;标签体系
中图分类号:TP311.13 文献标识码:A 文章编号:2096-4706(2020)24-0093-04
Research and Application of Profile of Telecom Optimization Assistance Employees Based on Big Data
CAO Fang
(Guangdong Vocational College of Post and Telecom,Guangzhou 510630,China)
Abstract:With the growing maturity of big data technology,making scientific decision supported by data is getting popularity. By means of the method of data portrait,through analyzing management platform data and online study data of telecom optimization assistance personnel,this study screens hidden data from a large number of employee basic information,job information,certification information,online learning information,and discovers different types of employee characteristics,proposes and establishes the label system of the profile of optimization assistance personnel,so as to establish employee profile. Which can be used for the scientific management to optimization assistance personnel.
Keywords:big data;online learning;employee profile;label system
0 引 言
为加强中国电信无线网络优化外包协助(以下简称“协优”)工作的规范化管理,保障协优工作质量和促进协优人员(指外包企业的网络优化人员)技术水平的提升,中国电信集团公司从2014年起启动协优企业资质和协优人员考试认证工作,每年举行一次认证,协优企业只有具备协优资格证书才有参加中国电信网优项目投标资格,因此拥有协优工程师证书是人员网优水平的重要参考。
为加强协优人员管理和能力提升,电信集团建立了“中国电信无线网络协优管理平台”,并从2019年开始,在学习平台上建立了“中国电信无线网络协优认证培训”,开展协优人员线上学习。
广东邮电职业技术学院作为中国电信集团网优认证唯一的承办单位,其中一项重要的工作就是每年对上百家协优企业,上万名协优工程师的考试成绩及考前培训情况进行分析,随着大数据技术的发展,为企业更好地提供及时、多维度、精准的数据分析服务,学校开展科研立项“基于大数据的网优人员能力画像与个性化学习平台的研究”,作者为该项目负责人,本研究借鉴大数据中用户画像方法论及技术,高效的数据挖掘方法,对协优人员进行多维度分析,及可视化呈现,帮助企业更加精准的了解协优人员在专业能力、员工稳定性,学习态度等各方面信息,进一步作出科学决策。另外,协优人员也可以通过个人画像,更加直观、全面地了解自己。
关于用户画像的概念,普遍认为最早是由“交互设计之父”Cooper提出来的,他认为用户画像是真实用户的虚拟表示,是基于一系列真实数据的目标用户模型。用户画像(user profile)作為实现精准信息服务的一种工具,近年来在图书馆、电子商务、健康医疗、旅游管理、精准营销等领域得到了较为广泛地应用,但用户画像在结合员工工作、专业技能、在线学习等方面的员工画像应用较少,本研究从协优人员的基本信息、工作信息、专业能力、学习行为四个维度聚合出不同类型的用户画像。
1 电信协优人员的员工画像构建
1.1 数据来源
本研究基于中国电信无线网络协优管理平台中的数据,和“中国电信无线网络协优认证培训”在线学习平台的学习数据集行为数据,涵盖了协优企业信息、及协优人员的基本信息、考试信息、工程项目信息、学习信息等五大板块。
1.2 构建流程
构建基于工作信息和学习行为分析的用户画像,首先,从协优管理平台数据库和协优认证线上培训Web日志中分别抽取和清洗员工的工作、项目、认证、学习行为等数据,收集的信息主要包括静态数据(基本属性)和动态数据(行为属性);然后,结合协优人员工作、学习进行特征提取,分为基本特征、工作特征、学习特征,并建立员工画像的分析维度和标签体系;其次,通过分类、聚类、预测、文本分析技术等算法对用户行为建模;最后,通过可视化呈现技术对协优人员进行整体画像、典型群体画像和个体画像,并针对画像结果进行多维度的应用。电信协优人员画像构建流程如图1所示。
1.3 建立标签体系
本研究结合协优工作及学习特点,从学员的基本信息、工作信息、认证信息和学习行为四类维度统计,梳理了47项常用的统计指标。基本信息主要包括:与员工相关的人口学属性,包括姓名、性别、出生日期、学历等;工作信息包括所属企业、所属省市、工作年限、资质类别、岗位信息、参与项目的信息、入离职信息等、参与项目时长及所承担的工作内容,是否是项目经理等;认证信息主要包括:考试时间,考试成绩、考试状态、不通过审批理由等;学习行为信息是学员课程学习和网站操作行为的合计,包括登陆时间、学习时长、学习进度、作业完成、线上小测等。
用户画像建模其实就是对用户“打标签”,從对用户打标签的方式来看,一般分为统计类标签、规则类标签、机器学习挖掘类标签,统计类标签是最为基础也最为常见的标签类型,例如平均年龄、平均工作年限、平均成绩等;规则类标签基于用户行为及确定的规则产生,例如确定规则月登录次数超过20次的为活跃度高,月平均学习时长超出20学时的为参与度高,学习进度完成70%并且作业完成70%的为投入度高,在线测验超过70分的为学习效果好,并可将活跃度高低等描述用系数描述;机器学习挖掘类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断,例如对项目表中“承担工作内容”项用大数据中文本分析技术,做数据提取和词频分析,结合工作实际建立项目内容工作字典,并按工作技术要求给出难度系数,通过数据挖掘确定员工项目能力难度和宽度(承担项目内容的种类多少)评价系数。
良好的画像标签能够满足清晰的可视化效果,画像标签即为用户特性划分结果的形象化表示,因此标签需要依据员工不同维度数据特点以及分类结果制定画像标签即为用户特性划分结果的形象化表示,在不同场景下侧重不同,在加强协优人员管理和能力的场景下,员工画像的服务对象主要是电信集团及协优企业的管理人员,本研究主要从以下四个维度考虑标签的设置,一是从基本信息维度,如协优人员的总人数、年龄分布,学历占比等;二是从工作维度,例如,各省市协优人员的分布、网优工作时长人数分布、员工流失率等;三是从能力维度,如协优人员资质总人数、占比,网优认证成绩各层次人员占比,项目经理占比等,四是学习维度,员工线上学习行为的活跃度、学习习惯、参与度、投入度、学习效果五个维度。根据以上考虑,设计网优人员画像标签体系,如图2所示。
2 协优人员画像可视化呈现设计及应用
根据以上协优人员画像标签体系,进行可视化设计,按照协优人员的归属关系,电信集团和各个协优公司可采用不同权限查看所管辖的协优人员画像,只是人员范围不同,但呈现形式一样,以下为整体画像、典型群体画像和个体画像可视化呈现设计思路。
2.1 整体画像
2.1.1 整体情况描述
统计协优人员的总人数,平均年龄、离职人数、认证通过人数等总体数据可用表格的形式描述;统计各年龄人数占比、性别占比、学历占比、有资质人员占比、离职人员占比等,可用饼图的形式描述;各省市的协优人员人数分布情况,可用地图的形式描述。
2.1.2 工作情况描述
统计员工从事网优工作时长,以直方图形式展示各时段中的人数分布,可了解有经验的人员分布;近几年离职率用折线图展示,并且用柱状图展示每个公司的离职人数、接受离职人数,可看出离职趋势和哪些公司流出流入比较多。
2.1.3 能力情况描述
统计网优认证的通过人数及未通过人数、网优考试认证平均成绩,协优项目经理人数等可用表格的形式描述;各工程师资质占比,网优考试成绩优良及格不及格比例,项目经理比例,可用饼图的形式描述;能承担不同难度的项目人员,不同宽度的项目人员的分布,以直方图形式展示各难度系数和宽度系数中的人数分布。
2.1.4 学习情况描述
展示员工的学习行为全貌,将活跃度,参与度,投入度,学习效果的平均值,用雷达图表示。
2.2 典型群体画像
2.2.1 认证通过人员和认证未通过人员的群体画像
协优人员经过协优考试,考试及格的人员则通过认证,将通过认证和未通过认证的人员从平均年龄、入职平均时长、平均从事网优工作时长,从认证平均成绩、每个分数段的人数、每个项目平均数和项目平均时长等方面分别进行画像,进一步细分考证未通过的人员分布,作为开展精准化认证培训的参考。
2.2.2 协优项目经理群体画像
从协优经理人数、人数占比、平均年龄、平均网优认证成绩、入职平均时长、平均从事网优工作时长、参与项目数、项目时长、主要项目中承担内容、跳槽频次等维度进行画像。
2.2.3 离职人员群体画像
从离职人员人数、人数占比、平均年龄,年龄分布、平均跳槽次数、入职平均时长、平均从事网优工作时长、参与项目数等维度进行画像。离职员工分析,根据离职人员画像,分析处于哪种情况的员工容易离职,做好这些员工的激励和发展规划,及人员培养,对协优人员流失率高的企业,发放调查表,定向分析原因,并提出预警,跳槽到其他协优企业的,分析其吸引原因。
2.2.4 不同学习类型的群体画像
将员工从在线学习的活跃度、参与度、投入度、学习效果四个维度划分,4个维度都低的划分为提升型,至少三个维度高于平均水平划分为成长型,各维度均高于平均水平划分为榜样型,三类人员分别用雷达图描述活跃度、参与度等四个维度。针对提升型员工可侧重关注学习的体验和督促,建立学习群,每天学习打卡,交作业提醒;针对成长型员工多推送感兴趣的内容,加强同学间的学习分享;针对榜样型,加强激励,学习积分排名,及积分转换奖励等。
2.3 个体画像
个人的在线学习四个维度,用雷达图展现个人画像,各维度值的平均值和优秀值作为参考,在展示学员自身学习画像的同时,也反映出学员与全网平均水平的差距。
3 画像系统设计
在明确了数据收集的内容,数据处理和分析的策略,數据展现的具体目标后,利用大数据相关技术将员工画像系统进行整体设计,主要分为四个层次,分别是数据采集层、数据存储层和数据分析层、数据展示层,系统技术架构设计如图3所示。
4 结 论
数据驱动人力资源管理,通过用大数据技术对协优人员进行画像,将员工画像转换为切实可见的洞察力,构建协优人员画像之后,即可更清晰的了解员工的基本情况,工作情况,学习情况,从而制定更有效的管理政策,和实施更有效的措施提升线上学习效果等。
参考文献:
[1] COOPER A,REIMANN R,CRONIN D. About Face 3:The Essentials of Interaction Design [M].New Jersey:Wiley,2007.
[2] 徐芳,应洁茹.国内外用户画像研究综述 [J].图书馆学研究,2020(12):7-16.
[3] 赵宏田.用户画像:方法论与工程化解决方案 [M].北京:机械工业出版社,2020.
[4] 杨浩.高校学生画像系统的设计与实现 [D].北京:北京邮电大学,2019.
[5] 伯纳德.马尔.人力资源数据分析:人工智能时代的人力资源管理 [M].胡明,黄心璇,周桂芳,译.北京:机械工业出版社,2019.
[6] 刘树军,王颖,许志坤.大数据视角下邮政企业教育培训用户画像研究与应用 [J].邮政研究,2019,35(6):36-38.
[7] 仲勇.大数据技术在企业员工标签体系中的应用 [J].电子技术与软件工程,2019(10):162-163.
[8] 吴奭登.基于大数据分析的电力企业供应商信用风险管理研究 [J].现代信息科技,2019,3(2):191-193.
[9] 刘艳.基于大数据的校园就业用户画像的构建与应用 [J].现代信息科技,2019,3(17):110-112.
[10] 李晶洁,彭喜梅,李岚,等.基于大数据方法的高校图书馆数据画像研究——以天津商业大学为例 [J].现代信息科技,2020,4(1):90-96+101.
作者简介:曹芳(1971.01—),女,汉族,甘肃天水人,讲师,软件工程硕士,研究方向:大数据、数据分析、软件工程。