数据挖掘在技校网络人才定向培养中的应用
2020-08-10杜嘉茵
杜嘉茵
(广州市机电技师学院,广州510000)
0 引言
随着大数据时代的到来,数据挖掘与数据应用技术结合互联网+、云计算、物联网环境,反映着各行业的现状与发展趋势,成为了实现“人才强国战略,制造强国战略,创造驱动发展智汇强国战略”宏伟目标的重要推手。同时,社会发展需要具有扎实技术、素质优良、创新潜能的技术人才;技工院校如何与时俱进培养优质人才,满足社会发展需求?大数据应用与数据挖掘技术将指引学校教育培训部门进行合理的课程设置和调整以及开展毕业生就业指导工作,以适应企业不断发展的需求。
1 教学现状分析
目前,技工院校网络技术专业的课程设置,主要分析网络技术发展的趋势、由行业技术专家和企业资深从业人员进行指导;调整课程体系,培养学生学习专业理论知识与掌握常用技术;学生学习完所有课程和经过岗位实训实践后,毕业直接在企业上岗工作,形成一种“专业(指导)->课程(指导)->就业”单向指导培养模式。“学生能短时间内满足岗位需求吗?能学以致用吗?综合职业能力如何?”实习指导部门会进行周期随访跟踪工作及收集反馈信息,慢慢就积累了大量宝贵的数据;如何对这些数据收集分析,使其更好地持续地服务到后续的人才培养中呢?数据挖掘技术使这一目标得以实施,利用关联规则和聚类算法进行统计、分析以上海量数据,获取企业常需工种的专业技术需求和趋势,与专业发展趋势相结合,共同指导网络专业课程体系的调整,形成一种新型双向指导培养模式。
把课程结构设置成“专业基础课+专业核心课+职业修养课”三维一体课程体系,建立对学生实行“专业+职业”能力定向培养模式。
2 数据挖掘技术
2.1 数据挖掘技术
数据挖掘(Data Mining)又称数据采矿、资料探勘,是数据库中的知识发现。数据挖掘利用“互联网+数据算法技术”,对海量的、模糊的、隐含的及有潜在价值的数据进行采集、分析处理;把数据内在的客观规律提取出来,成为有价值的信息资源。
数据挖掘的关联规则和聚类算法具有描述和预测两大功能,描述功能揭示数据的关联性;预测功能帮助人们了解数据的分布,从而作为人们的行为导向。使用关联规则和聚类算法,可以跟踪学生的就业情况,进行数据挖掘,获取网络专业技术在企业对应岗位应用的情况,定向指导本专业人才培养的课程设置调整与实习指导工作开展。
关联规则,就是从海量数据中找出频繁出现的数据集组成数据库,然后设置最小支持度,对数据进行迭代筛选,结果数据集反映了企业岗位对应网络专业相关技术的需求方向。
聚类算法,简而言之就是物以类聚,就是把海量的数据根据一定的条件进行划分,把性质相近或相似的数据分为一类;从而将没有明显关联的数据变成同类之间有关联的几组数据。聚类算法可以指引技工院校教育培训部门合理调整专业选修课程的设置,更好与专业核心课程结合,达到提高“学生-岗位”定向培养的职业能力的目标。
2.2 数据挖掘的应用
(1)挖掘流程
确定数据挖掘的目标,将数据挖掘技术应用到技工院校网络专业人才培养与就业指导工作中;既能促进课程设置的合理性,又能使就业指导具有针对性。
确定数据范围,为确保数据的时效性,选取前两届毕业生的就业数据进行初步挖掘处理,然后使用筛选条件进行迭代操作,逐层深度挖掘,最终利用获取的就业信息数据,再与课程体系建立关联。数据挖掘系统操作流程,如图1。
图1 数据挖掘系统
数据挖掘系统的几个重要组成部分:
①获取挖掘数据源:前两届网络专业毕业生的在校基本信息和就业信息。
②创建挖掘库:关联规则、聚类算法。
③设计挖掘规则:根据挖掘库内的规则,确定关联条件,对数据进行筛选,提取有价值的关联。
④条件库:对数据频繁集进行筛选的条件集合;迭代筛选,直到数据集为无交集数据。
⑤数据库:学生就业的各种类型信息,如学历、性别、必修课程、选修课程、专业技能等级、岗位类型、岗位薪酬。
⑥挖掘结果分析:通过逐层深度挖掘,获取课程、技能等级与企业岗位薪酬的关联信息,提供有价值的指导性报告。
(2)挖掘应用
在网络专业人才培养和实习指导工作中,需要对学生就业的影响因素进行量化分析,获取有效数据。数据挖掘主要针对学历与岗位关联;专业技能等级与岗位关联;课程主修方向与岗位关联;薪酬等级与岗位关联进行分析。
①数据采集
学生基本信息,包括学生学籍信息、课程信息、实习信息三大数据源;采集创建关系数据库。如表1。
表1 关系数据库数据源
②数据预处理
学生信息关系数据库中可能存在不完整、冗余、空值等情况,因此在挖掘操作前,需要对数据进行预处理,提高数据的准确性和完整性。这样有利于建立高质量的数据库系统。如学生生源地、课程学分及一些退学、服兵役的学生记录。同时通过添加关系,把各数据表关联起来,为数据挖掘做好准备。
③使用关联规则进行挖掘
在关系数据库中提取学生各类型信息,对数据进行抽象和离散化处理。学生性别有女(A1)、男(A2);学历有中技(B1)、高技(B2)、本科(B3);主修方向网络设备(C1)、网络系统(C2)、网站建设(C3);专业技能等级有中级工(D1)、高级工(D2)、技师(D3);岗位薪酬级别有月薪 4000元以上(E1)、月薪 3000-4000元(E2,不含4000)、月薪3000元以下(E3)。对以上各项类别进行抽象处理后,建立信息表,如表2。
④使用聚类算法分析、分类挖掘结果
聚类算法的聚类因子从信息表数据项中获取,算法策略利用数据库中关系查询读取功能,获得挖掘结果;分析出专业课程设置、技能等级与岗位需求,薪酬级别的关联性,提取客观规律。得出“硬件/软件”主修方向、“中技/高技/本科”学历、“中级工/高级工/技师”技能等级的毕业生;不同专业方向和技术水平的毕业生,分别对应哪些岗位,哪个薪酬级别;将会进行更有针对性的定向技术培养和就业指导。数据项的关联规则。如表3。
表2 信息表
表3 关联规则
根据聚类算法策略,获得性别、学历、技能等级、主修方向与薪酬级别的关联规则;挖掘分析出人才培养各阶段各层次和就业岗位的对应规则。发现性别与薪酬的关联支持度最小;学历和主修方向和技能等级三因素结合与薪酬级别支持度有不同的对应关系:中技学历中等技能等级并主修网络设备对应中高等级薪酬的支持度置信度高;高技学历技师等级主修网络系统或网站建设对应中高等级薪酬的支持度置信度高。通过支持度与置信度的概率分析有效地根据学生的具体条件和学业情况,进行分层职业岗位定向培养,达到更有针对性的学习与就业指导。摘取主修网络系统方向的职业岗位定位培养方案。如表4。
3 结语
创新,是复兴的征程上,推动国家兴旺发达的不竭动力。培养智造型人才是技工院校职业技能教育的时代课题。“互联网+数据挖掘”是信息时代的重要工具,也是技工院校人才培养改革与发展的技术推手;使用数据挖掘技术从海量、复杂的学生信息中,分析获取有规律有价值的数据,找出网络专业技术能力与企业相关岗位能力需求之间对应关系,指引技工院校及时合理的调整课程设置与能力培养模式与目标,对学生进行分层专业能力定向培养,提高核心竞争力,为国家建设培养输送高质量、高素质的创新性技能人才;同时也解决学生毕业就业难的问题,实现毕业即就业,更好地满足企业岗位需求,短时间内进行专业角色转换,投入到国家的生产建设中,实现“制造大国”向“智造强国”的转变。
表4 职业岗位定向培养表