APP下载

大数据分析技术在高校人才质量评价中的应用

2019-06-27吴佳清姚文伟

科技传播 2019年11期
关键词:大数据高校应用

吴佳清 姚文伟

摘 要 简要介绍大数据分析技术的相关概念,论述了大数据分析技术应用于高校人才质量评价的必要性,介绍了人才培养数据采集存儲、人才培养数据安全管理的方法,阐述了大数据分析过程中3个数据挖掘算法在高校人才质量评价中的应用。

关键词 大数据;高校;人才质量评价;应用

中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)236-0118-02

在当今大数据时代,大数据分析技术被广泛应用于各种组织包括政府和企业,为相关部门提高工作效率和决策科学性提供有力支撑。根据国际数据公司(IDC)监测,人类产生的数据量正在呈指数级增长,在2020年前继续保持大约每两年翻一番的速度[1]。大数据分析技术将是一个科技创新的前沿技术,人类将从数据中获取改变生活方式的有效价值信息。

1 大数据分析技术简述

大数据具有体量大、类型繁多、时效性高和价值高密度低4个特点。大数据分析是指对规模巨大的数据进行分析并提取数据价值的过程,是在强大的支撑平台上运行分析算法发现隐藏在大数据中潜在价值的过程[2]。大数据分析分为可视化分析、数据挖掘、预测分析、语义分析和数据质量管理5个领域,常见的大数据分析工具有Weka、R、Enterprise Miner等[2]。结构化数据分析、文本数据分析、多媒体数据分析、Web数据分析、网络数据分析和移动数据分析是大数据分析技术研究的六个重要方向。

2 大数据分析技术应用于高校人才质量评价的必要性

在高等教育领域,各类高校招生规模的与日俱增与学校内部教学管理人员增幅相对较缓之间产生了巨大的矛盾。高等教育人才培养质量评价作为高校教学管理工作中一个重要的环节,既是高校人才培养的落脚点,也是高校教学工作的参照点。只有充分借鉴大数据分析技术在其他行业的应用经验,采用最新的大数据分析手段,结合各高校教学管理的内在需求和工作流程,以大数据分析技术应用为手段,构建完善的人才质量评价大数据分析流程,通过对海量人才培养数据的采集存储、数据交换、清洗、整合、分析等过程,达到对人才培养过程相关信息的跟踪与检测,挖掘出学生人才培养质量与各因素之间的关系并准确预测未来,才能够有力提高高校教学管理的水平。

3 大数据分析技术在高校人才质量评价中的应用

3.1 人才培养数据的采集存储

3.1.1 数据的属性与存储

人才培养数据是大数据分析技术在高校人才质量评价中应用的先决条件。数据的属性必须满足规模性、多样性和动态性的特点。只有符合以上3个特点,大数据分析技术才能够挖掘出科学和有效的数据。具体来讲,规模性是从体量的维度衡量,规模越大,数据就越精细且越能反映真实情况,多样性是从种类的维度衡量,数据的种类多少体现了数据的采集层面广度和微观度,动态性是从时间序列的维度衡量,即要求人才培养数据不仅要包含在校期间情况,还要包含毕业后的工作、家庭、工作晋升等重要时点数据。如果人才培养相关数据不完整、不准确,即使采用最先进、前沿的大数据分析技术手段,数据挖掘出的结果也毫无价值。因此,做好人才培养数据采集工作是所有教育管理者应该关注的重点。在数据存储方面,随着高校办学规模越来越大,且教学管理的精细化要求越来越高,教学管理的相关数据与日俱增,数据规模越来越大。如果还是采用原有的服务器模式,服务器的数量会呈现多而分散的问题。因此,人才培养数据要存储在云架构的分布式文件系统(DFS)中,以云的形式存储。

3.1.2 数据的来源与获取

与高校人才质量评价有关的数据库主要包括本科教学状态数据库、毕业生质量评价数据库、学生成绩数据库、教师教学质量数据库、学生第二课堂数据库等,其中本科教学状态数据库是教育部要求全国本科院校每年于十月左右将本校当学年的教学状态数据上传至申报数据平台,毕业生质量评价数据库一般依托第三方机构对高校毕业生进行跟踪与评价形成数据,其他教学数据库一般由学校教务处、学生处和团委牵头开发系统并由各二级学院或学生填报形成数据。以本科教学状态、学生第二课堂和毕业生质量评价数据库为例,本科教学状态数据库涉及师资队伍、教育教学、学生课外活动等11类近115个数据实体、900多个状态数据项,数据以结构化数据为主,学生第二课堂数据库主要是采集学生参加社交活动、创新创业活动等数据,这类数据以非结构化数据为主,毕业生质量评价数据库中的数据包括就业去向、薪酬水平、职务晋升与调动、职业发展水平等,以非结构化数据为主。

3.2 人才培养数据的安全管理

人才培养数据采集存储后还需要做好安全措施和备份方案。人才培养数据的安全直接决定了数据的准确性,是保证大数据分析技术在人才质量评价有效性的前提。当前高校人才质量相关数据使用率高,由于相关管理人员安全意识差、计算机操作不规范等原因,再加上计算机网络开放共享的特点决定了大量的黑客恶意攻击、人为破坏因素的客观存在,数据信息的安全性问题成为必须要考虑的问题[3]。因此,除了定期升级系统补丁并安装好杀毒软件和防火墙外,系统管理员还需要做好人才培养数据的备份方案。通过信息加密、远程数据库镜像等手段进行数据管理和备份,确保紧急时候能够利用恢复数据手段使教学运行正常化。

3.3 人才培养数据的数据挖掘

数据挖掘有4种常见的分析方法,分别是描述型分析、诊断型分析、指令型分析和预测型分析。描述性分析注重分析数据的背后发生了什么,也是最常见的大数据分析方法,诊断型分析一般在描述性分析之后,侧重分析为什么会发生的问题,预测型分析注重分析接下来可能发生什么,包括发生的事情、该事情发生的时点、发生的可能性等等,指令型分析通常是最后一步,是在分析过“发生了什么”“发生的原因”“可能发生什么”之后,进一步为用户提供决策,即应该采取什么样的措施。数据挖掘采用的算法主要包括分类与预测挖掘、聚类挖掘、关联规则、决策树方法、神经网络方法、遗传算法、模糊理论、可视化技术等等,其中聚类分类与预测挖掘、关联规则和决策树分类三种算法比较适用于高校人才质量的评价。

3.3.1 聚类、分类与预测挖掘算法在人才质量评价中的应用

聚类算法主要包括K-means、 BIRCH、DBSCAN、CLIQLE等方法,高校在人才培养质量评价时候可采用K-means算法的聚类挖掘分析技术,这种分析技术能够分析出某一类学生群体的行为特征。该算法通过分析学生自身特点、学习目标环境与行为来分析学生的学习特征,然后将学生以及学习特征进行聚类和分类,分析有可能出现学业预警的学生群体特征,或者科研能力较强或是就业质量好的学生群体的行为特征[4],以此向这类学生推荐他们感兴趣或者有用的课程和学习路径。通过聚类、分类与预测,高校能够对学生实施分类、精准和个性化的培养方案。

3.3.2 关联规则算法在人才质量评价中的应用

关联规则算法主要用于发现大数据背后各要素之间可能存在的关联,主要算法有挖掘布尔关联规则频繁项集的Apriori算法,该算法可用于分析学生学习成绩的影响因素。利用学生参与社会活动情况、文体互动情况和成绩的关联规则算法,高校可以了解第二课堂与学习成绩是正相关还是负相关。通过分析学生在课程在线平台上作业完成情况、登陆次数、材料浏览情况等信息,加上学生登陆图书馆的次数和借阅情况,高校可以分析出学生自主学习习惯与学习成效之间的关系。利用人脸识别技术采集学生上课的抬头率情况,可以分析出课堂学习注意力与学习成绩之间的关系。

3.3.3 决策树分类算法在人才质量评价中的应用

决策树算法是一种逼近离散函数值的方法,在70年代末由J Ross Quinlan提出了ID3算法。利用决策树分类算法构建人才培养质量评测决策树来实现定性分析也是一种常见的应用,其背后的逻辑是具备某种优势的群体具备另一種优势的概率较大。因此,通过决策树分类算法,高校教学管理者能够分析出不同专业不同类别学生的潜在就业领域,大概测量出某个学生继续深造还是立即就业的适合度,为学生的职业生涯提供科学的量化建议和辅助决策数据。

参考文献

[1]高志鹏,牛琨,刘杰.面向大数据的分析技术[J].北京邮电大学学报,2015,38(3):1-12.

[2]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,25(S1):142-146.

[3]姚文伟.高校教务管理系统数据备份解决方案研究[J].湖南科技学院学报,2018,39(2):109-111.

[4]傅钢善,王改花.基于数据挖掘的网络学习行为与学习效果研究[J].电化教育研究,2014,35(9):53-57.

猜你喜欢

大数据高校应用
中日高校本科生导师制的比较
学研产模式下的医药英语人才培养研究
高校创新型人才培养制度的建设与思考
高校科研创新团队建设存在的问题及对策研究
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
基于大数据背景下的智慧城市建设研究
会计与统计的比较研究