分类技术在高校教学管理中的应用
2011-11-13王与刘洋
王与,刘洋
(滁州学院数学科学学院,安徽滁州 239000)
分类技术在高校教学管理中的应用
王与,刘洋
(滁州学院数学科学学院,安徽滁州 239000)
随着高等教育的日益普及,运用科学的分析方法找出更科学更有效的管理手段,已经成为高校管理面临的新课题。以某新建本科院校学生专业方向选择为例,根据学生的学习情况,运用贝叶斯分类技术对其进行分类预测,从而帮助教学管理部门做出科学的决策,合理分配教学资源。
分类预测;贝叶斯分类技术;教学管理
随着我国高等教育的日益普及,高校的办学规模在不断增大,高校的管理也随之面临着巨大的压力和挑战。对于高校教学管理者来说,基于现有的资源运用科学的分析方法找出更科学更有效的管理手段,已经成为高校面临的新课题。为适应高等教育的大众化,培养高素质的应用型人才,很多高校在培养模式上进行了大幅度的改革,比较常见的做法是在各专业实行“大专业、宽口径、多方向”的培养模式,即在大学的前两年内,学生主要学习公共基础课和学科基础课(必修),而后两年,学生可以根据自己的爱好、个性发展以及现阶段的学习情况,在设置的多个专业方向中任选一个方向进行深入学习。专业方向的选择一定程度上决定了学生今后的发展,因此合理的选择合适自己的专业方向显得尤为重要。一般来说,学生在进行专业方向的选择时,往往是依据自己的理解及兴趣爱好进行的,有时还会受到诸多外界因素的影响,主要包括同学、老师、父母、家庭和社会的影响。虽然大三学生已经在本专业进行了两年的学习,但对专业方向了解并不深,面对多种多样的方向及课程设置,大部分的学生对各门课程间的关联并不了解,对何种专业方向合适自己也没有认识,因此在选择时多半是随意选择,具有一定的盲目性,这也就造成了学生在后续的学习中遇到很多困难,可能选择了完全不合适自己的方向,甚至影响今后职业发展。如何科学的指导学生选择专业方向,将学生的兴趣爱好与专业知识的掌握程度充分相结合,从而合理的选择专业方向,成为高校教育管理中的一个重要的课题。
本文以某新建本科院校数学与应用数学专业学生方向选择为例,结合学生对专业方向选择的实际需求,运用贝叶斯分类技术,根据学生的学习情况对其进行分类预测,帮助教学管理部门做出合理决策,达到指导学生合理选择专业方向以及预测方向人数的目的。
1 贝叶斯分类技术
1.1 分类技术概述
数据挖掘技术是一门综合性多学科的技术,被认为是数据库和人工智能领域中研究、开发和应用最活跃的分支之一。近年来已广泛应用在产品质量分析、金融风险预测、电信、分子生物学、基因工程研究以及信息搜索等众多领域。分类作为数据挖掘中具有代表性的一种方法,也渐渐成为目前数据挖掘领域应用广泛的一个分支。分类技术是运用分类方法构建一个分类函数(分类模型或分类器),根据这个分类将输入的数据映射到某个给定的类别上。分类问题的应用领域很广,数据挖掘中的很多问题都可以转换为分类问题来处理。比较典型的是客户服务领域,比如将客户按忠诚度分类,预测客户的流失度等。
贝叶斯分类方法是一种使用方便且错误率最小的概率分类法,其具有完善的贝叶斯理论基础,有很好的模型、学习以及推理能力,是一种使用普遍的数据挖掘分类方法。贝叶斯分类技术是一种统计学分类方法,一般用于预测类成员联系的可能性,例如,数据项属于某个特定类的概率[1]。
1.2 贝叶斯分类模型
贝叶斯分类是一种基于概率统计中贝叶斯定理的分类模型,其利用数据的属性值,通过计算来预测数据属于某个类的可能性来对数据进行分类。分类数据项是由条件属性值组成的特征向量,并且还具有一个目标属性。其具体的数据项形式X{x1,x2,…,x n;c}为离散变量的有限集,其中xi(1≤i≤n)为条件属性值,c为目标属性。令样本集有A1,A2,…,An这n个属性,构成了样本的特征向量,可能的类别为{C1,C2,…,Cm},待分类样本X的特征向量为{x1,x2,…,xn;c}。这样,我们通过求出X分别属于每个类别的概率P(Ci|X),其中P(Ci|X)=P(X|Ci)P(Ci)/P(X),得出最大概率的即为X的预测类别。对所有的Ci,P(X)都相同,而P(Ci)等于训练集中类别为Ci的样本所占的比例值,则只需比较P(X|Ci)·P(Ci)的大小。若假设属性独立,则有P(X|Ci)=
2 贝叶斯分类技术在专业方向选择上的应用
2.1 问题描述及数据预处理
该专业设置两个方向供学生选择,分别为:软件工程方向及经济金融方向。入学前两年学生主要学习公共基础课和学科基础课,大三时学生可以根据自己的兴趣爱好及课程学习情况进行选择其中任意一个方向进行深入学习。
本例中,分类目标属性为本专业方向:软件工程方向及经济金融方向,数据样本包含19个条件属性(即课程),分别为:数值分析、数学建模与计算软件、数据库原理与应用、数据结构、解析几何、概率统计、离散数学、常微分方程、复变函数、计算机基础、高等代数(一、二)、数学分析(一、二、三)等17门课程,课程成绩转化为四级制(优秀、良好、中等、及格)记录,数据中还另外包含2个条件属性,分别是学生对两个方向的兴趣度:对软件方向的兴趣度及对金融方向的兴趣度,以三级制(较多、一般、较少)记录,即所有属性值均为离散值。在选择某届该专业学生成绩及专业方向选择情况作为专业选择训练集样本,经过预处理共有62条记录,其中2个目标属性数据来自于学生方向选择表,19个成绩条件属性来自于学生成绩表,而2个兴趣度条件属性则来自于对学生的问卷调查。
2.2 贝叶斯分类模型流程
贝叶斯学生方向选择模型流程如图1所示:
图1 贝叶斯分类的流程
2.3 实例分析预测
推断新样本的专业方向选择情况,用贝叶斯分类法对某高校数学与应用数学专业方向选择进行预测。例如,某学生N的各门课程成绩为:数值分析=中等,数学建模与计算机软件=优秀,数学分析一=良好,数学分析二=及格,数学分析三=中等,数据库原理及应用=中等,数据结构=及格,离散数学=良好,解析几何=优秀,计算机基础=及格,程序设计基础=及格,高等代数一=良好,高等代数二=中等,概率统计=良好,复变函数=良好,大学英语=及格,常微分方程=良好;其对软件方向的兴趣度为一般,经济金融方向兴趣度为一般。
使用贝叶斯算法计算各属性的所有取值相对于每个类别的概率结果如表1所示。
另,P(软件工程方向)=17/62,P(经济金融方向)=45/62。由上述条件,我们有
根据上述结果P(N|软件工程方向)>P(N|经济金融方向),可以推测该学生有较大的几率选择软件工程方向,该预测结果也于实际情况相一致。
表1 各属性的条件概率
3 结束语
运用数据挖掘中的分类技术,科学地预测学生专业方向的选择,将学生的兴趣爱好与专业知识的掌握程度充分结合,指导学生更合理的选择专业方向;通过对学生专业方向选择的预测,可以帮助教学管理部门做出决策,充分利用教学资源,避免了资源的浪费。本文只对分类技术在教学管理中作了简单的应用,还可以通过对学生每一学习阶段的情况进行预测,指导学生为专业方向的选择早做准备,更有利于学生的职业生涯规划。
[1]董 倩,王克俭,韩宪忠,苑迎春.基于贝叶斯分类的网上书店潜在用户挖掘[J].Microcomputer &Its Applications,2011,(1):47-49.
[2]韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2000.
[3]王 俊.朴素贝叶斯分类模型的研究与应用[D].安徽:合肥工业大学,2006.
[4]丁智斌,袁 方,董贺伟.数据挖掘在高校学生学习成绩分析中的应用[J].计算机工程与设计,2006,(4).
TP301
A
1673-1794(2011)05-0124-02
王 与(1984-),女,硕士,主要研究方向为数据挖掘。
2011-07-14