面向大学生健康领域的数据挖掘技术研究
2015-12-10焦向锋
焦向锋
摘要:为了配合学生素质教育改革,教育信息管理必须变换原有的手工处理方式。利用计算机自动实现数据筛选、自动阅读数据信息,势在必行。这必将大大提高辅导员的工作效率,能有效地提高对大学生综合管理水平。长期以来,学生综合素质评价报告一方面被辅导员们重视力度不够,另一方面被辅导员所带学生较多致使评语千篇一律,文式枯燥。面对海量数据如何客观分析说明,在这种情况下人们就迫切需要一种能去粗存精、去伪存真,快速、精炼得到相应结论的技术。数据挖掘是目前人工智能和数据库领域研究的热点问题,是一种决策支持过程[1]。它主要是基于人工智能、模式识别、数据库、可视化编程技术等,高效快速地分析数据,做出合理准确地归纳推理,是教育发展趋势。
关键词:数据挖掘;人工智能;精炼
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)33-0229-02
一、数据挖掘在国内外概况
数据挖掘是指从数据库的大量数据中寻找出隐含的、先前未知的并有潜在价值信息的非平凡过程[2]。目前国外的数据挖掘主要是基于对发现知识方法的进一步探索,如近年来的Bayes(贝叶斯)方法和Boosting方法。国内数据挖掘技术还不完善,从事这方面科研的人员也多数集中在高校,主要研究的是一些理论数据挖掘算法,能真正把科学理论转化为现实成果的还是少之又少,目前市场上所拥有的产品比较单一不够全面,在一线工作的人员迫切需要一种能够从多种混合信息中自动提取出有用价值的技术,来缓解他们的工作压力。
二、主要创新点、技术关键
1.数据挖掘语言的规范化,标准的系统开发化,模板数据的统一化,提高数据接口和系统功能之间的相互操作能力,促进其在社会企业的方方面面都能够得到广泛应用。
2.寻求一种简单、有效的可视化编程方法,使数据的可视化程度真正起到能够推动改变人们主观能动性作用。
3.与实际企业应用的一些特殊数据类型的兼容问题,依据不一样的数据存储容貌特征,切实采用一些行之有效的研究开发方法不仅是现在而且也是将来都必须要面对的事实问题。
三、建立起切实可行的数学模型
1.确定评价参数要求的模糊构架M={mj,m2,m3,m4…mn)。其中mj,j=l,2,3,4…,n是评估参数要求个数,n是同一层次上的参数的个数,这一集合初步构建起评估要求的数学模型框架。
2.确定评价结果的模糊构架N={ni,n2,n3,n4…ni}。其中ni,i=l,2,3…,i是评估参数要求个数,n是同一层次上的参数的个数,通过比较也就是要得到的等级档次数。这一数学模型规定了结果的参数既可以是定性的理论文字说明,也可以是量化的具体分数。
3.确定隶属度函数。假设需要对第j个评估参数mj要进行量化标准说明,首先要得到一个相对于Nj的模糊函数Rj=(rij,r12,r23…,rmn),其中i=l,2,3…n;j=l,2,3…m,rij为参数Mj具有Ni的程度,如果对n个元素进行整体说明,其结论就组成了一个m行n列的矩阵,称之为隶属函数度的值R。通过上述说明很明显可以得到该矩阵中行就是对每一个单评估参数的评价结论,同时整个矩阵也就包含了对所有评估参数所必须要获得的全部信息。
4.确定权重向量。权重向量又称权向量,权系数ωi的大小代表相应目标fi在多目标中的重要程度。在刚才确定好的m行n列矩阵中现要算出每行的和ai以及矩阵中所有元素的和a,最后权重向量ωi=ai/a。
5、得到最终结果B。权重向量ωi与隶属函数度的值R按照某种特定算法的组合就可以得到该事物的最终评价结果:B=ωi*R(*为算子符号)。
四、学生素质评测系的实现
(一)学生素质评测功能
学生素质评测子系统是整个系统数据的主要入口,该子系统主要实现的问题是通过工作人员记录学生平时的日常生活管理、课外活动表现、在校学习状况等事件产生出相应的量化分数或是等级程度。然后将这些内容分类与归纳录入到计算机中,在评价时把这些记录通过计算机系统进行调用处理,与事先规定好的体系标准进行比较。采用推优选优制度,是当前绝大多数学校进行德、智、体三方面的综合测评标准的主要依据。一般学校的测评计算公式为:M=0.2M1+0.7M2+0.1M3,其中M代表测评总分,M1、M2、M3分别为德育成绩、智育成绩和体育成绩,各系数为三者权衡比重,从上述公式也不难发现各个学校对学生的要求基本都是“以学习为主,德智体全面发展为辅”的办学宗旨。
评测子系统的功能分由两部分组成,一部分描述的是基本信息如学生基本信息,学籍管理信息等,另一部分描述的是素质评测管理信息如测评成绩管理、日常表现管理、素质等级管理、历史记录管理等。其中日常表现管理又分为课外活动管理、道德行为管理、考勤管理、学生身体状况和特殊事件管理。
1.学生基本信息模块。
目标:学生档案的添加、删除、修改、查询和打印
用户:学生、班评审小组、班主任、辅导员、学生处领导
功能:添加、删除、修改和查询学生的基本资料,根据不同的用户对于添加、修改和删除功能需要设置不同的权限。
2.学生的评测模块。
目标:管理学生的测试成绩
用户:学生、班评审小组、班主任
功能:学生素质测评成绩的动态添加、删除和修改。
(二)数据库程序的规范设计
数据挖掘是在数据库和数据仓库的支持下进行高率合理的提炼和知识挖掘工作的,因此我们构建的学生信息数据仓库,在建立时就特别需要注意数据的可靠性。表中应该尽量避免使用可为空的列,其次表中的记录应该有一个唯一的标识符,最后数据库在使用的时候要有统一的前缀名。所以数据库系统的建立一定要考虑实际需求和功能划分,设计出行之有效的数据库,使其一定要固有可靠、使用可靠和环境适应可靠。
五、系统开发工具及代码实现
该系统的前台开发是基于Visua1 Basic 6.0语言,以SQL Server 2000作为后台数据支撑,考虑数据的安全性,采用C/S的结构模式。部分代码如下:
Sql = "Select * From 用户信息表 where 用户名=" & un & ""
Rs.Open Sql,Conn,1,3
If Rs.EOF Then
MsgBox "您输入的用户名不存在,请查证后重新输入!", , "信息框"
Text1.Text = ""
Else
If Rs("密码") <> up Then
MsgBox "密码错误,请您重新输入!", , "信息框"
Text2.Text = ""
Else
If Text3.Text <> Label5.Caption Then
MsgBox "验证码错误,请您重新输入!", , "信息框"
管理数据代码
Rs.MoveNext
rst.MoveNext
i = i - 1
If i = 0 Then
faccess.Caption = "数据导入完毕!"
Rs.Update
MsgBox "已成功导入" & rst.RecordCount & "条记录!",vblnformation,"温馨提示"
cmd2.Caption = "关闭"
Else
faccess.Caption = "数据正在导入,请稍后......"
六、运行效果分析
智能评价对学生管理有着巨大的推动作用,运用该系统不仅能够快速、准确的得到结论而且还能扩大对学生的管理范围。此系统虽然是一个信息管理系统,但能充分采用人机交互工作,满足时尚需求,能够有效降低运行成本提高领导对工作的满意程度,在工作量大,人员紧缺的情况下是完全符合部分人工工作被取缔的条件。学生素质综合评价作为其中的一部分,它能比较全面的采集到学生的德、智、体、美等有效信息,实现全方位的查询、分析与统计。
参考文献:
[1]邵红全,赵蕊.用SQL Server 2000实现数据挖掘的技术与策略[J].电脑开发与应用,2003,(4).
[2]丁元.关于学生综合素质测评的研究和实现:贵州大学硕士学位论文[Z].贵州大学,2005.
[3]陈新文,周志艳.素质教育的理性批判[J].教育学,2000,(6).
[4]王朝方.关于高校教师教学积极性问题的初步探讨[J].西安外国语学院学报,2001,4.
[5]牛祥春.对大学生综合测评体系构建的思考[J].教育新导向,2003,(12).