基于数据挖掘技术的大学生信息检索系统研究
2017-09-11杨萍
杨 萍
西安外事学院 陕西西安 710077
基于数据挖掘技术的大学生信息检索系统研究
杨 萍
西安外事学院 陕西西安 710077
随着网络通信的普及,各行各业中产生了越来越多的信息量,特别是高校的信息化的不断发展中,出现了传统信息管理模式不能满足现代大学生的要求的问题,所以怎么能实现在海量的数据中快速检索出准确,有价值的信息已经成为教育领域中关注的主要问题。本研究根据数据挖掘技术思想,而提出了一种基于大学生的个人情况、成绩、考勤、社会行为、就业、奖励惩罚、贷款还贷七类模块数据的检索和挖掘的信息系统,并实现了基于大学生的信息检索的优化和具体的数据挖掘流程研究。
数据挖掘;云存储;信息检索
随着网络通信的普及,各行各业中产生了越来越多的信息量,特别是高校的信息化的不断发展中,出现了传统信息管理模式不能满足现代大学生的要求的问题,所以怎么能实现在海量的数据中快速检索出准确,有价值的信息已经成为教育领域中关注的主要问题。要实现高校数子化学生信息管理系统,必须从越来越多的大学生数据中深入挖掘信息,过滤出有用的知识,并能把不同的大学生按统一标准进行分类分析后,能够使信息得到重新组合和分配。通过对大学生的优化管理和对大学生的信息深度挖掘和整合,使大学校园的数字化信息建设得到更进一步的发展。
1 系统可行性分析
随着网络与通信技术的蓬勃发展,越来越多的数据资源处于膨胀状态,完全进入了“大数据”时代。面对大量的异构的数据资源,怎么进行划分,查询,获得有价值的信息,成为各应用领域关心的问题。要想实现从海量数据中提取各类有用的信息并找到信息中各种隐藏的关系,其中最有效的方法就是利用数据挖掘技术来完成对数据的分析与提取。数据挖掘技术是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的信息和知识的过程,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。随着教育信息化的发展和数据挖掘技术的成功运用,传统的以数据库实现对学生的海量数据及学习过程进行管理的模式已经满足不了教育工作者和大学生的要求了。如何转换这些数据成为有价值的信息,并能为教学决策,学习优化、改进学习效果等服务,不仅成为教育界所关注的焦点,更是教育信息化发展的一个重要趋势。Romero&Ventura(2007)以及Baker&Yacef(2009)对10余年的教育数据挖掘研究进行分析,归纳出5类教育数据挖掘方法。目前,教育数据挖掘技术已经得到广泛的关注和应用,特别是网络学习与相应的教育管理系统中得到充分的发挥。伴随着教育数据挖掘技术方法的成熟,会进一步开启对学生的行为分析的数据挖掘研究。本研究基于以上的教育数据挖掘技术的研究背景,立足于大学校园,通过对学生的海量数据进行挖掘,希望探索出学生的个人情况、成绩、考勤、社会行为、就业,奖励惩罚,贷款还贷中一系列活动分布特点。为开展对大学生教育教学个性化管理服务提供可靠的网络信息平台。
2 系统功能分析
基于数据挖掘技术的大学生信息检索系统是在大量的学生信息中发现隐含的数据规则,根据信息的需求,对包含有的信息进行采集、分析和存储,从而完成学生信息检索请求。主要实现的检索信息功能见图1。
图1 大学生信息检索系统功能模块
(1)个人信息:对大学生基本信息包括学号、姓名、性别、民族、出生年月、电话、QQ号码(MSN) 、邮箱、班级、家庭地址、所在院系、入学日期,年制等内容检索。
(2)成绩信息:主要包括成绩与选课(选修和必修)两部分内容。当查询学生相关考试成绩信息时,可以根据学号、姓名、课程、班级,专业等不同字段进行检索也可以对选的课程的类型进行信息查询。
(3)考勤信息:主要包括了学生在校上课情况信息的检索。可以列出以班、课程为关键字的学生考勤报表、并能智能筛选分析个人或班级的考勤对比等模块。同时,针对个人考勤情况,对个别问题学生也可以按一定标准进行统计并及时反馈。
(4)社会行为信息:社会行为信息中反应了大学生社会实践重要内容。每一个大学生的道德修养和知识应用能力都是通过社会行为体现出来,其中主要包括了校内和校外的课外活动,其中校内的包括社团活动和勤工助学等,校外的包括科技文化援助、医疗卫生、法律宣传、社会调查、文化服务等。
(5)就业信息:为了方便学校对已经毕业的学生进行跟踪统计调查,实现对学生毕业后的工作情况信息检索。
(6)奖励惩罚信息:大学生在上学期间因何理由奖励和因何事进行处分信息的检索。奖励惩罚的等级包括通报表扬、嘉奖、记小功、记大功、特别奖等和学生处分分为警告、严重警告、记过、留校察看和开除学籍五种。以上内容都会作为考核每一个大学生诚信水准的重要指标。
(7)贷款还贷信息:学生的贷款还贷现在已经成为大学里不可缺少的一部分。发展大学对贷款还贷信息化管理,以达到大学生自主管理贷款还贷的目的。为实现这一目的,该系统对学生贷款银行、个人的诚信信息、贷款利率、贷款类别、贷款年限、贷款金额、和还贷时间等信息进行检索和数据挖掘。
3 系统流程设计
3.1 功能结构设计
基于大学生信息检索系统需求分析,以B/S网络结构为基础,实现不同的用户通过网络平台对服务器中的学生的各类信息进行检索和挖掘,多样性的数据形式采取分类采集后,检索的结果可通过服务器端发送回给客户端。为了实现大学生的七大类信息检索和数据挖掘,把系统划分为用户管理模块、数据管理模块(数据采集功能、数据分析功能,数据存储功能),通过这些模块相互协作实现大学生信息检索功能。
3.2 用户管理模块
用户管理模块按管理员、教师、学生三类用户进行分类,不同的用户在相应的权限下执行操作。每个用户成功登录后,可对学生基本情况,在校行为表现,学籍内容,奖励和惩罚等信息的检索。对于学生,可以检索本人相关的全部信息,并能智能化推荐个性化的服务指导;而对于管理员,不仅可以获得学生的各类信息,而且可以把检索到的学生信息进行统计分析和进一步数据挖掘。同时,为了获得更全,准确的个人信息,在注册时提供数据类型具有多样性,能够满足各用户的各种输入要求。
3.3 数据管理模块
3.3.1 数据采集
数据采集分为客户端数据采集和服务器端数据采集两大类。当用户把检索条件提交后,先对客户端数据进行读取并匹配成功后传到Web服务器,根据请求的检索条件进行数据匹配,按一定的数据收集方法找到合适的数据源,并将收集到的不同数据源以相应的格式存入数据库。
3.3.2 数据存储
数据存储问题是基于数据挖掘技术的大学生信息检索系统中一个重要环节,需要建立一个完善的数据库,以实现各类数据信息的存储。本系统由七类信息模块为依托,分别建立相应的数据表,其中不仅考虑了功能扩展的问题,还必须针对了各个表之间的关系,设置相应的数据表的主键和索引。
3.3.3 数据分析
数据分析是本系统功能实现的核心部分。服务器端根据不同用户的要求,建立的相关索引,实时对海量数据的分析处理,经过数据清理后,将完整、正确、一致的信息存储到大数据库。其中可通过数据分析实现对用户的个性化需求进行分析,并给予学生的行为分析预测,从而可提供满足这些特征个性化内容的智能化信息展示与推荐指导。例如:从服务器中提取出某个学生的成绩,对学生的成绩数据筛选并进行数据挖掘分析后,不仅要分析成绩的好坏,并能够个性化指导学习状态以达到学习效率的提高。
3.4 实现流程
该系统的实现主要由3个层组成。
表1 基于数据挖掘技术的大学生信息检索系统的层次结构
图2 大学生信息检索流程图
各功能模块交互协作实现数据信息的检索,并传送给客户端。具体流程见图2。
(1)智能检索网络客户端接收用户所提出的检索要求,并对用户名和密码进行登录验证。
(2)服务器收到用户提出的信息检索要求后,把信息传送给服务器平台。
(3)在获得服务器信息存取访问后,建立客户端与网络平台的通信。读取信息时先从数据块中采集到对应的元数据的信息位置,通过数据的位置信息,依次对相关数据进行读取,真到读取完成。在整个系统实现过程中就是通过数据挖掘工具对查找到的数据进行反复的过滤,去除模糊,不确定的数据,提炼出有价值的信息。
(4)检索的结果将会有不同数据形式传递到客户端。
4 结语
目前,大学生信息数据进行合理的挖掘已经成为大学校园里数子信息化发展的重要指标。根据信息处理的挖掘技术,本研究提出了一种基于大学生的个人信息、成绩、考勤、社会行为、就业,奖励惩罚,贷款还贷七类模块数据的检索和挖掘的信息系统,并实现了基于大学生的信息检索的优化和具体的数据挖掘流程。 通过构建一个全方位的学生检索系统,使大学生的信息实现统一管理和数据重新分配与整合,而且还实现学生各类信息的优化,又保障了数据的准确性和实用性。但是,目前教育数据挖掘技术还不成熟,在具体应用中还出现很多问题,尤其是在检索信息的时候,信息安全性,数据匹配,数据准确性等方面都有待于深入研究。
[1] WANG Yi-jie,SUN Wei-dong,ZHOU Song,et a1. Key technologies of distributed storage for cloud computing[J].Joumal of Software,2012(4):1-25.
[2] WU Yong—wei.HUANG Xiao—meng.Cloud storage[J].Society of China Computer Communication,2009,5(6):44-51.
[3] HUANG C Q,DUAN R L,TANG Y,et a1.EllS:An educational information intelligent search engine supported by semantic services[J].International Journal of Distance Education Technologies(I~DET),2011,9(1):21-43.
[4] Baepler,P&Murdoch,C.J.Academic Analytics and Data Mining in Higher Education[J].International Journal for the Scholarship of Teaching and Learning,2010,4(2):170-178.
[5] 陈卫荣.Web网络信息挖掘系统的体系构建探究[J].宁德师范学院学报,201(10):156-160.
[6] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013(23):5-11.
[7] 徐鹏,王以宁.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.
[8] 刘宇.网络交易数据挖掘分析系统设计[J].电脑编程技巧与维护,2014(23):50-51.
[9] 中一鸣,申怀亮.基于Hadoop架构的校园信息系统研究[J].中国电子商务,2013(24):58-59.
[10] 张建莉.云存储技术在高校信息化建设中的应用分析[J].科技视界,2013(28):216.
TP311.13
A