基于关联规则的在线高考报名咨询个性化推荐系统
2019-12-23李佩张红
李佩 张红
摘 要: 高考志愿的填报是众多考生一次重要的人生抉择,它关系到考生的未来职业,关系到考生在校的学业成就,其中选择真正适合自己的专业方向显得尤为重要。设计了一个基于关联规则的在线高考报名咨询个性化推荐系统,采用J2EE技术架构。系统提供对高校信息、专业信息、高校往年招生情况等查询的功能,可根据考生录入信息为考生智能化地推荐高校,有助于考生选择合适自己的高校与专业。
关键词: 高考志愿; 智能化推荐; 关联规则; J2EE
中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2019)12-61-03
Association rules based personalized recommendation system for online
consultation of the college entrance examination registration
Li Pei, Zhang Hong
(Shanxi Conservancy Technical Institute, Yuncheng, Shanxi 044004, China)
Abstract: The aspiration choice of application for college entrance is an important choice in the lifetime for many candidates. It is related to the candidates' future career and the candidates' academic achievements in the school. It is particularly important to choose the right professional direction for the candidates. An online personalized recommendation system for college entrance examination registration consultation based on association rules is designed, which adopts J2EE technology framework. The system provides query functions for college information, professional information and the enrollment situation of the college in previous years. It can intelligently recommend colleges to candidates according to the information entered by candidates, which helps candidates to choose suitable colleges and specialties.
Key words: aspiration of college entrance; intelligent recommendation; association rules; J2EE
0 引言
高考考生通過高考志愿、电视、网络等多种渠道可获取拟报考高校的大量信息。如何从海量的数据中找出自己所需的信息,显得非常必要。本文结合当前高校信息查询系统的优缺点,采用J2EE技术架构,设计开发高考志愿填报辅助系统。借助本系统可以为高考学生提供各个高校的信息,帮助他们更好地选择适合自己的专业和学校,并为新生提供交流平台。
1 问题的背景
近年来出现了许多国内高考志愿填报参考系统,或侧重高考信息的查询,或注重专业喜好的测评,但这些系统仍存在一些不足之处。
⑴ 反映速度慢,有些软件技术平台较落后,数据库设计不合理,性能优化不完善,查询结果慢。
⑵ 用户界面设计不友好,功能分类模糊,实用性查。
针对这些不足,本文重在设计和实现功能相对完善的在线高考报名咨询个性化推荐系统。
2 准备知识
2.1 技术平台
基于关联规则的在线高考报名咨询个性化推荐系统的设计与实现采用J2EE技术框架和apriori关联规则算法进行开发,具体使用Spring+Mybatis+JSP等开发技术,数据库采用SQL Server2008,使用MyEclipse开发环境,应用Tomcat 6.0作为Web服务器。
2.2 关联规则算法Apriori
2.2.1 算法概述
Apriori算法是一种挖掘数据中布尔关联规则频繁项集的算法。它的核心是在预先设定的最小支持度条件下,对数据库进行多趟扫描,进而得到符合支持度要求的频繁项集(即频集),通常也称为最大项目集,根据最小置信度得到关联规则。
该算法优点是实现容易,对数据组织形式等要求较低。缺点是只考虑单维数据挖掘,适应面窄,同时频集长度变大后运算时间显著增加,效率较低[1]。
2.2.2 Apriori核心算法过程
⑴ 扫描一次数据库,找到候选的1项集(统计各项出现的次数);
⑵ 根据给定的最小支持度,得到频繁1项集;
⑶ 通过1项集自身连接得到新的候选集,再与最小支持度进行比较,此时得到一个频繁2项集;
⑷ 采用递归迭代的方法,重新执行以上步骤,直到不能生成新的频繁项集;
⑸ 在查找频繁项集的同时,可以采用剪枝操作将不符合条件的候选集删除。
3 系统设计
3.1 功能设计
系统功能模块图如图1所示[3]。
3.2 数据库设计
本系统使用SQLServer2008数据库,利用SQLServer2008数据库图形化管理工具,创建数据库表,系统数据库名为DB,数据库DB中包含7个数据表。表的具体内容如下。
⑴ 学校信息表(school),存储各学校的信息。
⑵ 专业信息表(profession),存储各专业的信息。
⑶ 历年高考录取情况(score),存储历年各院校各专业录取的分数。
⑷ 用户表(user),存储使用本系统的用户信息。
⑸ 留言表(message),存储每个登录用户给管理员发表的留言信息。
⑹ 历年学校分数表(sscore),存储每年每个学校的分数线。
⑺ 管理员表(admin),存储系统管理员信息。
3.3 系统设计
经过需求分析和概要设计后,对系统进行详细的设计,分析了各个模块的流程和步骤,绘出系统工作流程图,如图2所示。
本系统使用B/S架构,用户界面通过浏览器实现,主要逻辑功能由服务器端实现,形成三层MVC结构。MVC将系统分成视图层、业务逻辑层和模型层。
在用户模块主要完成历史高考填报相关信息查询和根据用户录入信息系统进行智能化信息反馈[4]:
⑴ 信息输入:用户只需输入考生历次模拟练兵考试的平均成绩,各科的平均成绩,考生的类别(理工科,文科),主要高校历年的录取分数。
⑵ 调研或自己模拟若干条历年考生被录取为某些高校的数据记录,用Apriori算法来对上述模拟的考生数据记录执行,获取有价值的关联规则[4]。
⑶ 用考生输入的信息与第2步获取的关联规则相匹配,获取高考自愿填写中相对可信的高校推介信息。
4 系统实现
4.1 界面设计
主要设计用户登录界面和数据查询页面。有关页面的图略。
4.2 功能模块
4.2.1 往年信息综合查询
本模块中,主要实现了院校搜索、专业查询、地区分数线检索、历史录取分数线查询等综合查询功能,运行界面如图3所示。
4.2.2 根据考生录入信息进行智能化高考信息推介
输入模拟平均总分,选择文理科类别,年份及所在省份,即可初步从数据库中筛选中符合条件的高校及专业信息[5]。
4.2.3 后台管理模块
后台管理模块主要负责对高考志愿填报系统的基础数据的维护,具体包括考生信息管理、高校基础信息管理维护等功能模块。
5 结语
本文分析并设计了采用J2EE的基于关联规则的在线高考报名咨询个性化推荐系统。分析了当前高考志愿填报系统存在的缺陷,优化了需求分析,采用JSP、MyEclipse开发工具和技术,完整地实现了整个系统。该系统为考生检索查询信息提供服务,系统根据输入的高考成绩提供智能化推介功能,对高考志愿填報起到辅助作用。
参考文献(References):
[1] 刘建花.Apriori 算法的改进及实例[J].电子技术与软件工程,2019.10:147.
[2] 李晓瑜.数据挖掘技术在高校课程设置中的应用[J].微型电脑应用,2019.5:5.
[3] 明日科技.Java Web从入门到精通[M].北京:清华大学出版社,2012.
[4] 敖希琴,费久龙,陈家丽. 基于关联规则的高校学生成绩分析研究[J].教育现代化,2017.45:240.
[5] 项亮. 推荐系统实践[M].北京:人民邮电出版社,2012.