APP下载

基于数据挖掘的高校自动化办公系统建设

2013-09-26王加年

电子设计工程 2013年24期
关键词:办公自动化数据挖掘模块

王加年

(常熟理工学院 江苏 常熟 215500)

近年来,高等教育信息化高速发展,教育管理部门管理信息化、决策科学化水平不断提高,高校办公自动化系统的开发和应用得到了广泛的重视。国外办公自动化概念提出的较早,发展也较快。以美国为例,从上个世纪60年代初到现在,它的办公自动化产品每年以20%的速度增长1。至今,全美国80%的信息业已实现了办公自动化。美国政府高度重视办公自动化系统的发展和应用,白宫在十多年前已建立了办公业务系统,这是一个具有一千多个终端的局域网。到21世纪初,美国各高校基本上都建立了适合自身的标准办公自动化信息系统。

1 数据挖掘概述

随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。是知识发现 (knowledge discovery in database)的关键步骤。

数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘在商业上是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据[2]。

简而言之,数据挖掘其实是一类深层次的数据分析方法。数据分析本身已经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学研究,另外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为了分析的目的而收集的,而是由于纯机会的(Opportunistic)商业运作而产生。分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。

因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。

1.1 神经网络方法

图1 数据挖掘定义示意图Fig.1 Schematic diagram of data mining

神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art模型、koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是"黑箱"性,人们难以理解网络的学习和决策过程。

1.2 遗传算法

遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用[3]。sunil已成功地开发了一个基于遗传算法的数据挖掘工具,利用该工具对两个飞机失事的真实数据库进行了数据挖掘实验,结果表明遗传算法是进行数据挖掘的有效方法之一。遗传算法的应用还体现在与神经网络、粗集等技术的结合上。如利用遗传算法优化神经网络结构,在不增加错误率的前提下,删除多余的连接和隐层单元;用遗传算法和bp算法结合训练神经网络,然后从网络提取规则等。但遗传算法的算法较复杂,收敛于局部极小的较早收敛问题尚未解决。

2 系统需求分析与总体设计

2.1 系统设计原则

在设计中主要遵循以下原则:

系统性原则——系统是作为一个整体而存在,因此在系统设计中,要从整个系统的角度进行考虑,系统的代码要统一、设计规范要标准,传递语言要尽量一致,对系统的数据采集要做到数出一处,全局共享。

实用性原则——系统应以用户的实际需求为导向,并结合先进、合理的管理模式对系统各功能加以实现。确保系统功能实用、操作简单、易学易用,适合各类人群。

先进性原则——采用的技术既要反映当今的先进水平,又要具有很好的发展潜力,力求方案的先进、灵活、高效。

安全性原则——办公自动化系统应能保证办公数据的安全性、有效性和一致性。

扩展性原则——系统的设计既要考虑当前的实际需要及经济承受能力,又要考虑长远发展的需要,保证系统的可扩展性,保护原有的投资。

2.2 需求分析

随着网络技术和计算机技术在学院内部所发挥的作用日益深厚,数据、公文等信息量的逐渐增大,而且这样的信息量都是涉及到了各个部门。

因此,诸如文件、报表等传统的手工处理方式已经不能满足学院日益发展的需要,这样的处理方式也会直接制约到学院的发展。针对该状况,学院迫切需要整合现拥有的计算机和网络资源,加快实现信息化的速度,促进校方的数据、信息的流通和利用。0A系统在现阶段技术手段成熟的条件下,整合了学院先用计算机设备与技术,通过学院工作人员的工作,逐步实现办公的自动化,从而提高工作效率,最终实现一套完善、成熟的工作流程[4]。该办公自动化系统目的改善现有旧的工作及教学方式,提供一种随着时代发展更新的信息化工作环境,以完善的管理信息系统为学院实现全面信息化教学奠定良好的基础。正是由于该办公自动化系统的实施,也推动了校园其他信息化基础的发展。

办公自动化系统建设是学院实现信息化教育的基础,旨在推动学院在高科技迅速发展的今天实现教育现代化水平,适应时代的要求,创造出一个崭新的教学工作环境[5]。而且该以系统又涉及到了学院管理的方方面面,是一项极其复杂的系统工程,因此也受到很多因素的限制。该系统从学院工作的总体出发运用综合平衡的方法,最终达到最理想的情况。因此,发展办公自动化系统一般都要经过从小到大、从点到面、从低级到高级的发展过程。

近来,学院的综合实力不断提升,学校也感觉到改变整合现用的教学制度,提高学校的管理水平对于一个学院的重要性,原有的办公制度的弊病也逐步显示,并且随着时间的发展,问题越来越尖锐,主要表现在:现有的学院文件和信息在办公的全过程中都是通过纸张传递和贮藏的,纯手工上的操作,相较于自动化办公系统,其存在以下缺点:

速度慢:学校要制定一份文稿,在起草人员修改完后成交由领导审阅,通过了领导审阅领导签发后又再到发送到相关部门,这样的流程白白消耗了大部分的时间。如果遇到的是紧急事件,时间就有点仓促了,需要相关人员加班加点。而对于这种情况,计算机网络就可以大显身手了,文件定稿后便可以迅速发送到各有关部门,极大地提高了办事效率。

不便于存储及查询:随着时间得推移,学校的信息量像滚雪球一样越来越大,纸质载体不断增加,量大就非常不利于储藏,也不便查找。文件在签批后,可能需要同时在多个单位传阅,需要大约两周的时间,文件才能回机要室,而且在流转的过程中可能有部份文件会损坏或者丢失。

成本高:学校用于纸质文件印刷的耗材费用投入巨大。

3 系统总体设计

本办公自动化系统分为以下六大模块,几个模块之间彼此相对独立,它们之间的交流主要是用户的信息,如用户的账号和密码等,功能上都非常独立,每一个功能实现不同的工作流程控制、信息管理等。现分别叙述如下:

3.1 个人办公

每位教职员工访问校园办公自动化系统之后,首先进入系统的登录界面,只有输入正确的用户名和密码,经过系统的身份验证之后,才能进入系统的主页面,系统同时要保存用户的相关信息。

每位普通用户都可以通过该模块查看已制定好的工作日程的详细信息,包括具体的内容:标题、日期、完成时间等,并可以设为自动提醒;对于个人工作日程,用户还可以修改、删除。通过该模块,用户可以与他人通过电子邮件相联系,加强彼此之间的交流,以促进协同工作,同时还可以添加自己的联系人。

3.2 公共信息

信息浏览:每个高校员工能够通过该模块查看校园的新闻公告、会议通知、各类教学管理信息,以及共享资源的使用情况,如:计算机机房,各类实验室,多媒体教室、车辆等。点击信息标题,可以弹出子窗口显示其详细内容。

信息管理:通过管理员的权限设置,某些员工可以拥有对各类信息进行管理的权利,可以定期地添加一些新的信息,对于一些过时的信息予以删除,并对某些内容及时地做出更新,但是不能修改和删除他人所管理的信息内容。

4 数据库设计

根据模块之间的关系,系统在数据库端主要分为8个表,为了查询方便设计了视图。模型的设计是根据模块之间的关联性和独立性来划分的。比如会议申请模块所用到的表包括会议室表和用户表。下面以核心业务为例来描述数据库的具体实现[6]。

4.1 公文流转

用户表(BJ_Users)用来保存用户的基本信息,如代码、姓名、密码等,其中密码长度在程序中控制,长度不超过 10。结构如表所示。

表1 用户表Tab.1 The user table

部门表(BJ_Depts)用来保存用户所在部门的基本信息,如部门代码、部门名称、上级部门等。

发文管理主要包括发布发文、发文删除两部分。

表2 部门表Tab.2 Department table

表3 发文管理模块实体属性表Tab.3 Document management module entity attribute table

4.2 会议管理模块设计

会议管理主要包括会议修改、会议删除、会议发布3部分。当用户单击会议标题超链接时,进入相关的会议信息详细页面,可对会议的详细信息进行浏览。

表4 会议管理模块实体属性表Tab.4 Conference management module entity attribute table

一般说来,文件包括内部发文和外部收文两类。内部发文流程要经过以下几个步骤:拟稿、核稿、修改、签发、办公室审阅、排版打印和存档;外部收文要经过签收、领导批阅、下发、相关部门阅办等步骤。

5 系统实现

5.1 开发与运行环境

下面是本系统的开发环境。

1)技术平台JSP框架。

2)信息服务器:Internet Information Service5.1版本。

3)开发语言:JSP技术框架,实现语言完全采用JAVA语言。

4)数据库:SQL Server 2005。

5)服务器操作系统:开发过程采用Windows XP Professional操作系统,系统实施后可采用的Windows 2000 Server:或Windows 2003 Server服务器操作系统。

5.2 登录模块的实现

系统登录是用户进入系统给的窗口。用户要进入系统必须输入正确的用户名、密码和验证码,否则会进入登录失败页面。登录模块的流程图如图2所示。

图2 登录模块流程图Fig.2 Login module flow chart

本模块中通过对用户名和密码的参数绑定来验证用户的合法性。本模块及系统的其他模块都采用HQL检索方式。它与SQL语法有些相似,但是HQL是面向对象的,它操作的是持久化类的类名和类的属性,而SQL操作的是表名和字段。Query接口封装了HQL查询语言。在使用HQL检索方式检索数据之前,HQL检索数据的执行步骤如下:

l)通过 Session类的 CreateQuery()方法创建一个 Query对象,CreateQuery()方法的入口参数为String型的SQL语句,在HQL语句中可以包含命名参数.

2)为命名参数赋值 query.setstring(“str User Name”, str User Name);

3)通过调用Query类的list()方法执行数据检索,它的返回值为List型的结果集。

此外用户登录系统还需要输入正确的验证码,来提高系统的安全性。本系统的Images/num文件夹下有文件名为(0-9).gif的10张图片。利用Math类的random()方法可得到一个大于等于0.0小于1.0的随机数,这个随机数用于获得名称与随机数相同的图片。值得注意的是random()方法产生一个个大于等于0.0小于1.0的随机数返回值为double类型,在应用时应对其进行强制转换。

5.3 日常管理模块实现

日常管理模块中主要有会议管理和公告管理两项功能,如果用户的权限是“只读”,则允许用户查看公告和会议记录;如果用户的权限为“系统”,则用户可以对会议和公告进行添加、修改和删除等操作。系统支持增加会议室,界面如下图。

图3 日常事务管理Fig.3 Daily affairs management

在日常管理模块中,主要应用了Hibernate技术从数据库中查找、增加、删除、修改数据,并对查出来的数据进行分页显示。完成上述操作主要应用了Session接口提供了众多的持久化方法,如 save()、update()和 delete()方法。

1)利用Session的save()方法将临时对象转化为持久化对 象 ,session.save (PersistenCeclassesName), 参 数PersistenCeclassesName表示持久化类名称,用于指定将哪个持久化对象保存到数据库中。

2)session的delete()方法用来删除与传入的持久化对象对应的数据库当中的记录,session.delete(Persisten Ceclasse sName);

3)Session的update()方法用来将游离对象重新转变为持久化对象,也就是更新一个已存在的业务实体到数据库中session.save;系统所有的分页查询方法中都用到了Query接口提供的分页方法。

5.4 系统管理模块

系统管理是系统管理员(系统管理权限)的信息维护及管理平台。主要包括:用户管理、部门管理、权限管理、论坛管理、公文管理、文件管理[7]。

1)用户管理:主要实现用户信息管理、新增加员工、员工调动。包括用户信息管理页面person-manage.aspx、新增加员工页面addmember.aspx、员工调动页面即deptchange.aspx。用户信息管理页面personmanage.aspx。主要有Gridview控件和LinkButton控件。员工管理窗口界面如下图。

图4 系统管理界面Fig.4 System management interface

Gridview控件绑定了数据库表emp和dept,设置控件ID=ernpview,AllowPaging=True,AutogEneratecolumns=False,DataKeyNames=empid。

然后再进入Gridview任务中的编辑列,编辑empview。添加6个BoundField字段,3个CommandField字段。6个BoundField字段为:

员 工 ID:DataField=empid,HeaderText= 员 工 ID,Readonly=True;

姓名:DataField=empname,HeaderText=姓名;

性别:DataField=sex,HeaderText=性别;

所在部门:DataField=meetaddr,HeaderText=所在部门;

住址:DataFiel=address,HeaderText=住址;

邮箱:DataFidd=email,HeaderText=邮箱。

3个commandField字段为:

选择: HeaderText=选择,ShowselectButton=True;

删除: HeaderText=删除,showDeleteButton=True。

2)部门管理(deptchange.aspx):主要针对部门信息进行修改、设置部门主管、添加部门。

部门信息表设计中Gridview控件绑定了数据库表dept和emp,后台代码调用了oa.cs文件里的oa.BindGridview函数。

部门主管设置设计的后台代码调用了oa.cs文件里的oa.bind--dropdownlist函数,完成两个下拉框的数据绑定。

添加部门设计的后台代码调用了oa.cs文件里的oa.bind-dropdownlist函数,完成了部门主管下拉框的数据绑定。

权限管理(access--manage.aspx):管理员设置用户权限使得用户可以浏览或禁止查看某些信息[8],并对用户对某项功能的操作有所限制。后台代码调用了oa.cs文件里的oa.bind_dropdownlist函数,完成两个下拉oa.cs文件里的oa.bind_dropdownlist函数,完成两个下拉框的数据绑定。

6 结束语

全面集成高校自动化办公的主要业务工作、信息服务和内务管理工作,提供人性化个性化的服务,更加的直观,可用性、易用性有了相当大的提高。目前,结合数据挖掘的高校自动化办公系统已经基本开发完毕,从测试情况来看,这套系统基本上达到了预期的设计目标。

[1]马费成.信息管理与信息系统研究进展[M].武汉:武汉大学出版社,2010.

[2]邝孔武,王晓敏.数据挖掘开发与管理[M].北京:中国人民大学出版社,2009.

[3]左美云.数据挖掘项目管理[M].清华大学出版社2008.

[4]黄劲荣.关于高校办公自动化系统建设的思考[J].中国科技信息,2010(21):165,173.

HUANG Jin-rong.The research on construction of office automation system in Colleges and universities[J].China Science and Technology Information,2010(21):165,173.

[5]宋莉芳.构建基于数据挖掘理念的校友管理信息化系统[J].网友世界,2012(22):26.

SONG Li-fang.Construction of concept of alumni management information system based on data mining[J].Net World,2012(22):26.

[6]王国宁.高校办公自动化系统的设计与建设[D].河南:山东师范学,2009.

[7]李夏隆,张峰.基于Web的校务管理系统架构集成与实施模式研究[J].榆林学院学报,2012(2):58-61.

LI Xia-long,ZHANG Feng.Study on integration architecture school management system based on Web and implementation of the model[J].Journal of Yulin University,2012(2):58-61.

[8]肖笑.基于BCC算法的多机系统PSS参数优化设计[J].陕西电力,2012(12):51-54.

XIAO Xiao.Optimal design of multi-machine power system stabilizer parameters based on bacterial colony chemotaxis algorithm[J].Shaanxi Electric Power,2012(12):51-54.

猜你喜欢

办公自动化数据挖掘模块
28通道收发处理模块设计
“选修3—3”模块的复习备考
探讨人工智能与数据挖掘发展趋势
浅谈办公自动化系统的设计与应用
基于并行计算的大数据挖掘在电网中的应用
办公自动化系统软件教学探索
办公室自动化、办公自动化与OA
一种基于Hadoop的大数据挖掘云服务及应用
沪苏浙高速公路办公自动化系统设计
高级数据挖掘与应用国际学术会议