数据挖掘技术在高校设备档案管理中的应用
2012-01-21刘璐璐
刘璐璐
(中州大学国资处,郑州450044)
近年来,随着我校北校区的大力建设和硬件设施的不断完善及师生人数的不断增加,固定资产和低值易耗品的购入数量与使用频率随之增多,设备档案资料的种类也在不断增多,例如:固定资产种类和数目的不断增长和调整,使得资产账目信息需要大量录入与输出,后期相关数据的保存难度和工作量都会随之加大。要想进一步提高档案管理的工作效率,就得从原有的纯手工档案资料管理方式上有所突破,这就要求设备的管理模式不能局限于手工管理模式,要与现代化网络数据库管理模式相结合。
与传统的档案管理方式不同,高校设备档案具有使用范围广、次数多、使用者要求高的特点。随着近些年学校设备的不断引进及设备资料的不断增多,包括收集、整理、归纳等。传统档案管理是手工管理模式,管理方式已经无法满足现行工作需求,我们目前需要一个确实可行的技术方法——数据挖掘技术。
一、数据挖掘的具体方法
数据挖掘技术从定义上讲就是从大量的不完整的模糊的数据中提取信息的一种方法。基本的方法有:①关联分析法。它是从统计学的角度出发,指在从给定的数据集或者数据库中发现频繁出现的那部分项或者集合,从而分析这部分数据集合的特征和性质。例如,某电子市场通过关联分析,找出了若干个用户在购买所需电子产品时,所需或者偏好购买的品牌电子产品,进而反映出这部分用户的购买习惯。②序列模式分析法。它比关联分析法能更进一步解释数据集合的特征。它是指在一组有序的集合中,频繁出现的那部分集合按一定顺序重新组合构成的模式。例如:计算超市购物中被共同购买的商品,它把每个顾客的一次交易视作一个Transaction,计算在不同Transaction中不同Item组合的规律性。而如果我们考虑一个用户多次在超市购物的情况,那么这些不同时间点的交易记录就构成了一个购买序列,N个用户的购买序列就组成一个规模为N的序列数据集。③分类分析法。将有关数据信息通过一定方式进行分类的方法。例如:学校可以根据学生的学习基础、掌握知识情况和分数情况,对其进行层次分划。④聚类分析法。从表面意义上讲就是从分析过的数据信息中再次进行细致的加工分析方法。在学校里,可以通过学生的基础信息数据将所有学生信息分组,并对所有学生的学习模式进行描述,找出他们的特征,进而帮助教师制定有计划和针对性的授课方案。⑤孤立点分析法。孤立点是所有数据信息中出现故障或排斥的信息点或信息段。孤立点分析法广泛应用于银行、金融业、电信部门和企业的经营管理等。例如:银行可以利用孤立点分析发现银行卡信息诈骗、银行卡或信用卡丢失等。
当今的高校设备档案管理模式既是对设备档案的管理,也是对其数据信息的数字化统计过程。它不仅从表面上实现了档案的静态模式管理,更实现了其数字信息不断更新的动态管理,从而对档案管理员的效率也是个提高。设备档案管理系统模式的建立使档案的录入和查阅工作变得更加方便和快捷。以传统手工整理模式进而转变为高、准、快的数字化录入模式,使资产管理人员及时了解学校设备的信息,真正实现了录入、编辑、修改等功能,达到了方便高效的管理目标。
二、数据挖掘技术在设备档案管理中的应用
(一)方法应用
1.设备档案的分类
设备档案分类是将单位所有固定资产和低值易耗品所建立的档案分成不同的种类,从横向来说每一类里的档案具有相似的属性,从纵向来说不同类别里的档案的属性是不同的。数据挖掘可以帮助从事设备档案管理的人员细致而准确地将所属档案进行分类。例如:数据挖掘可将档案按照属性类别进行排序,从而提高档案管理员的检索效率。
2.设备档案的收集工作
首先对各设备数据的基本信息进行分析,建立一个已知的数据集模型,对每一个要测试的样本,用已知的与预测的类别进行比较,若一个模型的准确率经测试被认可,则就可以用这个模型对未知对象进行具体的分类。例如,设备档案管理员对全校在编教师笔记本的领用情况进行书面统计,并将统计结果录入数据库中。这些信息包括姓名、年龄、性别、职称、职务、学历层次、所属学院(部门)、领用时间、笔记本型号等。当一个教师的信息被输入到数据库中时,该教师与其他新进教师的档案属性相匹配后,其他所有新进教职工的信息属性随之自然分类。
3.设备档案的保管工作
设备档案的保管核心工作,是保管好新设备档案的同时防止旧设备档案流失的过程。对学校这样一个特殊群体,其设备档案在保管过程中,除了正常的手工保管纸质文件要在通风干燥的环境下保存,还要在档案数据库中建立一个完整的备份系统,在这个系统里要建立好相关的网络保护措施,防止外界的病毒侵入,造成整个设备档案软件系统瘫痪。
4.协助配合资产使用部门搞好服务工作
设备档案信息是为档案利用人员服务的,不同单位不同部门的利用人员对档案的需求和利用程度不同,数据挖掘技术针对不同人员对设备档案的不同需求,设定不同的属性值和分类情况,为他们提供最优的检索结果,为国有资产管理部门的主动服务提供可靠保证。例如:两个不同的部门查找同一设备的不同检索信息,分别输入设备的两个不同属性,结果显示出的结果是两个部门所需的不同检索结果。
(二)如何在设备档案管理中实现数据挖掘技术
数据挖掘技术的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。
1.数据的抽取
数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面的处理。在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数据源的变化,使系统更便于管理和维护。
2.数据的存储和管理
数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据的表现形式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而快速累积。在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将普通关系数据库改造成适合担当数据仓库的服务器。
3.数据的展现
数据展现主要有以下方式:
⑴查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;
⑵报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;
⑶可视化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化等技术表现复杂数据及其相互关系;
⑷统计:进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;
⑸挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式信息。
三、结束语
通过数据挖掘技术在资产档案中的应用,大大提高了我校国有资产管理员的档案管理效率,对于档案利用者来说也更加及时与方便,通过使用这项技术,我校设备档案的管理也显得更加规范和有秩序。总之,数据挖掘技术在我校国有资产档案管理中起着至关重要的作用。
[1]万睿,祁风义.浅谈高校仪器设备档案现代化管理[J].2007(2):154-155.
[2]刘瑾.高校设备档案的计算机化管理[J].档案管理,2002(1):28-29.
[3]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小锋,等译.北京:机械工业出版社,2001.