APP下载

数据仓库为中心的企业人力资源统计信息系统的设计与实现

2013-08-15乔桂玲

中国新技术新产品 2013年7期
关键词:中间件数据仓库数据挖掘

乔桂玲

(黑河市黑宝山矿业有限责任公司,黑龙江 黑河 161449)

1 概述

在当今社会,人是最为关键的要素,此时人力资源相关的管控活动就成为了单位发展中要面对的一项非常关键的要素。单位开展该项管控活动的意义是结合单位战略意识的规定,分析将来或许会出现的问题对单位的该项管控工作产生的作用,设置单位人力资源发展思想以及活动意义,获取对单位成长有益的工作者,而且设置氛围,以此来确保工作者能够真正的参加到工作之中,切实的体现其能力。为了积极的应对管控活动中面对的不利现象,需要通过数据挖掘工艺对相关的信息开展全方位的探索,分析其中有意义的内容,进而为形成人力资源的综合方案等提供必要的参考信息。而且能够帮助更好的进行员工聘用以及培训等活动,所以,研发一项以数据仓库信息为前提的统计信息体系,对于当前的单位来讲意义非常关键。

2 数据仓库为中心的统计信息系统

数据仓库是一种从数据库技术发展而来但又不同于数据库的数据组织和存储技术,其主要的面对主题。而且是综合化的,会随着时间而改变的,非易失性的数据集合,它用于支持管理层的决策过程。不论是它的形成亦或是运行均是以主题为中心来开展的,其中的信息并非是信息单纯的聚集到一起,它是对于多种信息汇集,挑选然后全面分析而获取的内容的综合。其中存储的信息关键是用来查找等的目的的。由于数据仓库以统计分析技术作为分析数据和提取信息的有效方法,该项技术的关键前提及时统计学内容,所以数据仓库术、以及基于数据仓库的OLAP和数据挖掘形成了新型的统计信息系统框架。

3 关于数据挖掘科技的分析

它是一项融合多种学科知识的体系,比如数据库技术、人工智能、机器学习、统计学、面向对象方法、信息检索、高性能计算等学科。它是通过从很多层次的,有杂音的以及不明确的等特征的具体应用信息里得到的,分析其中隐藏的,之前并不了解的,有着实际意义的信息的一个具体的步骤。提取的知识表示为概念、规则、规律、模式等形式。现在常用的挖掘措施有如下的一些,统计分析方法、神经网络、机器学习、遗传算法、模糊集法、近似推理等。它的成立并不是必须要以数据仓库为基础的,但基于数据仓库的数据挖掘能简化数据挖掘过程的某些步骤,提升信息挖掘的功效特征,而且可以更加合理的符合当前的战略决定的规定。

4 以数据库为主要内容的单位人力资源统计信息体系

4.1 体系构造

该项体系分为两个要素,分别是统计管理和数据挖掘,依据数据流图和处理过程,统计管理包括了8个功能模块,分别是人力资总体规划、人员聘用计划生成、人员使用计划生成、培养和选拔计划生成、薪资计划生成、劳动关系计划生成、综合查询、报告生成,数据挖掘包括了3个功能模块,分别是数据仓库维护、SQL挖掘、自编算法挖掘。

4.2 体系的设计理念

(1)认真结合软件项目规定的研发以及制作等等的步骤,合理的利用有利的要素,研究出适合当前的管控体系的信息内容。(2)集成性与开放性并重。不仅要确保体系之中的所有的要素有效的联系,同时还要确保对外界公开。(3)合理的分析可视化内容,为使用者带来一种非常合理高效的应用体系。(4)使用当今的软件项目的措施,站在体系的多个层次中分析其稳定性。

4.3 关于报告的获取

(1)基础类报告:按年、季度、月等生成员工工资报告、员工考勤报告、员工基本情况汇总报告、人员使用计划、薪资计划、人员聘用计划报告等。(2)统计分析类报告:人员及工资的成本分析及统计报告、人员流失分析报告、人员缺口分析报告、人员需求预测报告、人员供给预测报告等。

4.4 数据结构化及编码规则

(1)离散化:它是为合乎使用的规定,使用少量的离散信息来代替连续的信息,也就是说把连续的内容分成单独的部分,所有的部分中的信息使用一个数来替换。(1)唯一性:即编码应该明确其有单独的指代要素。(3)结构化:结合编码的客体特征,设置有着特殊性质的编码体系,以此来综合化的体现其特征,便于它的的运行。

4.5 关于如何设置数据仓库

(1)定义数据仓库的体系结构。数据仓库体系架构可以分为五个层次:数据建模层、数据获取层、数据存储层、数据访问层、数据与元数据管理层。通过分析上面讲道的体系构造,可以通过数据仓库内容,设置适宜单位活动的智能化的应对措施,现提出集线器结构和集中式结构两种数据仓库的体系结构供企业统计信息系统选择并创建。(2)进行数据仓库容量的规划,定义物理的数据仓库结构,明确信息的放置以及查询的措施等,并选择存储服务器、数据库、OLAP服务器以及其它工具。(3)定义新的数据模型,设计数据仓库的模式和视图。因为它关注的是信息的查询,所以信息是结合决策探索的主要内容来设置的,所有的要素都对应着单独的分析内容。数据的逻辑模型是多维数据模型,能够运用多种存储模式来体现,此时可通过多维分析措施,以多层次化来对信息开展全方位的探索。常见的数据模型有:星形模型、雪花模型、星座模型、雪瀑模型等。(4)数据仓库的中间件设计。这些要素可以把仓库中的所有的内容有效地联系成为一个整体。数据仓库的中间件包括:数据抽取、转换、复制的拷贝中间件;数据库访问的网关中间件;对数据仓库进行监控的中间件。(5)对于初始信息的审定以及分析。因为信息是来自于多个机构的的数据库中的,所有的数据都是有其对应的使用方向的,所以,很多信息在进入库之前的时候,必须认真地处理。为实现异构数据库的数据集成,必须首先通过数据的抽取和转换工具将位于不同操作系统平台、不同数据组织形式的数据按照一定的数据模型集成到数据挖掘库中,其目的就是保证数据仓库中数据的一致性。

结语

和SAS等体系有很大的差距,这个体系不论是在功效的设计层次,亦或是其他的一些方面都更加的繁琐,应该融合实际的业务内容来进行全方位的设计活动,确保其能够非常的合理,而且便于使用者认可。而统计类数据挖掘方法应用的过程中较多地依赖于用户解决问题的能力,一般无法自动的分析涵盖在信息之后的内容。我们都知道,统计学是非常的综合的。它和希望分析模型的使用者间有着很大的间隙,所以,要结合领域的具体特征,研究适合的模型内容。

[1]杜栋.现代统计信息系统理论与实践[M].北京:清华大学出版社,2004.

[2]陈京民,等.数据仓库与数据挖掘技术[M].北京:电子工业出版社,2002.

猜你喜欢

中间件数据仓库数据挖掘
基于数据仓库的住房城乡建设信息系统整合研究
RFID中间件技术及其应用研究
基于VanConnect中间件的设计与开发
基于并行计算的大数据挖掘在电网中的应用
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于数据仓库的数据分析探索与实践
中间件在高速公路领域的应用
基于GPGPU的离散数据挖掘研究