基于数据仓库的矿工健康状况评价模型及实现
2013-10-11汪永宁
汪永宁,董 琦
(淮南职业技术学院, 安徽 淮南232001)
1 引言
目前,我国对煤矿职工的健康及体质十分重视,国内几所大型煤矿集团,以及国民体质监测中心都建立了体质信息管理数据库,并在此基础上开发了管理信息系统。但是,这些系统基本上都是面向各自事务处理的分散数据,分别处理当前各自业务,无法整体的从决策高度来考虑数据的管理,导致信息资源杂乱而无法对原始数据进行全局的分析和科学决策。
目前,国有大型煤矿企业一般每年都要求每个煤矿职工参加体质健康检查,这样年复一年的快速增长的数据库中的数据如果没有科学的分析方法与相关工具,根本不能被有效地、充分地利用。因此,从决策管理者的角度来看,数据处理的重点应该从传统的业务过程延伸到对业务数据的处理分析中来,并从中获取相关的决策支持及统计信息。
随着数据仓库技术的不断发展与应用的深入为上述问题的解决带来了新的技术支持。数据仓库将来自各个数据库的信息进行数据整合,从数据中找知识并运用科学的方法组织、存储数据,从不同的视角对企业经营各方面信息的精确分析、准确判断并供用户进行数据处理与分析,成为高层进行决策支持的新型应用领域。
2 相关技术概述
2.1 数据仓库
数据仓库的概念应当可以从两个方面予以单核,首先,数据仓库用于面向分析型数据处理,支持决策,它与企业现有的操作型数据库不同。其次,数据仓库是对多个不同架构的数据源进行有效集成,集成后并按照主题进行了重新组合,并包含原始数据,而且存放在数据库中的数据不需要更新与修改。
2.2 联机分析处理
联机分析处理(英文简称OLAP)是一项允许用户分析大型数据库从而对其包含信息深入洞察的技术,它是以多维分析为基础,刻画了在管理和决策过程中对数据进行多层面、多角度的分析处理的要求。OLAP能够使相关人员通过信息的多种可能的观察角度进行快速、一致和交互性的存取,以获得对问题的深入理解。
2.3 OLAP、数据仓库在管理信息系统中的应用
为了解决管理信息系统在分析与决策支持上的不足,近年来出现了以数据仓库技术为基础的决策支持系统,该方案包含了三个方面的内容:一是数据仓库技术(DW);二是联机分析处理技术(OLAP);三是数据挖掘技术(DM)。
2.4 模糊综合评价
模糊综合评价是对受多种因素影响的事物作出全面评价的一种十分有效的多因素决策方法,其基本思想就是考虑与被评价事物相关的各个因素,应用模糊变换原理和最大隶属度原则进行综合评价。所以,模糊综合评价又称模糊综合决策或模糊多元决策。
模糊综合评价法的原始数学模型。
建立被评价对象的因素集U;建立评价集V;建立单因素模糊评价Ri,然后由各单因素评价向量得到模糊评价矩阵R;建立权重集A;综合评价。
权重向量A与评价矩阵R的合成就是被评价对象的最终评价结果,即:
3 煤矿职工体质健康分析评价模型
对煤矿职工的体质健康状况进行分析与评价的最终用户是煤矿疗养院所,他们大多并不关心测试的数据本身,而是隐藏在这些细节数据中的有用信息。如:不同时期煤矿职工的体质健康状况的发展变化情况及其评价;不同地区煤矿职工的体质健康状况的差异;不同项目的成绩情况分析;比较煤矿职工的体质在该标准下比以前是进步还是退步了。
通过掌握这样的统计汇总信息,不仅提高工作效率、缩短工作周期,同时能够为各层领导者制定更加科学合理的健身锻炼计划提供依据,为全面提高煤矿职工的身体素质提供决策支持。
3.1 煤矿职工体质健康状况的表示
反映煤矿职工体质健康状况的指标通常为煤矿职工的身体形态、身体机能、身体素质等方面。即体质健康状况=F(身体形态,身体机能,身体素质)。
而身体形态由“身高标准体重”项目反映,身体机能由“肺活量体重指数”项目反映,身体素质通常又由“台阶试验、1 000m跑、800m跑、50m跑、立定跳远、坐位体前屈、仰卧起坐、握力体重指数”等各项中的部分项目予以反映。
由于各项目具有各自不同的权重,为了使各测试项目具有更好的可比性,在原有的煤矿职工各项目测试成绩的基础上,我们可以将煤矿职工的身体健康状况各项指标成绩用百分制数值表示出来,即某项目换算得分=项目测试得分/权重。在这里,各个项目测试得分是依照《国民体质测定标准手册》确定的。
3.2 煤矿职工体质健康状况的模糊评价
在《国民体质测定标准手册》中,各种测试指标的评分标准多为跳跃式的设计,其划分等级的中界值是一条清晰的界限,在此线上下的微小变化,就会被判为两个不同的等级。相反,同一组中尽管上限和下限的差值较大,但仍属于一个等级,这显然不够合理。因此,我们采用模糊数学的方法进行综合评价,会更科学一些。
同时,由于反映煤矿职工身体形态和身体机能的项目,分别有身高标准体重和肺活量体重指数,因此影响煤矿职工体质健康状况的因素个数较少,在此,我们只需采用单层次的模糊综合评价,具体步骤如下。
(1)选择因素集 U = {u1,u2,u3,u4,u5},u1=身高标准体重,u2=肺活量体重指数,u3=台阶试验,u4=50米跑/立定跳远,u5=坐位体前屈/握力体重指数/仰卧起坐。
参照淮南矿业集团的测评项目,我们选择测试的项目包括身高、体重、肺活量、台阶试验、立定跳远、握力六个项目共五项指标,即体质指数、肺活量体重指数、台阶试验、立定跳远和握力。
(2)评价集V={不及格v1,及格v2,良好v3,优秀v4}。
(3)用A、B、C分别表示某因素隶属依次等级的中界值,如以矿工的台阶试验为例,A、B、C 分别是39、45、53。
类似的,肺活量体重指数的A、B、C分别是43、56、69;立定跳远的A、B、C分别是194、226、249;握力的A、B、C分别是40、55、69。
用xi表示ui的测试值,rij表示评价对象ui隶属等级vj的程度,即隶属度,根据专家经验,按下列公式构造隶属函数。
不及格的隶属函数:
及格的隶属函数:
良好的隶属函数:
优秀的隶属函数:
(4)单 因素评价 矩 阵r。r = (ri1,ri2,ri3,ri4)。在此基础上得到评价模糊矩阵:
(5)确定指标权重A。根据专家所制定的标准可知,A = (0.15,0.15,0.2,0.3,0.2)。
(6)综合评价结果。B=A·R。
4 课题的总体设计
4.1 数据仓库工具的选择
经过综合考察各大厂商提供的数据仓库解决方案,本课题确定选用Microsoft的数据仓库产品及其相关技术作为本系统开发的平台和工具。
作者设计的“煤矿职工体质健康状况分析评价系统”是一个B/S(Browse/Server)结构模式的客户端查询分析评价系统,主要功能是向各级体育运动管理者提供数据,按其要求对数据进行组织和分析,帮助各级管理者了解和把握煤矿职工体质健康的状况。
这种结构,能够在充分利用数据仓库系统及其相应的决策工具的基础上,发现准确而广泛的决策信息,并在此基础上做出正确的预测或决策。
4.2 查询和分析工具的选择
经过数据处理的多维数据集,可在其上运用多种查询和分析报告工具,进行复杂的OLAP操作,得出相应的分析统计结果。在此使用Excel2003中提供的OLAP数据透视表视图功能。
5 系统实现
5.1 数据源分析
煤矿职工体质健康测试关系数据库kgjk中包括以下表。
项目表。#项目编号,项目名,权重,及格标准,优秀标准,项目性质(反映的是身体形态、身体机能还是身体素质),类型(是可选项还是必选项),最好成绩,备注。
煤矿职工表。#煤矿职工号,煤矿职工姓名,性别编号,工种编号,(所在)部门编号,工作时间,煤矿职工密码,备注。
成绩表。#煤矿职工号,#项目编号,#测试时间,测试成绩,项目得分,评价等级,换算得分,备注。
工种表。#工种编号,工种名称。
地区表。#地区编号,地区名。
5.2 数据转移的具体实施
在正式开始执行数据转换之前,首先为kgjk的数据仓库新建一个数据库kgjk_dw,然后利用SQLServer2000提供的数据转换服务将相关数据转入事实表或维度表。
当所需的数据表全部建立之后,通过设置事实表和维表的主键、外键,在事实表和各个维表之间建立关联,就最终实现了数据仓库。
5.3 数据的分析
微软将Excel当作一个OLAP的前端分析工具,由于Excel2003具有强大的分析功能,而且无需编程,所以一般非数据库专业的用户可以很容易上手查询所想要的数据。在本课题中,我们采用的是将数据透视表放置在一个网页之中,然后以交互的方式来浏览的形式,从而实现数据分析结果的呈现。
本文在煤矿职工体质健康的信息管理中引入了数据仓库、联机分析处理技术和模糊评价方法。通过对有关技术和方法的研究,设计并初步实现了一个具有辅助决策功能的煤矿职工体质健康状况分析与评价系统。
在该系统的设计过程中,运用了数据仓库的数据转移技术和多维建模技术,构建了一个以体质测试成绩分析为主题的数据仓库,运用OLAP技术实现了对数据的多维分析。
此外,通过对煤矿职工体质健康状况的评价中模糊综合评价方法的研究,系统给出了一个模糊综合评价的模型,对原有简单的总分评价方法进行了改进。
[1]董琦,汪永宁.对煤矿职工的体质健康状况的实证研究[J].淮南职业技术学院学报,2009,(4):122-124.
[2]贺仲雄.模糊数学及其应用[M].天津:天津科技出版社,1989.
[3]盛大栓.多维联机分析Simplified Analysis系统的设计与实现[D].上海:海事大学,2006.
[4]沈兆阳.SQLServer2000OLAP解决方案——数据仓库与AnalysisServices[M].北京:清华大学出版社,2001.
[5]国家体育总局群体司.2000年国民体质监测报告[M].北京:北京体育大学出版社,2002.
[6]国家体育总局.国民体质测定标准手册(成年人部分)[M].北京:人民体育出版社,2003.