基于OLAP的炼钢生产物流数据分析
2016-02-08耿占佳王南付玉霞吴慧张静耿占雄
耿占佳王 南付玉霞吴 慧张 静耿占雄
(1-5石家庄信息工程职业学院 河北 石家庄 050035)
(6石家庄市栾城区人民检察院 河北 石家庄 050000)
基于OLAP的炼钢生产物流数据分析
耿占佳1王 南2付玉霞3吴 慧4张 静5耿占雄6
(1-5石家庄信息工程职业学院 河北 石家庄 050035)
(6石家庄市栾城区人民检察院 河北 石家庄 050000)
钢厂在炼钢生产过程会产生庞大的物流数据,如何有效的进行数据分析,以帮助决策者提高决策力成为亟待解决的问题。本文在数据仓库技术(DW)和数据挖掘技术(DM)的基础上,基于联机分析处理技术(OLAP)创建炼钢生产物流信息数据仓库、物流信息多维数据集,进行数据挖掘,最终实现科学分析数据,帮助管理者进行决策。
数据仓库;联机分析处理;物流数据;数据挖掘
1.数据仓库、数据挖掘与OLAP概述
1.1 数据仓库中的数据的构建是多维视图架构,目的是用于决策支持。数据仓库技术具有以下三方面的主要功能。一数据仓库具有对物流信息历史数据进行查询的功能,并能够以企业级的标准报表和视图形式为用户提供前端显示。二数据仓库用来构建多维视图数据集,并在此基础上进行多维分析。三数据挖掘的实现以数据仓库的成功建立为基础。
1.2 数据挖掘(Data Mining),就是从已经存放在数据仓库或其他数据载体的大量的数据中抽取并得到准确的、隐晦的、有意义的、直观的数据信息描述的过程。
典型的数据挖掘系统的结构如图1所示。
图1 数据挖掘系统结构Fig. 1 The structure of Data Mining
1.3 OLAP是用来针对特定分析目的(主题)设计多维数据集,并对多维数据集进行选择、分类、查询、修改等操作。而当前各类数据库系统的实际应用的情况说明,单一的关系型数据库系统(OLTP数据库)不能满足企业用户对数据库查询的深层次要求,单靠SQL语句对数据库进行简单查询也不能满足企业分析人员的多角度分析要求。在这一背景下多维数据集和多维分析的概念被提上了发展的前台。
OLAP通过多维方式对企业生产过程实时和历史数据进行分析、查询和前端显示。OLAP的特点或者说优势,便是仿照数据库查询用户的多角度思考模式,预先为用户建立多维的数据库模型,使其便可以方便快速地从各个分析角度获取生产过程数据,具有极大的分析灵活性。
2.炼钢生产物流数据仓库的构建
2.1 炼钢生产物流信息系统总体设计方案
一以某钢厂炼钢生产过程中的物流信息现状进行分析,发现主要需求集中在天车调度管理与成本控制两方面;二以数据仓库技术为基础,采用OLAP技术实现数据分析,炼钢物流信息系统架构主要分为四层,联机分析层、DW层、用户接口层、OLTP层。其中联机分析层的实现平台为SQL数据库系统中的Analysis Manager功能模块,关系数据库层以源历史数据库作为数据源;三炼钢生产物流信息系统设计的目的是为了进行成本分析。成本分析的主题可分为3个子主题:原料主题、作业点主题、应商主题。四通过对炼钢物流数据进行分析研究,发现影响原料成本的主要因素是原料的消耗情况。原料消耗情况又受时间、作业点、供应商等多方因素影响。根据钢厂现状,本文设计以下维度:日期维的粒度、原料消耗信息维的粒度、供应商维的粒度。五建立物理数据库。在SQL Server 2000数据库系统的Enterprise Manager(企业管理器)模块中,分别建立关系数据库、维度表与事实表。
2.2 物流信息数据仓库的ETL实现
ETL(Extraction Transformation and Loading),指的是对异构目的数据源中数据的抽取、转换和装载。其过程是由前端ETL工具把源数据从分散无序的各种数据源中提取出来,在进行了有效性检验和数据格式统一化转换后根据多维数据集的设计模式对这些处理过的基本数据进行OLAP聚合操作,最终导入至物流信息数据仓库中。最终决策的分析与制定者可通过前端查询工具分析数据仓库内容,进而为企业制定合理的成本控制计划与安全生产方案。
2.3 炼钢生产物流信息数据仓库的构建
(1)数据仓库的建立以本机上的Windows Server 2003 Enterprise Editioin Servise Pack 2操作系统与Microsoft SQL Server 2000 Servise Pack 4企业版数据库系统为平台,联机分析(OLAP)服务器的建立与功能实现的平台为SQL数据库系统的Analysis Manager模块中的Analysis Services服务。
(2)在已经构建的数据仓库的“多维数据集”节点,新建多维数据集,将“原料消耗成本”作为事实数据表,将“日期编号”、“原料编号”、“原料消耗点编号”作为多维数据集度量值,将维度设置为日期、原料消耗信息、原料信息、供应商信息,组织结构设置为星型模型,每一维度又下设不同的成员属性。如时间维下设有日期编号、日期、年、月、日、周6个成员属性等。
(3)元数据为分析人员对已构建的多维数据集提供了一个完整、全面、直观的审视工具,整个多维数据集的所有关系、维度、数据源信息一目了然。作为数据仓库的核心功能之一,元数据中的信息不仅描述了数据仓库中数据分析主题的维度划分形式,各个分析主题的属性度量值在数据仓库中的具体存储位置也有描述,与数据仓库分析主题有关的其它内容也有说明。从这个方面来说,一个准确实用的数据仓库都建立在一个准确、清晰的元数据基础上。本文构建好物流信息数据仓库后的元数据显示如图2所示。
图2 物流信息数据仓库元数据Fig.2 The metadata in logistic data warehouse
3.结束语
本文从某钢厂的现状出发,通过创建物流信息数据仓库与多维数据集,应用OLAP技术举例说明了数据挖掘分析的应用,最终为管理者提供主题明确、挖掘适度、高效准确的分析结果,帮助决策者更好的管理企业。
[1] 丁琳琳,信俊昌,王国仁,黄山.基于Map-Reduce的海量数据高效Skyline查询处理[J]. 计算机学报. 2011(10).
[2]王斌,徐照兴.数据挖掘技术研究.电脑知识与技术,2009,27:6-9.
[3] 王烁生.炼钢生产过程物流调度与优化项目研究. 河北科技大学硕士论文,2010,3:25-45.
[4] A.A.VAISMAN,M.M.ESPIL,M.PARADELA.P2P OLAP: Data model, implementation and case study Information Systems,2009,04:231-257.
Data analysis of steel making production logistics based on OLAP
GENG Zhan-jia, WANG Nan, FU Yu-xia, WU Hui, ZHANG Jing. (Shijiazhuang Information Engineering Vocational College, Hebei Province, Shijiazhuang 050035, China;) GENG Zhan-xiong.(The People's Procuratorate of Luancheng District, Shijiazhuang City, Hebei Province, Shijiazhuang 50000 China)
Steel in steel-making process will produce a large logistics data, how to effectively analyze data, to help decision makers to improve decisions become the problems to be solved. In this paper, the technology of data warehouse (DW) and data mining (DM) technology based on, on-line analytical processing (OLAP) create steelmaking production logistics information data warehouse and logistics information data cubes, data mining based on, and ultimately scientific analysis of the data, help managers to make decisions.
Data warehouse; On-line analytical processing; Logistics data; Data mining
TF345
A
1009-5624-(2016)02-0029-02