基于数据仓库技术的新型决策支持系统研究
2009-04-29温苑花
温苑花
摘要:随着计算机的普及和信息技术的迅速发展,兴起了三项决策支持新技术,即数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)。本文首先分析了传统决策支持系统的不足,然后对基于数据仓库技术的新型决策支持系统进行了探讨。
关键词:数据仓库技术 决策支持系统 优势
随着信息技术的不断发展和应用的不断推广,基于数据库和模型库的传统决策支持系统的缺陷日益表现出来,这主要体现在数据信息收集和整理、辅助决策的方法及系统的灵活性与适应性等方面。基于数据仓库、联机分析处理和数据挖掘的新决策支持系统弥补了传统决策支持系统的不足,数据仓库为决策分析提供充分可靠的数据基础,联机分析和数据挖掘则从数据仓库中分析和挖掘出有用信息,为企业提供决策支持。
一、传统的决策支持系统
传统决策支持系统就是利用数据库、人机交互进行多模型的有机组合,辅助决策者实现科学决策的综合集成系统。它是在管理信息系统和运筹学基础上发展起来的。它以模型技术为主体,通过对话方式选择和修改模型,在模型库中将多个模型组合成更大的模型,并存取数据库中的大量数据,形成问题的决策方案,在计算机上运行该方案,能计算出方案的结果,完成对方案的评价,为决策者决断提供有力依据。传统的决策支持系统是在事务处理环境下采用各种定量模型的决策支持系统,通过模型操纵数据。随着决策环境日趋复杂,DSS 在决策支持中的局限性也日趋突出。
二、基于数据仓库技术的新型决策支持系统
九十年代中期,随着数据库技术的发展,兴起了一些新的辅助决策技术:数据仓库、联机分析处理和数据挖掘。数据库是为事务处理服务的,是管理信息系统的基础;而数据仓库是为决策分析服务的,是根据决策主题的需要,将分布在企业网络中不同站点的商业数据集成到一起,对其进行转换和重新组织,使企业的业务操作环境和信息分析环境分离,为决策者提供各种类型的、有效的数据分析。联机分析处理是从多个角度对数据进行分析,能帮助用户从中发现有用信息。数据挖掘则是利用一系列方法,从海量数据中提取隐含在其中的有用信息和知识的过程。它可以帮助企业对数据进行微观、中观乃至宏观的统计、分析、综合和推理,从而利用已有数据预测未来,帮助企业赢得竞争优势。
1、数据仓库
数据仓库不同于传统的数据库,是面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理层的决策过程。这个定义指出了数据仓库的几个基本特征:(1)面向主题。数据仓库中的所有数据都是围绕着某一主题组织展开的,主题就是一些数据集合。(2)集成性。数据仓库数据的来源可分为外部和内部数据,根据决策分析的需要,将分散于各处的源数据进行抽取、筛选、清理、综合等工作,变换成统一的数据结构进入数据仓库。(3)非易失性。从数据的使用方式上看,数据仓库中的数据是不可更新的。
数据仓库的物理结构一般采用星型结构的关系数据库。星型结构由事实表和维表组成,多个维表之间形成多维数据结构。星型结构的数据体现了空间的多维立方体。这种高度集中的数据为各种不同的决策需求提供了广泛的分析基础,数据仓库这种决策支持新技术显示了强劲生命力。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而原有的事务处理数据库在总体数据环境中承担的是日常基础业务的处理任务。数据仓库是数据库技术的一种新的应用,它能使企业的业务操作环境和信息分析环境分离,能够满足联机分析和数据挖掘技术对数据环境的要求。
2、联机分析处理
数据仓库是管理决策分析的基础,若要有效地利用数据仓库的信息资源,须有强大的工具对数据仓库中的信息进行分析决策。联机分析处理(OLAP)就是一个得到广泛应用的数据仓库使用技术。OLAP专门用于支持复杂的决策分析,它可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并且以直观的、容易理解的形式将查询结果提供给各种决策人员,使他们迅速、准确地掌握企业的运营情况,了解市场的需求。OLAP的一个重要特点就是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的两个方面。OLAP技术中比较典型的应用是对多维数据集中的数据的切片和切块、钻取、旋转等分析,它方便用户从多个角度、多个侧面去观察数据仓库中的数据。这样才能深入地了解数据仓库中数据所蕴含的信息,使用户深入地挖掘隐藏在数据背后的商业模式。
3、决策支持系统体系架构
数据仓库为数据挖掘提供了广阔的活动空间,确保数据挖掘中数据来源的广泛性和完整性。而数据挖掘面对的是经过初步加工的数据,使得数据挖掘更专注于知识的发现。OLAP从数据仓库中的集成数据出发,提供面向分析的多维数据模型,并使用多维分析方法从多个角度、多个侧面及多个层次对多维数据进行分析、比较,使用户以更接近自然的方式分析数据。虽然数据仓库、OLAP和数据挖掘技术最初是作为三种独立的信息技术出现的,但是由于三者之间存在着内在的联系性和互补性,把它们结合起来设计出一种新的DSS构架, 就可以更加充分地发挥它们各自的优势,为决策提供更加有效的支持。
数据仓库和数据挖掘组成的新的DSS构架解决了DSS数据库内数据不一致的问题。由于内在的统一性,这种新结构很好地解决了相互间的衔接问题。数据仓库自底层数据库收集大量事务级数据的同时,对数据进行集成、转换和综合,形成面向全局的数据视图,从而为整个系统提供了充分可靠的数据基础;数据挖掘以数据仓库和OLAP中的数据为基础,使用一系列方法进行挖掘、分析,自动发现数据中的潜在知识并以这些知识为基础自动做出预测。这种新的DSS构架真正展示了信息的本质,表明了DSS的设计观念从模型驱动到数据驱动的转变,而且开发难度小。◆
参考文献:
[1] 张志军,夏传良,宋玲. 基于数据仓库的企业管理决策支持系统[J]计算机应用与软件, 2005,(06) .
[2] 范丽霞,张雪兰. 利用数据仓库和数据挖掘实现电信决策支持系统[J]计算机与现代化, 2005,(08) .