数据仓库技术与信息加工理论镜像关联分析
2018-12-04王伟宁丽
王伟 宁丽
摘 要 数据仓库技术的内涵即企业根据决策需求对外部数据进行处理,对获取数据作体系结构化集成、装载处理,以支持企业决策分析。信息加工理论将人类学习过程比拟为计算机对信息的加工过程,学习内容(信息)进入学习者大脑,经大脑联结、加工而实现知识的学习。就两者在对象处理逻辑形式上表现出的镜像逻辑关联作相关论述。
关键词 数据仓库技术;信息加工理论;镜像逻辑关联性
中图分类号:G712 文献标识码:B
文章编号:1671-489X(2018)10-0032-03
1 前言
数据仓库(Data Warehouse,DW)技术对数据的处理过程,即在一定的体系结构与物理环境下,通过数据集成、组织、架构和更新,实现对异构数据源的数据处理,并装载入数据库,供决策者作决策使用[1]。美国教育心理学家罗伯特·加涅(R.M.Gagne)认为,学习者大脑内存在感受器、发生器以及反应器等用于信息加工的结构和系统,在期望和执行控制对信息流程的激活和调节下,这些大脑结构和系统对源自外界的各种信息(刺激)进行注意、登记、记忆和反应,最终实现信息的联结、加工与反馈,学习就此产生。
宏观层面,结合信息与数据间关系的概念,即信息是数据的内涵,数据是信息的载体,故二者逻辑镜像关联从处理对象的一致性上得到体现。微观层面,以下将从数据仓库技术与信息加工理论的定义和概念、实际对象(数据或信息)处理过程以及现实意义三个方面,论述其镜像逻辑关联性。
2 数据仓库技术与信息加工理论定义和概念的镜像关联性
著名数据库专家W.H.Inmon在Building the Data Ware-house一书中提出的概念比较具有代表性:数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合,用以支持获取企业管理决策[2]。按照该概念,可将数据仓库技术的特性描述为以下几个方面。
面向主题性 面向主题性,即数据仓库存储面向管理应用与综合分析的集成化和综合性信息。换言之,数据仓库中的数据是以面向主题的方式进行组织的[3]。主题是一个抽象概念,用于表示某一宏观分析领域所涉及的对象,以及与对象有关数据的集合。不同类型的企业或机构有不同的主题集合。
集成性 集成性是数据仓库最为重要的特性,即基于传统的面向业务的数据库或外界数据库作为数据源,经过提炼、加工、汇总和归一化整理,生成符合数据库应用语义规范要求的数据集合[3]。完成上述四项任务后,即按照目标数据模型要求对数据进行转换,并清除错误或无效数据后,将其装載到目标数据体系中。
随时间变化特性 从历史的角度描述系统结构和状态的变化,要求采用能够反应时间维度的数据[3],即数据仓库技术要求数据库在运行过程中必须不断捕捉操作型环境中产生的新数据,并将其归纳整理后追加到其中,保证决策支持系统(Decision Support System,DSS)能够支持多种复杂的数据应用和综合性管理的决策分析。
20世纪70年代,心理学家加涅建立的信息加工理论揭示了课堂教学的一般规律,并把人脑设想为由不同功能的构造体组成,把学习的过程比拟为信息的加工过程。信息加工理论提出的目的在于优化学习效果,提高学习绩效,加工过程即对信息(学习内容)的处理,故该理论存在学习过程的一般特性。
学习内容目的性 传统学习四要素包括学习者、教师、学习内容和学习环境。首先,学习内容是学习过程产生的基础,是联系学习者与教师的中介;其次,最佳的学习内容是目的性与对象性的统一,学习内容内在地包含学习目标,学习目标是学习内容的出发点和归宿,贯穿整个学习过程始末。由此可看出,信息加工理论在采集和输入外界环境信息时,主题性体现在对信息进行有意注意或选择性知觉的筛选,到实现输入信息的处理和感觉登录。这与上述数据仓库技术对采集的数据要求具有面向主题性是镜像一致的。
学习过程渐进性 信息加工理论认为,对于输入学习者大脑内部的信息(刺激),除了具有上述满足学习者学习水平和学习需要的目的性外,经感受器进行感觉登记后的信息,再将选择性知觉转换成可辨别的形式并输入短时记忆;后经语义编码转化成有意义的模式,形成可长期保存的长时记忆,学习过程完成。其中所涉及信息知觉、转化、编码和形成有意义信息联结(知识),与前者集成性(数据提炼、汇总和集成)突显出镜像一致性。
学习定义三要素 根据学习心理学,对教育情境中的学习进行定义:学习是指学习者在教育目标指引下,通过与其环境相互作用,所产生的比较持久的性能或倾向的变化[4]。归纳起来,学习的产生具备三个要点:主体产生变
化;变化保持相对持久;主体变化是由他与环境相互作用产生的。信息加工理论对学习过程进行阐述的最终目的是促进学习有效发生,因此,该理论中信息的加工处理过程同样涉及与数据仓库技术类似的时间特性,两者在数据(信息)的时间特性上表现出镜像一致性。
3 数据仓库技术与信息加工理论在对象处理过程上的镜像关联
数据仓库体系结构 决策支持系统的不断发展和演变促进了数据仓库技术的产生。对于数据仓库技术的数据处理过程,可以依据其数据体系结构作相应阐述。该体系结构所包含的功能可分为数据处理、数据管理、数据提取与数据应用四个层次(如图1所示[2])。数据仓库技术将其体系结构从下到上划分为四个层次。
1)数据源,即在操作型系统,如企业资源计划(Enter-
prise Resource Plan,ERP)系统等的支持下,对外部数据、文档资料和业务需要或产生的数据等进行获取和采集,生成操作型数据存储。
2)数据存储管理,即将操作型系统(如ERP)采集的数据正式向数据仓库装载。在此过程中,涉及数据的抽取、转换、集成和清理等数据处理流程,也是整个数据仓库系统的核心。即在操作型系统的基础上,对数据进行抽取、清理,并有效集成,按照主题进行重新组织,加工存储DW元数据(包括数据字典、记录系统定义以及数据转换规则等信息),并最终确定DW的物理存储结构[5]。
3)数据提取:企业按照数据的覆盖范围,将加工处理后的数据分类提取,装载到企业级DW和部门级DW(通常称为“数据集市”),以支持用户多角度、多层次分析,确定数据的趋势。
4)数据服务与应用:将数据仓库中的数据在前端工具(如OLAP服务器)、数据挖掘工具等配合下,实现数据面向主题、集成性使用,发挥DW在DSS中的决策支持作用。
此外,DW体系结构中的元数据是其重要数据,是关于数据的数据,与信息加工理论中的“元方法”具有相似性。管理工具集中涵盖了数据仓库技术对于数据监控与管理的各类工具,如监视器,用于翻译和检测数据源的变化,与信息加工理论中的“执行控制”与“期望事项”具有一致性。
加涅的信息加工理论模型 信息加工理论是随着信息论和现代通信技术特别是计算机技术的发展而发展起来的,着重运用认知心理学的理论观点特别是信息加工模式来解释人类学习活动。该理论模型如图2所示[6]。
信息加工理论把学习者大脑设想为由不同功能的构造体组成,把学习过程比拟为信息的加工过程:外界环境中的信息经由感受器注意并选择后,在一个感受记录器内短暂停留,并由选择性知觉转换为可辨认的形式输入短时记忆;随后转换成有意义的模式,才能进入长时记忆;长时记忆将信息重新提取到短时记忆,并和其他信息联结形成新知识,最终通过学习者肌肉等反应器表现出来[6]。图中“执行控制”和“期望事项”两个部分起着激活和调节学习中信息流程的作用。并将学习行动分解成八个阶段:动机阶段(期望)、领会阶段(注意)、习得阶段(编码)、保持阶段(记忆)、回忆阶段(提取)、概括阶段(迁移)、作业阶段(反应)、反馈阶段(强化)。括号内的内容为与阶段相对应的内部心理加工过程[6]。如图3所示,本文将上述八个阶段概括为学习过程四个层次。
1)学习准备层。学习动机即学习动力,为了促进学习,必须设法诱导学习者的学习动机,培养学习兴趣。此外,根据学习心理学原理,该层上给予学习者足够丰富的刺激(输入信息)同样重要,丰富刺激环境可为学习者提供更多学习准备信息,赋予学习者更丰富的学习期望,促进学习的发生。这与数据仓库中数据源获取阶段具有一致性。
2)学习发生层。在学习动机和期望的促使下,学习者将面向学习目标、具有主题性架构的学习内容提供的信息进行注意、选择性知觉、编码和形成稳定性系统架构。结合上述提及概念,即涵盖了领会、习得和保持三个阶段,体现出信息加工与数据仓库技术中数据处理阶段对数据转换和集成有镜像相似性。
3)学习总结层。长久保持的信息在一段时间后也会消退,因此,对信息不断总结和反复是知识学习的基础性、反复性环节。任何优秀的学习者都需要对所学知识反复练习。信息的不断总结过程类似于数据仓库技术的数据提取,是信息在学习者大脑内反复重现和在实践中进行信息反复运用并促进知识迁移。
4)学习反馈层。反馈原理是系统科学基本原理之一,如图3所示,贯穿所有层次。任何系统都需要通过信息反馈,才能实现对系统的有效控制,从而达到整个系统想要实现的功能和目的。通过信息反馈,教师才能把控教学效果,进而对学习进一步强化和提升。数据仓库技术前端服务器对于数据库内数据的完整性、更新情况和传输效率等也具有逆向指引功能,即同样存在反馈机制。
自此可以看出,数据仓库技术原理中四个层次间存在的从数据源到数据抽取、转换、集成、清理、装载、提取与运用的关系。信息加工原理层次涉及信息的选择性知觉、编码和记忆,再到反馈与运用;系统层次既相互独立又相互渗透,前者的输出作为后者的输入,后者的输入充当前者的输出,反馈与交换贯穿各个层次的系统间。两者在对象处理过程逻辑上表现出镜像一致性。
4 数据仓库技术与信息加工理论在现实意义上的镜像关联分析
综合上述对数据仓库技术特性、数据处理过程的阐述和对信息加工理论的概述,不难看出,两者都是为了使数据或信息能更好地满足实际对数据的需求,对其进行架构性和模式化处理、加工,实现原本错综复杂的数据源和信息源形成结构化、有意义的数据库和系统认知,使企业或主体能更加便捷有效地运用数据和信息。这便是数据仓库技术和信息加工理论在面对现实需要时表现出的实际意义镜像逻辑关联性。
5 结语
计算机技术的出现和发展是人类认知发展过程的必然阶段,计算机理论的发展离不开人类认知基本理论的支撑,同样,计算机技术的发展同樣推动社会学、心理学等基础学科的发展。本文通过对数据仓库技术和信息加工理论基本概念和特性、实现过程模型和实际意义三方面的论述,阐述两者在各个层面上表现出的镜像一致性。笔者在论述中使用的“镜像”一词是一种尝试性定义,不妥之处还请同行多多批评,予以改善。
参考文献
[1]Inmo W H.数据仓库[M].北京:机械工业出版社,2003:
25-28.
[2]何玉洁,刘乃嘉.数据库技术[M].北京:高等教育出版社,2017:271-275.
[3]李敏强,潘振江,等.基于数据仓库技术的决策支持系统的研究与应用[J].系统工程理论与实践,1998(3):14-19.
[4]皮连生.教育心理学[M].上海:上海教育出版社,
2011:31-32.
[5]张宁,李强娇.基于ERP的企业数据仓库设计[J].计算机工程与设计,2005(2):351-353,374.
[6]何克抗,李文光.教育技术学[M].北京:北京师范大学出版社,2009:105-107.