计算机数据库技术在数据管理中的应用
2020-06-11徐鹏军
文/徐鹏军
(中国民用航空温州空中交通管理站 浙江省温州市 325100)
我国关于计算机数据管理的建设起始于20 世纪70年代末期的信息化建设,在当时,计算机属于“高端”产品,无法正式开展普及,只能被运用为高校教育、科研等重点领域中,因此,当时的数据管理十分缺乏对“数据”的大体意识,如缺乏系统性、应用层次低、缺乏统一标准等等,都是当时数据管理建设面临的主要困难。随着科技水平的提高以及数据捕捉范围的扩大,数据库技术开始主动扩充、储存、管理大量的且繁复的数据信息,此时,计算机数据库技术主要针对数据访问、分析处理等服务方面。
1 计算机数据库技术的相关研究及理论
1.1 数据模型是计算机数据库技术的基础
数据模型是对数据特征的抽象,也可以被视为是数据操纵或结构对现实世界的一种抽象。计算机数据库技术是信息系统的核心,而数据模型恰恰是构成数据库系统的基础,它决定了数据库系统的结构、语言、设计以及方法等等。最早的数据模型起始于20 世纪60年代,起初,数据模型只是一种层次模型,而真正意义上的概念层抽象模型则是E-R 模型。迄今为止,数据库技术总共有着三大类数据模型:于20 世纪60年代的层次数据模型,它的代表结构是树结构,如IMS 模型,但很多时候,数据之间的关系并不是简单地概括为树型结构的,而网状数据模型与层次模型存在一样的缺点,因此,它们都被20 世纪70年代所出现的E-R 模型所取代,E-R 模型是典型的实体联系模型,如图1 所示。
如图1 所示,E-R 模型的构成成分是实体集、属性和联系集,实体集用矩形框表示,实体的属性用椭圆框表示,实体间的联系用菱形框表示。关系模型是数据模型研究的主流,也被常常运用于信息系统设计中,它能够在概念结构设计阶段为数据管理者提供有效的信息需求描述或储存相应的信息类型。
1.2 数据库数学理论是计算机数据库技术的工具
数据库是一门技术科学,而数学是数据库在研究、应用过程所需要的工具。在当前大部分数据库技术中,所需要运用到的数学一般是指离散数学与算法理论。
顾名思义,离散数学是以离散的对象作为主要研究目标,而数据库所研究的数据也是离散的,因此,离散数学是数据库进行数据研究时作为切合的数学工具。这是为什么在数据库中,往往会出现数字的集合(关系、函数)、树状图(图论)、代数系统(群、环、域、格等形式)以及相应的数理逻辑。
相对于离散数学,算法理论更为直观,它是一门研究算法的理论,能够帮助数据库解决各类算法问题,尤其是算法设计与分析、算法复杂性理论以及可计算性理论等方面,因此,算法理论也是数据库技术在应用过程中不可缺少的一种工具。
1.3 关系数据库理论是计算机数据库技术的归纳
图1:E-R 模型结构
关系数据库理论是Codd 开创的、截止到目前应用最为广泛的一种数据库理论,在关系数据库理论中,关系代数、关系演算、函数依赖、键、范式、模式分解、规范化、多值依赖、连续依赖、广义依赖、泛关系、无回路数据库等内容是当时年代主要研究的内容及方向。随着时代的发展与知识的普及,在20 世纪70年代、80年代及90年代的发展中,关系数据库理论从研究到发展,最终在21 世纪初,关系数据库理论冲破了原有的构架,它将偶尔、局限的类型与思想发展、完善成了相应的理论与体系。相对应的,以往特殊的、特异的关系数据库变为了“正常”研究的范围内,这促使关系数据库理论在不断完善的过程中也间接促使了关系数据库涉及范围的扩大,尤其是体系、算法等内容的丰富。也就是说,现代计算机数据库的计算内容、容纳程度与涉及领域早已经是早期数据库的几十倍。例如,偏序关系数据库、时态关系数据库等以往被视为特异的关系数据库,在现代,它们都已经形成了相应的系统理论与体系,这些被称为非经典关系数据库理论。
2 计算机数据库技术的发展与现状
2.1 计算机数据库技术的发展
计算机数据库技术的发展可以被视为是计算机与信息技术的发展,从现代社会来看,信息时代代表着信息已经与知识划上相应的等号,因此,如何组织、管理与应用这些数据,成为衡量计算机数据库技术发展与否的重要标志。在计算机诞生的早期,信息管理或数据管理仍然是一个笼统、宽泛的概念,而数据库的诞生与完善,更是给计算机数据管理带来极大的改变,越来越多的软件将数据库管理系统或数据库技术作为基础,如管理信息系统(MIS)、办公自动化系统(OA)、决策支持系统等。简单来说,数据库技术作为数据管理与运用的有效工具,它为我国任何行业提供了极佳的信息服务体验,同时,由于数据库技术的支撑,计算机应用也被渗透到各个行业,虽然我们不能简单地将数据库技术等同于行业信息化建设的直接动因,但数据库技术仍然未计算机应用与渗透起到了极大的促进作用。
2.2 计算机数据库技术的现状
时至今日,计算机数据库技术大部分仍然是基于关系数据库理论所开发出来的新技术,如NoSQL数据库,NoSQL意为“No SQL(没有SQL)”。如图2 所示。
如图2 所示,NoSQL 数据库可以被视为一种非关系型的、广泛的,它由Carlo Strozzi(1998年)率先提出,在Carlo Strozzi 给出的官方定义中,NoSQL 数据库是一种具有SQL 功能的、轻量级且开源的关系型数据库,然而,随着时代的发展与科技的进步,NoSQL 数据库逐渐偏移了Carlo Strozzi 的初衷,Carlo Strozzi 进而将NoSQL 数据库定义为“no relational”,不再是“No SQL(没有SQL)”,即非关系型数据库,但仍然有很多人将NoSQL 数据库视为“Not Only SQL”。同时,现代的NoSQL 数据库开始被代指那种开源分布式数据库、非关系型数据库。
3 计算机数据库技术在数据管理中的应用、设计
3.1 集群应用的功能
在2001年,计算机数据库技术开始真正支持数据集群的应用,这也使得数据管理方式获得了极大的优化。在Oracle 发布Oracle9i中,数据集群功能能够使得客户信息系统可以得到有效连接,不仅直接提高了客户在数据管理中的共享服务体验,还扩展了计算机数据库的可用性。同时,企业级网络计算数据库软件产品Oracle10g的问世,使得Oracle 开始向“信息公司”进行变革,无论是Oracle数据库软件产品的安全评估,还是Oracle1lg 版本中即插即用技术,它们都可以被称为是现代企业数据管理的雏形。而嵌入式数据库软件(Embedded Database)的问世,更是让计算机性能、内存等“活动”起来,在高性能内存数据库的支持下,快速响应能力和高吞吐量使得嵌入式数据库软件(Embedded Database)成为当时电信等行业的主要服务应用。
3.2 联机事务处理的革新
计算机数据库技术的历史起始于20 世纪60年代的层次模型,当时我国国内仍然处于一片空白,但西方国家已经将计算机广泛地应用于各类数据管理,因此,在行业需求的推动下,数据管理与共享技术应运而生,传统数据共享系统已经不能完全满足人们的日常生产需要。此时,的数据库管理系统(DBMS)开始被投入到数据的管理与共享中,随着涉及信息领域的不断扩大,小型单项事务处理系统已经无法满足人们的需求,联机事务处理(OLTP)、传统的企业管理的发展也受到了一定的限制,随着大型信息系统的问世,联机分析处理OLAP)开始促使传荣企业数据管理进行革新,这些都直接推动了数据库技术向第一代、第二代、到现今第三代关系数据库系统的发展。
3.3 SQL Server数据库产品设计
图2:NoSQL 数据库树状图
Microsoft Office 在严格意义上是不属于数据库技术的范畴,但它作为一款成功的SQL Server 数据库产品设计,就不得不提到Microsoft Office。Microsoft Office 是典型的关系型数据库,即SQL,在Microsoft 公司中,SQL Server 是一个关系数据库管理系统,它从20 世纪80年代后期开始开发,但能够追溯到更早的1987年Sybase SQL Server,其中更是涉及到三家公司的先后参与。在SQL Server 4 版本后,Sybase 公司与Microsoft 公司各自开发相应的SQL Server,这使得SQL Server 分别在UNIX 与Windows NT 两个平台中得到应用。在接下来数据库产品设计中,Microsoft 公司在数据存储和数据库引擎方面做出了变革,这促使Microsoft Office 等软件成为全球最主要的数据库应用方式之一。
4 结束语
综上所述,从笼统的广泛定义来看,计算机数据库技术是计算机信息系统的核心技术,它强调信息数据的储存与运用,并能帮助组织者完成信息数据的高效获取与处理。经过四十年的演变,围绕计算机数据处理核心,数据库技术已经形成了丰富的内容、庞大的软件产业,这使得计算机数据库技术成为一个广受关注、处于快速发展的重要领域。