多媒体数据库技术综述
2011-02-17李磊山东省青岛第二卫生学校山东省胶州市266300
李磊 山东省青岛第二卫生学校,山东省 胶州市 266300
多媒体数据库技术综述
李磊 山东省青岛第二卫生学校,山东省 胶州市 266300
随着多媒体技术的发展和广泛应用,多媒体数据越来越多地被引入到数据库中,从而形成了多媒体数据库。由于多媒体数据具有数据量大、内容复杂、非结构化的特点,如何对这些数据进行有效的管理和利用,是多媒体数据库要解决的主要问题。本文在介绍多媒体数据给数据库管理带来的问题的基础上,综述了多媒体数据库及其关键技术。
多媒体数据;多媒体数据库;关键技术
随着多媒体技术和网络技术的迅速发展以及社会信息化程度的不断提高,承载信息的媒体也逐步表现出多样化、数字化、交互化和集成性等特点,如图形、图像、音频、视频、动画等被称为多媒体数据的载体。
1.多媒体数据库
多媒体数据库是与传统数据库不同的数据库,它是为了实现对多媒体数据的存储、检索和管理而出现的一种新型的数据库技术。在多媒体数据库中,媒体可以进行追加和变更,并能实现媒体的相互转换,用户在对数据库的操作中,可最大限度的忽略媒体间的差别,实现多媒体数据库的媒体独立性。
简单的说,多媒体数据库是按一定方式组织在一起的可以共享的相关多媒体数据的集合,简称MDB(Multimedia Database)。与传统数据库应用中的主流数据库系统——关系模型数据库相比,多媒体数据库中的数据是非格式化的、不规则的且数据量大,没有统一的取值范围,没有相同的数量级,也没有相似的属性集。
2.多媒体数据的特点以及给数据库管理带来的问题
在传统的数据库中引入多媒体数据并对其操作,是一个极大的挑战。这不是一个只要把多媒体数据加入到数据库中就可以完成的问题。由于多媒体数据具有不同于传统数据的一些特点,这样给数据库的管理就带来了许多问题,主要有以下几个方面:
2.1 多媒体数据量大且媒体之间的差异也极大,从而影响数据库的组织和存储方法
一幅彩色图像,即使在压缩的情况下,也需要几K甚至几十K或几百K字节的数据量,而字符型数值等数据可能仅有几个字节的数据量。只有组织好多媒体数据库中的数据,选择设计好合适的物理结构和逻辑结构,才能保证磁盘的充分利用和应用的快速存取。
2.2 数据非格式化
多媒体数据基本上都是二进制形式,数据本身没有严格的数据结构,即为非格式化数据或非结构化数据。必须另外加入一些描述和解释,否则难以利用。这种描述和解释不是数据本身,而是关于数据的数据,即元数据。元数据的生成是多媒体数据库管理中的一个重要而突出的问题。
2.3 媒体种类的增多增加了数据处理的困难。
每一种多媒体数据类型都要有自己的一组最基本的概念(操作和功能)、适当的数据结构和存取方法、以及高性能的实现。但除此之外也要有一些标准的操作,包括各种多媒体数据通用的操作及多种新类型数据的集成。不同媒体类型对应不同数据处理方法,这便要求多媒体数据库管理系统能不断扩充新的媒体类型及其相应的操作方法。
2.4 不同的查询机制和方法
传统的数据库查询只处理精确概念和查询,相对简单且易于实现。但在多媒体数据库中非精确匹配和相似性查询将占相当大的比重。媒体的复合、分散、时序性质及其形象化的特点,注定要使数据库不再是只通过字符进行查询,而必须要采用特征匹配和模糊匹配的查询机制和方法。
3. 多媒体数据库的关键技术
多媒体数据库具有传统数据库所不具有的特性和结构以及要实现的功能要求,因此,多媒体数据库包含了许多不同于传统数据库的新技术,其中主要技术有多媒体数据建模技术、多媒体数据存储管理技术、多媒体数据的压缩/还原技术和多媒体数据查询技术,其关键内容是多媒体数据建模技术。
3.1 数据建模
数据模型(Data Model)是数据库管理系统中用于提供信息数据表示和操作手段的形式构架,数据模型通常由数据结构、数据操作、和完整性约束三部分组成。
多媒体数据要比传统数据复杂的多,因此在选择数据模型时必须考虑这些特性。多媒体数据模型要支持非结构化数据(如视频、声音)的表示及其属性特征的描述;支持多媒体的表现建模,即多媒体数据模型应能表示各种媒体对象间的语义关系、时态关系和空间关系。多媒体数据模型主要采用关系数据模型的扩充、面向对象的数据模型和超媒体数据模型。
3.2 数据存储管理技术
多媒体数据存储管理技术是指根据多媒体数据的使用频率和速度等要求,将数据采用分级存储的方案。由于多媒体数据量非常庞大,考虑到系统的性能价格比,往往可以将少数极常用的数据存于RAM 中,常用的数据存于硬盘,而光盘和磁带库则作为二、三级库。大对象一般是分页面进行管理的。多媒体对象的存储关键问题是能够快速定位,对超媒体文档和超媒体数据记录进行随机存取。目前比较流行的存取方法是B+树和Hash方法。为满足视频等连续媒体的时域约束需要,还应设法提高磁盘的读写速度,减少读写的延时及抖动。
3.3 数据的压缩与还原技术
多媒体数据压缩与还原技术是指数据压缩比、压缩/解压缩速度以及简捷的算法。以压缩/解压缩后的数据是否与压缩前的原始数据完全一致作为标准,可以把数据压缩方法划分为无失真压缩(可逆压缩)和失真压缩(不可逆压缩)两类。多媒体信息的数据量要远远大于传统媒体,例如:一幅1024×768 ×24位色的图像需要2.4M字节存储,相当于一本一百万字的小说的存储容量。因此在计算机中,结构化数据如文字、数值是编码后进行存放,非结构化数据如图形、图像、视频和音频也必须进行压缩存储。比如要实现视频数据的管理,首先必须解决的问题就是压缩编码和解码,目前MPEG、AVI、H.261以及Quick Time等压缩标准的压缩比例可以达到50:1~200:1。由于多媒体数据的压缩,在对它们进行编辑时,数据的长度会引起变化,这不仅会给数据重新存入带来问题,还会引起媒体间的不同步,故还应采取适当的方式,对被编辑的媒体进行局部的重编码,以保持原来的大小。
3.4 数据查询技术
多媒体查询技术(MSQL)是指多媒体数据库采用结构化查询语言的技术。MSQL是一个功能强大的查询语言,它有助于用户高效操纵多媒体数据库,实现数据库与应用程序间的相互独立,并且对于用户是友好的。多媒体数据库查询语言不仅能用关键字进行检索,还可以处理基于内容的非精确查询或模糊查询。
4.结束语
多媒体数据库是一门非常综合的技术,它几乎涵盖了计算机及电子领域的所有学科。随着社会信息化程度的提高和相关技术的发展,多媒体数据库技术对社会生产、生活的影响也越来越大。现在,无论是数字图书馆、数据仓库、数据挖掘、科学可视化、电子商务、远程教育、医疗、媒体服务等学科都能找到多媒体数据库直接或潜在的应用价值。因此,无论从研究价值还是应用前景上看,多媒体数据库技术的研究都处于信息科学和技术发展前沿,并将在研究的挑战性、活跃性及应用的广泛性方面起着举足轻重的领导作用。
[1] 胡晓峰,吴玲达等.多媒体技术教程.北京:人民邮电出版社,2002
[2] 黄志军,曾斌.多媒体数据库技术.北京:国防工业出版社,2005
[3] 钟玉琢,沈洪等.多媒体技术及其应用.北京:机械工业出版社,2003
[4] 段英风,杨春华.多媒体数据库及应用.青海气象,2005年第2期
[5] 孙凌,高大利.有关多媒体数据库的技术研究.福建电脑,2003年第12期
[6] 李泽建,许亮.浅析多媒体数据库技术的发展和展望,昆明理工大学学报.2002年第2期
[7] 王桂东.多媒体数据库技术的研究.潍坊学院学报,2002年第4期
[8] 李逸波.多媒体数据库技术.北京:机械工业出版社,2004
10.3969/j.issn.1001-8972.2011.17.038