媒体资产管理技术MediaAssetManagement第7章:多媒体数据库技术第7章多媒体数据库技术多媒体数据库技术是数据库技术与多媒体技术结合的产物。多媒体数据库要解决三个难题。第一是信息媒体的多样化,多媒体数据的存储、组织、使用和管理。第二要解决多媒体数据集成或表现集成,实现多媒体数据之间的交叉调用和融合,集成粒度越细,多媒体一体化表现才越强,应用的价值也才越大。第三是多媒体数据与人之间的交互性,也就是多媒体数据的检索问题,其中包括基于元数据的检索模式和基于内容的检索模式。MEDIAASSETMANAGEMENTMEDIAASSETMANAGEMENT第7章多媒体数据库技术关系数据库概述1多媒体数据库概述2面向对象数据库技术3分布式多媒体数据库4检索技术简介5§7.1.1关系数据库基本知识数据库的数据模型先后经历了网状模型、层次模型、关系模型和面向对象模型等阶段。其中关系模型因为有完整的理论基础,取代了网状模型和层次模型,目前关系数据库在实际应用中居于主导地位。MEDIAASSETMANAGEMENT面向对象模型关系模型层次模型网状模型§7.1.1关系数据库基本知识1.关系数据库的特征数据结构化。按照某种数据模型组织成为一个结构化的数据整体。它不仅描述了数据本身的特性,而且描述了数据与数据之间的各种联系,这使数据库具备了复杂的内部组织结构。实现数据共享。实现了多个应用程序、多种语言及多个用户共享一个库中的数据,甚至在一个单位或更大的范围内共享,因而大大提高了数据的利用率,提高了工作效率。MEDIAASSETMANAGEMENT§7.1.1关系数据库基本知识减少数据冗余度。由于数据库实现了数据共享,因而减少了数据的重复存储,节省了存储空间,减少了数据冗余。数据独立性。数据库技术中的数据与程序相互独立,互不依赖,不因一方的改变而改变另一方,这大大简化了应用程序设计与维护的工作量,同时数据也不会随程序的结束而消失,可长期保留在计算机系统中。MEDIAASSETMANAGEMENT§7.1.1关系数据库基本知识姓名地址年龄月薪工龄张非北京2750004李奎上海2965003王西风广州38800010MEDIAASSETMANAGEMENT数据库示例2.关系数据库的基本组成关系数据库由一组数据表组成。表中的每行称为记录,每列称为字段。表是一组彼此相关的记录的组合。例如,有一张包含公司中员工信息的表。每条记录里都存储了公司一名员工的姓名、地址和月薪等数据。§7.1.1关系数据库基本知识3.DBS和DBMS数据库系统(DBS)是采用了数据库(DB)技术的计算机系统。DBS是一个实际可运行的,按照数据库方法存储、维护和向应用系统提供数据支持的系统,它是数据库、硬件、软件和数据库管理员的集合体。数据库管理系统(DBMS)是指数据库系统中对数据进行管理的软件系统,它是DBS的核心组成部分。对DB的一切操作,包括定义、查询、更新及各种控制,都是通过DBMS进行的。MEDIAASSETMANAGEMENT§7.1.2关系数据库管理系统RDBMS通常利用数据库管理系统来处理诸如人们用文件柜来完成的那样一些任务。从某种意义上来说,数据库就像一个大文件柜,只不过是一个内建的文件编排系统而已。电子化处理记录相对手工处理记录有很多优点:MEDIAASSETMANAGEMENT§7.1.3关系数据库的数据模型关系数据库是一些相关的表和其他数据库对象的集合。该定义表达了三部分含义:第一,在关系数据库中,信息被存放在二维表格结构的表(table)中,一个关系数据库包含了多个数据表,而每一个表又包含行(记录)和列(字段),可以将表想象为一个电子表格,其中与行对应的是记录,与列对应的是字段;第二,这些表之间是相互关联的,表之间的这种关联性是由主键和外键所体现的参照关系来实现的;第三,数据库不仅包合表,而且包含了其他数据库对象,如视图、存储过程、索引等。MEDIAASSETMANAGEMENT§7.1.3关系数据库的数据模型主关键字(primarykey,也称主键)是指表中的某一列,该列的值可唯一标识一行。外部关键字(foreignkey,也称外键)是指如果表中含有与另一个表的主关键字相对应的列组,那么该列组就被称为外部关键字。从该定义可以看出,外部关键字也是由一个或多个列组成。如果两个表中具有相同的列或列组,那么该列或列组就被称为这两个表的公共关键字(commonkey)。如果公共关键字是其中一个表的主关键字,那么该公共关键字在另一个表中就被称为外部关键字。MEDIAASSETMANAGEMENT§7.1.4RDBMS的特点RDBMS的特点如下:数据完整性:所有RDBMS都使用SQL或其变体来控制包含在任意数据库中的数据。RDBMS必须保证数据的完整性。数据的安全性:多数RDBMS都坚持把实际数据和业务逻辑区分开,以确保数据库中的数据可以保持持久状态。MEDIAASSETMANAGEMENTMEDIAASSETMANAGEMENT第7章多媒体数据库技术关系数据库概述1多媒体数据库概述2面向对象数据库技术3分布式多媒体数据库4检索技术简介5§7.2多媒体数据库概述多媒体数据库(MMDB)与传统的关系数据库相比,具有数据量大、数据类型多、数据类型之间差距大、多媒体数据的输入和输出复杂的特点。当今时代,网络技术与信息传输技术的发达,更增加了多媒体数据的复杂性。一般来讲,多媒体数据有静态与动态之分,静态数据有字符、数值、文本、图形、图像等静态的数据,而动态数据有音频、视频、动画等。MEDIAASSETMANAGEMENT§7.2.1多媒体数据的特点多媒体数据库信息媒体的多样性MEDIAASSETMANAGEMENT§7.2.1多媒体数据的特点(1)数据量大图像、声频和视频对象一般需要大的存储容量。(2)数据长度可变多媒体数据的数据量大小可变,且无法预先估计。(3)多数据流多媒体展示时涉及多种数据类型的静态和连续媒体的集成及显示。(4)数据流的连续记录和检索多媒体数据要求连续记录(存储)和播放(检索),否则将导致严重失真,大大影响效果,使用户无法接受。MEDIAASSETMANAGEMENT§7.2.2MMDB的主要需求多媒体数据库(MMDB)就是要实现对结构化和非结构化的多媒体数据的存储、管理和查询,其主要需求有:1.MMDB应能够表示多种媒体的数据,如图形、图像、声音等。非结构化数据表示起来比较复杂,需要根据多媒体系统的特点来决定表示方法。2.MMDB应能够协调处理各种媒体数据,正确识别各种媒体数据之间在空间或时间上的关系。3.除必须满足物理数据独立性和逻辑数据独立性外,还应该满足媒体数据独立性。MEDIAASSETMANAGEMENT§7.2.2MMDB的主要需求4.更强的数据查询和操纵。多媒体数据既有其外在的表现形式,又有其自身内在的结构。5.媒体的集成和编辑。媒体的有机组合(集成)是多媒体数据库系统的一项重要而且难度较大的功能。6.网络功能。应解决分布在网络上的MMDB中的数据的定义、存储、操作问题,并对数据的一致性、安全性、并发性进行管理。7.多媒体数据库系统(MMDBS)应具有开放功能,提供MMDB的应用程序接口API。MEDIAASSETMANAGEMENT§7.2.2MMDB的主要需求8.交互性强。最常见的是用鼠标选择调用有关的信息,供用户观察、决策。9.MMDB还应提供数据和版本管理功能。MEDIAASSETMANAGEMENT§7.2.3MMDBS的层次结构MEDIAASSETMANAGEMENT用户层W1检索1检索2检索n数据模型多媒体数据存储(索引)时态模型检索图像视频音频WnW2过滤层网络层数据描述层物理存储视图W1WnW2W1WnW2通信网络§7.2.3MMDBS的层次结构(1)物理存储层:描述如何在文件系统中存储多媒体数据。(2)数据描述层:也是核心层。这一层负责对原始信息的解释和描述,并处理索引提出的数据快速存取请求。(3)网络层:媒体对象可能存储在不同的系统中,用户可以在计算机网络上进行数据存取。(4)过滤层:负责分析和处理用户的查询要求。用户可以用不同的方法查询数据库,这取决于用户所需要信息的类型。(5)用户层:应用和用户之间的接口,负责实现数据库中数据的浏览以及人机交互。MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型(1)支持结构化数据(如字符数值)和非结构化数据(如视频、声音、图象等)的表示及其属性特征的描述。(2)支持多媒体的表现(Presentation)建模,即多媒体数据模型应能表示各媒体对象间的语义关系、时态关系和空间关系。MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型目前开发出来的MMDBS大多是专用的MMDB,对信息的处理进行了折中,缺乏通用性。在多媒体数据模型方面主要存在以下问题:(1)没有表示多媒体数据模型经典完善的理论及技术。在建立多媒体数据模型时,虽然可能借助其它方面的研究成果,但表示多媒体数据的统一完善的理论还没有形成。(2)目前研究者各自从不同的方向对多媒体数据模型进行探讨,所建立的多媒体数据模型一般也只能反映和强调多媒体数据的某一类特征,其应用也侧重于某一类领域。(3)受目前图像理解、计算机视觉、人工智能等学科发展水平的限制。图像数据自动语义识别和视频数据自动分段,以及抽取高级语义特征还存在不少困难。MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型建立多媒体数据模型的方法可以概括为如下几种:扩充关系的模型:在传统关系数据库的基础上加以扩充,使之支持多媒体数据类型。基于面向对象语言的模型:在面向对象语言中嵌入数据库功能而形成MMDB。基于超文本或超媒体的模型:此种模型由节点和链组成,节点是信息单位(信息元),链用于组织信息,表达信息间的关系,把节点连接成网状结构。开发全新的数据模型:该方法从低层来实现MMDBS,首先建立一个包含面向对象数据库核心概念的数据模型,然后设计相应的语言和相应的面向对象数据库管理系统的核心。MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型1.扩充关系的模型:传统的关系模型结构简单,是单一的二维表,很难用于空间数据和时态数据,缺乏演绎和推理操作,表达数据特性的能力有限。在基于RDB的MMDB中,必须对现有的关系模型进行扩充,使它不但能支持结构化数据,也能处理非结构化数据,分为以下三种扩充方式:MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型(1)扩展现有的数据类型一般是利用标准扩展字段(General)来描述多媒体数据。在Oracle和Sybase系统中采用二进制大对象(BLOB)存放各种多媒体数据(可达2GB)。常规数据用关系数据库处理,多媒体数据则存储在数据库之外的图像或视频服务器上,关系数据库中包括了BLOB的位置信息,这些位置信息相当于指向多媒体文件的指针。MEDIAASSETMANAGEMENT属性A属性B属性C……General图像文件视频文件§7.2.4多媒体数据模型(2)扩充用户自定义的数据类型用户自定义一个抽象数据类型作为另一关系的值,而不仅仅是采用系统己定义的数据类型。例如,用函数定义的扩展系统允许用户将程序加到一个关系上,使系统的查询语言具备调用程序的能力。这种方法旨在扩充关系数据库,使之支持ADT(抽象数据类型)的定义和使用。以极小的代价拓宽的对多种媒体的管理能力。但由于基于二维构造的多媒体数据模型无法反映各媒体之间的空间、时间和语义关系,有关的处理必须用其它应用程序来实现,所以在多媒体数据的同步和集成方面存在很多问题,且对多媒体数据的基于内容的检索和查询更加难以实现。MEDIAASSETMANAGEMENT§7.2.4多媒体数据模型3)扩充嵌套语义,采用NF2数据模型。传统的关系模型要求关系数据库中