多媒体数据的组织第三章1第3章多媒体数据的组织随着计算机技术和信息技术的发展,人与人之间以及人与计算机之间的信息交流已经不再是单一的、独立的形式,而是相互关联的多种形式。特别是多媒体技术、计算机网络和通信技术的发展,包括图像、音频、视频等信息的多媒体数据大量涌现,如何有效地按照多媒体数据的特性去存取这些数据,特别是分布在Internet网上的这些数据,已经成为多媒体技术研究中的热点,而超文本作为一种非线性的数据存储和管理模式,正好适用于多媒体数据的组织和管理。本章主要了介绍超文本、超媒体以及多媒体数据库系统基本理论和基本概念。23.1超文本和超媒体文本(Text)是人们早已熟知的信息表示方式,如一篇文章、一段程序、一本书、一个文件等都是文本,它通常以字、句子、段落、节、章作为文本内容的逻辑单位,而以字节、行、页、册、卷作为物理单位。文本最显著的特点是它在组织上是线性的和顺序的。科学研究表明,人类的记忆是一种联想式的记忆,它构成了人类记忆的网状结构。联想方式实际上表明了信息的结构及其动态性。显然,这种网状的信息结构用普通的文本是无法管理的,必须采用一种比文本更高一级的信息管理技术,这就是超文本和超媒体。33.1.1超文本与超媒体概念超文本是TedNelson在1965年用计算机处理文本文件时提出的一种把文本中遇到的相关文本组织在一起的方法,让计算机能够响应人的思维以及能够方便地获取所需要的信息。TedNelson为这种方法杜撰了一个词,称为“超文本(hypertext)”。实际上,这个词的真正含义是“链接(Link)”的意思,用来描述计算机中文件的组织方法。有时人们也把用这种方法组织的文本称为超文本文件,并简称超文本。43.1.1超文本与超媒体概念早期的超文本文件完全由静态文本(包括静止图像)构成。随着多媒体技术的发展,除了使用文本外,还使用图形、图像、声音、动画或视频片断等多种媒体来表示信息,超文本技术被扩展到既包括静态文本,又包括动画、音频、视频等多媒体,这就是二十世纪八十年代诞生的超媒体方法。因为超媒体与多媒体之间有着不可分割的密切关系。用数据库来管理多媒体信息,叫多媒体数据库;用超文本技术管理多媒体信息,有一个特定的名词叫超媒体。简单地说:超媒体=超文本+多媒体53.1.1超文本与超媒体概念超媒体不仅可以包含文字而且还可以包含图形、图像、动画、音频和视频片断,这些媒体之间也是用超级链接组织的,而且它们之间的链接也是错综复杂的。超媒体与超文本之间的不同之处是,超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文本外,还使用图形、图像、音频、动画或视频片断等多种媒体来表示信息,建立的链接关系是文本、图形、图像、音频、动画和视频片断等媒体之间的链接关系。63.1.1超文本与超媒体概念实际上,超文本一词可以用来称呼具有多媒体信息的超文本即超媒体。有时超文本是指文本信息的超文本,有时泛指具有多媒体信息的超文本。在一般的应用场合,对超文本和超媒体这两个概念不加区别,统称超文本(超媒体)技术。73.1.2超文本系统的组成超文本是由信息节点和表示信息节点间相关性的链构成的一个具有一定的逻辑结构和语义的网络。节点(Node)、链(Link)和网络(Web)是组成超文本的三个要素。每个节点都有若干指针指向其他节点,或从其他节点指向该节点,这些指针称为链。由多个链将节点连接起来就组成了一个网络,这就是超文本结构。83.1.2超文本系统的组成1.节点在超文本信息管理技术中,节点是超文本中的信息基本单元,是围绕一个特殊主题组织起来的数据集合。它比字符高出一个层次,抽象地说,它可以是一个信息块,具体地说,它可以是某一字符文本集合,也可以是一段声音、一幅图像,甚至一段动画或视频信息,节点的大小由实际条件来确定。节点中可以嵌入链,使它能与其他节点相链接。93.1.2超文本系统的组成(1)媒体类节点媒体类节点中存放各种媒体信息,包含文本、图像、图形、视频、动画等各种媒体,也包含数据库和文献,存放这些媒体信息的来源、属性和表现方法等。在一些情况下,每一节点中确定包含媒体数据本身,但也有一些情况特别是在网络环境下,许多媒体数据需要临时从网络或机器中得到,所以节点中只有路径、属性等信息,而没有数据本身。103.1.2超文本系统的组成(2)动作与操作节点动作与操作节点是一种动态节点,它通过超媒体的按钮来访问,所以也有人称之为按钮节点。此类节点并不一定需要专门的节点,它可以嵌入到任何节点中,按钮也一般都与链相连接,只不过连接的是执行链。113.1.2超文本系统的组成(2)动作与操作节点动作与操作节点是一种动态节点,它通过超媒体的按钮来访问,所以也有人称之为按钮节点。此类节点并不一定需要专门的节点,它可以嵌入到任何节点中,按钮也一般都与链相连接,只不过连接的是执行链。123.1.2超文本系统的组成(3)组织型节点组织型节点是用来组织其他节点的节点。包括各种媒体节点的目录节点和索引节点。通过这些节点与相应目录项或索引项的链接可以访问相关的内容。加索引是描述节点的一种方法,同时也是数据库管理的需要。目录节点包含各个媒体节点的索引指针,指向索引节点。索引节点由索引项组成,索引项用指针指向目的节点,或指向相关的索引项,或指向相关表中相对应的一行,或指向原媒体的目录节点。133.1.2超文本系统的组成(4)推理型节点推理型节点用于辅助链的推理与计算,它包括对象节点和规则节点。对象节点主要用来描述对象的性质,而规则节点则用来存放规则,指明符合规则的对象,判定规则是否被使用,以及对规则的解释说明等。推理型节点的产生是超媒体智能化发展的产物。143.1.2超文本系统的组成2.链每个节点都有若干个指针指向其他节点或从其他节点指向该节点的指针,这些指针称为链。链也是组成超文本的基本单元,用来链接节点,是节点间的信息联系,它以某种形式将一个节点与其他节点连接起来。链通常是有向的,它可以是双向的。链的数量不是事先确定的,它依赖于每个节点的内容。超文本的链一般链接的是节点中有关联的一部分而不是整个节点。153.1.2超文本系统的组成链的结构一般可分为三个部分:链源、链宿及链的属性。链源是导致浏览过程中节点迁移的原因,可以是热标、媒体对象或节点等。热标是确定信息关联的链源,由它引起向相关内容的转移。根据媒体种类的不同,热标的形式一般有以下几种:热字热区热元热点热属性链宿是链的目的所在,可以是节点,也可以其他任何媒体内容。链的属性决定链的类型,是链的主要特性。163.1.2超文本系统的组成在各个超媒体系统的链型不完全一样,链可分为很多种类型。其中基本结构链、索引链、执行链、推理链是几种比较典型的链型。(1)基本结构链基本结构链是构成超媒体的主要链形式,它具有固定明确的特点。必须在建立一个超媒体文献时事先由作者指明,是一种实链。基本结构链又包括基本链、交叉索引链、节点内注释链。173.1.2超文本系统的组成(2)索引链索引链将用户从一个索引节点引到该节点相应的索引入口,这些链实现节点中的“点”、“域”之间的连接。索引用于文献和数据库的接口及查找共享同一索引项的文献,按钮通常表现为“总目录”、“影片索引”等。使用索引链可以加速实现对相关信息的检索和实现交叉引用。183.1.2超文本系统的组成(3)执行链执行链将一种执行活动与按钮节点相连。它是一种特殊的链,这些链允许超媒体系统与高级程序设计接口,触发执行链引起执行一段代码。执行链使应用程序不再是孤立的,可以激发一个动作或操作。一般的操作系统无法记录程序的功能与目的等,但超媒体的按钮节点与执行链可以通过建立节点,方便地解释应用程序的功能和目的,使超媒体成为高层程序的界面。193.1.2超文本系统的组成(4)推理链推理链是在链的推理过程中通过推理来决定目标。(5)自动链自动链是超媒体系统中一个非常重要的概念。它允许系统自动把当前节点与相似主题或满足某些条件的所有其他节点链接在一起。203.1.2超文本系统的组成3.网络超文本系统内部由节点、链等构成的有向图即网络。从图3-1可以看出,由六个节点(可以是窗口、各种媒体、按钮或更小信息块)组成的超文本结构中有9条链,在任意两节点之间可能有若干条不同的阅读路径。在这里要强调的不仅仅是阅读,更重要的是用户可以主动地决定阅读节点的顺序,即用户可以在信息网络中任意“航行”。213.1.3超文本系统的结构模型在创建超媒体系统时,由于存在各种各样的系统,就会导致如下的问题发生:(1)不同系统创建的文档可能格式不同;(2)描述为长期存储和回放需要的一个文档信息。这些问题的解决办法是超媒体模型,它需要定义和建立分层和链接结构、空间和时间关系以及传输和检索问题。223.1.3超文本系统的结构模型1988年,Campbell和Goodman提出HAM(HypertextAbstractMachine,超文本抽象机)模型。HAM模型把超文本系统划分为3个层次:用户接口层、超文本抽象机(HAM)层、数据库层。HAM模型如图3-2所示。233.1.3超文本系统的结构模型1.数据库层数据库层处于3层模型的最底层,涉及所有传统的有关信息存储的问题。首先它要保证信息的存取操作对于高层的超文本抽象机来说是透明的,即无论高层访问的信息是存储在本地或在远地,是存储在一台计算机中还是在多台计算机中,数据库层都能保证正确存取。其次,数据库层还有处理其它传统的数据库问题,如多用户并发访问信息的安全性、版本维护以及响应速度等问题。243.1.3超文本系统的结构模型此外,就数据库层而言,超文本的节点和链都是没有什么特殊含义的数据对象。它们各自占据若干比特的存储空间,构成在同一时间只有一个用户可修改的单元。增加对节点和链的索引和查询信息,是为了有效地管理数据空间,并提高响应速度。因此在超文本数据库层的设计中,实际上用到大量传统数据库的思想和方法。253.1.3超文本系统的结构模型2.超文本抽象机(HAM)层超文本抽象机层介于数据库层和用户接口层之间,这一层决定了超文本中节点和链的基本特点。它标识每个节点,记录了节点之间链的关系和链的类型,并保存了有关节点和链的结构信息。控制数据库层按指定的结构存储、访问数据。263.1.3超文本系统的结构模型在不同的超文本系统之间在进行信息相互传送和接收时需要按标准的信息转换格式,而超文本抽象机层(HAM)层就是实现超文本输入输出格式标准化转换的最佳层次。超文本抽象机(HAM)层提供了对数据库下层的透明性和对上层用户接口层的标准性。无论数据库层和用户接口层在不同系统中差异有多大,我们总可以通过两个接口:用户接口/超文本抽象机、超文本抽象机/数据库,使之在超文本抽象机层达到统一。273.1.3超文本系统的结构模型3.用户接口层用户接口层又称表示层或用户界面层,是三层模型中的最高层,也是构成超文本系统特殊性的重要表现,并直接影响着超文本系统的成功。它应该具有简明、直观、生动、灵活、方便的特点。它是超文本和超媒体系统的人—机交互的界面。它构成超文本系统特殊性的重要表现,并直接影响超文本系统的功能283.1.3超文本系统的结构模型超文本系统的HAM层定义了许多种类的节点和链,但在用户接口层它可以根据用户的权限规定哪些节点和链是可见的,哪些是不可见的。用户接口层决定了信息的表现方式、交互操作方式、导航浏览方式以及用户对信息的访问权限等。在大多数超文本系统中,信息的显示以窗口的方式操作,每个窗口对应相应的节点,并可同时打开多个窗口。用户接口层决定了信息的表现方式、交互操作方式以及导航等方式。293.1.4超文本和超媒体的发展方向经过30多年的发展,超文本和超媒体技术在某些方面已经很成熟,超文本和超媒体将向以下几个方面发展:1.开放式超媒体2.智能超媒体3.协作超媒体303.2多媒体数据库技术多媒体数据一般有格式数据和无格式数据两类。格式数据结构简单,处理方便。