多媒体技术专业选修课程MultimediaTechniques武汉大学在当今的信息时代,信息以爆炸的方式不断的增长,而且种类繁多,除文本、数字之外,图形、图像、声音、动态视频等多媒体信息也开始进入信息处理领域,使得人们感到现有的信息存储与检索机制越来越不足以使信息得到全面而有效的利用,尤其不能像人类思维那样以通过“联想”来明确信息的内部关联性,而这种关联却可以使人们了解分散存储在不同地点的信息快之间的连接关系及相似性。就像有的科学家指出的那样“我们可能已经发现了一种治疗癌证或心脏病的方法,我们可能已经找到摆脱时空限制的途径;我们可能…这种问题答案细分成成百上千个部分,以点滴信息的形式分散在世界各地,有待于搜索起来、联系起来。”现在,我们已经掌握了大量信息,但信息量非常大,并且相互之间关系复杂,甚至是某领域的专家,也不可能掌握该领域的全部知识。第8章超文本与超媒体因此,迫切需要一种技术或工具,能够将各种信息关联起来,形成有效的知识提供给人类。最近不断发展起来的一种技术就有希望使我们达到这样的目标,这就是超文本(Hypertext)与超媒体(Hypermedia)。本章将系统的介绍超文本与超媒体。1.超文本与超媒体的概念2.超文本发展历史与典型的超文本系统3.超文本系统的体系结构4.超文本标记语言HTML介绍5.XML:可延伸或扩展的标记语言第8章超文本与超媒体8.1超文本与超媒体的概念8.1.1超文本超文本这个术语与数学家F.Klein在1704年提出并流行于19世纪的“hyperbolicspace”有关。他用”hyperspace”描述了一个多维几何空间,而人类的思维结构也是一个多维空间。科学研究表明,人类的记忆是一个联想式的记忆,它形成了人类记忆的网状结构。对联想、记忆的探索形成了人类思维概念化的基础。人类记忆的这种联想结构不同于文本结构,文本最显著的特点是它在组织上是线形的和顺序的。这种线性结构体现在阅读文本是只能按固定的线性顺序阅读,先读第1页,然后第2页…,这样一页一页读下去。就像读一本小说,从头到尾读完,才可能弄清楚它的故事情节,这是线性结构的典型特征。8.1超文本与超媒体的概念8.1.1超文本但人类记忆的网状结构使得人类的记忆产生联想。例如,某人对“夏天”一词就可能产生一系列的联想结果:夏天——高考——上大学——工作——结婚——婚礼——婚纱——白雪——冬天。有时这种联想是风马牛不相及的内容,就是思维的非线性特征。超文本结构就类似于人类的这种联想记忆结构,它采用一种非线性的网状结构组织快状信息,没有固定顺序,也不要求按顺序来浏览。超文本最早思想是在1945年有Bush提出的。他描述了一种称为“Memex”的系统,在此系统中,可以对当时主要存储方式缩微胶卷进行管理。8.1.1超文本通常超文本被定义为:由信息结点和表示结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。结点可以包含文本、图形、图像、音频、视频等各种形式的数据。图8.1是一个完整的小型超文本结构。从图中可以看到超文本是由若干内部互联的文本块(或其他信息)组成,这些信息块可以是计算机的若干屏,也可以是若干窗口、文件或更小块的信息块。这样一个信息单元就称为一个节点(Node)。不管节点有多大,每个节点都有若干指向其他节点或从其他节点指向该节点的指针,这些指针被称为链(Link)。链有很多种,它连接两个节点,所以链通常是有向的,从一个节点,该节点称为源节点,指向另一个节点,称为目的节点。链的数量通常不是事先固定,它依赖于每个节点的内容和信息的原始结构。如果一个节点和其它节点有很多种关联,那么它就有很多种链;如果一个节点没有启程链,那它就只能作为目的节点。超文本的链通常连接的是节点中有关联的词或词组而不是整个节点。当用户触发该该词或词组时就激活这条链从而转到目的节点。8.1.1超文本8.1.1超文本图8.1所表示的超文本结构实际上就是有节点和链组成的一个信息网络。读者可以在这个网络中任意浏览。读者不仅可以“阅读”,而且可以主动选择阅读路径。例如,读者从A信息块开始阅读,与单一路径文本不同,该结构有三条阅读路径供读者选择,即可到B、D、E。如果选择B,则可继续阅读C或E,从E又可以到D。当然,读者可以直接到D。这就表明,在超文本结构中任意两点之间可以有若干条不同的路径,读者可以自由地选择沿那条路径阅读文本。这就要求事先建立一系列可供选择的路径或由超文本系统动态产生相应的路径。8.1.1超文本传统印刷文本中脚注和有许多交叉参考条目的百科全书,同超文本的结构有点类似。对于有脚注的文本,读者可以有多种选择,可以继续读正文,也可以读脚注。同样对百科全书也一样。然而,它们还是和超文本有本质的区别,这就是超文本利用了计算机的特点,可以快速的从一个节点转到另一个节点,而传统结构查阅时的转移速度很慢。总的来说,超文本技术是一种信息管理技术,以节点为基本单位,在信息组织方面则用链连成网状结构,既非线性文本结构。我们一般把已组织成信息网(Web)的信息网络称为超文本,而将能对起进行管理和使用系统称为超文本系统。8.1.2超媒体在现实世界中,我们处理的信息不光是文字和数字,还有很多的图形、图像、音频、视频等各种形式的信息。因此,只有多媒体信息才有可能较为接近人类的表达方式去表示复杂而丰富的信息及其相互关系。早期超文本系统的表现形式仅是文字的,这就是它被称为”Text”的原因。随着多媒体的技术的发展,各种各样多媒体接口的引入,表示信息的形式扩展到视觉和听觉甚至触觉来表现。先进的多媒体的表现的交互式特性可提供用户控制表现过程和存取所需要信息的能力。多媒体信息的组织将有助于信息的表达和交互。超文本和多媒体的结合大大改善了信息的交互程度和表达思想的准确性。正是由于多媒体信息引入超文本,有人就提出用超媒体来强调系统是多媒体的。也有人认为超文本是一个广义含义,多媒体的超文本也是超文本。所以,这两个术语是通用,除非特别指明。8.1.3超文本系统的基本元素基于超文本信息管理技术的系统称为超文本系统。它可以分为以下几个部分:1.节点(Node)超文本是由节点和链构成的信息网络,节点是围绕一个特殊主题组织起来的数据集合,这个集合可以是有形的,例如,是一个数据块,也可以是无形的,是信息空间中的一个部分。节点有很多种,而且分类的方法也不尽相同。在早期超文本中节点的内容一般是有形的节点,内容主要是文本、符号或数字。现在根据媒体的种类、媒体的内容和功能的不同,节点可以是媒体节点,其中包含各种媒体,也可以包含其他内容(如,动作类节点、组织类节点、推理型节点等)。8.1.3超文本系统的基本元素(1)媒体类节点媒体类节点中主要存放各种媒体信息,包括文本、图像、图形、音频、视频等,也可以包括数据库、文献,存放这些媒体信息来源、属性和表现方法等。在一些情况下,每一个节点中确实包含媒体数据本身,但也有一些情况不包括媒体本身(例如,在网络环境下,很多媒体数据要从其它机器上或网络中得到,所以节点只有路径和属性等内容)。节点中对媒体数据的描述直接关系到多媒体的表现,不同的媒体会有不同的属性和表现方法。例如,对文本要能够表现出文本的字体、大小、排版方式等;对图像要指明位置和大小;对视频要定义一些符合视频的操作等;对混合媒体来说,媒体之间的同步、配合和效果、就要有更复杂的描述形式。8.1.3超文本系统的基本元素(2)动作和操作节点动作和操作也是一类媒体,因此也可以当作一种动态节点,它可以通过媒体的按钮来访问,有时也称它们为按钮节点。(3)组织型节点组织型节点是组织节点的节点。加索引是描述节点的一种方法,同时也是数据库管理的需要。组织型节点可以实现数据库的部分查询工作,例如结构查询。组织型节点包括各种模型的媒体的节点的目录节点和索引节点。目录节点包含各个媒体节点的索引指针,指向索引节点。索引节点由索引项组成,索引项用指针指向目的节点或其他相关位置。8.1.3超文本系统的基本元素(4)推理型节点推理型节点主要指的是对象节点和规则节点。对象节点是用来描述对象的性质。而规则节点用来存放规则,指明符合规则的对象,判定规则是否被使用,以及对规则的解释说明等。对象节点和规则节点都是用来辅助链的推理与计算,是超文本智能化发展的产物。需要指出的是,现代很多的超媒体系统中有的已经没有节点的概念,或者说节点已是无形了。也有系统将节点分为原子节点和组合节点,原子节点是不能再分割的对象,组合节点是有原子节点构成的。8.1.3超文本系统的基本元素2.链(Link)链是节点间的连接信息,它通过某种形式将节点连接起来。链有多种形式,通常是有向的,并且链的数量通常是不能事先确定的,它依赖每个节点的内容。链的结构一般可分为三个部分:链源、链宿及链的属性。链源是导致节点信息迁移的原因,可以是热标、媒体对象或节点等。链宿是链的目的所在,可以是节点,也可以是其他任何媒体的内容。链的属性是指链的类型(如,版本、权限等)。8.1.3超文本系统的基本元素在超文本系统中主要有以下几种类型:(1).基本链基本链,用来建立节点间的基本顺序的链,有点类似书中的章、节、段落等结构。它能够使信息在总体上呈现层次结构。(2).交叉索引链交叉索引链主要是将节点连接成网状结构。和基本链不同的是它以动作决定访问顺序,而不是节点间固定访问顺序。(3).注释链注释链是一种指向节点内部附加注释信息的链,注释源主要是通过热标确定的,注释体则为某单一媒体对象。8.1.3超文本系统的基本元素(4)移动链移动链简单的移动到一个相关的节点,一般把它当作超文本系统中的导航。(5)缩放链缩放链可以扩大当前节点。主要是用于用户在浏览信息时,可以对所感兴趣的内容放大,以便看清楚该区域的信息。(6)全景链全景链和缩放链是对应的,主要是将链返回高层视图。(7)视图链视图链主要用来实现可靠性和安全性。(8)Is-a链Is-a链与语义网中的Is-a链类似,用于指明对象节点的某类成员。8.1.3超文本系统的基本元素(9)Has-a链Has-a链用于描述节点具有的属性。(10)蕴含链蕴含链用于连接推理树中的事实,通常等价于规则。(11)执行链执行链将一种执行活动与按钮节点相链。执行链使应用程序不再是孤立的,可以激发一个动作或操作。一般的操作系统无法记录程序的功能、目的等,但超媒体的按钮节点与执行链可以通过建立节点方便地解释应用程序的功能和目的,使超媒体成为高层程序的界面。8.1.3超文本系统的基本元素3.热标(Hotpot)热标是确定信息关联的链源,由它将引向相关内容的转移。不同的应有不同的形式的热标。根据媒体种类的不同,热标一般有以下几种。(1).热字热字是文本中被指定具有特殊含义或虚进一步解释的字、词或词组。如图8.2所示。在图中黑体加斜体和下划线都是热字,点击这些词就会按设计者的设计出现进一步的解释或说明,或更形象的演示。8.1.3超文本系统的基本元素(3)热区热区是在所显示的图像或类似图像显示区上指明的一个敏感区域,作为触发转移的热点。因为在一副图像上的不同区域可以有不同的信息表现。当触发这些区域时,就会按设定好的方法进行表现。(4)热元在图形媒体中,图元是其最基本的单位(例如,一个图、一条线、一串字符等)。为了使这些相对独立的图形能够作为信息转移的链源,就引入热元的概念。热元适用于在不影响图形本身的变化的同时,又可以由该图元引发相应进一步信息的表现。8.1.3超文本系统的基本元素(3)热区热区是在所显示的图像或类似图像显示区上指明的一个敏感区域,作为触发转移的热点。因为在一副图像上的不同区域可以有不同的信息表现。当触发这些区域时,就会按设定好的方法进行表现。(4)热元在图形媒体中,图元是其最基本的单位(例如,一个图、一条线、一串字符等)。为了使这些相对独立的图形能够作为信息转移的链源,就引入热元的概念。热元适用于在不影响图形本身的变化的同时,又可以由该图元引发相应进一步信息的表现。(5)热点热点主要用于时基类媒体(例如,动态视频、声音等),在时间轴上触发转移。由于时基类媒体是动态的,在使用时不能将热点定为