第八讲多媒体数据库概述多媒体数据的特点多媒体数据库的发展现状多媒体数据库的数据模型多媒体数据库检索与查询分布式多媒体数据库系统结构化查询语言多媒体数据挖掘多媒体数据的特点传统的数据处理中所处理的数据类型主要是整型、实型、布尔型和字符型,而多媒体数据处理中的数据类型除了上述常规数据类型外,还要处理图形、图像、声音、文字及动画等复杂数据类型。多媒体数据与常规数据有许多差别,主要表现在以下几方面:数据量、数据长度、数据模型、数据定义及操作、数据的时间特性和版本概念、数据传送多媒体数据库应具有的功能支持图形、图像、动画、声音、动态视频、文本等多媒体字段类型及用户定义特殊类型支持定长数据和非定长数据的集成管理支持复杂实体的表示和处理支持同一实体的多种表现形式具有良好的用户界面支持多媒体的特殊查询及良好的处理接口支持分布式环境多媒体数据库的构造通常,把能够管理数值、文字、表格、图形、图像、声音等多种媒体的数据库称为多媒体数据库(MultimediaDataBase,MDB)。多媒体数据库应具有的功能支持图形、图像、动画、声音、动态视频、文本等多媒体字段类型及用户自定义类型。支持定长数据和非定长数据的集成管理。支持复杂实体的表示和处理,要求有表示和处理实体间复杂关系(如时空关系)的能力,有保证实体完整性和一致性的机制。支持同一实体的多种表现形式(如一段视频在播放时可改变其帧率或一幅静态图像,在显示时改变其对比度等性质而不影响库中的内容等)。具有良好的用户界面。支持多媒体的特殊查询及良好的处理接口。支持分布式环境。构造多媒体数据库的方法一类是在关系数据库的基础上构造多媒体数据库。虽然关系数据模型抽象能力较差,不适于用来表示复杂的多媒体对象,但它比较成熟、应用广泛,对于某些应用而言,在关系数据库的基础上构造多媒体数据库还是可行的。另一类是在面向对象数据库的基础上构造多媒体数据库。因为面向对象数据模型具有很强的抽象能力,可以很好地满足复杂的多媒体对象的各种表示需求,能够为多媒体数据库的构造提供理想的基础,因而面向对象技术在多媒体数据存储及管理中的应用也成为重要研究课题。在关系数据库的基础上构造多媒体数据库从20世纪80年代以来,关系数据库系统凭借其坚实的理论基础、简单的结构,具有国际标准的数据库语言、成熟的产品和广大的用户群,一直在数据库领域占统治地位。但关系模型结构简单,是单一的二维表,数据类型和长度被限制在一个较小的子集中,又不支持新的数据类型和数据结构,难以实现空间数据和时态数据,缺乏演绎和推理操作,因此表达数据特性的能力受到限制。在多媒体数据库系统中使用关系模型,必须对现有的关系模型进行扩充,使它不但能支持格式化数据,也能处理非格式化数据。在面向对象数据库的基础上构造多媒体数据库20世纪80年代初发展起来的面向对象技术,以自然、直观、科学的思维模式去看待、描述、定义、处理现实世界,把世界看成是由对象组成的大系统,而对象包含了静态结构、动态行为和约束条件三大要素,通过引入封装、继承、对象、消息、超类、子类等概念,科学地描述各种对象及其内在的结构和联系,从而使许多复杂甚至无法解决的问题都变得相对简单。面向对象技术的发展也推动了数据库技术的发展,二者的结合促使了面向对象数据库的诞生。研究表明,面向对象数据库是解决多媒体数据较为科学的方法和工具,它可以方便灵活地处理图形、图像、声音、文字、动画等多媒体信息,尤其是具有层次结构的复杂对象,如GIS(地理信息系统)。多媒体数据库检索与查询查询方法全文检索技术万维网文档的全文检索技术图像检索基于内容的信息检索查询方法查询方法是数据库系统极其重要的特性之一,是鉴别一个数据库管理系统成功与否的重要依据。多媒体数据库的三种查询方法:关键字查询、可视化查询、语义查询。全文检索技术所谓全文检索就是给定一个字符串或字符串的逻辑表达式,在全文数据库中进行相应的检索,查出与指定表达式相匹配的出现并将这些出现的原文件作为检索结果返回给用户。实现快速的全文检索包括以下几个方面的技术问题:检索的快速响应如何建立索引库如何压缩索引数据提供完整、丰富的检索操作手段超文本处理分布式网络文档的检索处理万维网文档的全文检索技术对文档涉及全文检索系统时主要考虑以下几个方面的特点:分布性数据量巨大动态性复杂的标识符处理简单的网全文检索系统的结构(1)网页抓取搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛(Spider)或爬虫。Spider是基于Web的程序,它从已知的网页出发,通过请求站点上的HTML文档访问某一站点,不断从一个站点移到另一个站点,自动建立索引,加入到网页数据库中,这个过程就叫爬行。Spider进入某个超文本时,利用HTML语言的标记结构来搜索信息及获取指向其他超文本的URL地址,无需用户干预,实现网络上的自动爬行和搜索。Spider每遇到一个新文档,都要搜索它上面的链接。通常采取的爬行策略有两种:深度优先,即先沿一条路径采到叶节点,再从同层其他路径进行采集;广度优先,即先采集完同一层网页,再采集下一层网页。(2)索引Spider将抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引(index)。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。索引的方法主要分为两种:一种基于关键词的索引;另一种是基于概念的索引。第一种是大多数搜索引擎使用的方法,是从文档中提取重要的词作索引。在文档中顶部出现的词以及在整个文档中出现多次的词可以认为是比较重要的。第二种方法与前种不同之处在于试着了解语义,用一个词能代表许多意义相近的词,这样既节省了索引空间,也为检索时可返回有关主题的所有文档,甚至这些文档中的词与检索词并不精确匹配。(3)搜索词处理用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。(4)排序对搜索词处理后,搜索引擎程序便开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。排名算法决定了搜索结果中不同网站的排名,因为为了提升网站的排名,搜索引擎优化技术应运而生。搜索引擎优化即(SearchEngineOptimization,简写为SEO),一般可简称为搜索优化。其目的是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页内容进行相关的优化,使其符合用户浏览习惯,在不损害用户体验的情况下提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。基于内容的信息检索根据媒体对象的语义和上下文联系进行检索。它有如下特点:从媒体内容中提取信息线索。是一种近似匹配大型数据库的快速检索多种检索手段主要包括:基于内容的图像检索、基于内容的视频检索、基于内容的音频检索图象检索图象检索图像检索中的关键技术借用文本索引技术基于内容的图像检索相关反馈和自动标注技术借用文本索引技术早期的图像检索借用了文本索引技术。文本搜索引擎是将网站、网页的内容索引为一系列关键字,当用户输入关键字后,系统可以根据数据库中的倒排文件将关键字映射为网站或网页的地址。对于图像文件,一样可以根据其内容手工将其标注为一系列关键字,并对关键字建立索引,这样,图像检索就转化为文本检索的问题借用文本索引技术这种方法很不实用,一是必须由人工完整地标注所有图像,对于小图像集合也许问题不大,但随着图像数目的增加,特别是网络上的图像是无穷无尽的,这种方法显然不可行;第二个问题在于图像所包含的信息量庞大,不同用户对于同一张图像的看法不及相同,这就导致对图像的标注没有一个统一标准,检索出的结果不能很好符合用户的需求相关反馈和自动标注技术相关反馈和图像的自动标注技术是重要的突破。相关反馈是在信息检索系统中的一种指导性学习的技术,用以提高系统的检索能力。在基于内容的图像检索中,通常检索的结果不能令人满意,这时用户可以告诉系统哪些是符合用户需求的正反馈图片,哪些是不符合检索内容的负反馈图片,系统根据用户提交的指导信息,对内部检索参数进行调整,从而优化检索结果并提供给用户新的检索结果。相关反馈和自动标注技术对于图像的标注问题,可以手工标定很小一部分图,利用相关反馈的方法,将用户因为反馈而标定的信息不断加入数据库,同时对这些信息进行扩展,使具有相似内容的图像因为这些图的相似性而得到标注。试验表明,此方法使检索精度得到了很大提高基于内容的图像检索基于内容的图像检索(Content-BasedImageRetrieval,CBIR)是一种新的检索技术,它是指除了利用传统的数据库对图像描述的文字信息进行储存管理外,还利用图像的颜色、纹理、形状等特征进行检索。它融合了传统的模式识别技术与多媒体良好的人机交互技术,有着广泛的发展前景。基于内容的图像检索基于内容的检索不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。通常,可以抽取图像库中所有文件的特征,用户检索的过程一般是提供一个样例图像,系统抽取该样例图像的特征,然后同数据库中所有的特征进行比较,并将与样例特征相似的图像返回给用户,这个过程称之为基于样例的图像检索。基于内容的图像检索当前研究图像检索的重点和难点集中在如何在抽取的底层特征和图像内容所表示的语义特征间建立很好的联系,直到今天,这仍然是基于内容图像检索的一个没有解决的问题。也就是说,由于我们所拥有的特征并不能很好地体现图像真正的语义信息,以至于检索的结果往往不能令人满意CBIR的检索内容颜色:图像颜色分布、相互关系、组成等;纹理:图像的纹理结构、方向、组成及对称关系等;形状:图像轮廓组成、形状、大小等;对象:图像中子对象的关系、数量、属性、旋转等。CBIR的检索方式选择颜色的比例、层次以及纹理图案的图样进行查询;用工具生成表示物体和物体间空间关系的符号图像进行查询;用画图工具生成与希望查找的图像颜色分布相似的图像进行查询;从当前窗口所陈列的全部图像中选择接近自己意愿的图像进行查找,重复多次直至找到为止。上述方法与字符的关键词结合进行查找。基于内容的视频检索视频检索的方式目前主要有两种:基于关键帧的检索,是对代表视频镜头的关键帧进行检索。基于运动的检索,是基于镜头和视频图像的时间特征来检索,是视频查询的进一步要求。基于内容的音频检索音频信息检索分为以下几方面:基于语音技术的检索。语音检索是以语音为中心的检索,采用语音识别等处理技术。如电台节目、电话交谈、会议录音等。音频检索。音频检索是以波形声音为对象的检索,这里的音频可以是汽车发动机声、雨声、鸟叫声,也可以是语音和音乐等,这些音频都统一用声学特征来检索。分布式多媒体数据库系统分布式多媒体数据库系统的特点分布式多媒体数据库的实现途径特点实时性同步特性服务质量体系结构客户/服务器结构实现途径远程调用范型。远程调用语句经过编译器翻译成对服务器的调用码,由通信机制传送给服务器,再由服务器端将这些调用码翻译成局部的进程调用,以完成远程服务。中间件技术。中间件(Middleware)的作用是为了屏蔽不同操作系统接口的差异及分布性,为用户提供一个统一的应用开发接口。结构化查询语言SQL简介SQL的数据类型SQL的基本语法SQL简介结构化查询语言SQL(StructuredQueryLanguage)是Bovce和Chamberlin于1974年提出的,并首先在IBM的关系数据库系统SystemR上实现,开始称为SEQUEL(StructuredEnglishQueryLanguage