浅谈信息检索技术1/3浅谈信息检索技术关键字:概念常见信息检索技术多媒体信息检索技术概念:现代信息检索技术大体上分为广义和狭义两种概念。广义的信息检索(InformationRetrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(InformationSearch或InformationSeek)。常见的信息检索技术:1.布尔逻辑检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。2.截词检索截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索3.位置检索位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。4.字段限定检索字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。5.加权检索加权检索是某些检索系统中提供的一种定量检索技术。加权检索同布尔检索、截词检索等一样,也是文献检索的一个基本检索手段,但与它们不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。6.聚类检索聚类是把没有分类的事物,在不知道应分几类的情况下,根据事物彼此不同的内在属性,将属性相似的信息划分到同一类下面。浅谈信息检索技术2/3革命性的多媒体检索技术兴起背景:多媒体技术和Internet的发展给人们带来巨大的多媒体信息海洋,并进一步导致了超大型多媒体信息库的产生,光凭关键词是很难做到对多媒体信息的描述和检索的,这就需要有一种针对多媒体的有效的检索方式。如何有效的帮助人们快速、准确地找到所需要的多媒体信息,成了多媒体信息库所要解决的核心问题。在历史大趋势下,多媒体检索技术应运而生。基于内容的信息检索(Content-BasedRetrival)是一种新的检索技术,是对多媒体对象的内容及上下文语义环境进行检索,如对图像中的颜色、纹理,或视频中的场景、片断进行分析和特征提取,并基于这些特征进行相似性匹配。基于内容的图像检索:它是根据分析图像的内容,提取其颜色、形状、纹理,以及对象空间关系等信息,建立图像的特征索引。目前有的图像检索系统有:•QBIC(QueryByImageContent)是IBMAlmaden研究中心开发的第一个商用基于内容的图像及视频检索系统,它提供了对静止图像及视频信息基于内容的检索手段,其系统结构及所用技术对后来的视频检索有深远的影响;•由MIT的媒体实验室开发研制的Photobook,图像在存储时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码;•美国哥伦比亚大学开发的VisualSEEK图像查询系统,该系统的主要特点是用到了图像区域的空间关系查询和直接从压缩数据中提取视觉特征。•EXCALIBUR技术公司开发的retrievalware系统;•Virage公司开发的virage检索系统能;•香港中央图书馆的多媒体信息系统(MMIS)是IBM和分包商ICO于1999年底开始承建190万美元的数字图书馆项目,被认为是世界上最大且最复杂的“中文/英文”双语图书馆服务之一,其采用的DB2Text和ImageExtenders既支持文本查找,也支持图片查找。基于内容的视频检索:基于内容的视频信息检索是当前多媒体数据库发展的一个重要研究领域,它通过对非结构化的视频数据进行结构化分析和处理,采用视频分割技术,将连续的视频流划分为具有特定语义的视频片段——镜头,作为检索的基本单元,在此基础上进行代表帧(representativeframe)的提取和动态特征的提取,形成描述镜头的特征索引;依据镜头组织和特征索引,采用视频聚类等方法研究镜头之间的关系,把内容相近的镜头组合起来,逐步缩小检索范围,直至查询到所需的视频数据。其中,视频分割、代表帧和动态特征提取是基于内容的视频检索的关键技术。目前相关的研究有:•MPEG-7标准称为“多媒体内容描述接口”(MultimediaContentDescriptionInteface),它是一种多媒体内容描述的标准,它定义了描述符、描述语言和描述方案,对多媒体信息进行标准化的描述,实现快速有效的检索;•JJACOB基于内容的视频检索系统,可进行视频自动发段并从中抽取代表帧,并可按彩色及纹理特征以代表帧描述基于内容的检索;•卡内基•梅隆大学的informedia数字视频图书馆系统,结合语音识别、视频分析和文本检索浅谈信息检索技术3/3技术,支持2000小时的视频广播的检索;实现全内容的、基于知识的查询和检索。基于内容的音频检索:基于内容的图像检索要提取颜色、纹理、形状等特征,视频检索要提取关键帧特征,同样要实现基于内容的音频检索,必须从音频数据中提取听觉特征信息。音频特征可以分为:听觉感知特征和听觉非感知特征(物理特性),听觉感知特征包括音量、音调、音强等。在语音识别方面,IBM的ViaVoice已趋于成熟,另外剑桥大学的VMR系统,以及卡内基悔隆大学的Informedia都是很出色的音频处理系统。在基于内容的音频信息检索方面,美国的Musclefish公司推出了较为完整的原型系统,对音频的检索和分类有较高的准确率。基于内容的多媒体检索是一个新兴的研究领域,国内外都处于研究、探索阶段。目前仍存在着诸如算法处理速度慢、漏检误检率高、检索效果无评价标准、支持多种检索手段缺少等问题。但随着多媒体内容的增多和存储技术的提高,对基于内容的多媒体检索的需求将更加上升。