基于内容图像检索中的语义鸿沟问题作者:温超,耿国华,WENChao,GENGGuo-hua作者单位:西北大学,信息科学与技术学院,陕西,西安,710069刊名:西北大学学报(自然科学版)英文刊名:JOURNALOFNORTHWESTUNIVERSITY(NATURALSCIENCEEDITION)年,卷(期):2005,35(5)被引用次数:4次参考文献(11条)1.SMEULDERSA.WORRINGM.SANTINISSContent-basedimageretrievalattheendoftheearlyyears2000(12)2.EAKINSJPRetrievalofstillimagesbyconterd20043.GORKANIM.PICARDRWTextureorientationforsortingphotosataglance19944.VAILAYAA.FIGUEIREDOM.JAINETALAKImageclassificationforcontent-basedindexing2001(01)5.COLOMBOC.DELBIMBOA.PALAPSemanticsinvisualinformationretrieval1999(03)6.何恒.余英林一种用于图像检索的综合模糊直方图方法[期刊论文]-中国图象图形学报2001(07)7.RUIY.HUANGTS.MEHROTRASContent-basedimageretrievalwithrelevancefeedbackinMARS19978.张磊.林福宗.张钹基于支持向量机的相关图像检索算法[期刊论文]-清华大学学报(自然科学版)2002(01)9.朱兴全.张宏江.刘文印iFind:一个结合语义和视觉特征的图像相关反馈检索系统[期刊论文]-计算机学报2002(07)10.晏春莉.耿国华.周明全图像数据库中基于颜色的特征提取和度量算法[期刊论文]-西北大学学报(自然科学版)2000(03)11.王惠锋.孙正兴.王箭语义图像检索研究进展[期刊论文]-计算机研究与发展2002相似文献(10条)1.期刊论文席彩丽.XiCaili基于内容的图像检索高层语义处理方法-图书情报工作2009,53(9)从图像语义层次描述方式、图像语义抽取方法两个方面对利用语义进行图像检索的研究状况进行总结,提出建立语义模板用于支撑高层语义检索,同时应用多层次的相关反馈方法建立和修正图像低层特征与高层语义间的联系,缩小图像检索过程中的语义鸿沟,达到一定程度语义检索的目的.2.学位论文王小玲基于内容的图像检索技术研究2006随着数字图像以及网络技术的不断发展,基于内容的图像检索技术已经成为计算机视觉与多媒体计算的重要研究领域。基于内容的图像检索技术根据图像内容,如色彩、形状、纹理等特征或者这些特征的组合,在图像数据库中检索与查询图像相似的图像。图像检索技术的关键问题是图像特征的表示方法与图像特征相似性度量方法.本文主要围绕这两方面的问题展开研究。主要工作与创新点包括以下四个方面:第一,对图像内容特征表示方法进行了研究,包括色彩与形状表示方法.针对传统颜色直方图无法反映色彩空间信息,容易导致误匹配的不足,我们提出了两种新的颜色直方图检索方法:平均面积直方图(AverageAreaHistogram)与主要面积直方图(ProminentAreaHistogram).这两种直方图根据每个颜色所形成的不连通区域的平均面积与主要面积大小建立直方图的bins,能够反映色彩的空间分布,对图像旋转、缩放具有鲁棒性。实验表明,这两种直方图能够区分色彩相似但空间分布不同的图像,提高直方图检索性能。利用少量色彩能够集中反映对象结构基本组成的特点,我们提出了一种新的基于区域的图像检索方法。通过降低色彩等级,分割出能够表示对象形状基本组成的区域序列.这些序列,能够表达一定的对象语义。仿真实验表明,本文提出的形状检索算法简单有效,取得了较好的检索效果。第二,对线性与非线性方式的图像特征相似性度量方法进行了研究。首先,本文引入层次分析法(AnalyticHierarchyProcessAHP)为多个内容特征分配权重,以线性方式实现图像相似性度量。对内容特征变化范围相似的对象,权重可以重用。实验结果表明,该方法对图像检索是适用、有效的。其次,为了反映图像低层特征与高层语义之间存在的非线性映射关系,本文提出了基于模糊逻辑的图像检索系统。使用模糊语言变量描述对象特征之间的相似性程度,以非线性方式推理图像相似性。模糊规则能够反映用户对客观对象的认知,从而反映不同用户主观感知差异。外观特征变化相似的对象可以适用相同的规则,系统具有良好的鲁棒性。试验表明,系统能够为用户提供个性化的检索服务,缩小“语义鸿沟”,提高检索性能。第三,本文基于虚拟相关反馈(Pseudo-RelevanceFeedbackPRF)技术,提出了一种新的自动相关反馈检索方法:外部自动相关反馈(OuterAutoRelevanceFeedbackOARF).基于图像内容特征距离,应用K_均值聚类方法,从初始检索结果中自动选择正例图像。以每幅正例图像作为新的查询,实施传统检索,然后对检索结果进行融合。将用户从传统相关反馈检索方式的负担中解放出来。试验表明,本文所提出的外部自动相关反馈技术能够显著提高原始检索算法的性能,缩小“语义鸿沟”。第四,本文对基于语义的图像检索方法进行了研究,实现了基于粗糙集(RoughSetRS)方法的风景图像分类系统。我们从风景图像中抽取2种与对象密切关联的主要色彩和这些色彩形成区域的尺寸、空间位置以及纹理特征,将风景图像转化为上述特征描述的对象。系统可以自动发现图像分类的知识,更加灵活地处理风景图像外观变化以及噪声。实验结果表明,系统产生的规则对4类风景图像的平均分类正确率达到85﹪。3.学位论文杨德三基于内容的图像检索技术研究2008随着多媒体技术和Internet网络的迅速发展,人们获取图像的来源不断扩大和丰富。图像的应用和传播越来越广泛,但随之而来的是图像信息自身的无序化问题越来越突出。因此对日益庞大的图像信息库进行有效的组织、管理和检索显得日益重要,建立高效的图像管理系统成了亟待解决的问题。这种需求推动了图像检索技术的研究和发展。基于内容的图像检索作为一种新兴的技术已经成为新的研究热点,受到研究者的青睐。基于内容的图像检索包含两个层次:底层视觉特征和高层语义特征。由于提取语义特征存在很大困难,目前大多数的研究都是基于底层视觉特征,并研发出相应的系统。但这些系统普遍存在视觉特征和语义特征之间的不对称问题,也就是语义鸿沟。专家指出语义鸿沟的彻底解决依赖于模式识别、图像理解、计算机视觉、人工智能等领域技术上的突破,目前可行的办法就是找到尽量缩小语义鸿沟的技术。要缩小语义鸿沟,一般从以下三个关键技术进行突破:一个是底层视觉特征的提取和描述,此为图像检索的根本和基础;另一个为检索算法,好的算法能大大缩小时间和空间复杂性,更重要的是能保证良好的检索率;最后一个是相关反馈技术,通过人的参与,改善检索结果,目前在图像检索和信息检索领域广泛应用。本文对基于内容的图像检索的关键技术进行了深入研究。在简要的介绍了该领域的研究背景、意义、国内外应用研究现状之后,详述了通用的底层视觉特征的提取方法,并且探讨了相关反馈技术的发展。针对查准率低和语义鸿沟问题,提出了一种新的相关反馈方法。该方法可以避免为图像标注关键字的麻烦,只需要用户对检索结果按个人兴趣排序。通过计算系统输出顺序与用户排序的Rnorm值,系统能够自动调整各个特征的权重。实验表明重排序相关反馈机制较Rui方法在检索效果方面有很大提高,能够输出比较符合用户检索需求的结果,同时可以在一定程度上降低计算复杂度。本文的研究只是对检索起到了改善的作用,彻底解决语义鸿沟还需要相关领域的研究取得质的突破才能有更好的办法。4.期刊论文向培素.XIANGPei-su一种基于近邻半监督聚类算法的图像检索系统研究-西南民族大学学报(自然科学版)2010,36(4)为了解决基于内容的图像检索(Content-BasedImageRetrieval,CBIR)中存在的语义鸿沟问题,本文提出了一种CBIR检索模型,在模型中使用了基于近邻传播的半监督聚类算法和语义传播的算法,通过近邻半监督算法对图像库中的图像进行聚类,根据示例图像的视觉特征相似度在对应的聚类图像中进行相似度检索,在检索的结果中根据用户提供的关键字进行关键字标注检索,最后根据用户的反馈,通过语义传播算法对图像库中的图像进行自动语义标注.实验表明文中的模型是可行的,其检索效果受到反馈次数的影响.5.期刊论文乔荣华.周明全.耿国华.QIAORong-hua.ZHOUMing-quan.GENGGuo-hua基于语义分类的文物图像标注研究-计算机技术与发展2007,17(7)由于图像数据中普遍存在的语义鸿沟问题,传统的基于内容的图像检索技术对于数字图书馆中的图像检索往往力不从心.而图像标注能有效地弥补语义的缺失.文中分析了图像语义标注的现状以及存在的问题,提出了基于语义分类的文物语义标注方法.算法首先通过构建一个Bayes语义分类器对待标注图像进行语义分类,进而通过在语义类内部建立基于统计的标注模型,实现了图像的语义标注.在针对文物图像进行标注的实验中,该方法获得了较好的标注准确率和效率.6.学位论文李晶基于内容的图像检索相关技术的研究2009随着多媒体的推广和应用,以及信息和网络技术的发展,产生了大量的各式各样的视觉内容。图像是这些视觉内容中的一个重要的组成部分。它能够直接形象的表达信息。但如何从海量的图像中检索出自己感兴趣的内容成为当前人们面临的一个重要问题。因为传统的基于文本的检索已不能满足人们的需求。基于内容的图像检索正是解决此类问题的一个行之有效的方法。而本文所作的研究正是围绕基于内容的图像检索相关方法的探讨和实验。通过学习器学习训练样本的特性。在测试阶段用学习器对待测数据进行分类。br 在基于内容的图像检索中,图像的低层特征与高层语义之间一直存在“语义鸿沟”问题,这是一个比较困难的问题。用支持向量机解决语义关联问题是目前研究的热点,支持向量机被认为是统计学理论中一种最具优势的模式识别方法。用支持向量机进行图像分类具有十分优秀的分类性能。然而传统的SVM是一种有监督的学习方法。利用已标记的样本训练分类器,对未知样本进行分类。人们更多的想有效利用大量的未标样本。半监督学习算法的直推向量机(TSVM)正是基于以上的想法设计的。并且本文将主动学习隔入其中,选择对于学习过程中最为有用的样本进行标注,这些样本能够最大程度减少分类误差。br 本文所作的主要工作如下:1.对基于内容的图像检索进行概述。研究了图像的各种特征以及提取方法。2.关于SVM解决多类分类问题,将“一对多”方法进行改进。提出适合本文实验的多类分类方法。3.运用SVM解决图像中低层特征与高层语义之间的语义关联问题,如何选取核函数,来提高语义关联的性能。并对其中的多特征融合的技术进行实验。实验说明基于多特征的语义分类优于单一特征。4.介绍一种较新颖的半监督学习方法直推式支持向量机(TSVM),本文对半监督学习中引入主动学习的方法进行探索,提出一种基于TSVM与主动学习相融合的算法,并将其应用到小样本图像检索中,对进行相关实验。5.设计了一个基于内容的图像检索的框架,用于对本文所涉及的相关算法进行实验。7.学位论文王长虎互联网环境下大规模图像的内容分析、检索和自动标注的研究2009随着互联网和数字摄影设备的普及和发展,互联网上的图像数量飞速增长。一方面,互联网上的海量图像吸引了越来越多的用户;另一方面,越来越丰富的图像资源使用户难以在浩如烟海的数据中找到其真正需要的信息。这使得快速、有效的图像检索技术成为商业界和学术界的一个重要研究方向。当前,互联网图像检索主要分成两大类:基于文本的图像检索(text-basedimageretrieval,简称TBIR),和基于内容