图像检索算法研究与实现.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像检索算法研究与实现

图像检索算法的研究与实现 摘要: 在互联网高速发展的今天,人们的有哪些信誉好的足球投注网站内容已不仅仅局限与对文本的有哪些信誉好的足球投注网站,很多时候我们需要有哪些信誉好的足球投注网站图像,这就需要一种能够快速和准确的寻找图像的技术,这就是本文描述的图像检索技术。从历史的发展来看,图像检索主要经历了两个阶段,基于文本的图像检索和基于内容的图像检索。基于内容的图像检索可以分为两类,一类为物理特征,包括颜色、纹理、形状等;另一类为语义特征。本文概述物理特征,主要对语义特征展开说明。 关键字:图像检索 基于内容 基于语义 情感语义 相关反馈技术 随着多媒体技术和数字照相机,扫描仪,打印机这些数字图像设备的普及,全世界的数字图像数量正以惊人的速度增长,每天都会产生数以百万计的图像。随着互联网的发展,越来越多的人更加方便,快捷地接触到这些图像,人们面临的不是缺少图像媒体的内容,而是如何在浩如大海的图像媒体中寻找自己需要的信息。这就需要一种能够快速和准确地寻找图像的技术,这就是所谓的图像检索技术。[1] 图像检索方法的分类 从图像检索发展的历程来看主要经历了两个阶段:基于文本的图像检索和基于内容的图像检索。基于内容的图像检索实现了自动化、智能化的图像检索和管理,主要利用了图像中的一些可视化信息。“以图找图”的特点引起人们的兴趣。所用的图像特征分两类:一类为底层特征或物理特征,如颜色、纹理、形状等;另一类为高层特征或语义特征,即图像内容的语义描述及各类物理特征之问的逻辑关系。目前基于内容的图像检索技术主要以图像底层特征的相似性匹配检索为主,辅助以图像语义特征。具体分类如图1所示。[2] 图1 图像检索算法分类图 基于文本的图像检索算法 基于文本的图像检索技术是通过关键字或自由文本进行描述,查询操作是基于该图像的文本描述进行精确匹配或概率匹配。此方式简单、易于理解,但检索时要指明文本特征。由于人工注释图像的主观性和不准确性等弊端,因此这种传统的图像检索方法并不能满足用户的需要。 基于内容的图像检索算法 基于内容的图像检索把图像处理、图像识别、数据库三个领域的技术成果结合起来,融合了图像理解技术,提供了更加有效的检索途径。目前,基于内容的图像检索技术在国内外已经取得了不少的成就。 基于颜色的图像检索算法 颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征[4]。 基于纹理的图像检索算法 纹理特征通常定义为局部特征 ,它描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性 ,并不能完全反映出物体的本质属性 ,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同 ,纹理特征不是基于像素点的特征 ,它需要在包含多个像素点的区域中进行统计计算。 基于形状的图像检索算法 基于形状特征的图像检索主要是检测出目标的轮廓线或分割出目标的轮廓, 并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征。形状描述应该在尽可能区别不同目标的基础上对目标的平移、旋转和尺度变化来操作。目前, 虽然已经提出了许多形状分析方法, 但要将其有效地运用于图像检索上还有一些问题亟待解决, 如算法的效率和复杂性,形状特征的提取与描述等[5]。 基于语义的图像检索算法 语义图像检索是更合理的图像检索方式。虽然目前基于内容的物理特征的图像检索作为一项倍受关注的技术在研究和商业方面都取得了一定成果, 但由于它只利用了图像本身固有的物理信息, 因此, 它只在特定的应用领域,如指纹识别、商标检索等方面获得成功。 图2 图像内容层次模型 图2所示的图像内容层次模型中,语义位于最高层:第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟”。语义鸿沟的存在是目前基于内容的图像检索系统还难以被普通用户接受的原因。在某些狭窄的专业领域,比如指纹识别和医学图像检索中,将图像低层特征和高层语义建立某种联系是可能的,但是在广泛领域内,低层视觉特征与高层语义之间并没有很直接的联系。如何最大限度地减小图像简单视觉特征和丰富语义之间的鸿沟问题,是语义图像检索研究的核心。其中的关键技术,就是如何获取图像的语义信息[6]。 图像语义包括空间关系语义、对象语义、场景语义、行为语义和情感语义。其中情感语义是最高层的语义,通常用形容词来描述,其涉及到人的认知模型、文化背景和美学标准等。 以用户情感为线索的图像检索,目的在于令检索系统能更好地理解和把握用户心理感觉上对图像检索的要求,令检索结果更接近于用户的情感需求。此方法既有助于抓住用户观赏图像时的情感变化,为合理地分析用户在检索获取这些图像时的提问提供依据,还有助于对现有基于内容检索提供有益的补充,弥补

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档