- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于独立子空间分析的场景特征表述方法# 凌然,谢昭,高隽,吴克伟** (合肥工业大学计算机与信息学院,合肥 230009) 5 10 15 20 25 摘要:针对场景分类任务中图像内容的复杂多样性,本文提出一种基于基元构造的图像编码 模型和分类方法。利用独立子空间分析方法对图像样本进行无监督学习,获取场景图像的基 元并分析图像的内部嵌入信息。对于一幅场景图像,本文采用非重叠分块策略求取基元响应, 并借助于空间金字塔特征汇聚,得到场景图像的编码表征。本文利用一对多支持向量机分类 方法进行多类别场景分类,并与 Bag-of-Words 模型进行对比实验,实验结果表明,本文方 法能有效实现场景图像的分类问题,且具有较为稳定的分类性能。 关键词:独立子空间分析;图像基元;图像编码;空间金字塔汇聚;场景分类 中图分类号:TP 391 Feature Extraction and Scene Classification using Independent Subspace Analysis LING Ran, XIE Zhao, GAO Jun, WU Kewei (School of Computer and Information, Hefei University of Technology, Hefei 230009) Abstract: Due to the complexity and diversity of scene contents, this paper presents an approach for image coding and scene classification based on unsupervised learning of texton bases and embedding statistics without semantic labeling. The learning process is implemented by applying Independent Subspace Analysis to randomly sampled image patches. For a given scene, we divide it into a sequence of non-overlapping patches and compute the texton responses of all the patches using the trained ISA network. Scenes are coded through the mean responses pooled over spatial pyramid sub-regions. Experiment shows the proposed method performs efficiently and is more stable than Bag-of-Words model on OT outdoor scene dataset with One vs. Rest multi-class SVM classifier. Key words: Independent Subspace Analysis (ISA); texton bases; image coding; spatial pyramid pooling; scene classification 30 0 引言 场景分类是计算机视觉(Computer Vision)和图像理解(Image Understanding)领域中 的一个重要研究方向,其本质就是对场景图像进行某种定量分析,用以判断场景图像的语义 类别。但是由于场景图像自身的复杂性,使得基于图像内容的识别方法在场景分类任务中存 35 40 在相当的困难,往往需要大量的前期语义标记工作以提供学习过程的强监督性。近年来较为 有效的且常用的场景分类方法有基于 Gabor 滤波的全局语义建模法 [1,2]和基于词汇包 (Bag-of-words)的局部语义概念法[3,4],这两种方法均无需对场景内容进行分割标注,前者 利用 Gabor 滤波器模拟人类视神经元感受野(receptive field)的方向选择性响应模式提取图 像特征,而后者则利用聚类方法获取视觉词汇(visual vocabulary),利用统计直方图的方 法进行场景图像的表征。 基金项目:国家自然科学基金项目;教育部博士点基金项目(20090111110015)。 作者简介:凌然(1988-),女,硕士研究生,主要研究方向:图像理解、信号处理、模式识别 通信联系人:谢昭(198
文档评论(0)