中英文对照外文翻译毕业论文:使用Co – SVM对图像检索进行主动学习推荐.doc

中英文对照外文翻译毕业论文:使用Co – SVM对图像检索进行主动学习推荐.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中英文对照外文翻译毕业论文:使用Co – SVM对图像检索进行主动学习推荐

中英文对照外文翻译毕业论文:使用Co – SVM对图像检索进行主动学习 题 目: Rapid and brief communication Active learning for image retrieval with Co-SVM专 ?业? 班? 级: 学号: 姓?名:指 导 教 师: 学 院 名 称:快速和简单的沟通 使用Co ? SVM对图像检索进行主动学习 摘 要 在相关反馈算法中,选择性抽样通常用来减少标签成本以及探讨未标记的数据。在本文中,为了提高图像检索选择性抽样的表现,我们提出了一个积极的学习算法,这个算法被称为Co ? SVM。在Co ? SVM算法中,色彩和纹理很自然的当做一幅图像足够的、不相关的试图。我们能够分别在颜色和纹理的特征子空间上学习SVM分类器。因此,这两个分类器被用于分类未标记的数据。当两个分类器分辨出不同时,这些未标记的数据就成为了选择标签。实验结果表明我们提出的这种算法对图像检索是非常有利的。 1 前 言 相关反馈是提高图像检索性能的一种重要的方法[1]。对于企业大型图像数据库检索的问题,标记图像总是比未标记的图像罕见。当只提供一个小的标记图像时,如何利用大量未标记的图像去增强学习算法的性能已成为一个热门话题。Tong 和Chang提出了一种主动学习的算法,这种算法叫做SVMAct ive [2]。他们认为处于边界的样本是最丰富的。因此在每一轮相关反馈中,能作为标签返回给用户的是那些最接近支持矢量边界的图像。 通常情况下,图像的特征表示是一个组合的,多样化的功能,如颜色,纹理,形状等。例如,对于指定的图像,不同特征的重要性是显著不同的。另一方面,重要性相同的特征对于不同图像也是不同的。例如,通常情况下,颜色是比形状更为突出的图像。然而,检索结果是所有特征的平均作用,而忽略了个别特征鲜明的特性。一些研究显示多视角的学习比单视图的假说要好[3,4]。 在本文中,我们把颜色和纹理作为图像描述的两个充分的、不相关的图像特征。受SVMAct ive的启发,我们提出了一种新的主动学习法,这种方法叫做Co?SVM。首先,在不同的特征表示上分别学习SVM分类器,然后这些分类器用来从未标记的数据中选择最翔实的合作样本,最后,这些翔实样本将作为标签返回给用户。 2 支持向量机 作为一个有效的二元分类器,将SVM用于图像检索相关反馈的分类是特别适合的[5]。随着标签图像,SVM学习一个边界(即超平面),就是从带有最大利润的不相关的图片中分离相关图像。处于边界一侧的图像被认为是相关的,而处于另一侧的则被认为是不相关的。给定一个标记图像集(x1,y1), ,xn,yn , xi 是一幅图像的特征描述,yi ∈ ?1,+1 是类标签(- 1表示正极,+1表示负极)。训练SVM分类器会导致下面的二次优化问题: S.t.: 其中C是一个常数,k为内核的功能。边界(超平面)是 其中满足任何支持向量的条件是: 该分类函数可以写为: 3 合作支持向量机 3.1. 双试图计划 假设图像的颜色特征和纹理特征是两个互不相关的观点是自然的也是合理的。假设xc1, ,ci , t1 , ,tj 是一幅图像的特征表示,其中 {c1, ,ci}和 t1, ,tj 分别是颜色属性和纹理属性。为简单起见,我们定义特征表示空间V VC × VT , 而{c1, ,ci}∈VC , t1, ,tj ∈VT。为了尽可能找到相关的图像,像一般相关反馈的方法,在第一阶段的联合视图V中支持向量机用于学习标记的样本分类h。通过h未标记集被分为正面和负面的.然后m的正面形象将返回到用户的标签。在第二个阶段,通过VC颜色视图和VT纹理视图SVM用于在标记样本上分别学习hc和ht两种分类器 。对于两个分类有分歧的未标记的样本推荐给用户做标签,并将其命名为争夺样本。也就是说,争论样本以HCCP的分类划分为阳性,以HTTN的分类划分为阴性。或以HCCN的分类划分为阴性,以HTTP的分类划分为阳性。对于每一个分类器,样品之间的超平面(边界)的距离可以被看作信心程度。越大的距离,越高的信任度。为了确保用户可以标签最翔实的样本,在两种意见上接近超平面的样本被推荐给用户作为标签。 3.2. 多视图计划 在两个个案中,提出的算法很容易扩展到多视图计划。假设,一个是彩色图像特征被表示为V V2的× × V1的× Vk,钾 2条所界定,每个VI,i 1,钾对应的彩色图有不同的看法。然后在每一个视图上可以学习K向量机分类。所有未标记的数据被 k 支持向量机分类器归类为阳性 + 1 或阴性 ?1。定义置信度Dx ____ki1signhix _____。置信度

文档评论(0)

allap + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档