第九章节根据内容检索.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9章 根据内容检索 本章目标 介绍根据内容检索的基本概念。 介绍检索系统的评介方法。 讨论针对文本数据的根据内容检索问题,集中讨论向量空间表示,以及文档中匹配查询的算法、隐含语义索引和文档分类。 介绍用于对个人偏好建模的自动推荐系统。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 第9章 根据内容检索 本章目标 讨论图像检索算法中表示和检索问题。 介绍匹配时间序列和序列的基本概念。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 9.1 简介 传统的数据库查询定义为:查询是一种返回精确匹配指定要求的记录集合(或表项集合)的操作。例如,查询“[level=MANAGER] AND [age30]”, 返回的结果是有具有重要职务的年轻雇员的列表。 但在数据分析时,所感兴趣的是更一般的但不很精确的查询。 例如,假设已知一个患者的人口统计学信息(比如年龄性别等等)、血液和其他常规检查的结果,以及生物医学方面的时间序列、X-光和图像。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 为了辅助对这个患者进行诊断,医生希望了解医院数据库中是否包含类似的患者,如果有类似的患者,那么他们的诊断、治疗方法和最终结果如何? 这个问题的难点在于如何根据不同的数据类型(多元变量、时间序列和图像数据)来判断各个患者间的相似性。这类问题采用精确匹配是行不通的,因为数据库中不可能存在各项指标完全匹配的患者。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 因此,需要解决的是在数据库找出和指定查询或指定对象最相似的k个对象的各种技术问题。 可以把这种形式的检索看是交互式的数据挖掘,因为用户直接参与了探索数据集的过程—指定查询并解决匹配过程得到的结果。 如果数据集是根据内容批注的,那么检索问题就简化为标准的数据库索引问题,如果数据库没有被预先索引,我们仅有要寻找目标Q(查询模式)的一个实例,根据这个查询模式Q,我们要推论出数据集中哪些其他对象和它相近。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 这种检索方法被称为根据内容检索(retrieval by content),它的最著名应用是在文本中检索。在文本检索中,查询模式Q通常是很短的(查询词汇列表),然后在很大的文档集合匹配这个模式。 这类问题由三个基本部分组成: 1.如何定义对象间的相似尺度; 2.如何实现高计算效率的有哪些信誉好的足球投注网站算法(对于给定的相似尺度); 3.如何在检索过程中融入用户的反馈并进行交互。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 本章主要讨论第一和第三个问题,第二个问题通常是一种索引问题(一个好的索引可以极大提高效率)。 在下面的分析中,我们使用“相似”这个词,又使用“距离”这个词。对应的是相似尺度最大化和距离尺度最小化,其他章节的相似度和相异度。 根据内容检索需要解决的几个问题: 1.如何客观地评估特定检索算法的性能。 2.如何决定用以计算相似尺度的表示。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 例如,通常用颜色、纹理和相似特征来地、表示图像;用单词的出现次数来表示文本。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Clie

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档