第六讲结构数据查询与图像检索.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六讲结构数据查询与图像检索

第六讲 结构数据查询与图像检索 回顾 查询扩展 Local Analysis local clustering local context analysis Global Analysis 相似词典 统计词典 性能评估 查全与查准 查全/查准曲线 F标准 回顾-关联聚类 记fij为项si在文档dj(? Dl )的频率。令M = (mij ),其中mij = fij ,并记Mt为M的转置矩阵,称S = MMt为局部项-项关联矩阵。 回顾-相似词典 每个索引项fi用一个向量(wi1 , wi2 , …, wiM )表示。其中 索引项fi与索引项fj的相似性如下定义: 回顾-相似词典 用索引项向量表示查询 计算sim(q, fi) 根据sim(q, fi) 挑选值最大的前r个索引项来扩充查询 回顾-查全和查准 查全:检索结果中与查询相关的文档占所有相关文档的比率 查准:检索结果中与查询相关的文档占检索结果的比率 回顾-窜改查准 实际上对查询而言,不肯能刚好有对应的十一个查全值,因此得不到对应的查全值。 例如:r = 0.33, 0.75 记rj, j ? (0, 0.1, 0.2, 0.3, …, 1),对应rj的查准可如下计算: 回顾-F标准 回顾-Scatter/Gather 内 容 结构数据查询 图像检索 结构数据查询 数据库简介 数据模型 关系数据查询 SQL 数据、信息和数据处理 数据 一种物理符号序列 信息 具有价值的数据 数据处理 对各种类型的数据进行收集、存储、分类、计算、加工、检索和传输的过程 三个阶段 手工数据处理 文件系统 数据库系统 文件 VS 数据库 文件(File):有关某个组织、个人、地域或主题的记录或文档的集合 手写文件 计算机文件 数据库(Database):相关记录和这些记录之间关系的集合 书目数据 统计数据 商业数据 多媒体数据 数据库-定义 A Database is a collection of stored operational data used by the application systems of some particular enterprise. (C.J. Date) 纸质“数据库” 如报纸、书、刊物等,然仍是信息发布、传播和保存的重要手段 基于文件的数据处理系统 早期商业数据处理模式 数据库管理系统 Database Management Systems (DBMS) 数据库应用实例 假定我们要构建一个系统来存储以下信息: 学生 课程 教授 学生选了什么课程,教授教了什么课程 不用 DBMS 当然可以! 用文件的方式保存数据: students.txt courses.txt professors.txt 那么我们可以编写C、C++ 或是 Java 程序来实现特定的任务 不用 DBMS(续) 记录 “张三” 选了 “智能信息检索” 问题 系统崩溃: 会造成什么后果 ? 非常大的数据集合 (比如 50GB) 会出现什么情况? 多个用户同时访问 两个人同时写数据 … 数据库管理系统(DBMS) 从文件系统到数据库管理系统 文件处理系统的问题 数据冗余和不一致 相同信息可能在多个文件中重复存储 同一数据的不同副本可能的不一致,这将导致数据的不一致 数据访问困难 传统的文件处理环境不能支持以一种方便而有效的方法去获取所需数据,需要开发通用的、能对变化的需求作出更快反映的数据检索系统 数据孤立 由于数据分布在不同文件中,这些文件又可能具有不同的格式,因而编写新的且检索特定数据的应用程序非常困难。 从文件系统到数据库管理系统 文件处理系统的问题 完整性问题 数据库中所存数据的值必须满足某种一致性约束。如要求银行帐户的余额不少于10元。开发者通过在不同应用程序中加入适当的代码来实现系统中的这些约束。但是,当新的约束加入时,很难通过修改程序来实现这些约束。尤其是当约束涉及到不同文件中的多个数据时,问题就变得更加复杂。 原子性问题 一旦执行某个操作计算机系统发生故障时,数据应该恢复到与故障发生前一样的状态,即操作要是原子的。例如从帐户A向帐户B转10000元,如果在从A扣除10000之后而在向B中转入10000元之前,系统崩溃了? 传统的文件处理系统,难于保证操作的原子性 从文件系统到数据库管理系统 文件处理系统的问题 并发访问问题 为了提高系统的总体性能以及加快访问速度,许多系统允许多个用户同时更新数据。在这种情况下,并发更新操作相互影响,可能会导致数据的不一致。 客户X和Y同时从A帐户(500元)取款,分别取出50元和100元,假定取款操作对应执行的程序是读取帐户余额,在其上减去取款的金额,然后再写回结果。

文档评论(0)

138****7331 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档