第1章图像处理与计算机视觉技术综述.ppt.pptVIP

第1章图像处理与计算机视觉技术综述.ppt.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章图像处理与计算机视觉技术综述.ppt

* * * * * 1.2.1 马尔视觉计算理论 1. 视觉是一个复杂的信息加工过程 视觉是一个远比人所想象更为复杂的信息加工任务和过程,而且其难度常不为人们所正视 为理解视觉这个复杂的过程,要解决两个问题 视觉信息的表达问题:某些信息是突出的和明确的,另一些信息则是隐藏的和模糊的 视觉信息的加工问题:对信息处理、分析、理解,将不同表达形式转换,逐步抽象 * 1.2.1 马尔视觉计算理论 2. 视觉信息加工的三个要素 ① 计算理论;② 算法实现;③ 硬件实现 ① 计算理论 可计算性问题:一个任务要用计算机完成,它应该是可以被计算的 一般对于某个特定的问题,如果存在一个程序,对于给定的输入,这个程序都能在有限步内给出输出,这个问题就是可计算的 * 1.2.1 马尔视觉计算理论 2. 视觉信息加工的三个要素 ① 计算理论 目前视觉的可计算性常指对计算机给定输入,能否得到人类视觉可获得的类似结果 两方面的研究内容:① 计算的是什么以及为什么要计算它们;② 提出一定的约束条件,它们可唯一地确定最终得到的运算结果 * 1.2.1 马尔视觉计算理论 2. 视觉信息加工的三个要素 ② 算法实现 需要给加工所操作的实体选择一种合适的表达 选择加工的输入和输出表达 确定完成表达转换的算法 ① 一般情况下可以有许多可选的表达 ② 算法的确定常取决于所选的表达 ③ 给定一种表达,可有多种完成任务的算法 * 1.2.1 马尔视觉计算理论 2. 视觉信息加工的三个要素 ③ 硬件实现 有了表达和算法在物理上如何实现算法也是必不可少的 算法的确定常依赖于物理上实现算法硬件的特点 同一个算法也可由不同的技术途径实现 * 1.2.1 马尔视觉计算理论 2. 视觉信息加工的三个要素 计算理论:如何由系统的输入求出输出。视觉系统输入的是二维图像,输出则是三维物体的形状、位置和姿态,任务是研究如何建立输入输出之间的关系和约束,如何由二维灰度图像恢复物体的三维信息。 算法实现:如何表达输入和输出信息,如何实现计算理论所对应的功能算法,以及如何由一种表示变换成另一种表示。 硬件实现:用硬件实现上述表达和算法的问题。 * 视觉信息加工三要素的含义 要素 名称 含义和所解决的问题 1 计算理论 什么是计算目的,为什么要这样计算 2 表达和算法 怎样实现计算理论,什么是输入输出表达,用什么算法实现表达间的转换 3 硬件实现 怎样在物理上实现表达和算法,什么是计算结构的具体细节 1.2.1 马尔视觉计算理论 * 2. 视觉信息加工的三个要素 它们之间有一定的逻辑因果联系,但并无绝对的依赖关系 实际上看成两个层次更恰当 一旦有了计算理论,表达和算法与硬件实现是互相影响的 1.2.1 马尔视觉计算理论 * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 (1) 基素表达(primal sketch) 一种2-D表达,它是图象特征的集合,描 述了物体上属性发生变化的轮廓部分 只用基素表达不能保证得到对场景的唯一解释 * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 (2) 2.5-D表达(2-D sketch) ① 将物体可见面正交 投影分解成单元表面 ② 用法线代表单元表 面的取向 ③ 将各法线画出,叠加 于物体轮廓内可见面上 * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 (2) 2.5-D表达(2-D sketch) 本征图,表示了物体表面面元的朝向 可将2.5-D图转化成(相对)深度图 既表达了一部分物体轮廓的信息(这与基素表达类似)表达了以观察者为中心、可观察到的物体表面的取向信息 与人所理解的3-D物体一致(可见物体轮廓以内目标的3-D信息,如边界、深度,反射特性等) * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 (2) 2.5-D表达(2-D sketch) 将2.5-D图转化成(相对)深度图 给定z(x, y)对x和y的偏导p和q,理论上讲可通过在平面上沿任意曲线的积分来恢复z(x, y) 为最小化误差可选择z(x, y)满足 * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 (3) 3-D表达(3-D representation) 以物体为中心(即也包括了物体不可见部分)的表达形式 在以物体为中心的坐标系中描述3-D物体的形状及其空间组织 ① 空间占有数组,② 单元分解,③ 几何模型 广义圆柱体表达方法 * 1.2.1 马尔视觉计算理论 3. 视觉信息的三级内部表达 从计算机或信息加工的角度来说,视觉可计算性问题可分成几个步骤,步骤之间是某种表

文档评论(0)

aena45 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档