第二讲 计算机视觉.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲 计算机视觉

(a) factorization-based structure from motion (Tomasi and Kanade 1992), (b) dense stereo matching (Boykov, Veksler, and Zabih 2001), (c) multi-view reconstruction (Seitz and Dyer 1999) (d) face tracking (Matthews, Xiao, and Baker 2007), (e) image segmentation (Belongie, Fowlkes, Chung et al. 2002) (f) face recognition (Turk and Pentland 1991a). (a) image stitching: merging different views (Szeliski and Shum 1997) (b) exposure bracketing: merging different exposures; (c) morphing: blending between two photographs (Gomes, Darsa, Costa et al. 1999 (d) turning a collection of photographs into a 3D model (Sinha, Steedly, Szeliski et al. 2008) 图像处理:图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成 计算机图形学:通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其它特征.因此,计算机图形学属于图像综合,计算机视觉属于图像分析. 模式识别:模式一般指一类事物区别于其它事物所具有的共同特征。 人工智能(AI):涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后,接下来要用人工智能方法对场景特征进行表示,并分析和理解场景.人工智能有三个过程:感知、认知和行动.. 神经生理学与认知科学:将人类视觉作为主要的研究对象.计算机视觉中已有的许多方法与人类视觉极为相似.许多计算机视觉研究者对研究人类视觉计算模型比研究计算机视觉系统更感兴趣,希望计算机视觉更加自然化,更加接近生物视觉 零件识别与定位 产品检验 移动机器人导航 遥感图像分析 医学图像分析 安全鉴别、监视与跟踪 国防系统(目标自动识别ATR与目标跟踪) 其它(体育、考古、动画 ) Sojourner 火星车前部图,中部的两个小突出是两个黑白CCD摄像机 勇气号火星车 Rocky 7 火星车 CMU月球探测实验车Nomad漫游者 * 37:33:35 课程设置: 计算机视觉 视觉基础 底层处理 中层处理 高层处理 视觉基础理论: 神经生理学、认知科学; 色度学、光学; 射影几何、矩阵理论。 图像处理: 空域图像处理; 频域图像处理; 图像特征提取。 图像分割; 相机标定; 深度估计; 运动估计。 三维重建; 目标识别。 智能机器:能够模拟人类的功能,感知外部世界并有效解决人所能解决问题的系统。 在人类的感知器官中,视觉获取的信息量最大,大约80%,因此对于发展智能机器而言,赋予机器以人类视觉功能是十分重要的。 计算机视觉:研究用计算机来模拟生物外显或宏观视觉功能的技术学科。 计算机视觉的任务是用图像创建或恢复现实世界模型,然后认知现实世界。 具体来说,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。 分为三个阶段 特征提取和区域分割 基于轮廓,纹理,颜色… 建模与模式表达 基于各种物体的抽象化模型 描述和理解 基于景物的结构知识 底层处理 中层处理 高层处理 知 识 少 多 恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,并在此基础上恢复物体的完整三维图,建立物体三维描述. 根据机器预先存贮的模型知识以及形状、色彩等特征,对于图像中各种物体进行识别,确定它们用于哪一类物体. 建立各个图像中物体的拓扑关系图,给出图像所反映景物的结构描述. 体系结构(system architecture),涉及一系列相关的课题,并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径. 图像多义性: 三维场景被投影为二维图像,深度和不可见部分的信息被丢失,因而

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档