- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3D手势识别背后技术
3D手势识别背后技术 摘要:探讨了3D手势识别需要的技术。 关键词:手势识别;3D视觉;DSP DOI: 10.3969/j.issn.1005-5517.2012.9.003 随着触摸屏技术的不断推广,用户已经适应并逐渐熟悉了与机器的互动。现在,人机互动技术已迈上了更高的台阶,进入了手势识别时代,不过这也并不是一帆风顺的。手势识别现已在娱乐及游戏市场出现,然而这种技术将对我们的日常生活产生怎样的影响呢?不妨假想一下,有人坐在沙发上,只需一挥手就能操控灯光和电视,或者汽车自动检测附近是否有行人。随着手势识别技术支持人机互动的不断深入发展,这些及其它功能将很快得以实现。手势识别技术长期以来一直采用 2D 视觉进行研究,但随着 3D 传感器技术的出现,其应用将日益广泛并多样化。 2D视觉的局限 计算机视觉技术一直在努力向堪比人类智慧的智能方向发展,以更好地了解场景。如果不能解释周围的世界,计算机就无法与人实现自然交流对接。计算机在了解周围场景方面面临的主要问题包括细分、对象表征、机器学习与识别等。由于 2D 场景表征本身存在局限性,手势识别系统必须应用其它各种提示信息才能得到包含更有用信息的更好结果。在可能性信息包含整个身体跟踪时,尽管将多种提示信息整合在一起,单靠 2D 表征也很难获得超越手势识别的任何信息。 “z”(深度)创新 向 3D 视觉及手势识别发展过程中的挑战一直都是第三坐标 —z 轴坐标的获取。人眼能看到 3D 对象,能自然识别 (x,y,z) 坐标轴,从而能够看到一切事物,而后大脑能够以 3D 影像的形式表达这些坐标轴。机器无法获得 3D 视觉的一大挑战就在于影像分析技术。目前有 3 种应对 3D 采集问题的常见解决方案,每种方案都有其独特的功能与特定的用途。这三种方案分别为:立体视觉、结构光模式以及渡越时间 (TOF)。有了这些技术提供的 3D 影像输出,就可实现手势识别技术。 立体视觉 立体视觉系统可能是最为人所熟知的 3D 采集系统。该系统使用 2 个摄像机获得左右立体影像,该影像有些轻微偏移,与人眼同序。计算机通过比较这两个影像,就可获得对应于影像中物体位移的不同影像。该不同影像或地图可以是彩色的,也可以为灰阶,具体取决于特定系统的需求。立体视觉系统目前通常用于 3D 电影,能带来低成本而又震撼人心的娱乐体验。 结构光模式 结构光模式可用来测量或扫描3D 对象。在该类系统中,可在整个对象上照射结构光模式,光模式可使用激光照明干扰创建,也可使用投影影像创建。使用类似于立体视觉系统的摄像机,有助于结构光模式系统获得对象的 3D 坐标。此外,单个 2D 摄像机系统也可用来测量任何单条的移位,然后通过软件分析获得坐标。无论使用什么系统,都可使用坐标来创建对象外形的数字 3D 图形。 渡越时间 (TOF) 渡越时间 (TOF) 传感器是一种相对较新的深度信息系统。TOF 系统是一种光雷达 (LIDAR) 系统,同样可从发射极向对象发射光脉冲。接收器则可通过计算光脉冲从发射器到对象,再以像素格式返回到接收器的运行时间来确定被测量对象的距离。 TOF 系统不是扫描仪,因为其不支持点对点测量。TOF 系统可同时获得整个场景,确定 3D 范围影像。利用测量得到的对象坐标可创建 3D 影像,并可用于机器人、制造、医疗技术以及数码摄影等领域的设备控制。 实施 TOF 系统所需的半导体器件现已开始供货。目前的器件支持实现 TOF 系统所需的处理性能、速度与带宽。 3D 视觉技术的比较 不同的应用或市场适用于不同的3D 视觉技术。图 1 显示了不同 3D 视觉技术的比较及其相关响应时间、软件复杂性、成本及准确性的相对优缺点。 立体视觉技术需要极高的软件复杂性才能获得高精度3D 深度数据,其通常可通过数字信号处理器(DSP) 或多内核标量处理器进行处理。立体视觉系统支持小巧的外形与低成本,是移动电话等消费类设备的良好选择。不过,立体视觉系统的精确度与响应时间不及其它技术,因此对于制造质量控制系统等要求高精度的系统来说不太理想。 结构光技术是包括 3D 计算机辅助设计 (CAD) 系统在内的 3D 对象扫描的良好解决方案。这些系统的相关软件复杂性可通过硬接线逻辑解决(如 ASIC 与 FPGA 等),其需要高昂的开发及材料成本。此外,该计算复杂性还可导致较慢的响应时间。在实现微观层面上的高精度方面,结构光模式技术优于其它 3D 视觉技术。 TOF 系统取得了性能与成本的平衡,非常适用于需要快速响应时间的制造与消费类电子设备等应用领域的设备控制。TOF 系统软件复杂程度通常较低,不过这些系统需要昂贵的照明部件(L
您可能关注的文档
最近下载
- 高中数学人教A版(2019)选择性必修第一册知识点归纳含答案.pdf VIP
- 农村污水治理工程施工方案与技术措施.pdf VIP
- 关于马克思主义环境法思想探究.doc VIP
- 越众集团2012年招聘简章.doc VIP
- 酒店装修施工组织设计.doc VIP
- 半导体光电子器件全套教学课件.pptx
- 日语初级~阅读理解.pdf VIP
- 人教版九年级数学第二十四章《圆》单元知识点总结.doc VIP
- 2022-2028全球及中国化学水处理设备行业研究及十四五规划分析报告.docx VIP
- CISSP Official (ISC)2 Practice Tests英文(第3版)考试认证文档p.pdf VIP
文档评论(0)