- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
媒体认知课程中智能感知技术教学方法探究
媒体认知课程中智能感知技术教学方法探究 摘 要:媒体与认知是电子系在课程改革中提出的一门全新的核心必修课程。文章阐述如何探索并建立一种智能感知技术及相应的教学方法,说明设计开发一套以三维重建技术为基础的智能感知教学内容及教学手段的过程,目标是培养学生的创新性思维,培养智能感知学科的人才。 关键词:媒体认知;智能感知;三维重建; RealSense平台 1 背 景 随着电子信息技术日新月异,电子信息教学领域也面临着全新的挑战,需要培养具有全方位视野和超强能力的新一代工程师及领导者。本着这一目标,清华大学电子系自2008年开始着手进行课程改革,通过改革课程体系将原有课程重新整合,从学科范式的角度整理出电子工程本科教育的知识体系结构,从而梳理出新的本科课程体系,形成了电子信息领域学科地图。 媒体与认知是清华大学电子信息学科在课程体系改革过程中提出的一门重要的必修课程[1-2]。我们结合清华大学电子工程系在该领域研究的基础、优势和创新性成果,有针对性地将已有科研成果转化为教学内容,通过建设一套完整、全面的涵盖人机感知交互、媒体信息处理、虚拟现实及信号处理领域的探索前沿型实验教学平台,培养学生的智能感知技术开发能力;同时,采用集体创新培养和个人研究探索相结合的方式,最终达到理工与人文、技术与艺术、感知与思考的高度融合,使学生成为具有国际一流水平的、兼具科研创新能力和未来探索精神的领军型人才。 在2017年开设的媒体与认知课程内容中,我们参考国内外诸多科研院所及名企与智能感知技术相关的项目内容,结合本系在该领域研究的基础优势和创新性成果,建设了一套基于智能感知的物体三维重建项目。通过对该项目的学习和研究研发,学生能够获得智能感知技术的基础理?知识和开发能力,力争成为具有国际领先水平的智能感知技术专业人才。 2 基于智能感知的物体三维重建项目 物体三维重建是计算机图形学、计算机动画、计算机视觉、医学图像处理、虚拟现实、机器人定位等领域的核心技术,近年来随着计算机硬件的快速发展,包括CPU主频的提高、GPU及GPU阵列的快速迭代,计算量已经不再是瓶颈,因此三维重建技术也开始被重视。 在许多三维重建的技术应用中,机器人感知与定位中的建图部分具有一定的代表性,主要原理是利用相机每一个位姿下的图片恢复出物体或场景的三维形状。目前,主流的三维重建系统包括Kinect Fusion[3]、Elastic Fusion[4]、Kinitinuous[5]、 BundleFusion[6]等,主要使用GPU加速实现较好的效果。 我们提出的基于智能感知的物体三维重建项目主要包括两个部分:RGBD重建基线系统及其增强系统。 2.1 RGB-D重建基线系统 RGB-D重建基线系统中包含基本的三维重建功能以及实时功能,但由于硬件条件所限,不能很好地进行实时点云查看,通常用于离线数据集的方式重建,方法是先启动扫描程序,利用RGB-D相机扫描一系列的RGB 图片与深度图并保存,然后启动重建系统完成重建。 1)系统架构。 RGB-D重建系统工作流程图如图1所示。整个系统分为前端和后端两部分,前端负责将RGBD图像生成点云并利用图2所示的 PNP(perspective-n-point)算法估计出相邻两帧之间的刚体变换矩阵,从而得到当前这一帧相对于上一帧的位姿变换,当此位姿变换满足预设的阈值,将这一帧定义为关键帧。对于数据集版本,则在得到所有关键帧后进行图优化且提取优化后的相机位姿,最后将所有的点云进行拼接。 2)位姿计算方法。 由于计算量较大,我们在使用PNP算法时并未针对整幅图片直接操作,而是首先进行特征提取与匹配,其中特征提取选用ORB(oriented fAST and rotated brief)方法,具有尺度和旋转不变性,此外在得到相邻两个关键帧的匹配点之后需要进行筛选,降低PNP算法的重投影误差。 3)后端图优化。 在得到一系列关键帧后,需要对其拼接,但相关信息只有相邻两帧之间的位姿变化,因此需要进行局部优化。传统方式是采用拓展卡尔曼滤波,但场景变化会引起状态变量的长度变化,因此我们采用图优化方式。方法是将相机位姿作为图的定点,将两帧之间的变换作为边,从而建立一个稀疏图,进而定义能量函数为各个边之间的投影误差,优化的目的是使得这个误差函数最小,具体采用第三方库实现。 4)系统效果。 本系统的采集设备是realsense F200[7],实际设备的最大有效距离为1.2 m。 将realsense设备作为前端扫描设备扫描玩偶,对得到的数据采用RGB-D重建系统进行离线重建,得到图3所示的效果。 2.2 RGB-D重建增强系统 除了
您可能关注的文档
最近下载
- 灭火救援应用估算与火场供水组织方法(07版).pptx VIP
- ISO20000实例文件运维服务目录模板5.pdf VIP
- 招标代理机构电子化采购档案管理方案.docx VIP
- 急性肺栓塞诊断和治疗指南(2025版)解读PPT课件.pptx VIP
- ISO20000实例文件-设计和转移新服务或变更的服务-模板2.docx VIP
- 灭火救援力量估算方案.pptx VIP
- ISO20000实例文件-CMDB审计报告-模板2.docx VIP
- 消防专业论文-液化石油气储罐火灾爆-炸事故处置中安全距离的估算.docx VIP
- 震裕科技深度研究报告:精密级进冲压模具佼佼者,深度布局人形机器人赛道.pdf VIP
- ISO20000实例文件-服务报告-模板2.docx VIP
文档评论(0)