- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
利用深度学习从RGB-D视觉和深度机器人传感器估算物体物理
属性
RicardoPedreirasCardosoPlinioMoreno
InstitutoSuperiorTécnicoInstituteforSystemsandRobotics
UniversityofLisbonInstitutoSuperiorTécnico
Lisboa,PortugalUniversityofLisbon
ricardoreisc@tecnico.ulisboa.ptLisbon,Portugal
plinio@isr.tecnico.ulisboa.pt
本Abstract—惯性质量在机器人应用如物体抓取、操作和模辨率的厚度掩模以提高估计准确性[1]。然而,在实践
拟中起着至关重要的作用,为规划和控制提供了强大的先验信中这些方法几乎没有用处,因为它们要求机器人首先
译息。在交互前准确估计物体的质量可以显著提升各种机器人任识别出他们希望与其交互的对象的边界框,这是一个
中务的性能。然而,仅使用视觉传感器进行质量估计是一个相对耗时的过程,通常需要从物体周围多个视角进行观察。
较少探索的领域。本文提出了一种结合深度图像中的稀疏点云
1数据与RGB图像来估算物体质量的新方法。我们评估了一系深度传感器可以避免这一限制,因为它们可以从度量
v
9列点云处理架构以及仅使用RGB的方法。为了克服训练数据深度中消除对象比例的歧义。但是,之前的工作很少
2有限的问题,我们使用ShapeNetSem3D模型创建了一个合成
0数据集,并通过Kinect相机模拟了RGBD图像。这些合成数直接使用它们,主要是由于集成深度信息、RGB图像
5据用于训练一个生成密集深度图的图像生成模型,然后我们将和质量的数据集稀缺。因此,当前没有模型能够充分
0
7.该模型用于增强现有的带有质量值的图像数据集。我们的方法利用深度数据与图像数据的结合,在广泛的对象范围
1
0在所有评估指标上显著优于现有基准。数据生成以及深度估内进行质量估计。
23
5计器和质量估计器的训练均可在线获取。
2为了解决这些限制,我们建议通过增加深度信
:
vI.介绍息来扩充现有的RGB-质量对数据集。我们首先在一
i
x规划如何抓取物体得益于在与物体物理接触前准个由RGB和深度图像对组成的合成数据集上微调
r
a确估算其质量。虽然可以直接使用秤来测量质量,但GLPDepth模型[19],然后将深度估计应用于整个数
在动态或非结构化的环境中,这种方法是不切实际的,据集。我们开发了一种多模态架构,该架构以RGB图
在这些环境中,往往无法在抓取前进行物理互动。相像和稀疏点云作为输入,并输出质量预测(千克)。我
反,利用摄像机提供的视觉信息来估算物体的质量具们提出了几种架构的变体,并在扩充的数据集上训练
有显著的优势。基于视觉的方法允许机器人在没有先它们。我们还探讨了同时训练模型进行点云重建是否
前接触的情况下预测质量,从而在抓取或提升物体时能提高其质量估计能力。我们的结果显示,我们的方
能够更快地做出更适应性的决策。此外,这种方法更法在所有评估指标上显著优于先前的方法,并且同时
加灵活,因为它不需要专门的硬件如力传感器或秤。执行点云重建不会显著改变模型的预测能力。
仅从RGB数据进行质量估计的一个主要挑战在
您可能关注的文档
- SV-DRR-使用扩散模型进行高保真新视角 X 光合成-计算机科学-X 射线图像生成-扩散模型-医学图像增强.pdf
- 硬件高效的 TinyML 神经符号 AI 应用中的可计算概率推理-计算机科学-神经符号人工智能-概率推理.pdf
- 基于极学习机的 IoMT 设备 DDoS 攻击检测系统-计算机科学-医疗物联网-攻击检测.pdf
- 验证 LLM-基于 LLM 的机器人预执行任务计划验证-计算机科学-大语言模型-机器人.pdf
- 多模态表示模型的适应性研究在多任务手术计算机视觉中的应用-计算机科学-人工智能-计算机视觉.pdf
- 当模仿学习在手术动作规划中优于强化学习时-计算机科学-人工智能-强化学习-手术动作规划.pdf
- 多模态表示在细粒度多标签安全关键视图识别中的应用-计算机科学-人工智能-安全关键视图.pdf
- 鲁棒的不完全模态对齐通过标记最优传输进行眼科疾病分级和诊断-计算机科学-眼科成像-最优传输.pdf
- 企业管理-视觉检测仪生产工艺流程 SOP.pdf
- 保护环境建议书900字[10篇].docx
最近下载
- 拼多多法律顾问岗面试题库参考答案和答题要点.docx VIP
- 腾讯法律顾问岗面试题库参考答案和答题要点.docx VIP
- 小米法律顾问岗面试题库参考答案和答题要点.docx VIP
- 网易法律顾问岗面试题库参考答案和答题要点.docx VIP
- 惠普HP DeskJet Ink Advantage Ultra 4800 系列参考指南.pdf
- 第19课 七七事变与全民族抗战 学案(记忆清单+分层训练)(2024年).doc VIP
- DB32T 5071-2025长江江苏段污染物接收船舶作业条件及要求.docx VIP
- DB32T 5071-2025 长江江苏段污染物接收船舶作业条件及要求.docx VIP
- 短视频拍摄与剪辑:拍摄商品短视频PPT教学课件.pptx
- 简约中国烟草局工作专业PPT模板课件.pptx VIP
文档评论(0)