使用控制障碍函数和世界模型在潜空间进行安全性认证-计算机科学-机器学习-安全的视觉运动策略.pdfVIP

使用控制障碍函数和世界模型在潜空间进行安全性认证-计算机科学-机器学习-安全的视觉运动策略.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

使用控制障碍函数和世界模型在潜空间进行安全性认证

MehulAnand,andShishirKolathaya

Abstract—从视觉数据中合成安全控制器通常需要对关应用于视觉观测仍然非trivial。此外,为任意系统合

键的安全数据进行大量的有监督标注,这在实际场景中往往是成有效的CBFs本身就是一个具有挑战性的任务。最

不切实际的。世界模型方面的必威体育精装版进展使得在潜在空间中的可

近的神经CBFs进展[14],[15]利用神经网络的表现力

靠预测成为可能,为可扩展和数据高效的安全部署开辟了新途

径。在这项工作中,我们介绍了一个半监督框架,该框架利用从数据中直接学习障碍证书,使这些方法能够适用于

在世界模型潜在空间中学到的控制屏障证书(CBCs)来合成更广泛的系统和输入,包括视觉。

安全的视觉运动策略。我们的方法联合学习一个神经屏障函数

和一个安全控制器,使用有限的标注数据,同时利用现代视觉最近的一些研究探讨了从视觉观测中使用CBFs

变压器对潜在动态建模的预测能力。进行安全控制的应用[16]–[18],但大多数依赖于控制

本I.介绍仿射动力学的假设,这限制了其泛化能力。将神经辐射

译场(NeRFs)与CBFs集成的方法[16]显示出对视觉运

中随着自主系统日益普及,确保其安全性仍然是一动控制有前景的结果,但也带来了显著的计算开销,阻

个关键挑战——特别是当使用基于学习的控制器时,碍了实时部署。其他方法使用生成对抗网络(GANs)

1

v这些控制器缺乏内在的安全保证。已经开发了各种[17]来推断用于几何CBF计算的三维障碍物几何形

1范式来解决控制系统中的安全问题。约束强化学习状。基于潜在空间的方法[19],[20]从编码的视觉运动

7

8(CRL)[1]–[3]在策略优化过程中将安全规范编码为表示中生成CBFs。然而,这些方法通常采用自编码器

3

1约束条件,允许数据驱动的学习,但通常缺乏正式的或GANs,它们缺乏建模动作条件下的时间动态的能

7.保证,并且在探索期间可能会出现不安全的行为。力,这使得它们不适合控制和规划。

0相比之下,如哈密顿-雅可比(HJ)可达性[4]–[6]

5世界模型[21]通过学习结构化、动作感知的潜在

2提供通过偏微分方程的解来表征安全集的严格安全性

:表示来填补这一空白,这些表示捕捉系统动态,从而

v分析。然而,它们的计算复杂度随着状态空间维度的

i实现预测规划和安全决策。在这项工作中,我们利用

x增长而显著增加,限制了其在高维系统中的应用。

r世界模型的优势,在潜在空间中使用学习到的控制障

a控制障碍函数(CBFs)已成为一种可扩展且有效

碍证书合成安全的视觉运动策略。

的安全关键控制系统工具[7]–[10]。基于CBF的方法

通常将控制综合表述为一个二次规划问题(QP),从本工作的主要贡献是:

而实现实时安全过滤[7],[8],[11],[12]。然而,传统的

基于QP的公式通常仅限于仿射系统,并且不自然地我们提出了一种半监督框架,该框架将控制屏障

处理输入约束。基于证书的公式[9],[10]通过容纳一

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档