基于科珀曼算子的二维四足机器人行进、跳跃和步态转换线性模型预测控制-计算机科学-机器人-模型预测控制.pdfVIP

基于科珀曼算子的二维四足机器人行进、跳跃和步态转换线性模型预测控制-计算机科学-机器人-模型预测控制.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于科珀曼算子的二维四足机器人行进、跳跃和步态转换线性模

型预测控制

Chun-MingYangandPranavA.Bhounsule

Abstract—四足机器人在线最优控制将使它们能够规划有效优化工具的发展已使使用模型预测控制

在新环境中的运动。线性模型预测控制(LMPC)作为一种实(MPC)实现最优控制成为可能。例如,通过从分层非

用方法,适用于实时控制。在LMPC中,会制定一个有限时

线性MPC[4]中导出控制输入实现了四足动物的跳跃

间范围内的二次成本和线性约束的优化问题,并即时求解。然

而,LMPC依赖于对运动方程(EOM)进行线性化处理,这步态。然而,由于优化所需的时间较长,这仅限于离线

可能导致解决方案质量较差。本文使用Koopman算子理论及计算。在线最优控制可以通过求解具有二次成本和线

扩展动态模态分解(EDMD),在高维空间中创建系统的线性性约束的短时域最优控制问题来实现,这也称为线性

本模型,从而保留了EOM的非线性特性。我们使用不同的线性

模型预测控制(LMPC)[5]。在这里,加速是通过将优

译模型来建模空相和地面接触阶段。然后,利用LMPC,在平坦化转换为凸二次规划实现的,这导致了分析解。然而,

和平整地形上展示了跳跃、快跑以及从跳跃到快跑和从快跑到

中跳跃的步伐转换。主要创新点在于使用Koopman算子理论创简单性是有代价的:线性约束是通过对运动方程进行

1建四足系统的混合模型,并展示在线生成多种步伐及其转换。线性化得到的,在系统远离线性化点时可能导致收敛

v

5不良。另一个问题是这种优化假设了一个预设的时间,

0I.介绍

6这可能不适用于某些步态(例如跳跃步态)或粗糙地

4在多足系统中,四足机器人已成为设计和测试激形[6]。解决这个问题的方法是将步态和足部位置时间

1

7.进新型控制理念的通用平台。一种主导方法是使用线添加为优化变量以实现多功能的四足动物步态,在此

0性化模型(例如模型预测控制)执行在线最优控制以单次优化过程规划了步态序列、步伐时间和足点[7]。

5

2实现实时适应。然而,线性化可能会引入导致性能不但是这种优化在实时中难以求解。

:

v佳的模型伪影。本文通过使用Koopman算子理论在深度强化学习(DRL)是一种无模型方法,它在

i

x高维空间中构建保留系统非线性的线性模型来解决这整個状态空间上解决一个优化问题。在这里,通过离

r

a一局限。此外,我们利用线性模型预测控制演示了多线优化,神经网络学习传感器和执行器命令之间的映

种步态(跳跃和快速行走)以及步态转换。射。然后,在在线部署期间,根据传感器值,神经网

最早的研究工作调查了简单的启发式方法,例如络输出一个执行器命令。DRL已经在[8]跑步、[9]跳

调节足部位置以控制速度和垂直力以控制高度,并将跃、[10]漫步、[11]直立跳跃以及每种步态之间的过渡

其应用于四足动物的跳跃、快步跑和奔跳[1]。然而,这[12]上得到了证明。然而,DRL并不是样本高效的,因

样的控制器需要手动调整才能变得鲁棒,这通常是耗为它需要大量的数据集进行训练。为了实现样本效率,

时且不适用于其他系统的。一种正式的方法是计算生可以使用基于模型的优化来计划参考运动,并使用无

成周期性步伐所需的控制,也称为庞加莱极限环[2],模型RL跟踪参考运动[13]。

并使用特征值来确定稳定性[3]。这种稳定性分析的Koopman算子将一个非线性模型

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档