- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
可解释的梯度下降法用于卡尔曼增益
∗†
M.A.BelabbasandA.Olshevsky
2025年7月23日
摘要
本我们推导出了一种关于线性时不变系统中滤波增益的创新损失梯度的分解方法,该
译分解为一个可观察格拉姆矩阵和一个量化估计误差与创新之间“非正交性”的项的乘积。
中我们利用这种分解来给出梯度下降收敛到最优卡尔曼增益的证明,特别指出了恢复卡尔
曼增益如何依赖于一个非常规的可观测条件,并获得了一个可解释的几何收敛率。
2
v
4
51介绍
3
4
1虽然线性时不变系统的最优卡尔曼增益可以从代数黎卡提方程中以闭合形式获得,基
.
7于梯度的计算卡尔曼增益策略仍然有两个主要原因显得有趣。首先,在时变或自适应滤波环
0
5境中,增量梯度更新允许连续修订增益,因此滤波器可以响应不断变化的系统动态而无需反
2复求解完整的黎卡提方程。其次,当系统模型部分已知或完全未知但测量数据继续到达时,
:
v
i随机梯度方法可以直接用于以数据驱动的方式识别增益。
x
r我们采用创新的期望均方幅度——即一步预测误差——作为梯度下降的成本,这个量
a
我们称之为创新损失。这是衡量滤波器性能最直接的方法,并且由于它仅依赖于可观测数
据,因此即使真实状态未知时仍定义良好。
分析创新损失上的梯度下降问题,据我们所知,仅在[5]中被考虑过。[5]考虑了一个一
步预测形式的卡尔曼滤波器,并证明了,在底层系统可观察的情况下,梯度下降及其随机变
体收敛于卡尔曼增益。一篇紧密相关的论文[3]考虑了一个稍有不同的成本函数,使用了创
新中的预测,并同样获得了收敛到卡尔曼增益的结果。
还存在大量关于使用梯度下降计算LQR最优增益的相关问题的平行文献(例如,[2,1,
4,6])。然而,如[5]所述,尽管这里在可控性和可观测性之间存在某种对偶关系,通常无法
∗UniversityofIllinoisatUrbana-Champaign,belabbas@illinois.edu.
†BostonUniversity,alexols@bu.edu.
Authorsnamesareorderedalphabetically.
1
从对应的LQR结果推导出卡尔曼增益的结果,因为关键的非奇异性假设在变换中没有得到
保留。
本文中我们考虑使用梯度下降来恢复标准形式下的卡尔曼滤波器。与[5]不同,我们表
明如果仅假设底层系统的可观测性,则确实存在虚假的稳定点。我们的分析起点是一个新的
观察结果,即创新损失的梯度是可观测性格拉姆矩阵和一个衡量卡尔曼滤波器正交性原理
违背程度的项的乘积。基于这种分解,我们给出了一种稍不标准的可观测性条件,该条件排
除了稳定点并确保梯度下降以几何速率收敛到卡尔曼增益。最后,我们表明这个速率是可以
解释的,它是两个因素的乘积:轨迹接近失去可观测性的程度以及违背正交性原理的程度如
何急剧增加创新损失。
2问题陈述
我们考虑一个由状态空间方程描述的离散时间线性时不变系统
(1)
您可能关注的文档
- 双层模型预测控制在节能集成产品定价与生产调度中的应用-计算机科学-机器学习-模型预测控制-双层优化-制造调度.pdf
- 单一连接:一种参数高效的微调技术用于 Transformer-计算机科学-深度学习-大语言模型-参数高效的微调.pdf
- 远程协助或远程驾驶: 操作设计领域对 ADS 支持系统选择的影响-计算机科学-人工智能-自动驾驶系统-远程操作.pdf
- 偏好数据集剪枝的影响函数-计算机科学-大语言模型-强化学习-参数微调.pdf
- 2025年煤炭清洁燃烧技术产业创新与产业布局优化研究报告.docx
- 互联网金融平台用户信任建立与维护机制技术保障研究报告.docx
- 2025年教育行业人才流失与吸引机制创新思考与案例报告.docx
- 农村电商服务站农村电商产业链整合与2025年发展报告.docx
- 2025年工业互联网平台TEE在工业设备智能监控中的应用实践报告.docx
- 2025年农产品质量安全追溯体系在农产品质量安全监管体系创新中的应用.docx
- 养老服务中心设施2025年老年人心理需求评估报告.docx
- 工业互联网平台流量整形技术助力企业数字化转型案例分析报告.docx
- 智能交通时代交通运输人才需求与培养模式变革报告.docx
- 2025年环境影响评价公众参与中的公众参与与环境保护法律援助报告.docx
- 2025年数字艺术市场:艺术创作、交易与版权保护的产业政策研究.docx
- 2025年K2教育中AI个性化学习系统对学生个性化学习路径与教学策略的优化报告.docx
- 农业科技成果转化与农村基层治理信息化应用2025年研究报告.docx
- 音乐产业版权运营与音乐版权授权机制创新研究报告.docx
- 新媒体时代,2025年新闻传播真实性与公信力传播效果评估报告.docx
- 未来五年储能技术多元化在能源市场中的应用与影响研究报告.docx
文档评论(0)