- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
可解释的梯度下降法用于卡尔曼增益
∗†
M.A.BelabbasandA.Olshevsky
2025年7月24日
摘要
本我们推导出线性时不变系统中滤波增益的创新损失梯度的一个分解,该分解为一个
译可观察格拉姆矩阵与量化估计误差和创新之间“非正交性”的项的乘积。我们利用这一
中分解来给出梯度下降收敛到最优卡尔曼增益的证明,并具体识别出卡尔曼增益的恢复如
何依赖于一个非常规的可观测条件,同时获得了一个可解释的几何收敛率。
2
v
4
51介绍
3
4
1虽然线性时不变系统的最优卡尔曼增益可以从代数黎卡提方程以闭式形式获得,基于
.
7梯度的策略用于计算卡尔曼增益仍因以下两个主要理由而引人关注。首先,在时变或自适应
0
5滤波环境中,增量梯度更新允许持续修正增益,因此滤波器可以响应系统动态的变化而不必
2反复求解完整的黎卡提方程。其次,当系统模型仅部分已知或完全未知但测量数据继续到达
:
v
i时,可以使用随机梯度方法直接以数据驱动的方式识别增益。
x
r我们采用创新的期望均方幅度——即一步预测误差——作为梯度下降的成本,这个量
a
我们称之为创新损失。这是衡量滤波器性能最直接的方法,并且由于它仅依赖于可观测数
据,因此即使真实状态未知时也保持定义良好。
分析创新损失上的梯度下降问题,据我们所知,此前只在[5]中被考虑过。一种一�前
瞻形式的卡尔曼滤波器在[5]中被考虑,并且证明了,在底层系统可观测的情况下,梯度下
降及其随机变体收敛到卡尔曼增益。一篇紧密相关的论文[3]考虑了一个稍微不同的成本函
数,使用了创新的一�前瞻,并且也得到了收敛到卡尔曼增益的结果。
还存在大量关于使用梯度下降计算LQR最优增益的相关问题的平行文献(例如,[2,1,
4,6])。然而,正如[5]中解释的那样,尽管这里在可控性和可观测性之间存在一定形式的对
∗UniversityofIllinoisatUrbana-Champaign,belabbas@illinois.edu.
†BostonUniversity,alexols@bu.edu.
Authorsnamesareorderedalphabetically.
1
偶关系,但通常不能从对应的LQR结果推导出卡尔曼增益的结果,因为关键的非奇异性假
设在转换过程中没有被保持。
在这篇论文中,我们考虑使用梯度下降来恢复标准形式下的卡尔曼滤波。与[5]不同的
是,我们展示了如果只假设底层系统的可观测性,则确实存在虚假的稳定点。我们的分析起
点是一个新的观察结果,即创新损失的梯度是可观测性Gramian和一个衡量正交原则违反
程度的项的乘积。基于这种分解,我们给出了一种稍微非标准的可观测性条件,该条件排除
了稳定点,并确保梯度下降以几何速率收敛到卡尔曼增益。最后,我们展示了这个速率是可
以解释的,它是两个项的乘积:一个衡量轨迹接近失去可观测性的程度,另一个衡量违反正
交原则的程度迫使创新损失上升的速度。
2问题陈述
我们考虑一个由状态空间方程描述的离散时间线性时不变系统
(1)
您可能关注的文档
- 用于无训练手术视频分割的增强记忆 SAM2-计算机科学-机器学习-手术器械分割-零样本学习.pdf
- Prompt4Trust:一个用于多模态大型语言模型临床对齐置信度校准的强化学习提示增强框架-计算机科学-多模态大型语言模型-医疗保健.pdf
- 2025年车载娱乐行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年专用汽车行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年眼部护理精华行业现状分析报告及未来五至十年发展前景预测报告.docx
- 二手交易电商信用评级体系与信用风险防范技术报告.docx
- 租房合同验收.docx
- 2025年车载支架行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年裁缝剪刀行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年专用仪器仪表行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年眼部护理套装行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年其它灭蚊用品行业现状分析报告及未来五至十年发展前景预测报告.docx
- 二手交易电商信用评级体系与信用风险防控措施研究.docx
- 2025年体育锻炼强健体魄班会.pptx
- 租房合同遗漏.docx
- 2025年茶匙行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年眼部精华行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年裁缝镊子行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年防火板表层纸行业现状分析报告及未来五至十年发展前景预测报告.docx
- 2025年汽车膜行业现状分析报告及未来五至十年发展前景预测报告.docx
文档评论(0)