GC-GAT:使用图目标条件和跨上下文注意力的多模态车辆轨迹预测-计算机科学-机器学习-自动驾驶.pdf

GC-GAT:使用图目标条件和跨上下文注意力的多模态车辆轨迹预测-计算机科学-机器学习-自动驾驶.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

这是发表在IEEE上的论文的作者版本,IEEE也是版权所有者,其DOI为:10.1109/LRA.2025.3585757

GC-GAT:使用图目标条件和跨上下文注意力的多模态车辆轨迹

预测

MahirGulzar,YarMuhammad,andNaveedMuhammad

摘要—预测周围车辆的未来轨迹高度依赖于提供给运动预理速度下安全驾驶),自动驾驶汽车需要能够可靠地预

测模型的上下文信息。这个上下文本身可以是静态的(车道、规测周围代理未来的行动。

则元素等)或动态的(交通参与者)。本文介绍了一种基于车道

图的运动预测模型,该模型首先预测基于图的目标提案,然后通存在几种表示代理未来运动的方法。[4]提出了一

过跨多个上下文元素的交叉注意力将它们融合在一起。我们遵循个运动预测的分类法,其中预测输出被归类为意图、单

著名的编码器-交互器-解码器架构,其中编码器使用轻量级门控模态/多模态轨迹和地图占用。在这里,意图过于宽泛

循环单元对场景上下文进行编码,交互器在编码的场景特征和图而无法用于自动驾驶车辆规划,而地图占用通常计算密

本形目标提案上应用跨上下文注意力,解码器通过拉普拉斯混合密集型。我们今天看到的文献大多围绕着预测预期代理的

度网络从聚合的编码中回归多模态轨迹。通过对基于图的目标提

未来轨迹。我们在各种组织提出的近期运动预测竞赛中

译案使用交叉注意力可以得到稳健的轨迹估计,因为模型学会了关

中注与预期代理未来相关的场景元素。我们在nuScenes运动预测看到了这一点[5]–[7]。向参与者提供了一个包含高精度

2数据集上评估了我们的工作,取得了最先进的结果。(HD)地图及代理历史记录的数据库。预计预测结果将

v以多模态轨迹的形式呈现。

0

5I.介绍许多研究人员提出了多种解决方案来解决现有数

1

1据集上的运动预测问题。早期的工作包括[8],通过将

1.自主性,在自动驾驶车辆(AV)的背景下,可以定高清地图光栅化为多个语义层来预测多模态轨迹。此

4义为车辆无需人类干预即可运行的能力[1]。实现自动处,一个普通的卷积神经网络(CNN)从光栅中提取相

0驾驶后,承诺带来许多好处,包括(i)更安全的道路,

5关场景特征。同样地,[9],[10]使用光栅来编码场景的

2因为大多数事故是由人为错误引起的,(ii)由于驾驶效

:上下文信息。由于运动预测是自动驾驶管道中的关键步

v率提高而减少排放,(iii)所有人都能出行,例如儿童和

i骤,这些方法无法在实时环境中使用,因为它们计算强

x老人,(iv)以及便利、舒适并释放时间[2]。

r度大。此外,当编码时,光栅化输入会遭受较大的神经

a可以说,[3],在自动驾驶中最具挑战性的子问题之

感受野问题,即CNN特征图经常产生幻觉,从而导致

一是估算交通中的其他意图。对于我们人类来说,预测

错误预测。最近的工作利用了高清地图的结构化数据。

其他代理(无论是由人驾驶的车辆、行人还是骑自行车

在这

文档评论(0)

zikele + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档