1 总结

本文调研在给定导航信号后,如何在端到端架构下,利用导航信息引导轨迹生成。

目前主流的方案可以分为2种。一种是将导航作为“前置引导”深度融入轨迹生成过程(导航前置型);另一种则是将导航作为“后置评价”标准来筛选最优轨迹(导航后置型)。

但是两者并不是割裂的,可以结合使用,导航前置可以缩小搜索范围,节省算力,提高Precision;导航后置可以进一步约束轨迹形态,提高轨迹质量。

2 导航前置型

2.1 导航路径型

  • 核心思想:用导航路径信息和自车特征融合作为query,和场景特征(如BEV)交互,从而融合自车状态/场景/导航目标,再解码得到轨迹。
  • 优势:显式使用导航路径点信息,引导车辆行驶
  • 劣势:模型对导航路径点坐标敏感,在路径点坐标误差大时,车辆可能驶入错误车道
  • 代表方案:UniAD

The planning head is a Transformer decoder. We design a planning query to predict the future trajectory. To incorporate the guidance from the route plan, we sample N reference points from the planned route and project them to the ego-vehicle coordinate. These reference points are then encoded by an MLP and added to the ego-vehicle’s state (velocity, acceleration, etc.) embedding to form the final planning query. The planning query then interacts with the occupancy forecast features via cross-attention to be aware of the future dynamic environment.

具体做法:

  1. 采用Dijskra算法计算到达目标的最短路径,然后沿着该路径均匀采样10个参考点

The planned route is composed of 10 reference points uniformly sampled along the path length.

  1. 对参考点进行编码,得到route_embedding;然后对自车状态(包含物理尺寸,速度,加速度等)也进行编码,得到ego_state_embedding。这2个同维度的embedding直接相加得到planning query。这一步融合了“我现在是什么状态”和“我将要去哪里”。

…and added to the ego state embedding to form the final planning query.

  1. 将planning query和OCC(4维:时间,X,Y,Z)进行交互,关注导航路径附近的障碍物/车道线信息,从而输出丰富context的特征,采用prediction head进行解码,就得到了轨迹(6个点,间隔0.5s,未来3s轨迹)。

For the planning task, we set the prediction horizon to 3 seconds with 6 predicted waypoints.

2.2 导航指令型

  • 核心思想:用导航指令信息和自车特征进行融合,和场景特征(如向量化场景表征)交互,再解码得到轨迹。
  • 优势:将导航视为“意图”,而不是要遵行的路径点,更加鲁棒
  • 劣势:没有显式的路径点进行引导,可能存在指令理解偏差
  • 代表方案:VAD

具体做法:

  1. 将导航路径简化为指令。通过分析在导航路径上的关键决策点,生成离散的控制指令(比如左转/右转/执行)。这一步避免依赖精确的导航路径点,从而更加鲁棒。

For each sample, we provide a high-level command from a sparse set of waypoints indicating the intended maneuver, e.g., turn left/right, go straight, or lane change. Specifically, we define 4 discrete commands, i.e., Follow Lane, Go Straight, Turn Left, and Turn Right.

  1. 将指令映射为对应的指令嵌入。

To incorporate the command, we first define a set of learnable embeddings {c(1), c(2), …, c(K)} for K commands. For a given command k, we obtain its embedding c(k).

  1. 将指令嵌入和自车状态进行融合,实现上就是相加。

We also introduce a learnable ego query q(ego) to represent the ego vehicle. The initial planning query q(plan) is formed by adding the command embedding to the ego query: q(plan) = q(ego) + c(k).

  1. 融合后和障碍物/车道线进行cross attention,然后解码得到轨迹。

This command-guided query then serves as the input to the planning decoder, which is a standard Transformer decoder. It iteratively interacts with the instance queries (representing other agents) and map queries (representing lanes) through self-attention and cross-attention layers to refine its representation and finally predict the trajectory.

3 导航后置型

3.1 神经网络型

  • 核心思想:通过轨迹生成网络输出多条轨迹,然后采用轨迹评估网络对其进行评分。其中导航信息强约束神经网络。
  • 代表公司:Tesla

Tesla AI Day 2021 演讲: 在运动规划环节,Ashok Elluswamy 指出,他们使用神经网络来预测“jerk”(加加速度)、“intervention”(被接管的可能性)等,这些都作为代价函数的一部分。整个评价体系是深度学习驱动的。

注意:特斯拉的导航信息可能在轨迹生成网路中存在弱引导作用。

3.2 规则型

  • 核心思想:针对输出的多条轨迹,采用综合了效率/安全等代价的函数进行整体评测。

  • 代表公司:华为,小鹏(应该并非最新方案)

  • 小鹏:CN113232873A《一种自动驾驶的路径规划方法、装置、设备及存储介质》

  • 华为:CN1138055724A -《一种运动规划的方法和装置》

【0065】 “可选地,在S102之后,该方法还包括:对所述多条候选轨迹进行评估,以从所述多条候选轨迹中选择出目标轨迹。”
【0066】 “具体地,所述多个性能指标可以包括:所述候选轨迹的安全性指标、舒适性指标和效率指标中的至少一种。”
【0067】 “例如,所述安全性指标可以用于表征所述车辆按照所述候选轨迹行驶时的碰撞风险。”
【0068】 “例如,所述舒适性指标可以用于表征所述车辆按照所述候选轨迹行驶时的乘客乘坐体验,例如,乘客感受到的冲击、颠簸等。”
【0069】 “例如,所述效率指标可以用于表征所述车辆按照所述候选轨迹行驶时的通行效率,例如,到达目的地所需的时间。”

其中,效率指标中的一项即为“轨迹终点和导航路径的贴合程度”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/94356.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/94356.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/94356.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

玳瑁的嵌入式日记D21-08020(数据结构)

双向链表double link listtypedef struct dou_node { DATATYPE data; struct dou_node *prev; struct dou_node *next; }DouLinkNode;双向链表:节点 数据 NEXT PREV . 手撕代码(增加删除) 增加,删除的操作, 需要 tmp 停止待操作节点的前一…

Uipath查找元素 查找子元素 获取属性活动组合使用示例

Uipath 查找元素 查找子元素 获取属性组合使用示例使用场景案例介绍项目流程图附加浏览器查找元素查找子元素遍历循环获取属性点击元素使用场景 在实际场景中,有时需RPA自动点击某组范围元素或获取某组范围元素的值,如需获取指定的父元素,再…

【MongoDB与MySQL对比】

MongoDB 与 MySQL 全方位对比分析在现代软件开发中,数据库的选择直接影响系统性能、扩展性和开发效率。MongoDB 和 MySQL 作为两种主流数据库,分别代表了 NoSQL 和关系型数据库的典型,各自在不同场景中发挥着重要作用。本文将抛开代码示例&am…

Spring AI开发指导-对话模型

对话模型接口描述Spring AI基于Spring Cloud的架构体系,定义了一系列可扩展的API接口,支持对接不同类型的AI大模型的核心功能,这些API接口支持同步编程模式或者异步编程模式:接口ModelModel是同步编程模式接口,其参数支…

Win11 下卸载 Oracle11g

目录 1、停止服务 2、启动 Universal install 应用 3、执行 deinstall.bat 脚本 4、删除注册表相关数据 5、删除环境变量中的oracle相关路径 6、删除安装文件 7、删除C盘中的相关Oracle文件 8、删除 Oracle 数据存放目录 9、检查 10、重装oracle可能还会碰到的问题 &…

深入剖析Spring Boot应用启动全流程

目录 前言 启动流程概览 一、第一阶段:初始化SpringApplication 二、第二阶段:运行SpringApplication 三、第三阶段:环境准备 四、第四阶段:创建应用上下文 五、第五阶段:准备应用上下文 六、第六阶段&#xf…

Matplotlib 可视化大师系列(三):plt.bar() 与 plt.barh() - 清晰对比的柱状图

目录Matplotlib 可视化大师系列博客总览Matplotlib 可视化大师系列(三):plt.bar() 与 plt.barh() - 清晰对比的柱状图一、 柱状图是什么?何时使用?二、 函数原型与核心参数plt.bar(x, height, ...) - 垂直柱状图plt.ba…

基于 FastAPI 和 OpenFeature 使用 Feature Flag 控制业务功能

模拟业务场景:多租户系统跨域转账,需要控制某租户下某用户是否可以在某域转账 open_feature_util.py import typing from abc import abstractmethod, ABCMeta from typing import Sequencefrom openfeature.evaluation_context import EvaluationContex…

Stm32通过ESP8266 WiFi连接阿里云平台

本文将介绍stm32如何通过WiFi来连接阿里云,上传数据和接收指令。要先与阿里云建立TCP连接,然后再通过MQTT协议交互。 大体流程:1、在阿里云网页上创建产品和设备;2、stm32通过WiFi连接云平台;3、MQTT连接阿里云&#…

北京-测试-入职甲方金融-上班第三天

今日上班时间9-20.18,再加42分钟就可以拿到75块钱了,但我想回家,所以下班今天上午有人事举办的入职培训,下午有业务培训,培训完领导给我安排了两个需求。慌死,吓死,我都不懂,业务和工…

Java基础第2天总结

使用switch时注意事项:表达式类型只能是byte、short、int、char,JDK5开始支持枚举,JDK7开始支持String,不支持double、float、long(精确度问题,小数有点不精确)。case给出的值不允许重复,且只能是字面量,不…

鸿蒙开发中的List组件详解

目录 引言 1.List组件基础 2.List接口参数 1.space 2.initialIndex 3.scroller 3.ListView的属性 1.listDirection 2.lanes 3.divider 4.scrollBar 4.布局与约束 5.ListItem生命周期 1.使用ForEach创建ListItem 2.使用LazyForEach创建ListItem 3…

2026界计算机专业毕业的有福了!(开题报告任务书)

开题报告 我们以基于Java的婚纱店管理系统为案例进行指导。 任务书: 首先是毕设的立题依据,这个主要描写一些简洁大体的大白话,描述一下你为什么要做这个题目的毕设。 那就需要你描述一下现阶段社会面婚纱店的运营情况,写一些…

安全、高效、可靠的物理隔离网络安全专用设备———信刻光盘安全隔离与文件单向导入系统!

着各种数据传输、储存技术、信息技术的快速发展,保护信息安全是重中之重。军工企业、政府、部队及企事业单位等利用A网与B网开展导入/导出相关工作已成为不可逆转的趋势。针对于业务需要与保密规范相关要求,涉及重要秘密信息,需做到完全的物理…

JetPack 与 PyTorch 版本对应及资源详情

下载链接 JetPack 版本适配 PyTorch 版本发布日期可下载资源(.whl 安装包 / 文档)JP 6.1PyTorch 2.5.0a0(构建号:872d972e41.nv24.08.17622132)2024/10/01- torch-2.5.0a0872d972e41.nv24.08.17622132-cp310-cp310-li…

【c++进阶系列】:万字详解多态

🔥 本文专栏:c 🌸作者主页:努力努力再努力wz 💪 今日博客励志语录: 你以为自己在孤独地爬坡吗?看看身后吧——那些被汗水浸湿的脚印,早已连成一道向上的阶梯 ★★★ 本文前置知识&am…

AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年8月23日第168弹

从今天开始,咱们还是暂时基于旧的模型进行预测,好了,废话不多说,按照老办法,重点8-9码定位,配合三胆下1或下2,杀1-2个和尾,再杀4-5个和值,可以做到100-300注左右。(1)定位…

分布式搜索(Elasticsearch)深入用法

目录 数据聚合 聚合的种类 DSL实现聚合 桶聚合 度量聚合 RestAPI实现聚合 多条件聚合 自动补全 拼音分词器 自定义分词器 自动补全查询 实现搜索框自动补全 数据同步 数据同步思路分析 实现elasticsearch与数据库数据同步 集群 搭建ES集群 集群脑裂问题 集群…

java:接口与实现类

1. Java 基础层面接口(Interface) 只是方法的定义/规范,里面没有真正的逻辑。例如:public interface IBookService {boolean save(Book book); }👉 这里只说明了:我要有一个 save 方法,但“怎么…

Chrome 插件开发实战:从入门到进阶

1.1 Chrome 插件的魅力与应用场景Chrome 插件是增强 Chrome 浏览器功能的得力助手,能实现广告拦截、密码管理、标签管理等实用功能。在日常办公中,我们可以借助插件提升效率,如自动填充表单、快速保存网页内容;在浏览网页时&#…