一、感知决策一体化模型架构

单一神经网络整合全流程

端到端神经网络能够直接将传感器输入映射为控制输出,消除了传统模块化架构中感知、规划、控制等独立模块之间的割裂。传统架构中,感知模块负责识别环境信息,决策模块根据感知结果进行路径规划和决策制定,控制模块再根据决策执行车辆的操作,各模块之间存在信息传递损耗和延迟。而端到端架构通过一个单一的神经网络模型,将整个流程整合在一起,使传感器采集到的数据能够直接用于生成车辆的控制指令,大大提高了系统的响应速度和整体性能。

例如,特斯拉 FSD v12 采用纯视觉感知模型,通过多个摄像头采集车辆周围的视觉信息,这些信息直接输入到一个深度神经网络中,经过网络的处理和计算,最终输出车辆的转向角度以及加速或制动指令,实现从输入到输出的端到端闭环,让车辆能够根据实时视觉信息做出精准的驾驶决策。

模型架构创新

  • BEV+Transformer:将多摄像头数据转换至鸟瞰视角(BEV),结合注意力机制动态捕捉道路拓扑关系。鸟瞰视角能够提供更全面的周围环境信息,类似于从空中俯瞰道路和车辆周围的情况,有助于更好地理解复杂的道路布局和交通参与者之间的关系。注意力机制则可以根据不同的驾驶场景和任务,动态地关注道路上的关键区域和重要信息,从而提升车辆在复杂路口等场景下的通行能力。
    以华为 ADS 3.0 为例,在城市复杂路口场景下,通过 BEV+Transformer 架构,系统能够准确地捕捉到各个方向来车、行人、非机动车等交通参与者的运动状态和位置关系,实现了路口通行成功率提升至 98%。这意味着车辆在通过复杂路口时,能够更精准地做出避让、转弯或直行等决策,减少因决策失误导致的通行延迟或安全隐患。

  • 占用栅格网络(Occupancy):通过 3D 体素建模识别异形障碍物。传统的目标检测方法通常使用边界框来标识和定位障碍物,但对于一些形状不规则或较小的异形障碍物(如掉落的轮胎、油桶、塑料袋等),边界框检测可能会出现漏检或误检的情况。占用栅格网络将空间划分为一个个 3D 体素单元,对每个体素单元进行占用状态的判断,从而能够更精确地识别出这些异形障碍物的形状、大小和位置,解决了传统检测方法的局限性。
    在高速公路上,如果车辆前方有掉落的轮胎,占用栅格网络可以准确地检测到这个异形障碍物,并及时为车辆的决策系统提供信息,使车辆能够提前采取制动或避让措施,有效避免潜在的碰撞事故。

二、多模态数据融合技术

传感器协同感知

融合摄像头、激光雷达、毫米波雷达等多种传感器的数据,可以构建一个冗余感知体系。不同传感器具有各自的优势和局限性,摄像头能够提供丰富的视觉纹理和颜色信息,用于识别交通标志、车道线、行人等;激光雷达可以生成高精度的三维点云数据,精确测量物体的距离和形状;毫米波雷达则在测距、测速方面表现出色,且在恶劣天气条件下仍能保持较好的工作性能。通过将这些传感器的数据进行融合,可以相互补充和验证,提高系统对周围环境感知的准确性和鲁棒性,尤其在浓雾、强光等恶劣天气条件下,能够确保车辆依然能够可靠地感知周围环境。

Mobileye 的复合 AI 系统(CAIS)就是一个典型案例。该系统以摄像头为核心,同时辅以低成本的固态激光雷达,成本降至 1200 元,但通过传感器融合技术,实现了厘米级的探测精度。这意味着即使在复杂环境下,车辆也能够精确地感知到周围物体的位置和距离,为后续的决策和控制提供更精准的数据支持,有效提升了自动驾驶系统的安全性和可靠性。

时空对齐与特征级融合

为了实现多模态数据的有效融合,需要通过时空同步算法对齐多传感器数据的时间戳与空间坐标。因为不同传感器采集数据的时间和频率可能不完全一致,存在时间上的偏差,同时它们的坐标系也可能不同,所以必须先将这些数据在时间和空间上进行对齐,使其具有可比性和可融合性。在此基础上,再利用深度学习模型提取跨模态特征,例如将视觉纹理信息(来自摄像头)与点云深度信息(来自激光雷达)相结合,形成更丰富、更具判别力的特征表示,从而提高对环境物体的识别和理解能力。

例如,在一个包含行人和车辆的复杂交通场景中,经过时空对齐后,系统可以将摄像头捕捉到的行人的外观、动作等视觉纹理特征与激光雷达测量到的行人的距离、形状等深度信息进行融合。通过深度学习模型提取融合后的特征,能够更准确地识别出行人的位置、运动方向和速度,以及车辆的类型、行驶状态等信息,为自动驾驶车辆的决策系统提供更全面、准确的环境感知结果,帮助车辆更好地规划行驶路径和做出安全的决策。

三、大模型驱动与训练优化

AI 大模型赋能决策

  • 模仿学习:通过大量的千万级人类驾驶视频来训练模型,使其能够学习到人类驾驶员在各种场景下的驾驶行为和决策模式,从而具备拟人化的决策能力。这些人类驾驶视频涵盖了各种不同的路况、交通条件和驾驶场景,模型在学习过程中可以逐渐理解在何种情况下应该采取何种驾驶操作,例如在路口如何转弯、在高速公路上如何超车、在拥堵路段如何跟车等。
    小鹏 XNGP 系统通过训练超过 1000 万段真实路况视频,让模型学习到丰富的驾驶经验,使其在实际驾驶过程中能够做出更贴近人类驾驶员的决策,如在复杂的城市道路中灵活避让障碍物、平顺地通过路口等。这种模仿学习的方式能够有效提升自动驾驶系统的智能化水平和用户体验。

  • 强化学习:强化学习是一种通过与环境进行交互,根据奖励信号来优化模型决策策略的学习方法。在端到端自动驾驶中,地平线征程 6 芯片针对 Transformer 架构进行了优化,能够更高效地支持强化学习的计算需求。这使得模型可以在动态博弈场景(如加塞、拥堵跟车等复杂交互场景)中,实时地根据当前的交通状况和车辆之间的相互关系,做出最优的决策,并通过不断的学习和训练来提升决策的准确性和适应性。
    在高速公路上遇到前车突然加塞的情况,经过强化学习的自动驾驶模型能够根据实时的车速、车距、周围车辆的运动状态等信息,迅速判断出是采取减速避让还是保持原速行驶等不同的应对策略,并根据实际的行驶结果和设定的奖励机制(如行驶安全性、舒适性、效率等指标)来不断调整和优化决策策略,从而在未来的类似场景中做出更合理的决策。

数据闭环与迭代

端到端自动驾驶系统的数据闭环包括真实路测、仿真训练和 OTA 更新三个关键环节,形成一个持续迭代优化的闭环。

  • 首先,在真实路测过程中,车辆会行驶在各种实际道路上,采集大量真实的驾驶数据,特别是长尾场景(如施工区、违章行人等罕见但关键的场景)的数据。这些数据能够为模型的训练提供丰富多样的样本,帮助模型更好地学习和适应各种复杂的现实情况。
  • 然后,利用虚拟仿真平台生成极端案例(如传感器失效、GPS 丢失等罕见但危险的场景),这些场景在真实路测中可能很难遇到,但在仿真环境中可以方便地构造和模拟。通过在仿真平台上对这些极端案例进行训练,可以提前发现模型的潜在问题和不足之处,并有针对性地进行优化和改进。
  • 最后,通过车云协同的方式,将优化后的算法和模型通过 OTA(Over-The-Air)技术快速更新到车辆上,实现系统的快速迭代升级。例如,蔚来 NOP+ 系统通过 OTA 更新后,将地库泊车成功率提升至 95%,这表明经过数据闭环的迭代优化,车辆在特定场景下的性能得到了显著提升。

例如,某自动驾驶车辆在真实路测中遇到了一个施工区域,施工区的道路布局和交通标志与常规道路有很大不同,车辆的自动驾驶系统在该场景下的表现可能不够理想,采集到了相关数据。这些数据回传到云端后,研发人员在仿真平台上对该施工场景进行模拟和扩展,生成更多的相关训练数据,并对模型进行针对性的训练和优化。优化后的模型通过 OTA 推送到车辆上,当车辆再次遇到类似的施工场景时,就能够更准确地识别和应对,提高了行驶的安全性和可靠性。

四、高可靠性执行与验证体系

技术方向及核心能力

  • 线控底盘:线控底盘能够实现微米级转向和制动控制,确保车辆对高精度指令的精准执行。传统的机械式底盘控制可能存在一定的滞后性和精度误差,而线控底盘通过电子信号直接控制转向和制动系统,能够更快速、更精确地响应自动驾驶系统的控制指令,从而提高车辆的操控性能和行驶稳定性。
    吉利的线控底盘响应误差小于 0.1°,这意味着当自动驾驶系统发出转向指令时,车辆的实际转向角度与指令要求的角度之间的偏差极小,能够确保车辆按照预期的轨迹行驶,无论是进行精确的车道保持还是复杂的避障操作,都能提供可靠的支持。

  • 冗余设计:为了提高系统的可靠性,端到端自动驾驶系统采用冗余设计,包括双备份传感器和计算单元。这样,即使其中一个传感器或计算单元出现故障,另一个备份单元仍能接管工作,确保车辆的安全运行。这种冗余设计类似于飞机上的关键系统备份,能够在单点故障发生时,维持系统的基本功能,降低因硬件故障导致的事故风险。
    蔚来的全冗余系统通过了 ASIL-D 功能安全认证,ASIL-D 是汽车安全完整性等级中的最高等级,这表明蔚来的冗余设计在功能安全方面达到了极高的标准,能够有效保障车辆在各种复杂工况下的安全运行,为乘客提供可靠的出行保障。

  • 仿真验证平台:构建千万公里级虚拟里程的仿真验证平台,能够覆盖 95% 的长尾场景。通过仿真平台,可以在虚拟环境中高效地测试和验证自动驾驶系统的性能,模拟各种极端工况和罕见场景,提前发现潜在问题并进行优化,大大降低了在真实道路上测试的风险和成本。
    华为的仿真平台能够将极端场景的生成效率提升 5 倍,这意味着可以在更短的时间内生成更多的极端场景案例,为自动驾驶系统的测试和训练提供充足的数据支持。例如,在仿真平台上可以模拟暴风雨天气下的高速公路行驶、复杂的山区道路行驶、城市中的突发交通事故等场景,全面验证自动驾驶系统在这些场景下的应对能力和安全性。

关键挑战与应对

  • 黑箱决策风险:端到端自动驾驶系统的决策过程往往被视为 “黑箱”,难以直接解释其决策依据。为了应对这一挑战,可以通过注意力热力图等可视化技术来显示模型在决策时关注的关键区域和因素。例如,特斯拉 FSD v12 在避让障碍物时,能够显示障碍物避让权重的注意力热力图,让研发人员和用户能够直观地了解模型是如何根据周围环境信息做出避让决策的,从而提高系统的可解释性和用户对系统的信任度。
  • 算力瓶颈:端到端自动驾驶系统的大模型对算力要求极高,为了突破这一瓶颈,可以采用分布式计算的方式。例如,华为昇腾 610 芯片支持 500+ TOPS 算力,通过分布式计算架构,将计算任务分配到多个芯片上并行处理,能够显著提高模型的推理效率,满足自动驾驶系统对实时性的严格要求。

技术趋势

端到端自动驾驶技术正向 “轻地图化” 和 “车路云协同” 的方向演进。

  • 轻地图化:传统自动驾驶系统对高精地图的依赖程度较高,但高精地图的制作和更新成本较高,且在一些动态变化频繁的场景下可能无法及时反映道路的实际情况。轻地图化的目标是减少对高精地图的依赖,通过增强车辆自身的感知和决策能力,使车辆能够在仅有普通地图或无地图的情况下,依然能够准确地进行环境感知和路径规划。这将提高自动驾驶系统的适应性和通用性,降低系统对地图数据的依赖和更新成本。
  • 车路云协同:通过 V2X(Vehicle-to-Everything)实时交互技术,实现车辆与车辆、车辆与道路基础设施、车辆与云端之间的信息共享和协同优化。车路云协同可以提供更全面的交通信息,帮助车辆提前了解前方道路状况和交通信号变化,优化全局路径规划,提高行驶效率和安全性。例如,当车辆行驶在高速公路上时,通过与路边的智能交通设施通信,可以提前获取前方路段的拥堵信息、施工信息等,并及时调整行驶路线;同时,云端平台可以对大量车辆的行驶数据进行分析和处理,为车辆提供更精准的交通预测和路径规划建议。

以上讲解涵盖了端到端自动驾驶系统的关键技术,包括感知决策一体化模型架构、多模态数据融合、大模型驱动与仿真验证等方面的内容,并结合实例进行了详细阐述,希望能帮助你更好地理解和掌握这一领域的知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/912790.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/912790.shtml
英文地址,请注明出处:http://en.pswp.cn/news/912790.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue Vue-route (2)

Vue 渐进式JavaScript 框架 基于Vue2的学习笔记 - Vue-route重定向和声明式导航 目录 Vue-route路由 重定向 首页默认访问 不存在匹配 声明式导航 路由原理 使用示例 自定义class类 Tag设置 版本4路由 改变 示例 总结 Vue-route路由 重定向 首页默认访问 希望访…

Mabl 基于云端的智能化自动化测试平台

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 </

Linux/Dog

Dog Enumeration nmap 第一次扫描发现系统对外开放了22、80端口&#xff0c;端口详细信息如下 ┌──(kali㉿kali)-[~/Desktop/vegetable/HTB] └─$ nmap -sC -sV -p 22,80 -oA nmap 10.10.11.58 Starting Nmap 7.95 ( https://nmap.org ) at 2025-06-26 03:36 EDT Nmap s…

青少年编程与数学 02-022 专业应用软件简介 01 设计与创意类软件:Adobe Creative Cloud

青少年编程与数学 02-022 专业应用软件简介 01 设计与创意类软件&#xff1a;Adobe Creative Cloud **一、Adobe公司介绍**&#xff08;一&#xff09;Adobe的创立与早期发展&#xff08;二&#xff09;Adobe的市场地位与影响力&#xff08;三&#xff09;Adobe的创新文化 **二…

【亚马逊防关联攻略】多店铺运营如何做好环境隔离?

在亚马逊跨境电商中&#xff0c;多店运营的最大风险是账号关联。亚马逊规定&#xff0c;同一卖家在同一站点只能拥有一个店铺。平台会通过多种方式追踪注册信息、设备和网络环境等&#xff0c;如果发现关联因素&#xff0c;所有关联账号可能被批量封禁&#xff0c;这会导致资金…

She‘s Coming !

#好书推荐《一本书讲透汽车功能安全&#xff1a;标准详解与应用实践》 #功能安全应用指南 #功能安全实践参考宝典 Finally, shes coming ! 她来得有点晚&#xff0c;但 “好饭不怕晚”。 她就是刚出炉的新书《一本书讲透汽车功能安全&#xff1a;标准详解与应用实践》 京东…

如何用废弃电脑变成服务器搭建web网站(公网访问零成本)

文章目录 &#x1f4bb; 如何用废弃电脑变成服务器搭建 Web 网站&#xff08;公网访问零成本&#xff09;一、背景与目标✅ 本文目标&#xff1a; 二、准备工作&#xff08;软硬件需求&#xff09;&#x1f9f1; 1. 硬件需求&#x1f9f0; 2. 软件环境准备 三、快速搭建一个 Fl…

〔从零搭建〕指标体系平台部署指南

&#x1f525;&#x1f525; AllData大数据产品是可定义数据中台&#xff0c;以数据平台为底座&#xff0c;以数据中台为桥梁&#xff0c;以机器学习平台为中层框架&#xff0c;以大模型应用为上游产品&#xff0c;提供全链路数字化解决方案。 ✨杭州奥零数据科技官网&#xf…

Vue3 中watch和computed

Vue 3 中 computed 与 watch 深度解析 在 Vue 3 组合中&#xff0c;响应式工具的类型安全使用至关重要。以下是详细说明 一、watch 侦听器 1. 基础类型监听 <template><div>实际参数1{{count}}</div><div><button click"count">点…

.NET测试工具Parasoft dotTEST:全兼容RMS的测试解决方案

随着项目规模扩大&#xff0c;需求管理变得复杂&#xff0c;如何高效追溯需求与测试的关联性成为一大挑战。Parasoft dotTEST 提供了一套强大的需求追溯解决方案&#xff0c;不仅能自动关联单元测试结果与需求&#xff0c;还能兼容几乎所有需求管理系统&#xff08;RMS&#xf…

基于Jeecgboot3.8.1的vue3版本前后端分离的flowable流程管理平台

初步迁移完成了基于jeecgboot3.8.1的vue3版本的前后端流程管理平台,基于flowable6.8.0,同时支持bpmn流程设计器与仿钉钉流程设计器。 功能类似于3.6.3,但增加了一些以下功能: 1、支持多租户 2、支持并行网关的任意跳转、退回与驳回 3、流程表达式 这里流程表达式定义四…

IP 限流 vs. URI 限流

背景&#xff1a; 昨天调程序的时候遇到了一个 BUG&#xff0c;前端无法将文件正确传给后端&#xff0c;后端报错 EOFException&#xff08;EOF 代表 End Of File&#xff09;就是在程序尝试从一个数据流中读取数据时&#xff0c;发现已经到达了数据流的末尾&#xff0c;但它却…

2025年Java常见面试题(持续更新)

数据库事务特性。原子性、一致性、隔离性、持久性如何防止SQL注入&#xff1a;使用#不要使用$符号&#xff1b;对所有的入参做校验&#xff1b;使用存储过程&#xff1b;执行预处理语句和参数化查询&#xff1b;最低权限原则&#xff1b;微服务拆分的原则&#xff1a;微服务的拆…

Spring AI ——在springboot应用中实现基本聊天功能(ChatModel)

文章目录 前言项目版本依赖引入配置key信息编写测试接口注入ChatModel并普通返回注入ChatModel并流式返回自定义模型对象并直接返回总结前言 在Spring AI 中,CchatClient 是一个所有大模型通用性的调用方式,对绝大多数大模型的功能点都具备封装和见解调用性。 但这一点在部…

78、系统工程生命周期阶段及方法

一、系统工程生命周期的七大阶段 系统工程生命周期涵盖从概念萌芽到系统退役的全过程&#xff0c;通常分为以下七个阶段&#xff0c;每个阶段具有明确目标与核心任务&#xff1a; 1.探索性研究阶段 目标&#xff1a;识别利益相关者需求&#xff0c;探索技术可行性。任务&…

二十九、【用户体验篇】个人中心:用户资料展示与密码修改

二十九、【用户体验篇】个人中心:用户资料展示与密码修改 前言准备工作第一部分:后端实现 - 个人中心 API1. 修改 `UserDetailSerializer` 以支持密码修改2. 在 `api/views.py` 中添加 `UserMeView` 和 `PasswordChangeView`3. 注册个人中心相关 API 路由4. 后端初步测试第二…

STEP-BACK PROMPTING:退一步:通过抽象在大型语言模型中唤起推理能力

摘要 我们提出了 STEP-BACK PROMPTING&#xff0c;这是一种简单的提示技术&#xff0c;可以让LLM进行抽象&#xff0c;从包含具体细节的实例中推导出高层次概念和第一性原理。利用这些概念和原理来引导推理过程&#xff0c;LLM在朝向正确解答路径上显著提升了推理能力。我们在…

Paimon vs. HBase:全链路开销对比

Paimon 在特定场景&#xff08;如流式 Lookup Join&#xff09;下&#xff0c;会为了极致的查询性能而引入额外的存储&#xff08;本地磁盘 LookupFile&#xff09;和计算&#xff08;构建 LookupFile&#xff09;开销。但这是一种用一次性的、可控的开销&#xff0c;换取后续持…

本地的包名导致的AttributeError: module ‘langchain‘ has no attribute ‘verbose‘

你遇到的 AttributeError: module langchain has no attribute verbose 问题&#xff0c;确实可能是因为你的本地文件或目录名与 langchain 官方包冲突&#xff0c;导致 Python 在导入时优先加载了你的本地文件而非真正的 langchain 库。 问题原因 Python 模块加载机制&#xf…

玄机——某学校系统中挖矿病毒应急排查

本篇文章主要记录某学校长期未运营维护的程序&#xff0c;被黑客发现了漏洞&#xff0c;但好在学校有全流量设备&#xff0c;抓取到了过程中的流量包 需要你进行上机以及结合流量分析&#xff0c;排查攻击者利用的漏洞以及上传利用成功的木马 文章目录 靶机介绍1.使用工具分析共…