作者:北京华兴万邦管理咨询有限公司  翔煜  商瑞

智能汽车时代的加速到来,使车载智能系统面临前所未有的算力需求。随着越来越多车型引入电子电气架构转向中心化、智能驾驶的多传感器融合、智能座舱的多模态交互以及生成式AI驱动的虚拟助手等创新技术,都要求车用主芯片能够同时胜任图形渲染、AI推理和安全计算等多重任务。当下,功能安全、高效高灵活性的算力、产品生命周期,以及软件生态兼容性这“四大核心要素”,已成为衡量智能汽车AI芯片创新力和市场竞争力的核心标准。

传统汽车计算架构中,往往采用CPU与GPU或/和NPU等计算单元组成异构计算模式;随着自动驾驶算法从L1向L5快速演进对软件适配性的要求越来越高,以及不断有新的传感器和信息娱乐设备加入车内,不同的架构开始出现不同的发展轨迹。同时,系统复杂性快速提升、大量的数据搬运、资源调度协同难度提升和软件快速迭代等新挑战开始出现,使缺乏灵活性的硬件架构成为了在技术、安全和成本等多个方面制约汽车智能化发展的瓶颈。

市场急需一种既能灵活地提供高性能、高效图形与AI加速能力,同时满足功能安全标准、可与广泛的软件生态对接且总成本更低的车用芯片架构。

功能安全不仅关乎安全也是芯片成本控制关键

功能安全永远是消费者、主机厂、Tier-1和芯片供应商首先关心的问题,但它并不是一个智能驾驶技术快速发展进程中才出现的问题;行业已经形成了完善的ISO26262标准和ASIL认证体系,以及锁步(Lock-Step)和双套硬件结果对比等解决方案。但是随着车用芯片中的CPU、GPU和NPU越来越复杂并占用更大面积,这些原本为MCU提供的功能安全解决方案的硅成本和复杂性都大幅提升,因此市场需要在汽车芯片功能安全解决方案领域实现创新。

作为汽车电子领域的一项创新产品,Imagination DXS GPU IP专注于智能座舱与自动驾驶场景的深度优化,其设计充分体现了业界近期在功能安全方面的巨大突破,同时确保了性能的提升、安全性的增强以及芯片成本的有效控制。Imagination DXS GPU的峰值性能较前一代产品提升了50%,算力从单核的0.25TFLOPS扩展至1.5TFLOPS,最高可达6TFLOPS和24TOPS,同时支持高达192GPixel/s的图形渲染速率。


在功能安全的实现上,Imagination DXS GPU采用了针对GPU运算开放的分布式安全机制(DSM),仅以10%的面积开销就实现了ISO 26262 ASIL-B功能安全认证。DSM利用了处理器的并行特性,在空闲周期运行安全测试,既保证了性能不受影响,又确保了安全,打破了锁步和备份等传统安全设计的局限性。这一创新设计从架构层面阐释了功能安全领域仍然存在着许多创新机会,可以帮助越来越先进的GPU在安全保障、系统复杂性、成本控制与下游厂商获得认证等多个方面创造价值。


正是因为Imagination DXS GPU在功能安全性和计算性能等方面实现了开创性的突破,在2025年5月于上海举办的 “第十二届汽车电子创新大会暨汽车芯片产业生态发展论坛(AEIF 2025)”上,Imagination DXS GPU IP凭借其创新的、先进的GPU技术,荣获“2025 汽车电子・金芯奖-新锐产品”殊荣。据了解,从该公司的D系列GPU IP产品开始,包括最新的公布了架构的E系列中的车用GPU IP都将采用这种成本和复杂性都具有明显优势的分布式功能安全机制。目前,DXS GPU IP已集成于瑞萨R-Car Gen 5系列SoC中,助力智能驾驶技术的商业应用,满足从入门级到旗舰车型的全方位需求。

高灵活性的高效算力是车用处理器的核心功能


对于车用芯片设计企业,为了处理越来越复杂的AI计算和图形渲染,在其计算芯片中采用GPU或者NPU这样的并行处理器成为了必然;然而随着汽车电子电气架构从域控制转向中央控制,车用核心处理器不仅需要更高的算力,而且还需要针对不同的应用可以在架构上灵活地进行优化,也就是需要性能更高、同时又不会被锁死在NPU或者GPU架构上的灵活架构,这也成了汽车和其他很多边缘AI应用中高性能并行计算的发展方向。


对于这种可以针对应用进行优化和定义的并行计算处理器架构,依然是Imagination凭借其技术前瞻性和能力,而重新定义了面向汽车和端侧AI的高性能并行计算行业标准。2025年5月,Imagination推出了专为端侧智能场景设计的新一代E系列(E-Series) GPU IP架构,该系列GPU凭借其高效的并行处理架构,在提供卓越图形性能的同时,针对人工智能工作负载具备灵活算力扩展能力。

E系列GPU架构集成了神经核(Neural Cores)和爆发式处理器(Burst Processors),支持算力从2TOPS灵活扩展至200TOPS(INT8/FP8),满足从基础端侧计算到高阶智驾的多样化算力需求。这样的架构设计使Imagination E系列GPU同时具有了NPU的高性能和GPU的高灵活性;通过优化指令调度和数据复用机制,端侧计算的平均功耗效率提升了 35%,在相同算力条件下,车载系统的功耗降低了20%。

这种高效且灵活的AI算力及图形处理功能调配,完美贴合了在包括汽车在内的端侧AI场景中同时存在大量的AI计算与图形处理需求的应用,优化了中央计算模式下核心车用芯片同时处理驾驶和座舱需求的性能与能耗。此外,通过升级硬件级虚拟化技术,E系列GPU IP支持多达16个虚拟机任务隔离,实现了AI、图形、UI等多任务的异步并行处理,确保了智能座舱多系统协同工作和自动驾驶多任务并行处理的车用场景需求。以“高灵活性的高效算力”为核心,E-Series GPU不仅满足了未来智能汽车车用处理器的算力需求,并推动了汽车智能化体验的进一步提升。

更长的产品生命周期:GPU 架构的可编程性打破总成本困局

随着智能驾驶和智能座舱技术从旗舰车型向中低端车型的渗透,主机厂对芯片成本的严格控制正在推动行业打破传统开发模式的局限性。根据行业数据,传统车用计算芯片的开发成本高达2亿-3亿美元,研发周期长达3~5年。在算法需要迭代时,固定功能架构的NPU芯片必须重新流片,每次迭代的成本占到初始开发费用的40%~50%。这种“高投入、长周期、低弹性”的开发模式,在主机厂追求“一款芯片满足多车型10年生命周期”的目标面前,明显暴露出成本上的限制。

因此,相对于从架构到功能都基本固定的基于NPU车用控制芯片,采用GPU IP的车用芯片可以更加从容地去面对这样的总成本压力,因为采用GPU的硬件设计可以通过更高的可编程性来实现跨算法、跨厂商和跨车型应用,用更大数量的市场应用来摊低高昂的芯片研发成本,因而基于GPU架构的车用芯片比基于NPU的车用芯片拥有更长的产品生命周期和更高的应用灵活性。

当然,如果车用芯片中GPU本身的AI计算与图形处理能力就可以灵活配置,那么还会带来更高的成本节省和更长的产品生命周期。以Imagination在其GPU IP产品中推动的可编程泛化架构以及由此开发的E系列GPU为例,其通过软件定义硬件的设计,可将芯片硬件生命周期延长至10年以上:当AI模型升级时,仅需数月软件适配即可完成迭代,较传统NPU迭代方案大幅减少。这种统一计算单元设计可跨汽车、工业等几大场景复用,硬件设计成本降低40%,研发投入回收周期显著缩短。

开放软件生态:一次开发、多场景部署

软件生态和可适配性正在变成各种高性能计算的重要门槛,英伟达的CUDA生态使其在AI计算和汽车芯片方面占尽了先机。因此,其他的汽车和端侧AI芯片厂商要在市场中斩获更多份额,就需要其核心计算单元IP提供商构建更加开放的软件生态;随着诸多基于此目的的标准组织不断建立和壮大,其中的主要玩家正在支持新一代车用芯片开发商解决软件生态的问题。

例如,Imagination就构建了一个面向未来的开放体系,其核心优势在于“一次开发,多场景部署”。其算力可以通过OpenCL、Vulkan等主流API直接调用,开发者利用oneAPI、Apache TVM等工具链,可以轻松地将工作负载迁移到E系列GPU中的神经核。这种可编程性不仅大幅降低了跨平台开发的成本,还赋予了设备适应未来算法变革的灵活性。面对生成式AI、多模态交互等前沿应用的快速迭代,E系列GPU无需硬件迭代,仅通过软件升级就能迅速适应,确保产品持续满足新兴需求。

在自动驾驶领域,Imagination的GPU IP同样遵循“一次开发,多场景部署”的理念。通过集成FP16流水线以及imgBLAS、imgNN等高效计算库,显著提升了雷达点云数据、视觉SLAM等传感器数据的处理速度,有效减轻了CPU和NPU的负担。同时,通过与OpenCL、Vulkan等开放标准以及CoreAVI安全驱动的兼容,确保了在复杂场景下系统的实时响应和稳定运行,使技术能力贯穿智能座舱、自动驾驶等多个场景,巩固了跨场景部署的技术基础。

结语

从Imagination的E系列GPU等产品实现的架构创新来看,用于智能汽车等端侧应用的AI芯片也在重塑其技术逻辑,更揭开了端侧AI计算革命的序幕。在智能汽车领域,功能安全、高效灵活的算力、生命周期管理与开放软件生态这四大要素构建的技术护城河,正推动行业从“硬件堆砌”向“智能进化”转型;而在更广阔的端侧 AI场景中,这种“软件定义硬件”的理念正在帮助消费电子、工业物联网、智慧城市和智能商业等边缘计算等领域全面拥抱AI技术。

这种变革的深层意义,在于打破了“云-边-端”的技术壁垒。当智能汽车的GPU架构能够通过软件升级支持智慧城市的交通调度算法,当工业设备的计算单元可复用至消费电子的AI交互场景,端侧AI正从单一功能模块进化为“可生长的智能体”。可进化的端侧芯片将如同今日的CPU般,成为所有智能设备的“数字大脑”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/87177.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/87177.shtml
英文地址,请注明出处:http://en.pswp.cn/web/87177.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

照明新基建:塔能科技如何用数字骨骼支撑智慧城市生长

一、能源管理困局:双碳目标下的市政用电痛点 在双碳背景下,城市照明用电量已引起市政部门的重点关注。据国家统计局统计:我国城市照明用电量已占据全市城市用电量的28%,部分城市的照明用电量已高达35%以上,高压钠灯传统…

让Claude Code像Cursor一样好用

最近折腾AI工具,发现Claude Code真是个宝藏。但说实话,初学者一上手,十有八九会被命令行那一堆黑框框劝退。你以为你用熟了?其实你只解锁了Claude Code不到20%的威力,剩下的80%都藏在命令行背后的“黑魔法”里。00后谁…

ROS 2 中更改从设备(如电机控制器)的运动模式

在 ROS 2 中更改从设备(如电机控制器)的运动模式(例如从位置模式切换到速度模式),需要通过操作模式(Mode of Operation,对应对象字典索引0x6060) 进行设置。结合你的配置&#xff08…

朴素贝叶斯分类

一、朴素贝叶斯算法概述 朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的简单概率分类算法,它假设特征之间相互独立("朴素"的含义)。尽管这个假设在现实中很少成立,但该算法在许多实际应用中表现优异,特别是…

python协程:yield实现协程执行、生成器取值的三种方式

yield关键字执行流程 注意:yield关键字的调用次数如果超过了任务执行次数会报错,提示stopiteration异常,例如 正常范围内的任务执行 # 定义一个任务(函数1) def task1():for i in range(3):print(f----task1 i {i}-…

pdf删除一页 python实现(已验证)

首先安装库 使用PyPDF2 首先,确保你已经安装了PyPDF2。如果没有安装,可以通过pip安装: pip install PyPDF2 然后运行 import PyPDF2def remove_page(input_pdf_path, output_pdf_path, page_number_to_remove):# 打开PDF文件with open(i…

2025.1版本PyCharam找不到已存在的conda虚拟环境

前言 创建Python项目指定conda虚拟环境是最常用的操作,我下载的2025.1版本PyCharam编译器找不到我已经创建好的conda虚拟环境,解决方法如下 目录 问题描述 问题解决 总结 问题描述 我使用2025.1版本PyCharam编译器创建项目指定已经存在的虚拟环境出现如下情景 说是我没有…

开机启动项在哪里设置 实用步骤分享

电脑开机时,系统会自动运行一系列程序,其中包括必要的系统进程和用户自行添加的启动项。然而,过多的启动项可能会导致开机速度变慢,影响系统性能。因此,合理管理开机启动项,可以优化电脑的运行效率。电脑开…

LeetCode--39.组合总和

前引:明天就考最后一趟考试,最近考试周,我时时断更,从明天开始,就会一直更新了,可以期待一下 解题思路: 1.获取信息: 给定一个无重复的整数数组和一个目标值 从数组中选取任意数量的…

Visual Studio2022和C++opencv的配置保姆级教程

1.c桌面开发和windows平台开发(Visual Studio2022安装时) 2.下载OPenCV 3.系统属性→添加环境变量→Path 4.VS2022配置opencv 5.项目→属性→VC目录中的包含目录和库目录 5.项目→属性→VC目录中的包含目录和库目录 包含 目录添加: D:\…

使用Ansible的playbook安装HTTP

实验环境 安装好ansible 一、准备测试服务(192.168.10.41) 1、安装HTTP服务 dnf -y install httpd 2、启动HTTP服务 systemctl start httpd 3、使用浏览器访问 192.168.10.41 因为开启了防火墙,所有无法访问 4、开放防火墙的80端口 …

V少JS基础班之第六弹

一、 前言 第六弹内容是闭包。 距离上次函数的发布已经过去了一个多月, 最近事情比较多,很少有时间去写文章, 低质量还得保证所以本章放草稿箱一个月了,终于补齐了,其实还有很多细节要展开说明,想着拖太久…

【面板数据】全国高频交易明细数据(2000-2024.7)

中国土地交易市场作为国家宏观调控的重要组成部分,其通过市场机制,使土地使用权在不同主体间流转,将土地资源配置给最具利用效率的部门或企业,提升土地利用率和经济产出。中国土地高频交易明细数据汇集了全国范围内2000-2024年7月…

MongoDB 常用增删改查方法及示例

MongoDB 的增删改查(CRUD)操作是其核心功能,主要通过 mongo shell 或驱动(如 Node.js、Python 等)实现。以下是最常用操作的详细说明及示例(基于 mongo shell 语法)。 ​一、插入操作&#xff…

moodle升级(4.5到5.0)

升级目标 由Moodle 4.5 (Build: 20241129) 升级到Moodle 5.0.1 (Build: 20250629) 参考教程:moodle升级(详细版)-CSDN博客 操作平台:宝塔 通过宝塔进行备份 备份文件 将/www/wwwroot/moodle 和/www/wwwroot/moodledata 复制…

基于Apache POI实现百度POI分类快速导入PostgreSQL数据库实战

## 引言:POI数据的价值与挑战 POI(Point of Interest)数据作为地理信息系统的核心要素,在智慧城市、位置服务、商业分析等领域具有重要价值。百度POI数据包含了丰富的地点信息(如名称、类别、坐标等),但如何高效处理这些数据并将其导入数据库进行分析是开发者面临的挑战…

linux LAMP 3

[rootcode apache2]# bin/apachectl AH00558: httpd: Could not reliably determine the server’s fully qualified domain name, using fe80::20c:29ff:fe2a:708a. Set the ‘ServerName’ directive globally to suppress this message root192.168.235.5s password:┌─…

UI自动化-Selenium WebDriver

前言 Selenium WebDriver 是 Selenium 项目中最核心、最强大的组件,它是一个用于自动化控制网页浏览器的开源 API(应用程序编程接口)。 简单来说,Selenium WebDriver 就是一个允许你用编程语言(如 Java、Python、C#、…

具身多模态大模型在感知与交互方面的综述

引言在本学期方老师的《机器人与大模型》课上,我首次接触到了关于具身智能的前沿知识,尤其作为课上交互组的成员,从表情识别到语音交互到机械狗的开发实践进行了一些有意思的探索,使我在其中感受到了具身智能的巨大魅力和无限潜力…

UI 设计|审美积累 | 拟物化风格(Skeuomorphism)

拟物化是指把现实世界的材质、光影和结构带到数字界面中。木纹、金属、皮革、纸张等真实物体的质感,被细致地还原到屏幕上,让用户一眼就明白元素的意义与操作方式。它曾是iOS6之前移动端设计的主流风格,也一度被极简风格取代,但在…