2025年的春天格外特别。伴随着人形机器人、DeepSeek的强势刷屏,AI成了最有前景的赛道。万物皆可AI,万物也在寻觅用上AI或者让AI“转正”的“aha moment”。

帮助机器更好地“思考”,让更多的AI走向边缘,是AI发展的重要趋势之一。在MCU中加入NPU单元是落实这一趋势的芯片技术路线之一,STM32N6便是MCU+NPU架构的开山之作,它拥有MPU级的AI性能,同时具备MCU级的功耗和成本。这一独特的价值定位,让边缘AI部署更轻松。

我们发现,在人工智能芯片技术持续创新的过程中,许多神经网络算法对传统MCU的要求过高,为了运行这些算法,实现边缘AI功能,开发者不得不采用集成神经处理单元(NPU)的MPU。当集成ST自研NPU的STM32N6问世之后,它可以替代那些性能强大的MPU,在保持贴近原始输入数据源、降低延迟、增强数据安全性和隐私性等优势的同时,还能降低系统成本(BOM成本更低)、加强系统的实时操作性、满足更低的功耗要求。

1. STM32N6特性概览

STM32N6是意法半导体最新且性能最强劲的STM32 MCU,它强在:

  • 专用嵌入式神经处理单元(NPU)STM32N6集成ST自研硬件NPU,处理能力达600GOPS;同时具有3TOPS/W的极低功耗,在运行AI模型时,不需要任何散热装置。
  • Arm Cortex-M55内核 STM32N6内核为Cortex-M55,主频达800MHz,新增150个DSP矢量扩展指令集(MVE),可实现在数据被送到NPU之前的预处理,或从NPU得到结果的后处理。
  • 大容量嵌入式RAM STM32N6内置4.2 Mbytes嵌入式RAM,支持实时数据处理和多任务处理,如存储NPU运算中的推理数据,或作为帧缓存,或H264压缩时的中间数据。
  • 强大的计算机视觉能力 STM32N6集成并行和MIPI CSI-2摄像头接口及专用图像处理单元(ISP),提供600GOPS的AI处理算力,可胜任很多机器视觉应用。
  • 扩展的多媒体功能 STM32N6集成2.5D图形加速器、H264编码器,以及JPEG编解码的硬件加速,能轻松实现在运行AI处理时,把从摄像头获取的视频通过以太网口或USB(UVC协议)传输到外部。
  • 增强的安全功能 STM32N6包括为Cortex-M55核和NPU配备的Arm TrustZone,目标认证SESIP3、PSA L3。

2. NPU引入MCU,将触发边缘AI应用新场景的“aha moment”

STM32N6之所以能够实现MPU级别的AI性能,是因为它搭载了神经网络硬件加速单元—Neural-ART加速器,这是ST自研的神经处理单元(NPU),运算吞吐量高达600 GOPS(每秒6000亿次操作),比不具备NPU的STM32H7高出600倍。

NPU是专为加速神经网络计算和人工智能相关任务而设计的,针对矩阵乘法、卷积和其他线性代数运算进行了优化。因此,NPU在运行和处理AI算法非常高效,非常擅长处理图像分类、语音处理以及自然语言等多模态模型。NPU在处理AI相关任务时,功耗非常低,尤其适合电池供电的设备。不仅如此,它还可以减少微控制器上处理AI任务的延迟,这对于实时应用来说非常重要。

通过将NPU引入MCU,它将为您的人工智能应用开辟出一系列全新的可能性,为更高级和更复杂的AI用例甚至多模态场景打开大门,而不仅仅是单模态场景。

NPU带来的性能提升也是非常显著的。如上图,选取一些如图像分类、对象检测、语音识别等非常经典的神经网络模型,让这些模型分别运行在STM32N6的NPU上,也运行在STM32N6的Cortex-M55内核上,通过比较,可以发现运行这些神经网络模型时,推理性能提升了26倍到134倍。

3. STM32N6完备开发工具链邂逅成熟产品生态

AI应用的开发,除了硬件性能,软件支持也非常重要。STM32N6拥有完备的开发工具链和成熟的软件生态系统,原生支持多种主流人工智能框架,如TensorFlow和Keras。对于其他人工智能框架,如PyTorch,STM32N6通过ONNX格式来支持。ONNX是一种中间转换格式,可用于将任何神经网络模型格式转换为开放和标准化的格式。这体现了STM32N6 NPU工具链的灵活性,未来将支持更多的人工智能框架和应用层。

ST还提供一个完整的软件生态系统,极大地促进并优化基于STM32N6的新型人工智能应用的开发过程。这一生态系统的核心是ST Edge AI Suite,它由三部分组成:首先是Edge AI Model Zoo,这是一个免费软件工具的资源库,汇聚了免费的软件工具、实用的边缘AI模型和代码示例,以及详尽的文档资料。无论开发者经验丰富与否,都能在其中找到创建边缘人工智能应用所需的支持。其次是Edge AI Developer Cloud在线平台,开发者可以通过托管在这个云平台上的板卡对自己的AI模型进行远程性能基准测试。最后是STM32Cube.AI和ST Edge AI Core,这两款工具是模型优化器,可以将您的神经网络转换为可以在设备上执行的C代码。

4. 结语

在AI蓬勃发展的当下,STM32N6以MCU+NPU架构破局,性能飞升,为边缘AI解锁更多场景,成为边缘AI落地的插上“隐形的翅膀”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/96006.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/96006.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/96006.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

演练:使用VB开发多智能体协作的荣格八维分析器

在大语言模型高速发展的时代,我们面对困难的语义分析任务,通过构建智能体进行处理是一个流行趋势。本文将介绍如何使用 Visual Basic .NET 开发一个多智能体协作系统,用于分析聊天记录中特定人物的荣格八维人格类型。 本文使用 CC-BY-NC-SA …

llamafactory使用qlora训练

llamafactory使用qlora训练 1.环境搭建 conda create -n qlora python3.10 -y conda activate qlora# 克隆LLaMA-Factory仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git# 进入仓库目录 cd LLaMA-Factory# 切换到0.9.4版本 git checkout v0.9.4pip install -e .2…

模型微调/量化技术整理

一、模型微调技术1.模型微调简介大模型微调(Fine-tuning),是指在已经预训练好的大语言模型基础上(基座模型),使用特定的数据集进行进一步训练,让模型适应特定任务或领域。通常LLM的预训练是无监督的,但微调…

实践笔记-VSCode与IDE同步问题解决指南;程序总是进入中断服务程序。

一、VSCode 修改文件后,IDE 未同步如果你在 VSCode 中异步修改了项目文件内容,但 S32DS 或 Keil(等集成开发环境)中的项目没有同步更新,有两个解决方法:检查文件是否已保存:确保 VSCode 中修改的…

C#WPF实战出真汁04--登录功能实现

1、登录功能实现要点对于登录系统,应该注意几个要点:用户认证流程设计,密码存储与验证,会话管理,防暴力破解措施,错误处理与提示2、登录功能的视图模型首先在xaml文件中必须指定该页面使用的视图模型&#…

鸿蒙入门简化版

第一步: 首先下载DEVStudio https://developer.huawei.com/consumer/cn/deveco-studio/ 第二步: 了解基本的ArkTs语言 https://developer.huawei.com/consumer/cn/doc/harmonyos-guides/introduction-to-arkts 第三步 : 教学视频有两个途径&a…

day25|学习前端js

函数声明,被提升(hoisting)。函数表达式必须先定义才能用。对象解构,按属性名数组解构按顺序点运算符. 对象.属性名哪些可迭代(可以被for..of循环的东西):array,string,m…

quic协议与应用开发

quic为什么出现?quic主要是为了解决TCP协议的局限性而提出的,具体来说是要解决如下问题:1. 加密连接建立时间长TCP协议是传输层协议,而TLS是会话层协议,在Linux等主流操作系统中TCP在内核实现而TLS一般在用户态实现&am…

【浅学】tflite-micro + ESP32S3 + VScode + ESP-IDF 基于例程快速实现自己的图像分类模型训练部署全流程

如果你用Pytorch训练的模型那么可以参考我的步骤,使用的是Tensorflow的话参考官方文档即可,但流程都是一样的,每一步我都会提到部分操作细节及注意事项 官方教程 要详细学习的话tflite-micro里的微控制器章节下都详细看(页面左侧…

【HarmonyOS】应用设置全屏和安全区域详解

【HarmonyOS】应用设置全屏和安全区域详解 一、前言 IDE创建的鸿蒙应用,默认采取组件安全区布局方案。顶部会预留状态栏区域,底部会预留导航条区域。这就是所谓的安全区域。 如果不处理,界面效果很割裂。所以业内UI交互设计,都会设…

openfeign 只有接口如何创建bean的

OpenFeign 能够为纯接口创建 Spring Bean,其核心机制是通过动态代理和 Spring 的 FactoryBean 机制实现的。以下是详细的工作原理:1. EnableFeignClients 注解的启动在 Spring Boot 主类上添加 EnableFeignClients 注解:SpringBootApplicatio…

【展厅多媒体】互动地砖屏怎么提升展厅互动感的?

在数字化展厅设计中,互动地砖屏 正成为提升观众参与度的重要工具。这种融合视觉科技与交互体验的装置,通过动态影像与即时反馈,让参观者从被动观看转变为主动探索,从而大幅增强展厅的互动感。 Led地面互动屏的优势在于其强大的视…

AI赋能电力巡检:变压器漏油智能检测系统全解析

🔥 AI赋能电力巡检:变压器漏油智能检测系统全解析 📖 前言 在电力系统的日常运维中,变压器作为核心设备,其安全运行直接关系到整个电网的稳定性。传统的人工巡检方式不仅效率低下,还存在安全隐患和漏检风险…

GitHub上值得Star的计算机视觉项目

GitHub上值得Star的计算机视觉项目 前言 一、OpenCV:计算机视觉领域的瑞士军刀 1.1 项目简介 1.2 核心功能与技术特点 1.3 代码示例 二、YOLO 系列:实时目标检测的领导者 2.1 项目简介 2.2 核心功能与技术特点 2.3 代码示例 三、Detectron2:Facebook AI Research 的目标检测…

【深度学习】pytorch深度学习框架的环境配置

文章目录1. 配置cuda环境2. 配置conda环境3. 配置pytorch gpu环境1. 配置cuda环境 在命令行输入以下命令可以查看当前显卡驱动版本和最高支持的cuda版本 nvidia-smi根据cuda版本去官网下载并安装cuda 下载链接:https://developer.nvidia.com/cuda-toolkit-archive…

数据处理与统计分析 —— 房源数据集分析案例

数据集网盘下载: 链接:https://pan.quark.cn/s/0e577858dba3?pwdFJnb 提取码:FJnb代码仅供参考具体可打开ipynb文件进行学习和练习:链接:https://pan.quark.cn/s/8efbe3061fad?pwdT47B 提取码:T47Bimport…

蓝牙如何测试?

车载蓝牙测试需覆盖 连接稳定性、功能完整性、兼容性、交互体验等核心维度,结合车载场景的特殊性(如行驶中信号干扰、多设备交互、安全需求),具体测试点如下: 一、基础配对与连接测试 1. 首次配对 触发配对:车机端 “蓝牙设置” 中搜索设备、手机端搜索车机(车机名称是…

算法02 二进制与位运算

二进制作为计算机底层数据的核心表示方式,其独特的位结构和运算规则在算法设计中有着广泛且关键的应用。以下从基础操作、算法技巧、数据结构、经典问题等多个维度,全面梳理二进制在算法中的应用: 一、基础位运算:算法的“原子操作…

PAT 1071 Speech Patterns

题目大意是说给出一个文本,找出里面出现最多的单词,如果有多个单词出现次数一样多,则输出字典序最小的。 需要注意的是: 给出的文本字符串不仅有数字还有字母,还有一些特殊的字符,还有空格。 而单词是只包含…

CSS中的 :root 伪类

在CSS中&#xff0c;伪类是一种用于选择元素特定状态的选择器。:root 伪类专门用于选择文档的根元素&#xff08;在HTML中通常是<html>元素&#xff09;&#xff0c;它是CSS变量&#xff08;Custom Properties&#xff09;的理想载体&#xff0c;常用于定义全局样式变量&…