YOLOV13最近发布了,速速来看。

论文标题:YOLOv13:融合超图增强的自适应视觉感知的实时目标检测

论文链接:https://arxiv.org/pdf/2506.17733

代码链接:https://github.com/iMoonLab/yolov13

话不多说,直接上摘要!

中文摘要

YOLO 系列模型因其卓越的精度与计算效率,一直在实时目标检测领域占据主导地位。然而,YOLOv11 及更早版本所采用的卷积架构,以及 YOLOv12 引入的基于区域的自注意力机制,都仅限于局部信息聚合与两两相关性建模,难以捕捉全局的多对多高阶关联,这在复杂场景下限制了检测性能。

为了解决上述问题,我们提出了一种全新且轻量的目标检测器 —— YOLOv13。我们引入了一种基于超图的自适应相关性增强机制(HyperACE),该机制能够自适应地挖掘潜在的高阶关系,突破了传统方法仅能进行两两建模的限制。借助超图计算,HyperACE 实现了高效的跨位置、跨尺度的全局特征融合与增强。

在此基础上,我们进一步提出了一个基于 HyperACE 的全流程聚合与分发范式(FullPAD),通过将增强后的相关性特征分发至整个网络流程,实现了细粒度信息流动与特征协同建模。

此外,我们采用深度可分离卷积替代传统的大卷积核操作,并设计了一系列模块,在大幅减少参数量和计算复杂度的同时,保持甚至提升了性能。

我们在广泛使用的 MS COCO 基准数据集上进行了大量实验证明,YOLOv13 在保持轻量的前提下,取得了当前最先进的性能。具体而言,YOLOv13-N 相较于 YOLOv11-N 提高了 3.0% 的 mAP,较YOLOv12-N提高了1.5%。YOLOv13 的代码与模型已开源,欢迎访问:https://github.com/iMoonLab/yolov13

贡献点

  • 我们提出了 YOLOv13,一款性能卓越的端到端实时目标检测器。YOLOv13 通过自适应超图挖掘潜在的高阶相关性,在高阶关系的引导下实现高效的信息聚合与分发,从而达到精准且鲁棒的目标检测。
  • 我们提出了 HyperACE 机制,基于自适应超图计算捕捉复杂场景中的潜在高阶相关性,并在相关性引导下完成特征增强。我们提出了 FullPAD 范式,在整个网络流程中实现多尺度特征的聚合与分发,提升信息流动性与表示协同能力。我们设计了一系列基于 深度可分离卷积 的轻量化模块,用以替代传统的大卷积核结构,在大幅减少参数量与计算开销的同时保持出色性能。

  • 我们在 MS COCO 基准数据集上进行了大量实验,结果表明 YOLOv13 在保持轻量化的同时,达到了当前最先进的检测性能。

模型架构

YOLOv13 模型的网络架构。该模型以主干网络提取的多尺度特征为输入, HyperACE 模块自适应地挖掘高阶相关性,实现特征的增强与融合。随后, FullPAD 通道将增强后的相关性特征分发至整个网络,实现对复杂场景中目标的精准检测。 HyperACE 的详细结构如右图所示
自适应超图构建与卷积的细节

DS 系列模块的详细架构

 实验结果

这里仅展示部分论文实验数据,在 MS COCO 数据集上与其他先进实时目标检测器的定量对比。

 与其他实时目标检测器的泛化能力对比。所有模型均在 MS COCO 数据集上训练,并在 PASCAL VOC 2007 数据集上进行测试。

总结

YOLOv13作为最新发布的实时目标检测模型,通过引入基于超图的自适应相关性增强机制,显著提升了模型对复杂场景中多尺度、多层次特征的融合能力。同时,采用轻量化的深度可分离卷积模块,有效降低了参数量和计算复杂度,使得模型在保持高精度的同时更加高效。大量基于MSCOCO数据集的实验验证表明,YOLOv13在保持轻量化的前提下,实现了当前领先的检测性能,展现出极强的实用价值和推广潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/86767.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/86767.shtml
英文地址,请注明出处:http://en.pswp.cn/web/86767.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker错误问题解决方法

1. Error response from daemon: Get “https://registry-1.docker.io/v2/”: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) https://zhuanlan.zhihu.com/p/24228872523 2. no configuration file provided: …

大模型在恶性心律失常预测及治疗方案制定中的应用研究

目录 一、引言 1.1 研究背景与意义 1.2 研究目的与方法 1.3 研究创新点 二、大模型技术概述 2.1 大模型基本原理 2.2 常见大模型类型及特点 2.3 大模型在医疗领域的应用现状 三、心律失常的术前预测与准备 3.1 术前心律失常预测的重要性 3.2 大模型在术前预测中的应…

【视频芯片选型】

一、边缘 AI 芯片选型逻辑与未来趋势 (一)嘉楠 K230、全志 V853、瑞芯微 RK3588 对比选型 核心场景适配 嘉楠 K230: 适合低功耗边缘 AI场景,如智能家居中控(支持语音 视觉双模态交互)、电池供电设备&#…

JavaScript---DOM篇

1. DOM 概念 文档对象模型:将 HTML 文档映射为树形结构,JS 可通过 DOM 操作页面。 2. 获取元素 document.getElementById(id) document.querySelector(CSS选择器) document.querySelectorAll() 获取多个 3. 操作元素 属性操作: element.getAt…

第三次课:实验室安全用电

触电的危害 触电的方式 安全用电与预防措施 触电急救 时间就是生命 安全自省 安全用电常识补充

NV064NV065美光固态闪存NV067NV076

美光NV系列固态闪存技术深度解析与应用指南 技术架构革新:垂直堆叠与浮栅技术的突破 美光NV系列固态闪存的核心竞争力在于其232层NAND闪存技术,通过垂直堆叠工艺将存储单元层层叠加,如同在指甲盖面积内构建超过200层“数据楼宇”&#xff0…

设计模式精讲 Day 18:备忘录模式(Memento Pattern)

【设计模式精讲 Day 18】备忘录模式(Memento Pattern) 文章内容 开篇 在“设计模式精讲”系列的第18天,我们来探讨备忘录模式(Memento Pattern)。这是一种行为型设计模式,其核心思想是在不破坏封装性的前…

SpringCloud系列(35)--使用HystrixDashboard进行服务监控

前言:在上一节中我们使用了Hystrix进行服务熔断处理,至此关于Hystrix的使用到此为止,本节内容关注的是如何使用HystrixDashboard对调用进行监控。 1、HystrixDashboard概述 Hystrix提供的准实时的调用监控(HystrixDashboard),Hys…

爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码

需求是将贴吧的【某个吧】里面【n页】的网页代码爬取下来,保存至本地 首先我们要思考这个贴吧爬虫的框架,要有方法可以构造url列表(就可以一次获取多个url),能请求获取相应,能把html保存到本地。 import …

webpack5 css-loader 配置项中的modules

在 Webpack 的 css-loader 中,modules 选项是一个核心配置,它直接关系到 CSS 的模块化处理方式。下面从概念、原理、使用场景和实践技巧四个方面详细解析: 概念解析:CSS Modules 是什么? CSS Modules 是一种让 CSS 类…

springboot+Vue驾校管理系统

概述 基于springbootVue开发的驾校管理系统。该系统采用主流技术栈开发,功能完善,既包含用户端便捷的操作界面,又具备强大的后台管理功能。 主要内容 一、用户端功能模块 ​​核心功能导航​​: 首页展示驾校推荐信息及最新动态…

#华为鲲鹏#华为计算#鲲鹏开发者计划2025#

#华为鲲鹏#华为计算#鲲鹏开发者计划2025# <新版开发者计划>的内容链接&#xff1a;鲲鹏开发者计划2025-鲲鹏社区 通过学习毕昇编译器整体介绍&#xff0c;以及安装使用流程、新增特性、调优工具的使用及相关指导文件获取&#xff0c;对毕异编译器有了更深的认识。 我刚…

小程序学习笔记:声明式导航的多种玩法

在小程序开发中&#xff0c;页面导航是实现用户流畅交互体验的关键环节。今天&#xff0c;咱们就一起来深入学习小程序里通过声明式导航实现页面跳转、切换 tab 页、后退等功能的技巧&#xff0c;还会附上详细代码示例&#xff0c;让大家轻松掌握&#xff01; 一、什么是页面导…

Linux中《动/静态库原理》

目录 目标文件ELF文件ELF从形成到加载轮廓ELF形成可执行readelf命令ELF可执行文件加载 理解连接与加载静态链接ELF加载与进程地址空间虚拟地址/逻辑地址 重新理解进程虚拟地址空间 动态链接与动态库加载进程如何看到动态库进程间如何共享库的动态链接动态链接到底是如何工作的&…

Android大图加载优化:BitmapRegionDecoder深度解析与实战

在移动端开发中&#xff0c;超大图片加载一直是性能优化的难点。本文将深入剖析BitmapRegionDecoder原理&#xff0c;提供完整Kotlin实现方案&#xff0c;并分享性能调优技巧。 一、为什么需要大图加载优化&#xff1f; 典型场景&#xff1a; 医疗影像&#xff1a;2000015000…

基于ApachePOI实现高德POI分类快速导入PostgreSQL数据库实战

目录 前言 一、高德POI分类简介 1、数据表格 2、分类结构 二、从Excel导入到Postgresql 1、Excel解析流程 2、Mybatis批量导入 3、数据入库 三、总结 前言 在大数据与地理信息深度交融的当下&#xff0c;地理信息系统&#xff08;GIS&#xff09;的触角已延伸至各个领域…

如何打造Apache Top-Level开源时序数据库IoTDB

引言 数据与时间结合后&#xff0c;便拥有了生命。在金融、系统日志、工业产线和智能设备等领域&#xff0c;时序数据每毫秒都在不断产生。管理这些海量时序数据需要专业的数据库系统。时序数据库产品正逐渐受到市场的关注&#xff0c;本文将分享如何通过开源的方式&#xff0…

高并发内存池实战指南

项目源码&#xff1a;https://gitee.com/kkkred/thread-caching-malloc 目录 一、脱离new&#xff1a;高并发内存池如何替代传统动态分配 1.1 new的痛点&#xff1a;碎片、延迟与锁竞争 1.2 高并发内存池的替代方案&#xff1a;分层预分配无锁管理 二、大内存&#xff08;…

基于springboot+vue的数字科技风险报告管理系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7数据库工具&#xff1a;Navicat12开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;Maven3.3.9 系统展示 管理员登录 管理…

实战篇----利用 LangChain 和 BERT 用于命名实体识别-----完整代码

上一篇文章讲解了Langchain,实现一个简单的demo,结合利用 LangChain 和 BERT 用于命名实体识别。 一、命名实体识别模型训练(bert+CRF) bert作为我们的预训练模型(用于将输入文本转换为特征向量),CRF作为我们的条件随机场(将嵌入特征转为标签),既然要训练,那么我们的损失函…