这里时间比较有限,优先看Sparse4Dv3方法里面相对以前改动的地方。

0.参考

代码v1/v2/v3:https://github.com/HorizonRobotics/Sparse4D

跑起来:https://github.com/HorizonRobotics/Sparse4D/blob/v3.0/docs/quick_start.md

1.方法

(1)时序实例去噪(3D)

代码解析:在head的InstanceBank模块中,两组kmeans提前初始化好的均匀分布锚点:nuscenes_kmeans900.npy,然后另外一组锚点,通过SparseBox3DKeyPointsGenerator模块进行forward噪声生成,然后通过二分图匹配(在哪?)。通过时间差,补偿锚点的中心点、尺寸、yaw、速度等。

(2)质量估计 (Quality Estimation)

代码解析:下面三张图,由配置文件,可以知道是用到了质量估计这个模块的。

代码解析:下面三张图,由配置文件,可以知道中心点的使用的交叉熵损失函数,而yaw角度的优化,使用的高斯focal loss损失函数进行优化。看起来跟论文中的是正好反过来的!!!

(3)解耦注意力 (Decoupled Attention)

将锚点独立的高维特征编码 (independently conduct high-dimensional feature encoding),随后将它们拼接 (concatenate) 起来。将与原始 Sparse4D 相比,这种方法带来了更低的计算量和参数开销 (lower computational and parameter overhead)。然后E 和 F 分别代表锚点嵌入 (anchor embedding) 和实例特征 (instance feature)也拼接起来。

代码解析:我们可以看到将a这个独立高维特征编码后进行add或者concatenate操作,其中是进行add还是cat操作通过self.mode这个参数进行配置的。head中anchor_encoder中type=“SparseBox3DEncoder”对应 mode=“cat”。

(4)扩展到追踪 (Extend to Tracking)

代码解析:Sparse4DHead中forward,通过调用instance_back.get返回instance_feature与anchor  作为R;

代码解析:Sparse4DHead中forward,通过调用instance_back.cache,将topk的instance_feature存在cache中;

代码解析:Sparse4DHead中forward,通过调用instance_back.get_instance_id,如果id为空或置信度>threshold,给赋新的id(self.pred_id基础上+i);

2.结果

v3增加了track的任务,帧率上降低并不多。mAP提升了2.5个点,对于IDS可能还需要做一些优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/918205.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/918205.shtml
英文地址,请注明出处:http://en.pswp.cn/news/918205.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「ECG信号处理——(22)Pan-Tompkins Findpeak 阈值检测 差分阈值算法——三种R波检测算法对比分析」2025年8月8日

目录 1、引言 2、算法原理 (1)Pan-Tompkins 算法(方法1) (2)Findpeak 阈值检测算法(方法2) (3)差分阈值算法(方法3) 3、算法性能…

Qdrant Filtering:must / should / must_not 全解析(含 Python 实操)

在向量搜索中,过滤(Filtering) 是保证结果精准性和业务契合度的关键手段。Qdrant 的过滤机制不仅能在向量相似度检索的基础上叠加结构化条件,还提供了灵活的布尔逻辑组合,让我们可以像写数据库查询一样,精准…

五、RuoYi-Cloud-Plus 前端项目部署以及如何改后端请求地址。

1.前情描述 前面的文章我们介绍了RuoYi-Cloud-Plus的nocos的配置内容,已经启动其他服务要注意什么东西。 专栏内容在这,感兴趣可以看看。 https://blog.csdn.net/weixin_42868605/category_13023920.html 2.前端项目部署。 官网地址:plus…

工作量评估

工作量评估 API 工作量评估: 得分 入参个数 * 0.2 业务规则 * 0.5 改动的库表个数 * 0.3 得分(1-2):简单API-5人天 得分(3-8):中等API-8人天 得分(8-15):复…

篮球运动(动态规划)

题目描述小明建造了一个篮球场,他请来了2行n列的人,想让他们进行比赛。每一个人都有一个能力值,第一行分别为h11,h12,…,h1n,第二行为h21,h22,…,h2n。现在小…

区块链与大数据分析技术深度解析

目录 区块链与大数据分析技术深度解析 1. 引言:当区块链遇见大数据 2. 区块链数据特性 2.1 数据结构差异 2.2 区块链数据层级 3. 数据获取技术 3.1 节点直连方案 3.2 链上数据湖架构 4. 数据分析关键技术 4.1 交易图谱分析 4.2 地址聚类算法 5. 链上分析应用场景 5.1 反洗钱(A…

网络基础——网络层级

OSI七层模型OSI七层模型名称功能协议应用层直接为用户应用程序(如浏览器、邮件客户端)提供网络服务接口。HTTP/HTTPS(网页浏览)FTP(文件传输)SMTP/POP3(邮件)DNS(域名解析…

【Redis】hash哈希,List列表

目录 一. hash哈希 1.1.常用命令 1.1.1.HSET 1.1.2.HGET 1.1.3.HEXISTS 1.1.4.HDEL 1.1.5.HKEYS 1.1.6.HVALS 1.1.7.HGETALL 1.1.8.HMGET 1.1.9.HLEN 1.1.10.HSETNX 1.1.11.HINCRBY 1.1.12.HINCRBYFLOAT 1.2. 内部编码 1.3. 使用场景 1.4…

MySQL相关概念和易错知识点(4)(分组查询、连接查询、合并查询、子查询)

目录1.分组查询(1)聚合函数(2)group by子句(3)having2.连接查询(1)内连接(笛卡尔积)(2)外连接(3)内外连接的区…

【Python 高频 API 速学 ①】

一、为什么先学它们? 在真实代码里,90 % 的 bug 都源于「拿到的是 A 类型,却当成 B 类型用」。 把「不确定」变成「确定」——这就是类型转换三兄弟的核心价值。二、三兄弟速览函数一句话定位常见输入失败会怎样int(x)把 x 变成整数‘42’, 3…

FFmpeg 视频旋转信息处理:3.4 vs 7.0.2

1. 概述 FFmpeg 在处理视频旋转信息方面经历了重要的架构变化。本文档详细对比了 FFmpeg 3.4 和 7.0.2 在封装(muxing)和解封装(demuxing)视频旋转信息时的差异,并提供兼容性解决方案。文档内容由Claude Sonnet 4辅助撰…

《Resolving tissue complexity by multimodal spatial omics modeling with MISO》

概念多模态空间组学:简单来说,就是同时研究生物组织里的多种分子信息(比如基因表达、蛋白质、代谢物、表观遗传标记等),而且这些信息还带有空间位置。MISO(MultI-modal Spatial Omics)是这篇论文…

三阶段提交(3PC)协议的全面解析:理论、机制与实践局限性

第一部分:非阻塞提交的起源:从两阶段提交(2PC)的缺陷到三阶段提交(3PC)的构想在分布式计算领域,确保跨多个独立节点执行的事务的完整性是一项至关重要的挑战。这些节点或站点可能在地理上分散&a…

衰减器的计算

pi型衰减器,如下图所示。 它适用于输入输出阻抗匹配的情况下,还能进行衰减。 不过当输入输出阻抗不匹配时,2个R1也会不相等。 已知特性阻抗Z0,衰减比AVin/Vout,怎么计算R1、R2? 1、电阻分压。 Vout Vi…

Day02 员工管理,分类管理

新增员工需求分析和设计产品原型:接口设计:本项目约定:管理端发出的请求,统一使用 /admin 作为前缀用户端发出的请求,统一使用 /user 作为前缀数据库表设计:代码开发根据新增员工接口设计对应的 DTO&#x…

[SC]SystemC 常见的编译/语法错误与解法(三)

SystemC 常见的编译/语法错误与解法(三) 摘要:下面按“现象/编译信息 → 成因 → 解决方案”的结构,归纳 SystemC 建模在 SoC 验证中常见的“编译期/语法层面”问题,并补充如何根据编译信息快速定位与如何在流程上避免这些问题。 一、SystemC 常见的编译/语法错误与…

06-docker容器常用命令

文章目录一.docker容器相关指令概述二.生产环境中常用的 docker容器相关指令1.创建容器(create)2.查看已创建的容器(ps,ls,list)3.运行一个已创建的容器(start)4.停止一个正在运行的容器(stop)5.重启容器(restart)6.创建并启动一个容器(run,等…

Xiphos Q8 摄像头板 高性能图像处理板

我们的高性能图像处理板设计用于与具有两个 Camera Link 接口(2x Base 或 1x Medium)的 Q8 混合处理器卡配合使用。接口: 2个Camera Link接口 4个SpaceWire接口 4个USB 2.0主端口 串行接口和 GPIO 多个 Vcc 输出(5.0、3.3 和 1.8V…

Rocky Linux 10 搭建 NFS 服务详细步骤

1.NFS描述 NFS,全称为Network File System,即网络文件系统,是一种分布式文件系统协议,允许一个系统在网络上与他人共享目录和文件。通过NFS,用户和程序可以像访问本地文件一样访问远端系统上的文件。以下是NFS的一些主…

Android MediaMetadataRetriever取视频封面,Kotlin(1)

Android MediaMetadataRetriever取视频封面&#xff0c;Kotlin&#xff08;1&#xff09; <uses-permission android:name"android.permission.WRITE_EXTERNAL_STORAGE" /><uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE&qu…