Griffin|增强现实数据集|无人机数据集

数据来源:huggingface 百度网盘

构建方式

Griffin数据集的构建采用了模块化架构,结合了CARLA和AirSim平台,通过模拟真实世界中的无人驾驶环境和无人机动态,收集了超过30,000帧图像数据,覆盖了多种无人机飞行高度、天气条件和物体遮挡情况。数据采集框架包括一个基于Unreal Engine 4的服务器和一个Python客户端,其中Python客户端包含了四个专门的管理器,分别负责车辆规划控制、无人机轨迹生成、环境配置和传感器数据管理。数据预处理阶段,对多源数据进行时空对齐,并利用CARLA的实例分割地面真实接口进行遮挡感知的3D标注。

特点

Griffin数据集的特点在于其多模态性、遮挡感知标注、无人机动态模拟和多样性。数据集包含超过200个动态场景,涵盖了城市和郊区两种环境,以及多种天气条件和车辆速度。无人机飞行高度从20米到60米不等,确保了数据集的多样性。此外,数据集中的标注不仅包括目标类别、跟踪ID和9维边界框模型,还包括可见度比率,这使得数据集更适合研究遮挡场景下的感知问题。

使用方法

使用Griffin数据集进行研究和开发时,首先需要了解数据集的组织结构和标注信息。数据集包括多个场景,每个场景包含多个时间戳的图像数据和对应的标注信息。研究人员可以根据自己的需求选择合适的场景和任务,例如3D物体检测和3D物体跟踪。在使用数据集时,需要注意数据预处理,包括时空对齐和遮挡感知标注的处理。此外,研究人员还可以利用数据集提供的基准方法和评价指标来评估自己的算法性能。

背景与挑战

背景概述

在自动驾驶技术的发展中,尽管取得了显著进展,但目前的单视角系统在复杂环境中仍然面临着严重遮挡和视野受限的基本挑战。为了解决这些限制,越来越多的协作感知策略涌现出来,包括车对车(V2V)和车对基础设施(V2I)的合作。这些方法已经展示了可行的解决方案和在感知能力上的显著提升。然而,它们的实际实施通常需要大量的基础设施投资和联网车辆的广泛采用,这可能会带来经济障碍。相比之下,车对无人机或所谓的空中-地面协作(AGC)系统利用了空中的全景视图和地面级别的详细观察。无人机的集成提供了在关键应用中快速部署的独特优势,包括智慧城市、应急响应和安全巡逻,从而为动态环境感知提供了一个新的范例。尽管具有巨大的潜力,但开发有效的空中-地面协作感知系统仍然面临着两个关键的挑战。第一个挑战源于动态视角不匹配:与主要在水平平面上移动传感器的V2V和V2I协作不同,无人机引入了高度变化和动态俯仰/横滚角度变化,这使跨视图特征的校准变得复杂。第二个挑战是现有的无人机视图3D感知数据集仍然存在缺陷。如表I所示,CoPerception-UAV和UAV3D等数据集缺乏遮挡感知注释,导致边界框包括不可见区域的目标。同时,许多数据集采用过于简化的固定角度或固定高度的相机模型,这不能反映受风干扰和目标加速度等现实世界无人机动态的影响。受神话生物Griffin的启发,它结合了狮子的陆地力量和鹰的空中主导地位,我们旨在利用空中和地面视角的联合力量来克服这些挑战并增强自动驾驶的感知能力。为此,我们为空中-地面协作3D感知提出了以下贡献:Griffin,一个包含超过200个动态场景(30k+帧)的大型多模态数据集,具有不同的无人机高度(20-60m),多样化的天气条件和遮挡感知的3D注释,并通过CARLA-AirSim联合仿真增强了真实的无人机动态;一个统一的基准测试框架,用于评估空中-地面协作检测和跟踪任务,包括评估通信效率、延迟容忍度和高度适应性的协议;AGILE,一个实例级别的中间融合基准,通过基于查询的交互动态地对齐跨视图特征,在通信开销和感知精度之间取得了有利的平衡。广泛的实验证明了空中-地面协作感知的有效性,并展示了进一步研究的方向。数据集和代码可在https://github.com/wang-jh18-SVM/Griffin上获得。

当前挑战

空中-地面协作感知系统面临着两个关键的挑战。第一个挑战源于动态视角不匹配:与主要在水平平面上移动传感器的V2V和V2I协作不同,无人机引入了高度变化和动态俯仰/横滚角度变化,这使跨视图特征的校准变得复杂。第二个挑战是现有的无人机视图3D感知数据集仍然存在缺陷。例如,CoPerception-UAV和UAV3D等数据集缺乏遮挡感知注释,导致边界框包括不可见区域的目标。同时,许多数据集采用过于简化的固定角度或固定高度的相机模型,这不能反映受风干扰和目标加速度等现实世界无人机动态的影响。为了克服这些挑战,Griffin数据集提供了高保真的3D注释,覆盖了六种对象类别:行人、汽车、卡车、公共汽车、摩托车和自行车。注释包括类别标签、跟踪ID、可见率以及由x、y、z、长度、宽度、高度、翻滚、俯仰和偏航定义的9维边界框模型。为了解决现有数据集中遮挡判断的常见问题,我们开发了一种利用CARLA的实例分割地面真实接口的可视性量化方法。在数据收集过程中,RGB和分割图像使用相同的传感器配置记录,以保持时空对齐。在后期处理阶段,我们从每个目标的边界框内采样点并将其投影到分割地面真实值上。然后通过比较采样像素和相应目标之间的语义类别和实例ID来计算可见率。过滤掉可见性低的目标,以确保注释精度。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

面向低空交通场景的通信与多模态感知仿真数据集

数据来源:http://pcni.pku.edu.cn/cn/dataset_3.html
PKU 低空交通场景数据集:由北京大学构建,包含十字路口低空交通场景和山区公路低空交通场景。数据集包含无人机端采集的 RGB 图像和深度图像,以及车端采集的激光雷达点云和毫米波雷达点云数据。十字路口场景有 1 个无人机端、12 个车端,共 1500 帧;山区公路场景有 1 个无人机端、8 个车端,共 1500 帧。

亮点与特色

①支持无人机三维轨迹和多速度仿真:在生成的动态场景中,该数据集考虑了环境中动态无人机的多种三维轨迹,包含爬升、俯冲、平飞等多种三维轨迹以及加速、减速、匀速等多种速度。

② 多视角的多模态感知数据:在数据集中,包含无人机端采集的RGB图像和深度图像,以及车端采集的激光雷达点云和毫米波雷达点云数据。

③ 通过碰撞检测机制,保证数据集的真实性和有效性:为保证生成的大规模低空交通动态场景的合理性,基于动态物体的运动轨迹,实现了对动态物体的碰撞检测。若动态物体发生碰撞,即可精确地提示发生碰撞的动态物体的名称和对应发生碰撞的快照。

④ 场景的批量生成、排队仿真和数据的自动化导出,使生成大规模无线通信信道数据集成为可能:将物体和天线的三维坐标进行批量修改,实现低空交通动态场景的批量生成,并完成了将生成的动态场景排队仿真和仿真结束后数据的自动化导出的功能。

数据集介绍

本数据集包含十字路口低空交通场景和山区公路低空交通场景,各场景数据集简要介绍和说明如下表

场景数据种类元素数据大小备注
十字路口低空交通无线通信信道数据、激光雷达点云、RGB图像、深度图像、毫米波雷达点云1个无人机端、12个车端1500帧常见城市交通场景
山区公路低空交通无线通信信道数据、激光雷达点云、RGB图像、深度图像、毫米波雷达点云 1个无人机端、8个车端1500帧起伏较大、空旷的山区场景

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/95904.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/95904.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/95904.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣.1054距离相等的条形码力扣767.重构字符串力扣47.全排列II力扣980.不同路径III力扣509.斐波那契数列(记忆化搜索)

目录 力扣.1054距离相等的条形码 力扣767.重构字符串 力扣47.全排列II 力扣980.不同路径III 力扣509.斐波那契数列(记忆化搜索) 力扣.1054距离相等的条形码 是否策略正确 但是假如 1 2 2 此时 1_2 此时中间只能填写2,但是就不对了,所…

「docker」二、3分钟快速理解docker核心要素

上一节中我们知道docker的作用,这节我们介绍一下docker的要素。 镜像 docker的核心要素里面有个叫镜像(images)的概念,镜像的作用就类似我们安装虚拟机用到的iso镜像文件。镜像里包含了我们要运行的应用,如&#xff…

搭建基于 Solon AI 的 Streamable MCP 服务并部署至阿里云百炼

一、快速搭建 Solon 项目,引入 Solon AI 1. 开发环境准备 JDK 8 或以上版本。Maven 3.8.6 或以上版本。通义千问 API Key(用于模型调用)。 2. 创建名为 mcp-server-demo 的项目 创建时选择 Archetype 为 Solon AI(可以减少些活&am…

免费的SSL和付费SSL 证书差异

免费的 SSL 和付费的 SSL(TLS 证书)本质上提供的加密能力是一样的,因为 SSL/TLS 协议本身是开放标准,核心加密算法不会因为是否收费而不同。主要区别在于以下几个方面:🔑 1. 加密强度免费 SSL:一…

代码随想录算法训练营第六天 -- 字符串1 || 344.反转字符串I / 541.反转字符串II / kamacoder54.替换数字--第八期模拟笔试

代码随想录算法训练营第六天 -- 字符串1 || 344.反转字符串I / 541.反转字符串II / kamacoder54.替换数字--第八期模拟笔试344.反转字符串I思路541.反转字符串II题目理解解题思路边界细节reverse()函数的实现[kamacoder54.替换数字 -- 第八期模拟笔试](https://kamacoder.com/p…

计算机视觉——光流法

系列文章目录 本系列开篇文章,暂时没有目录啦~ 文章目录系列文章目录前言一、问题假设二、方程推导三、计算Ix,Iy,ItI_x,I_y,I_tIx​,Iy​,It​四、计算光流u,vu,vu,v4.1 传统算法Lucas-Kanade算法五、孔径问题5.1 直观理解5.2 数学角度5.3 解决方法总结…

前端安全攻防:XSS, CSRF 等防范与检测

前端安全攻防:XSS, CSRF 等防范与检测在Web应用日益普及的今天,前端安全已经成为一个不容忽视的重要环节。随着攻击技术的不断演进,各种前端安全漏洞(如跨站脚本攻击 XSS、跨站请求伪造 CSRF 等)层出不穷,它…

03OpenCV图像处理

参考课程: 【黑马程序员 OpenCV入门教程】 [https://www.bilibili.com/video/BV1Fo4y1d7JL] ZZHow(ZZHow1024) 1.1几何变换 图像缩放 对图像的大小进行调整,即使图像放大或缩小 cv2.resize(src, dsize, fx0, fy0, interpolationcv2.INTER_LINEAR)参数…

UE5 C++ 第三方动态库的使用

一. 首先要拷贝对应的 第三方库 bin里有dll动态库,include里有动态库需要的头文件。 二.在Target.cs里,进行设置 头文件前面的路径为公共路径 设置需要一起打包的三方库文件 三.加载这个库 FPlatformProcess::GetDllHandle将他解析为 任意类型&#x…

C++进阶——多态

ʕ • ᴥ • ʔ づ♡ど 🎉 欢迎点赞支持🎉 个人主页:励志不掉头发的内向程序员; 专栏主页:C语言; 文章目录 前言 一、多态的概念 二、多态的定义及实现 2.1、多态的构成条件 (1)虚函…

Swift 语法学习指南 - 与 Kotlin 对比

Swift 语法学习指南 - 与 Kotlin 对比 本指南专为有 Android/Kotlin 开发经验的开发者设计,通过对比学习快速掌握 Swift 语法 目录 语言基础对比变量与常量数据类型函数定义类与结构体继承与协议可选类型集合类型控制流闭包与Lambda扩展与Extension错误处理内存管理…

嵌入式C语言笔记十七——构造数据类型

一.结构体:1.类型定义:struct 结构体名 {数据类型1 成员变量1;数据类型2 成员变量2;数据类型3 成员变量3;... };struct student {char name[32];char sex;int age;int score; };2.结构体变量定义:存储类型 数据类型 变量名;3.结构体元素初始化…

深入实践G1垃圾收集器调优:Java应用性能优化实战指南

深入实践G1垃圾收集器调优:Java应用性能优化实战指南 一、技术背景与应用场景 随着微服务和海量并发请求的普及,Java应用在生产环境中对低延迟和高吞吐的需求日益显著。传统的CMS和Parallel GC 在大内存场景下常出现Full GC 停顿时间长、吞吐下降等问题…

【JobScheduler】Android 后台任务调度的核心组件指南

JobScheduler 是 Android 平台上原生支持在直接启动模式(Direct Boot Mode)下执行任务的调度器。 相比 WorkManager 需要复杂的配置才能勉强支持直接启动,JobScheduler 在这方面有着天生的优势和明确的 API 支持。如果你面临的硬性要求是必须…

c# 调用basler 相机

目录 一联合halcon: 二 c# 原生 一联合halcon: 环境配置 下载安装pylon软件 下载安装halcon 创建 winform项目 test_basler 添加引用 打开pylon可以连接相机 可以看到我的相机id为23970642 ( c#联合halcon的基础教程(案例…

《2025年AI产业发展十大趋势报告》四十六

《2025年AI产业发展十大趋势报告》四十六随着科技的迅猛发展,人工智能(AI)作为引领新一轮科技革命和产业变革的战略性技术,正逐步渗透到各个行业和领域,成为推动经济社会发展的重要引擎。2023年,生成式AI的…

c++ 杂记

1. 为什么返回*this?2. 3. 友元函数的使用&#xff1a;需要头文件中类内外声明&#xff0c;cpp文件中实现定义哦// Sales_data.h #ifndef SALES_DATA_H #define SALES_DATA_H#include <string>class Sales_data {std::string bookNo;int units_sold 0;double revenue …

PDF文件基础-计算机字体

计算机字体的原理包含了字符编码、字形渲染和字体文件存储三个关键技术。 字符编码负责将每个字符映射到一个唯一的数字码&#xff1b;字形渲染则将这些数字码转换成屏幕或纸张上可识别的图形&#xff1b;字体文件存储则包含了字符的编码、图形描述信息以及字体的其他属性&…

华为IP(9)

OSPF的基本配置OSPF路由计算前言&#xff1a;1)同一区域内的OSPF路由器拥有完全一致的LSDB&#xff0c;在区域内部&#xff0c;OSPF采用SPF算法完成路由计算。2&#xff09;随着网络规模不断扩大&#xff0c;路由器为了完成路由计算所消耗的内存、CPU资源也越来越多。通过区域划…

java.nio.file.InvalidPathException异常

一.问题概述 本人在ubuntu22.04的操作系统上&#xff0c;运行java程序时创建一个文件时&#xff0c;由于文件名称中包含了中文&#xff0c;所以导致了程序抛出了java.nio.file.InvalidPathException的异常。 java.nio.file.InvalidPathException: Malformed input or input co…