“白虎”数据集首批开源

在机器人智能不断迈向自主化、通用化的进程中,如何解决人形机器人的“喂养”难题、走出“数据荒漠”,已成为具身智能领域亟需攻克的关键课题。为此,2025 年初,全国首个异构人形机器人训练场在模力社区正式启用,超百台异构本体在场景中日复一日演练、采集、优化,构建出一个前所未有的数据工程体系。而在这片“进化之地”中孕育而生的,正是被誉为机器人“粮仓”的——“白虎”数据集。

“白虎”数据集开源直达https://www.openloong.org.cn/cn/dataset?utm_source=referral&utm_medium=csdn&utm_campaign=data&utm_content=250728

"白虎"数据集由国家地方共建人形机器人创新中心(以下简称“国地中心”)牵头打造的,作为全球首个规模突破百万量级的异构机器人数据集,其数据源自真实应用场景,全面覆盖多种全尺寸人形机器人、类人形轮式机器人以及机械臂等异构平台,并经过严格的质量控制与校验。它不仅在体量上实现突破,更在采集方法、采集内容、数据管理上形成了标准规范,成为驱动人形机器人能力跃迁的数据基座。

本次正式开源的数据集,正是从“白虎”数据集中精心选取的一部分子集,聚焦于四款主流机器人本体和两类典型末端类型,共计10万余条高质量任务数据。这是白虎数据集面向开源社区迈出的第一步,未来“白虎”数据集将持续逐步开放,预计最终累计开源超百万条数据,构建起全球领先的具身智能数据开放体系。

图片

值得一提的是,该数据集已通过中国信息通信研究院组织的具身智能数据集质量评估,获得官方颁发的《数据集质量检测报告》《具身智能数据集质量评估证书》成为我国首个获得信通院权威认证的具身智能机器人数据集。

四大机器人、两类末端、五大真实场景、数十类任务

本次开源数据涵盖四款主流机器人本体,分别为:青龙、智元A2D、傅利叶GR2、乐聚夸父,在构型设计与适用场景上各具代表性。青龙是全尺寸开源公版人形机器人,具备高度仿生躯干设计特性,适用于科研、工业制造、民生服务等多种场景;智元A2D采用轮式结构设计,主要面向工业及数采场景;傅利叶GR-2配备了仿生灵巧手,适合高精度操作;乐聚夸父采用开源鸿蒙系统驱动,具备高动态运动构型特征。

在末端类型上,数据集覆盖夹爪与灵巧手两类类型,分别适用于简单结构件抓取与精细操作,构成了具身控制中极具代表性的末端类型分布,为不同末端类型的操作模型训练提供了数据支撑。

数据样本涉及五大真实场景工业制造、家居家政、餐饮服务、商超药店和通用抓取放置,合计覆盖30余类高频任务类型,每类任务均配套详细自然语言描述、动作标签、场景信息、传感器及机器人硬件参数,并采用统一的数据处理与管控方法,对具身模型的泛化性提升具有极高的价值,满足深度学习、控制策略、语义理解等不同层次的建模需求。

部分任务示例包括:

电池抓取

冰箱拿取物体

插花

为提升数据的通用性与结构清晰度,每条数据配套多维度语义标签信息,具体包括:

物品标签

涵盖工业件、餐具、日用器具、药品等多种物品;

技能标签:

如抓取、放置、旋转、推进、拉取、按压等基本操作原语;

任务与场景标识

任务名统一编码,场景维度区分操作上下文语义;

末端类型:

分别记录夹爪或灵巧手执行动作,可用于策略差异建模;

语言描述:

如“从传送带抓取药盒并放置到指定托盘”,支持自然语言与动作对齐建模。

该标签体系作为“白虎”数据集数据标准的核心要素,未来将在持续开放的数据集中复用。

高质量数据的三重保障

任务多样,数据真实

数据采集任务紧贴现实应用场景,从流水线操作、家庭生活服务,到餐饮商用与通用交互任务全面覆盖,构建出一个面向泛化智能系统训练的任务谱系。例如在工业制造场景中,“电池抓取”“传送带物品分拣”等任务模拟典型自动化操作流程;而在家庭家政与商超服务类任务中,“咖啡机使用”“文具收纳”“药品上架”等任务则更具复杂操作步骤与物品交互多样性。

与仿真数据不同,本数据集100%来源于真实机器人在真实物理环境中的任务执行记录,数据通过“数据质量验证”和“本体算法验证”双重机制,形成了系统化、工程化、前置化的数据质量保障路径。

图片

多元异构,差异全面覆盖

与传统数据集相比,该数据集最显著的特点在于异构本体间任务的高度统一与复用性设计。每一个关键任务都在多个机器人平台上进行了采集,例如“文具收纳”任务在青龙、智元A2D、傅利叶GR2等本体上均有执行版本,这种跨本体一致采集设计,为迁移学习、模仿学习、通用动作策略训练等研究方向提供了非常理想的实验基础。

同时,在执行过程中,机器人所采用的末端类型也被详细记录,包括夹爪与灵巧手两种典型类型。不同末端结构对物品的操控方式、夹取路径、姿态控制等都有显著差异,这也使得数据集天然支持控制策略的对比研究和结构适应性评估:

机器人本体异构性

青龙为全尺寸开源公版人形机器人,具备高度仿生躯干设计、智元A2D为轮式结构,面向工业及数采场景、傅利叶GR-2配备仿生灵巧手,适合高精度操作、乐聚夸父为开源鸿蒙系统驱动,高动态运动构型,多者结合综合体现了机器人本体异构性;

末端执行器差异

夹爪主要用于规则物体处理,灵巧手支持复杂物品抓握、工具使用、人类类比动作执行;

任务分布广泛

同一任务在不同机器人上执行,形成天然的跨本体对照实验语料,有利于训练具备泛化能力的策略模型。

这套异构数据结构使数据集具备了极强的可拓展性与对比分析能力,是实现“通用任务能力”验证的核心基础之一。

数据规范统一, 可直接调用

本数据集采用人形机器人具身智能训练数据集管理标准,明确不同来源、不同类型的数据结构和表示方法,并规范数据质量评价方法,有效解决多源异构数据格式不统一、质量层次不齐等问题,保障规模化数据集的高质量生产,同时为行业内的数据生产与管理提供了标准参考。

图片

向更广阔的数据生态迈进

具身智能离不开大规模真机数据。我们希望这批由真实本体、真实任务、真实执行过程构建的高质量数据,能够助力更多开发者和研究者开发更强健的具身智能系统、构建统一可对比的任务基准,推动从“能动”到“会做”的能力跃迁

本次开源标志着“白虎”数据集向开源社区迈出的坚实一步,但远未终点。白虎数据集开源的全量规模未来将突破百万条任务数据,不断引入更多机器人类型、末端形式、任务内容与多模态传感输入(视觉、力觉、语音等),构建面向通用具身智能系统训练的完整数据基座

OpenLoong 社区也将携手行业开发者与生态伙伴,持续推动具身智能数据生态开放,共建基准测试、开源评测、技能迁移与大模型训练等关键环节,共同打通“真实数据-算法建模-智能演化-实体应用”的闭环链路。

欢迎各位加入OpenLoong开源社区,如果您在使用过程中有任何建议或合作需求,欢迎与我们取得联系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91123.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91123.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/91123.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第17章——多元函数积分学的预备知识

文章目录思维导图场论初步方向导数梯度散度与旋度今日格言:如果凡事缺少了实行的勇气,再有智慧与仁爱也是枉然。思维导图 场论初步 场就是空间区域ΩΩΩ上的一种对应法则。可分为:数量场和向量场。 比如一个数量函数uu(x,y,z)uu(x,y,z)uu(x…

Vue》》Slot 插槽

插槽的概念 插槽就是子组件中的提供给父组件使用的一个占位符,用slot标签 表示,父组件可以在这个占位符中填充任何模板代码,如 HTML、组件等,填充的内容会替换子组件的slot标签。简单理解就是子组件中留下个“坑”,父组…

AKS部署.Net Shopping(K8S本地部署/AKS部署/key-value)

文章目录 项目地址 一、Api配置修改 1.1 配置docker 1. docker-compose配置环境变量 2. 修改appsettings 二、本地k8s部署 2.1 将本地镜像Push到dockerHub 2.2 制作K8S yaml文件 1. mogodb 2. shopping api 3. shoppingclient 3. port补充 4. Service 的type 三、部署到AKS 3.1…

vue3 el-table 去除小数

在 Vue 3 中使用 Element Plus 的 <el-table> 组件时&#xff0c;如果你希望去除表格列中的小数&#xff0c;你可以通过几种方式来实现&#xff1a;1. 使用 formatter 属性<el-table-column> 组件的 formatter 属性允许你自定义单元格的显示格式。你可以使用这个属…

JavaScript数组去重性能优化:Set与Object哈希表为何效率最高

文章目录 数组去重性能优化:为什么Set和Object哈希表的效率最高 引言 一、数组去重的常见方法 1.1 双重循环法 1.2 indexOf/includes方法 1.3 排序后相邻比较法 1.4 filter + indexOf方法 1.5 使用Set数据结构 1.6 使用Object哈希表 二、性能对比分析 2.1 时间复杂度对比 2.2 …

在VS Code中克隆项目失败

前提条件&#xff1a;电脑中已经安装好了Git一、错误原因&#xff1a;1、打开命令面板 快捷键 CtrlShiftP&#xff0c;输入Git: Clone 并回车&#xff1b;2、输入仓库URL回车后就发现报错了可以看到最后一行的报错内容&#xff1a;Git 无法找到或读取 SSL 证书文件&…

ASP.NET Core MVC中taghelper的ModelExpression详解

Microsoft.AspNetCore.Mvc.ViewFeatures.ModelExpression 是 ASP.NET Core MVC 框架中的一个核心类型&#xff0c;用于表示对模型属性的强类型引用。它在 Razor 视图、表单绑定和自定义 Tag Helper 中扮演关键角色&#xff0c;下面从技术细节、应用场景和最佳实践三个方面详细解…

楼宇 3D 建模:驱动建筑领域革新的数字力量

在科技飞速发展的当下&#xff0c;数字化技术正深刻改变着各个行业&#xff0c;建筑领域也不例外。楼宇 3D 建模作为关键的数字化技术&#xff0c;逐渐成为建筑设计、施工和管理过程中不可或缺的工具。它通过将现实中的楼宇以三维数字模型呈现&#xff0c;为建筑行业带来前所未…

打通视频到AI的第一公里:轻量RTSP服务如何重塑边缘感知入口?

在 AI 系统大规模部署、设备边缘化、数据实时化趋势下&#xff0c;视频能力的部署方式正迎来深刻变革。2025世界人工智能大会&#xff08;WAIC&#xff09;上&#xff0c;视频感知与智能决策之间的“连接效率”成为关键话题。而在这场连接能力的竞争中&#xff0c;轻量级、标准…

旅行短视频模糊的常见原因及应对方法

在旅行中拍摄短视频时&#xff0c;你是否经常遇到这样的问题&#xff1a;明明景色很美&#xff0c;但拍出来的视频却模糊不清&#xff0c;色彩暗淡&#xff0c;甚至噪点严重&#xff1f;尤其是在弱光环境&#xff08;如夜景、洞穴&#xff09;或快速移动&#xff08;如航拍、运…

【基础篇四】ASGI:Python异步Web的新标准

目录 一、ASGI规范深度解析 1.1 ASGI的诞生背景 1.2 ASGI核心概念 1.3 ASGI规范版本演进 二、WSGI vs ASGI&#xff1a;深度对比分析 2.1 架构模式对比 2.2 性能特性对比 2.3 适用场景分析 三、ASGI支持的协议类型 3.1 HTTP协议支持 3.1.1 HTTP处理流程 3.2 HTTP S…

51 单片机单文件多文件结构工程模板的创建教程

本章将详细介绍KEIL C51软件的使用方法及51单片机工程的创建流程。通过本章学习&#xff0c;掌握建立51单片机工程模板的技能&#xff0c;为后续51 单片机编程学习奠定基础。 单文件与多文件结构对比 对比项单文件结构多文件结构项目规模小项目、实验项目中大型项目、正式开发…

【Git】实用Git操作指南:从入门到高效协作

目录 1. Git 工作流程图 2. 基本配置 3. 获取本地仓库 4. 基础操作 5. 分支 6. Git远程仓库 6.1 常用的托管服务[远程仓库] 6.2 注册码云 6.3创建远程仓库 6.4 配置SSH公钥 6.5 操作远程仓库 7. 在IDEA中使用Git 附&#xff1a;铁令 下载地址&#xff1a;Git - Downloads 安装&…

InstructBLIP:通过指令微调迈向通用视觉-语言模型

温馨提示&#xff1a; 本篇文章已同步至"AI专题精讲" InstructBLIP&#xff1a;通过指令微调迈向通用视觉-语言模型 摘要 大规模预训练和指令微调在构建通用语言模型方面取得了显著成功。然而&#xff0c;构建通用视觉-语言模型仍然面临挑战&#xff0c;这主要源于…

[python][flask]flask蓝图使用方法

在 Flask 中&#xff0c;蓝图&#xff08;Blueprint&#xff09;是一种用于组织和管理代码的机制&#xff0c;可以将应用分解为多个模块&#xff0c;每个模块专注于特定的功能。以下是使用蓝图的基本步骤和方法&#xff1a;1. 创建蓝图首先&#xff0c;需要创建一个蓝图对象。蓝…

学习dify:一个开源的 LLM 应用开发平台

Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等&#xff0c;让您可以快速从原型到生产。以下是其核心功能列表&#xff1a; 1. 工作流: 在画布上构建和测试功能强大的 AI 工作流程&#xff0c;利用以下所有…

VEX实现物体沿线条流动

1. 效果如下&#xff1a;float offset fit01(rand(ptnum654),0.5,1)*Time*chf("speed") rand(ptnum547);int num nprimitives(1); vector pos primuv(1,"P",ptnum%num,offset%1);P pos;2.效果如下&#xff1a; float min detail(1,"min");…

puppeteer 系列模块的系统性、详细讲解

puppeteer 系列模块的系统性、详细讲解 &#x1f9e9; 一、核心模块介绍 1. puppeteer全功能 Puppeteer 包&#xff0c;默认包含 Chromium 浏览器npm install puppeteer包含内容&#xff1a;Puppeteer API Chromium 浏览器适合场景&#xff1a; 想直接运行&#xff0c;不关心浏…

golang实现一个规则引擎,功能包括实时增加、修改、删除规则

以下是一个用 Go 实现的轻量级规则引擎,支持实时增加、修改、删除规则,并基于表达式评估触发规则动作: package mainimport ("errors""fmt""sync" )// Rule 定义规则结构体 type Rule struct {ID string // 规则唯一标…