我们构建了一个基于 Quest 3 的 VR 遥操系统,该系统能够同时支持 DISCOVERSE 仿真环境与 MMK2 真机的操控,实现了从虚拟环境到真实机器人系统的无缝对接。 • 基于 VR 实现的遥操系统具有良好的扩展性和便携性,为多场景应用提供了灵活的操作方式。 • 该 VR 远程操控系统可用于在 DISCOVERSE 仿真环境和 MMK2 真机采集数据,并将采集到 的数据作为模仿学习中的示教数据,从而提升机器人学习与控制的效率——罗凯骏、刘子聿、冯儒

一、研究背景

• 基于learning的方法在机器人领域引发了变革,显著提高了机器人在移动、操纵等方面的能力。 近期研究进一步推动了多模态学习以及预训练模型的高效微调等任务。而这些研究的核心需求 是收集示教数据,以支持模型训练和优化。

• 通过遥操可以收集示教数据,并提供流畅的轨迹数据,使学习到的策略能够推广到新的环境和任 务中。因此当下遥操一种收集数据的重要手段

二、目前主流方法

外骨骼:需要一个从臂来控制主臂,成本高,通用性较差且不便移动

手柄:操作复杂,上手难度较高

以上方法都有两个明显缺陷: 1. 操作者和真机必须在同一地点,不支持远程操作 2. 操作者与机器人的观测不同,难以支持第一人称视角,操作者很难确保 采集到需要的corner case数据

VRVR开发灵活,可以适配多机器人平台,易于拓展 VR遥操作方案无需穿戴外骨骼等设备,安全且低成本 VR遥操以第一人称采集示教数据,更容易确保示教数据的质量

三、研究思路

基于DISCOVERSE仿真环境及真机,使用VR遥操作采集数据,并训练ACT算法

使用quest3在DISCOVERSE中采集仿真器数据

使用quest3在mmk2真机上遥操采集数据

混合模拟环境自动生成和VR遥操采集数据训练

在仿真环境以及真机上验证模型的性能

四、VR遥操技术方案

VR遥操实现 使用ROS-TCP-Endpoint与ROS-TCP-Connector实现VR、仿真器 和真机之间的网络连接;同时通过开发Unity程序进行图传,实 时展示VR遥操的效果。 通过ROS-TCP-Endpoint和ROS-TCP-Connector建立连接,可以实 时发送与接收ROS2中的话题,同时我们通过话题的实现图传与 VR数据的传输。 对于机器人底盘的移动以及平台的升降,我们使用Quest 3 手柄 的摇杆实现;夹爪的开闭通过手柄上的按键实现;最后机械臂 的移动通过获取手柄的末端位姿,并通过IK结算得到机械臂对应的关节角实现。

五、后续工作

• VR 远程操控系统已成功实现对夹爪、脊柱及底盘的遥操,但在手臂部分仍存在一定问题。 鉴于当前的操纵任务相对简单,系统未涉及复杂的超限问题的处理。然而,为了进一步提 升系统的可靠性与鲁棒性,该问题仍需深入研究与解决。

• 设计数据采集和实验方案,采集真机与仿真数据进行训练,从中对比模型的效果,为后续 优化提供思路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/79898.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/79898.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/79898.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux复习笔记(一)基础命令和操作

遇到的问题,都有解决方案,希望我的博客能为你提供一点帮助。 一、Linux中的基础命令和操作(约30%-40%) 1.用户和组(5%左右) 1.1用户简介(了解) 要求:了解,知道有三个用户…

【C语言干货】野指针

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、什么是野指针?二、野指针的三大成因 1.指针未初始化2.指针越界访问2.指针指向已释放的内存 前言 提示:以下是本篇文章正文内容&…

Unity:Surface Effector 2D(表面效应器 2D)

目录 什么是表面效应器 2D? 🎯 它是做什么的? 🧪 从第一性原理解释它是怎么工作的 📦 重要参数解释 为什么不直接用 Rigidbody(刚体)来控制运动 ? 所以什么时候该用哪个&#…

android 记录应用内存

windows cmd下 30s 记录一次 echo off setlocal enabledelayedexpansion set /a counter0 :loop echo %date% %time% >> meminfo.txt adb shell dumpsys meminfo packagename>> meminfo.txt timeout /t 30 /nobreak >nul set /a counter1 echo counter: !coun…

基于神经网络的 YOLOv8、MobileNet、HigherHRNet 姿态检测比较研究

摘要 随着人工智能技术的飞速发展,基于神经网络的姿态检测技术在计算机视觉领域取得了显著进展。本文旨在深入比较分析当前主流的姿态检测模型,即 YOLOv8、MobileNet 和 HigherHRNet,从模型架构、性能表现、应用场景等多维度展开研究。通过详…

解决HomeAssistant 无法安装 samba share问题

最近家里树莓派上的homeassistant 被折腾崩了,重新安装过程中发现加载项“Official add-ons”里面的“samba share”、“file edit”、“Mosquitto broker”等常用组件都不能安装。报以下错误: [supervisor.docker.interface] Cant install homeassista…

[Linux]从零开始的STM32MP157 Buildroot根文件系统构建

一、前言 在前面的教程中,教了大家如何移植一个LInux的内核并且正确启动,我们发现Linux内核在启动后会出现一个错误,提示我们没有找到根文件系统。那么什么是根文件系统呢?之前我们使用Ubuntu编译了STM32MP157的TF-A,UBOOT,LINUX内…

2025-05-07 学习记录--Python-变量 + 常量 + 命名规则 + 变量的数据类型 + 数据类型

合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下。💪🏻 一、变量 ⭐️ 多个变量的赋值 🍭 二、常量 ⭐️ 程序在运行的过程中,值永远不会发生改变的量称之为常量…

16.状态模式:思考与解读

原文地址:状态模式:思考与解读 更多内容请关注:深入思考与解读设计模式 引言 在开发软件系统时,特别是当对象的行为会随着状态的变化而变化时,系统往往会变得复杂。你是否遇到过这样的情况:一个对象的行为在不同的状…

从 Pretrain 到 Fine-tuning:大模型迁移学习的核心原理剖析

引言 在人工智能领域,大模型的出现掀起了一场技术革命。这些拥有海量参数的模型,如 GPT-4、PaLM 等,在众多任务上展现出了惊人的能力。然而,训练一个大模型需要耗费巨大的计算资源和时间,而且直接让大模型处理特定领域…

Java详解LeetCode 热题 100(11):LeetCode 239. 滑动窗口最大值(Sliding Window Maximum)详解

文章目录 1. 题目描述2. 理解题目3. 解法一:暴力法3.1 思路3.2 Java代码实现3.3 代码详解3.4 复杂度分析3.5 适用场景 4. 解法二:优先队列(最大堆)4.1 思路4.2 Java代码实现4.3 代码详解4.4 复杂度分析4.5 适用场景 5. 解法三&…

org.apache.poi——将 office的各种类型文件(word等文件类型)转为 pdf

org.apache.poi——将 office的各种类型文件&#xff08;word等文件类型&#xff09;转为 pdf 简介使用方法word转pdf 使用示例word转pdf 简介 使用方法 word转pdf Maven坐标为 <dependency><groupId>com.documents4j</groupId><artifactId>documen…

二叉树与优先级队列

1.树 树是由n个数据构成的非线性结构&#xff0c;它是根朝上&#xff0c;叶朝下。 注意&#xff1a;树形结构之中&#xff0c;子树之间不能连接&#xff0c;不然就不构成树形结构 1.子树之间没有交集 2.除了根节点以外&#xff0c;每一个节点有且只有一个父亲节点 3.一个n个…

如何进行室内VR全景拍摄?

如何进行室内VR全景拍摄&#xff1f; 室内VR全景拍摄作为先进的视觉技术&#xff0c;能够为用户提供沉浸式的空间体验。本文介绍如何进行室内VR全景拍摄&#xff0c;并阐述众趣科技在这一领域的技术支持和服务优势。 室内VR全景拍摄基础 1. 室内VR全景拍摄概述 室内VR全景拍…

如何通过代理 IP 实现异地直播推流

在直播行业日益火爆的今天&#xff0c;许多主播希望突破地域限制&#xff0c;实现异地直播推流&#xff0c;以获得更广泛的观众群体和更好的直播效果。代理 IP 作为一种有效的网络工具&#xff0c;能够帮助主播轻松达成这一目标。本文将详细介绍如何通过代理 IP 实现异地直播推…

随机变量数字特征

主要介绍一维随机变量期望和方差、二维随机变量期望和方差、以及协方差相关公式&#xff0c;及推导。 一维随机变量 以一个抛硬币的场景作为例子&#xff0c;如下&#xff1a; 抛掷两枚均匀硬币&#xff0c;如果两枚都是正面向上&#xff0c;则赢得2元&#xff0c;否则就输掉…

上传图片后,如何调用API进行商品搜索?

以下是一个完整的示例&#xff0c;展示如何在上传图片后调用淘宝按图搜索商品&#xff08;拍立淘&#xff09;API进行商品搜索&#xff1a; 1. 准备工作 注册账号并获取API密钥&#xff1a;在淘宝开放平台注册账号&#xff0c;创建应用&#xff0c;获取app_key和app_secret。 …

Android 数据持久化之 Room 数据库存储

一、简介 Room 是 Google 推出的 Android 持久层框架,建立在 SQLite 之上,提供了一个抽象层,简化了数据库操作。它通过注解和编译时检查来确保数据操作的正确性。 Room 主要由以下三个组件组成: Entity(实体):定义封装实际数据的实体类,每个实体类对应数据库中的一个…

react中的用法——setDisabled dva dispatch effects

setDisabled 在react中&#xff0c;setDisabled通常是指通过状态管理来控制某个组件&#xff08;如按钮、输入框等&#xff09;的禁用状态。虽然react本身没有内置的setDisabled方法&#xff0c;但你可以使用useState钩子来实现类似的功能。以下是一个简单的示例&#xff0c;展…

html css js网页制作成品——HTML+CSS珠海网页设计网页设计(4页)附源码

目录 一、&#x1f468;‍&#x1f393;网站题目 二、✍️网站描述 三、&#x1f4da;网站介绍 四、&#x1f310;网站效果 五、&#x1fa93; 代码实现 &#x1f9f1;HTML 六、&#x1f947; 如何让学习不再盲目 七、&#x1f381;更多干货 一、&#x1f468;‍&#x1f…