自监督学习在合成孔径声呐目标识别中的应用
BW Sheffield
美国巴拿马城海军水面作战中心

1 引言
在自主水下航行器(AUVs)中应用计算机视觉面临着独特的挑战,因为海洋环境往往条件不可预测且极为严苛。传统计算机视觉研究主要依赖光学相机成像,而在光照不足、悬浮沉积物及水体浑浊的水下环境中难以适用。因此,声呐成像,尤其是其衍生技术——合成孔径声呐(SAS),成为水下成像的首选。搭载SAS的AUV能够扫描海底生成高分辨率图像,其细节表现远超其他类型的声呐。然而,SAS图像虽然细节丰富,但数据量巨大,给标注工作带来了极大挑战,而标注又是训练深度神经网络(DNN)不可或缺的一步。

与传统机器学习方法相比,DNN因其能够自主从数据中学习特征而受到广泛关注,无需专家手工设计特征。然而,DNN的显著限制在于其对大规模标注数据和强大计算资源的依赖。在SAS领域,不仅标注数据稀缺,且获取难度远高于传统相机图像。

近年来,随着计算能力和数据量的增长,自监督学习(SSL)逐渐兴起。SSL无需标签即可让模型从数据中学习特征,因而为解决SAS数据标注不足问题提供了潜在途径。本研究旨在评估两种主流SSL算法——MoCov2 [1] 和 BYOL [2],与经典监督学习模型ResNet18 [3]在二分类SAS图像识别任务上的表现(如图1所示)。SSL模型在真实世界SAS数据上进行预训练,以学习有用特征,并与监督学习基准进行对比。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85848.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85848.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/85848.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

进程间通信2(命名管道)linux

1 命名管道 前面讲到匿名管道,有一个很大的限制,那就是只有具有相同祖先(具有亲缘关系)的进程间才能进行通信,但是如果想实现不同进程间的通信,这个时候命名管道就发挥着巨大作用。 命名管道是一种特殊类…

简单通过SenseVoice给自己配置一个语音转文字服务

首先把代码下载下来 gitgithub.com:FunAudioLLM/SenseVoice.git 然后写一个docker文件 FROM ubuntu:latestRUN apt-get update -y RUN apt-get install -y python3-full python3-pip RUN mkdir -p /SenseVoice WORKDIR /SenseVoice RUN python3 -m venv . ENV USE_CUDA0 EXP…

网络钓鱼攻击

​根据2023年Proofpoint年度网络钓鱼报告显示:91%的针对性攻击始于钓鱼邮件,平均每30秒就有一个企业成为攻击目标,全球损失超过$6.5B​ 一、钓鱼攻击技术深度解析 1. 钓鱼攻击核心技术架构 2. 现代钓鱼技术演进 ​攻击向量升级路线​ ​当前…

uvicorn api:app --host 0.0.0.0 --port 7777容器运行失败

docker logs pycorrector-container-gpu 你这个报错的核心是: ERROR: Error loading ASGI app, Could not import module "api".这说明: uvicorn api:app 没有找到 api.py 文件,或者没法导入 app 对象。 🔍 一步步排查…

热成像仪测MOSFET温度

热成像仪测MOSFET温度 根据提供的搜索结果,热测量方法主要分为非接触式和接触式两大类,针对不同材料特性和测量场景各有优势。以下是核心方法的总结及关键技术要点: 🔥 一、非接触式热测量方法 红外热成像技术 原理:通…

Dagster资产元数据与标签:数据治理的利器

在现代数据栈中,有效的数据治理至关重要。Dagster作为领先的数据编排平台,提供了强大的资产元数据和标签功能,帮助团队更好地理解、组织和跟踪数据资产。本文将深入探讨Dagster中的资产元数据和标签功能,展示如何利用这些功能提升…

基于物联网的智能饮水机系统设计

标题:基于物联网的智能饮水机系统设计 内容:1.摘要 随着物联网技术的快速发展,智能设备在日常生活中的应用越来越广泛。本研究的目的是设计一种基于物联网的智能饮水机系统,以提高饮水机的使用便捷性和智能化程度。方法上,通过传感器实时监测…

DP读书:NEC年终小结和显示器【明基rd28u】

一点真实体验_写在ROBOCON2025国赛前 很久没有写这种关于感受的博客了,就用真实感受的角度来看看一次众测的经历,哈哈^ 差不多一个月前,我收到了明基的28寸显示器,体验了差不多2周左右,一直把显示器挂在实验室仓库La…

Solana 一键冷分仓机制详解:如何用技术手段构建健康的持仓结构

在 Solana 的快速发币环境中,许多项目方在成功部署代币后,会面临一个共通问题——如何避免持仓结构过于集中。无论是初始铸造的 Token、流动性预留份额,还是空投分发的准备金,如果长时间停留在单一钱包地址中,将在链上…

【智能体】dify部署本地步骤

从git克隆仓库到本地 git clone https://github.com/langgenius/dify.git设置环境变量 cd dify cd docker cp .env.example .envdocker启动 docker compose up -d在浏览器打开网址 http://localhost/install 登录后即可使用

开源鸿蒙6.0 Beta1版本发布!深圳触觉智能即将适配RK3566/RK3568/RK3576/RK3588等芯片

开放原子开源鸿蒙(OpenAtom OpenHarmony,简称“开源鸿蒙”或“OpenHarmony”)6.0 Beta1版本正式发布。相比5.1.0 Release版本进一步增强ArkUI组件能力,提供更安全、更灵活的组件布局;增强分布式数据管理能力&#xff0…

机器学习 (ML) 基础入门指南

一、机器学习概述 (一)定义 在当今科技飞速发展的时代,机器学习作为人工智能的一个重要分支,正深刻地改变着我们的生活和工作方式。根据机器学习泰斗、卡耐基梅隆大学的汤姆米切尔 (Tom Mitchell) 教授的定义,机器学…

基于ARM ubuntu如何进行交叉编译

场景总结: 平台:x86 主机 工具链:aarch64-linux-gnu-gcc(用于编译 64-bit ARM 程序) 目标:让 gcc 自动使用 ARM Ubuntu rootfs 中的头文件和库(位于 /opt/arm64-ubuntu) 不希望每…

java+vue+SpringBoo社区药房系统(程序+数据库+报告+部署教程+答辩指导)

源代码数据库LW文档(1万字以上)开题报告答辩稿ppt部署教程代码讲解代码时间修改工具 技术实现 开发语言:后端:Java 前端:vue框架:springboot数据库:mysql 开发工具 JDK版本:JDK1.…

VS2022打Unity中的脚本断点时出现当前不会命中断点,找不到相应位置

今天遇到一个很傻的问题, 在新电脑中安装了Unity和VS2022后,在Unity中打开一个新脚本,打断点时报警告,如下: 原来在Unity中新建的脚本,如果没有被使用,就会出现找不到位置的错误! 反…

UVA489刽子手游戏

UVA489 刽子手的游戏 Hangman Judge - 洛谷 #include <bits/stdc.h> using namespace std;bool arr[26]; int main() {int n;while (cin >> n && n ! -1){string s1, s2;memset(arr, 0, sizeof(arr));cout << "Round " << n <&l…

bat脚本抓取android日志

一 通过bat脚本抓取日志到windows电脑本地 1 通过包名抓取日志 echo off chcp 65001 >nul echo 获取 com.starauto.ac 的 PID… FOR /F “delims” %%i IN (‘adb shell pidof com.starauto.ac’) DO set PID%%i echo 当前 PID: %PID% echo 开始抓取日志&#xff0c;仅限…

java开发为什么要分层

在 Java 开发中,分层架构(Layered Architecture)是一个常见的设计模式,它将系统分为不同的层级(如表示层、业务逻辑层、数据访问层等),每个层次都有不同的职责和功能。分层架构的设计能够带来很多好处,下面是一些主要原因: 1. 提高代码的可维护性 模块化:通过将系统…

通达信 主力攻击信号系统幅图指标

通达信 主力攻击信号系统幅图指标 用法说明: 该指标用于识别股票或交易品种在短期内的主力资金介入信号,结合趋势强度及多维度技术条件,帮助投资者捕捉潜在的上涨机会。 核心逻辑: 趋势确认:要求价格处于20日均线之上,且均线呈上升态势,确保短期趋势偏多。 多信号共振…

Nuscences转kitti数据集格式nuscenes2kitti,以及.bin文件可视化

1.首先去官网下载对应的工具库https://github.com/linClubs/nuscenes2kitti.git 2.官网有具体的教程&#xff0c;不过编译的时候需要删除nus2kitti_ws/src的Cmake文件&#xff0c;除此之外在命令窗口进行软链接export LD_PRELOAD/usr/lib/x86_64-linux-gnu/libffi.so.7 3.详细…