CVPR 2025 | 优化SAM:高效无监督Prompt与偏好对齐驱动的半监督医学分割

论文信息

  • 标题:Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation
  • 作者:Aishik Konwer, Zhijian Yang, Erhan Bas, Cao Xiao, Prateek Prasanna, Parminder Bhatia, Taha Kass-Hout
  • 单位:Stony Brook University, GE Healthcare
  • 会议:CVPR 2025

背景简介

Segment Anything Model(SAM)等基础模型已成为医学图像分割的重要工具,但仍依赖大量人工标注或专家prompt,难以充分利用无标注大数据,且人工成本高昂。现有自监督/弱监督提升方案要么仅用于训练伪标签,要么缺乏高效的偏好对齐,仍未实现真正低标注、高性能的自动化医学分割。


创新方法

  1. 高效无监督Prompt生成

    • 融合BiomedCLIP、MedVInT(VQA)、GPT-4等多模态大模型,自动生成融合语义、定位、形状等关键信息的bounding box和文本prompt,无需人工参与
    • 视觉prompt基于CLIP生成显著性图+CRF优化,提取目标区域坐标;文本prompt融合疾病/器官通用描述和VQA输出。
  2. 偏好对齐的直接优化(Direct Preference Optimization, DPO)

    • 训练初期用少量标注数据微调prompt模块,后续在无标注数据上,通过“虚拟标注员”对多组掩码候选进行评分/排序,直接优化模型对偏好分割的正确性,无需显式reward建模或真实人工反馈。
    • DPO损失函数可自动奖励高分候选,惩罚低分候选,实现端到端半监督优化。

方法流程

  1. 阶段一(Prompt微调):用10%有标注数据,联合视觉(BiomedCLIP)+文本(MedVInT+GPT-4)prompt指导SAM-Med2D主干微调。
  2. 阶段二(偏好对齐训练):剩余无标注数据,自动生成多组分割候选,用IoU分数(与真实掩码对比模拟虚拟评分)分为4档,依照DPO损失优化模型,使其输出更贴合高评分分割。
  3. 端到端无需Reward模型:全流程无需人工反馈或reward函数训练,极简实现,高效易用。

主要实验与结果

  • 数据集:涵盖胸部X光肺分割、乳腺超声肿瘤分割、Abdominal CT多器官分割,支持X-ray、US、CT等多模态。
  • 少标注强性能:仅用10-20%标注数据,性能大幅优于U-Net、nnU-Net、SAM、SAM-Med2D、Self-prompt等SOTA方法,在20%数据下胸片Dice达到78.87,远超同类。
  • 半监督优势明显:在50%数据量下,半监督DPO模型Dice可达89.68,接近全监督prompt-only模型(91.42)。
  • 边界精度与泛化:分割边界更精细,肿瘤/肺/多器官实验中对小结构和难分割区域表现突出。
  • 鲁棒性:评分噪声(虚拟评分误差)下性能损失极小,体现方法稳健性。

消融实验

  • 各模块贡献明确:无监督prompt、VQA、GPT-4等模块叠加显著提升性能。
  • 不同Preference策略:排名优于单独评分和“只优化最好”候选,且无监督数据越多,提升越大。
  • 参数选择:DPO损失中的权重参数经实验证明最优为β1=1, β2=0.5。

总结与展望

本方法实现了面向半监督医学图像分割的高效无监督prompt+偏好对齐优化,极大降低对人工标注和专家干预的依赖,泛化性和实用性突出。未来可拓展至3D/时序医学影像、更多大模型prompt融合与真实用户偏好采集。


欢迎关注,获取更多CVPR 2025医学AI前沿论文解读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86669.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86669.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/86669.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】责任链模式

目录 一、模式核心概念与结构二、C++ 实现示例:员工请假审批系统三、责任链模式的关键特性四、应用场景五、责任链模式与其他设计模式的关系六、C++ 标准库中的责任链模式应用七、优缺点分析八、实战案例:Web 请求过滤器链九、实现注意事项如果这篇文章对你有所帮助,渴望获得…

dp进阶,树形背包(dfs+01)

顾名思义,就是在对树进行搜索的时候,由于限制了子节点选根节点必选和节点数限制,所以需要额外利用背包来维护最大值 假设根节点就是0,我们很容易 发现,这就是一个正常的树求和,但是限制了节点数量&#xf…

微信小程序安卓手机输入框文字飘出输入框

最近在开发微信小程序遇到一个问题,安卓手机输入框文字飘出输入框,但是ios系统的手机则正常。 使用情景:做了一个弹窗,弹窗内是表单,需要填写一些信息,但是在填写信息时光标不显示,输入的内容飘…

3 大语言模型预训练数据-3.2 数据处理-3.2.2 冗余去除——3.后缀数组(Suffix Array)在大模型数据去重中的原理与实战

后缀数组(Suffix Array)在大模型数据去重中的原理与实战 一、后缀数组的核心原理与数据结构二、后缀数组去重的核心流程1. **文档预处理与合并**2. **构建后缀数组**3. **计算最长公共前缀(LCP)数组**4. **基于LCP检测重复文档** …

数据库外连接详解:方式、差异与关键注意事项

🔄 数据库外连接详解:方式、差异与关键注意事项 外连接用于保留至少一个表的全部行,即使另一表无匹配记录。以下是三种外连接方式的深度解析: 🔍 一、外连接的三种类型 1. 左外连接 (LEFT OUTER JOIN) 作用&#xf…

vscode把less文件生成css文件配置,设置生成自定义文件名称和路径

1.下载less插件 在插件市场搜索 less 2.设置生成配置 3.修改out属性 "less.compile": {"compress": false, // 是否删除多余空白字符 一行显示[压缩]"sourceMap": false, // 是否创建文件目录树,true的话会自动生成一个 .css.map …

探索相机成像的奥秘 - 齐次坐标、径向失真和图像传感器倾斜

引言 大家好!今天我们将一起探索相机成像背后的一些关键技术概念:齐次坐标、径向失真和图像传感器倾斜。这些概念对于理解相机如何捕捉和处理图像至关重要。我们将通过简单易懂的语言和严谨的公式来详细解释这些概念。 齐次坐标(Homogeneou…

校企协同育人,智慧养老实训基地助力人才就业无忧

随着我国人口老龄化程度不断加深,智慧养老产业蓬勃发展,对专业人才的需求日益迫切。校企协同打造智慧养老实训基地,成为解决人才供需矛盾、提升人才培养质量的重要途径。通过科学的建设方案,智慧养老实训基地能够为学生提供实践平…

从需求到落地:一个AI训练平台的售前全流程复盘

目录 一、项目背景:客户要建自己的AI训练平台 二、需求梳理三板斧:并发量、存储带宽、模型种类 1. 并发训练量 2. 存储带宽需求 3. 模型类型与参数规模 三、解决方案设计:GPU选型 + 高速网络 + 存储架构 ✅ GPU服务器选型 ✅ 网络与通信架构 ✅ 存储与数据缓存 四…

织梦DedeCMS转WordPress

最近,有个用户找模板兔迁移网站,源站用的dede,需要转成wp,文章数量大概7000-8000篇,其中有个需求是保证旧文章的链接有效,在wp上的新文章与旧文章的链接类型不一样,所以这涉及到伪静态来处理跳转…

installGo.sh

#!/bin/bash # 检查是否以root用户运行 if [ "$(id -u)" -ne 0 ]; then echo "请使用root权限运行此脚本" exit 1 fi # 检查是否安装了必要的工具 for cmd in curl wget tar; do if ! command -v $cmd &> /dev/null; then echo…

【技术难题】el-table的全局数据排序实现示例,不受分页影响,以及异步请求带来的页面渲染问题

参考链接:https://blog.csdn.net/qq_35770559/article/details/131183121 问题代码 编辑页面detail.vue <el-form title="列表信息" name="detail"><el-form><el-form-item><el-buttontype="cyan"icon="el-icon-p…

非功能测试

非功能测试范畴&#xff1a;界面测试&#xff0c;易用性测试&#xff0c;兼容性测试&#xff0c;文档测试&#xff0c;安装/卸载测试等等 界面测试 1.窗体界面测试 1.窗体定义&#xff1a;指整个软件窗口&#xff0c;也可称为窗口&#xff0c;是界面测试的基本单位 2.控件分…

一起endpoint迷路的问题排查总结

今天上班&#xff0c;一到工位上&#xff0c;就有同事和我说有客户反映自己的容器的一些指标在监控平台不上报了&#xff0c;我当时一看机器所在的监控&#xff0c;发现确实是这样 确实存在某个点开始数据就没了&#xff0c;主要这个点当时也没有任何的操作变更&#xff0c;于…

官方 Linker Scripts 语法和规则解析(2)

系列文章目录 官方 Linker Scripts 语法和规则解析&#xff08;1&#xff09; 官方 Linker Scripts 语法和规则解析&#xff08;2&#xff09; 官方 Linker Scripts 语法和规则解析&#xff08;3&#xff09; 链接脚本(Linker Scripts)语法和规则解析(自官方手册) 7.9. 链接脚…

CentOS 7 通过YUM安装MySQL 8.0完整指南

一、准备工作&#xff1a;更新系统与YUM源 # 1. 更换阿里云镜像源 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo# 2. 清理并重建缓存 yum clean all yum makecache# 3. 升级系统所有包 yum -y update 二、安装MySQL 8.0 1. 下载…

qq邮箱 新版 怎么去掉个性签名?

qq邮箱 新版 怎么去掉个性签名&#xff1f; 新版的qq邮箱&#xff0c;用着还不错&#xff0c;特别是搜索&#xff0c;比以前好多&#xff0c;以前加载的时候&#xff0c;搜索框里有一行字&#xff0c;加载不完&#xff0c;就没法搜索&#xff0c;特别菜。现在好多了。 不过现在…

C++:string类(1)

一.初步了解STL STL是Standard Template Library的缩写&#xff0c;中文译为标准模板库&#xff0c;是C标准库的重要组成部分。它本质上是一套基于模板的通用编程工具&#xff0c;通过模板技术实现了数据结构和算法的抽象与复用&#xff0c;让开发者无需重复编写基础功能&…

如何避免静态变量初始化中的异常

确保初始化表达式的安全性 基本数据类型初始化 对于基本数据类型&#xff08;如int、double、boolean等&#xff09;的静态变量初始化&#xff0c;要确保赋值的表达式是合法的。例如&#xff0c;在初始化一个int类型的静态变量时&#xff0c;避免出现除数为零的情况。 class Sa…

【151】基于Springboot+Vue实现的校园订餐管理系统小程序(有文档+PPT+视频)

系统介绍 视频演示 基于SpringbootVue实现的校园订餐管理系统小程序&#xff08;有文档PPT视频&#xff09; 基于SpringbootVue实现的校园订餐管理系统小程序采用前后端分离的架构方式&#xff0c;系统设计了管理员、商家、用户三种角色&#xff0c;系统分为管理端、小程序端&…