论文题目:Uncertainty Modeling for Out-of-Distribution Generalization

论文来源:ICLR 2022

论文作者:

论文链接:https://arxiv.org/pdf/2202.03958

论文源码:https://github.com/lixiaotong97/DSU

一、摘要

尽管深度神经网络在多种视觉任务中取得了显著进展,但在面对分布外(out-of-distribution)场景时,其性能仍然明显下降。我们认为,特征统计量(均值和标准差)承载着训练数据的领域特性,可以通过合理操控来提升模型的泛化能力。现有方法通常将这些统计量视为从特征中计算得到的确定性值,未能显式考虑测试阶段由潜在领域偏移引起的统计不确定性。本文提出在训练阶段通过建模领域偏移的不确定性来提升网络的泛化能力。具体而言,我们假设特征统计量服从多元高斯分布,因此每个统计量不再是确定值,而是一个具有多种分布可能性的概率点。借助这种不确定特征统计量,模型可在训练中缓解领域扰动,增强对潜在领域偏移的鲁棒性。我们的方法可无缝集成到现有网络中,无需引入额外参数或损失函数。大量实验表明,该方法在多个视觉任务(包括图像分类、语义分割和实例检索)中持续提升模型的泛化性能。

二、Introduction

深度神经网络在计算机视觉中表现卓越,但其成功严重依赖于"训练与测试域服从独立同分布"的假设(Ben-David et al., 2010; Vapnik, 1992)。然而,现实场景常违背该假设。例如:

  • 在雨天/雾天环境部署晴天训练的语义分割模型(Choi et al., 2021)
  • 用照片训练模型识别艺术画作(Li et al., 2017)

此类​​分布外部署场景​​均会导致性能显著下降。因此,​​域泛化(Domain Generalization)​​ ——提升模型在未知测试域上的鲁棒性——成为关键问题。

​​核心问题分析​​:先前工作(Huang & Belongie, 2017; Li et al., 2021)表明,作为特征矩的​​特征统计量(均值与标准差)​​ 携带了训练数据的领域特征(如照片风格、拍摄环境)。不同数据分布的域通常具有不一致的特征统计量(Wang et al., 2020b; Gao et al., 2021a)。主流深度学习方法遵循​​经验风险最小化(Empirical Risk Minimization)​​ 原则(Vapnik, 1999),虽在训练域表现良好,但​​未显式建模测试时统计差异的不确定性​​,导致模型过拟合训练域,对测试时的统计变化高度敏感。

​​解决方案动机​​:测试域可能引发方向和强度均不确定的统计偏移(如图1所示)。

​​关键洞察​​:通过合成特征统计量变体建模​​域偏移的不确定性​​,可提升网络对不同测试分布的适应性。

本文提出​​不确定性域偏移建模(Domain Shifts with Uncertainty, DSU)​​:将特征统计量重新定义为​​概率分布​​(多元高斯分布),其中心为原始统计量,分布范围表示潜在域偏移的变异强度。通过随机采样合成的统计量变体替代原始值,迫使模型学习域不变特征。

​​方法优势​​:

  1. ​​轻量化​​,无额外参数,训练阶段插入,测试阶段移除。
  2. ​​通用性​​,适用于图像分类、分割、检索等多种任务。
  3. ​​有效性,实验证明其显著提升模型对域偏移的鲁棒性。

三、相关工作

3.1 域泛化 (Domain Generalization)​​

数据增强 (Data Augmentation)​​

  • 图像级:AugMix(Hendrycks et al., 2020)、CutMix(Yun et al., 2019)
  • 特征级:Mixup(Zhang et al., 2018)及其流形扩展Manifold Mixup(Verma et al., 2019)
  • 统计量操作:MixStyle(Zhou et al., 2021b)对实例间统计量线性插值;pAdaIn(Nuriel et al., 2021)通过批次置换交换统计量

​​不变表示学习 (Invariant Representation Learning)​​

  • 域对齐:最小化域间分布距离(Li et al., 2018b,c)
  • 解耦表示:分离域特定/不变特征(Chattopadhyay et al., 2020; Piratla et al., 2020)
  • 归一化方法:通过标准化移除风格信息(Pan et al., 2018; Choi et al., 2021)

​​学习策略 (Learning Strategies)​​

  • 集成学习:组合多样化模型(Zhou et al., 2020b)或模块(Seo et al., 2020)
  • 元学习:模拟域偏移的元训练范式(Finn et al., 2017; Li et al., 2018a)
  • 自挑战机制:如RSC(Huang et al., 2020)通过丢弃主导特征迫使模型学习通用表示

​​3.2 深度学习中的不确定性 (Uncertainty in Deep Learning)​​

  • 数据不确定性:变分自编码器(Kingma & Welling, 2013)建模隐空间不确定性
  • 模型不确定性:Dropout(Srivastava et al., 2014)可作为贝叶斯近似(Gal & Ghahramani, 2016)
  • 应用场景:处理噪声标签(DistributionNet)、人脸质量评估(DUL, PFE)

​​本文创新​​:首次将不确定性建模用于​​特征统计量​​,以解决分布外泛化问题,区别于前述方法。

四、方法

​​4.1 预备知识

给定网络中间层的特征张量

其中,B为批次大小,C为通道数,HW为空间尺寸。我们定义每个实例在批次中的​​通道级特征均值和标准差

它们可通过以下等式计算得出

先前工作(Huang & Belongie, 2017; Li et al., 2021)表明,特征统计量可抽象化表征域的​​关键特性​​(如颜色、纹理、对比度)。在分布外场景中,不同域的统计量不一致性会削弱模型泛化能力(Wang et al., 2019a; Gao et al., 2021a)。现有方法(如MixStyle、pAdaIN)通过样本间线性操作(交换或插值)生成新统计量,但受限于参考样本的选择,其生成的​​变异方向与强度有限​​,难以覆盖真实域偏移的多样性。

​​4.2 不确定性域偏移建模

针对测试域特征统计量的​​任意方向与强度偏移​​(图1),我们提出​​不确定性域偏移建模(DSU)​​:

假设每个特征统计量在考虑潜在不确定性后服从​​多元高斯分布​​,即均值μ和标准差σ分别服从

​和

分布中心为原始统计量,标准差Σ描述潜在偏移的不确定性范围。

​​4.2.1 不确定性估计

由于测试域未知,我们提出​​非参数化估计方法​​,利用批次统计量方差指导变异范围:

这里的\mathbb{E}_b[\mu(x)]是指对batch维度求期望(均值),且\mathbb{E}_b[\mu(x)]\in \mathbb{R}^C.

​​4.2.2 特征统计量的概率分布

通过重参数化技巧(Kingma & Welling, 2013)从分布中采样新统计量:

该操作生成方向和强度随机组合的多样化统计量变体。

​​4.2.3 实现

通过​​自适应实例归一化(AdaIN)​​(Huang & Belongie, 2017)实现特征变换

该模块可插入网络任意位置,​​训练时按概率p激活​​,测试时移除。算法流程如下:

五、实验

我们在多种视觉任务上验证了所提出方法的有效性,包括图像分类、语义分割、实例检索以及对图像损坏的鲁棒性测试。这些任务的训练和测试数据之间存在不同类型的分布偏移,例如风格变化、合成到现实的差距、场景变化和像素级损坏。

5.1 多领域分类任务

  • 设置与实现细节:我们在PACS数据集上进行评估,该数据集包含四种风格:艺术画(Art)、卡通(Cartoon)、照片(Photo)和素描(Sketch)。采用留一领域验证协议(leave-one-domain-out),使用ResNet18作为骨干网络,训练设置与MixStyle一致。此外,我们还在Office-Home数据集上进行了实验。
  • 实验结果:如表1所示,我们的方法相比基线方法有显著提升,尤其是在Art和Sketch领域,平均准确率提升近10%。与现有方法(如 MixStyle、pAdaIN、SagNet 等)相比,DSU也表现出更强的泛化能力。

5.2 语义分割任务

  • 设置与实现细节:使用合成数据集GTA5训练,真实数据集Cityscapes测试。采用DeepLab-v2网络(ResNet101骨干),评估指标为mIOU和mAcc。
  • 实验结果:如表2所示,DSU在mIOU和mAcc上分别提升了6.1%和5.5%,显著优于基线和其他方法。可视化结果表明,DSU能更好地保留细节并适应真实场景。

5.3 实例检索任务

  • 设置与实现细节:在DukeMTMC和Market1501数据集上进行跨域行人重识别实验,使用ResNet50骨干网络,评估指标为mAP和Rank-1准确率。
  • 实验结果:如表3所示,DSU在两项指标上均显著优于基线,并超越MixStyle和pAdaIN。这表明DSU在细粒度任务中也能有效保留关键信息并提升泛化能力。

5.4 对图像损坏的鲁棒性

  • 设置与实现细节:在ImageNet-C数据集上测试模型对15种图像损坏的鲁棒性,使用ResNet50骨干网络,评估指标为Clean Error和mCE(平均损坏误差)。
  • 实验结果:如表4所示,DSU在保持清洁图像性能的同时,显著提升了模型对损坏图像的鲁棒性。与APR方法结合后,mCE从65.0%降至64.1%,表明DSU可与其他增强方法兼容并进一步提升性能。

5.5 其它实验

图5定量对比了baseline与DSU模型在未见域上的特征统计量(均值+标准差)分布。DSU的分布明显更靠近训练域,说明其通过不确定性扰动有效抑制了统计偏移。

图6用自编码器把DSU扰动后的特征重建回图像,展示同一输入可生成多样风格、纹理与对比度变化。这些可视化证实DSU能在特征空间产生丰富且合理的域偏移样本,从而提升模型泛化能力。

图8对比MixStyle/pAdaIN的线性插值或交换与DSU的多元高斯采样:后者无需参考样本即可生成方向与强度更丰富的特征统计变异,突破训练域凸包限制。

六、结论

在本文中,我们提出了一种概率化的方法,通过在训练阶段建模领域偏移的不确定性,并利用合成的特征统计量来提升网络的泛化能力。具体而言,我们假设每个特征统计量服从一个多元高斯分布,以建模各种潜在的偏移情况。由于生成的特征统计量具有多样化的分布可能性,模型能够对不同的领域偏移具备更好的鲁棒性。实验结果验证了我们所提出方法在提升网络泛化能力方面的有效性。

七、个人思考与理解

1. 不确定性是如何嵌入到模型的学习过程的?

不确定性来源:

  • 小批统计量的通道方差
  • 重参数化时注入的标准高斯噪声

如何嵌入到模型:通过等式(7)对x进行特征变换,然后使用变换后的统计量进行特征归一化(类似AdaIN操作),于是不确定性就嵌入到模型的学习过程中。

2. DSU的本质是什么?

一种无参数的、非监督的、基于特征统计扰动的方法。

3. 与LLM的潜在结合之处有哪些?

  • 特征统计扰动的泛化思想迁移:在Transformer中,LayerNorm也使用了均值和方差进行归一化;可以尝试对LayerNorm的统计量进行类似的“扰动建模”,增强模型对文本风格、领域变化的鲁棒性。
  • 不确定性建模用于提示学习(Prompt Learning):在soft prompt或continuous prompt中,prompt embedding可视为随机变量;引入类似DSU的不确定性建模,增强prompt的泛化能力。
  • 数据增强策略:在文本表示空间(如[CLS]向量或中间层表示)引入统计扰动,作为一种表示级数据增强;有助于提升模型在跨域文本(如新闻 vs 微博、正式 vs 口语)上的泛化能力。
  • 对抗鲁棒性提升:DSU的扰动机制可视为一种隐式对抗训练;可用于提升LLM在面对输入扰动(如拼写错误、风格变化)时的鲁棒性。

4. 重参数化是什么?

一种将随机采样操作转化为可微表达式的技巧,支持梯度回传。可以看一下博客:搞明重参数化。感觉说得还算清楚。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/100332.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/100332.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/100332.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式系统单点登录(SSO)状态管理深度解析:从Cookie+Session到JWT的演进之路

分布式系统单点登录(SSO)状态管理深度解析:从CookieSession到JWT的演进之路作者:默语佬 | CSDN博主 在分布式微服务架构盛行的今天,单点登录已成为企业级应用的标准配置。本文将深入探讨SSO状态管理的技术演进,从传统的CookieSess…

从 WPF 到 Avalonia 的迁移系列实战篇7:EventTrigger 的迁移

从 WPF 到 Avalonia 的迁移系列实战篇7:EventTrigger 的迁移 在 WPF 中,EventTrigger 是非常常用的功能,它可以让我们直接在 XAML 中绑定事件与动画或动作,实现 UI 的交互效果。例如按钮点击时旋转、鼠标悬停时变色等。 然而&…

深圳比斯特|电池组PACK自动化生产线厂家概述

电池组PACK自动化生产线是指用于生产电池模组的一套自动化系统。这类生产线主要用于生产各类电池组,如锂离子电池组,应用于电动汽车、储能系统等领域。自动化生产线通过机械设备和计算机控制系统,实现电池组生产过程的自动化和高效率。整条生…

基于librdkafa C++客户端生产者发送数据失败问题处理#2

https://blog.csdn.net/qq_42896627/article/details/149025452?fromshareblogdetail&sharetypeblogdetail&sharerId149025452&sharereferPC&sharesourceqq_42896627&sharefromfrom_link 上次我们介绍了认证失败的问题。这次介绍另一个问题生产者发送失败…

pg卡死处理

[postgresapm ~]$ ps -ef|grep postgres:|grep -v grep|awk {print $2}|xargs kill -9 锁: 1 查找锁表的pid select pid from pg_locks l join pg_class t on l.relation t.oid where t.relkind r and t.relname lockedtable; 2 查找锁表的语句 select pid, …

Spring Boot 与 Elasticsearch 集成踩坑指南:索引映射、批量写入与查询性能

前言Elasticsearch 作为分布式搜索和分析引擎,凭借其高性能、可扩展性和丰富的查询能力,被广泛应用于日志分析、全文检索、电商搜索推荐等场景。 在 Spring Boot 项目中集成 Elasticsearch 已成为很多开发者的日常需求,但真正落地时往往会踩到…

windows 10打开虚拟机平台时,出现错误“找不到引用的汇编”解决办法

通过dism.exe开启虚拟机平台时,出现了以下错误:找不到引用的汇编,如下图所示 通过以下命令进行修复均无效: dism /online /cleanup-image /scanhealth sfc /scannow 最后通过加载windows系统的安装光盘iso, 双击setup.exe以【保…

设计模式(C++)详解——建造者模式(1)

<摘要> 建造者模式是一种创建型设计模式&#xff0c;通过将复杂对象的构建过程分解为多个步骤&#xff0c;使相同的构建过程能够创建不同的表示形式。本文从背景起源、核心概念、设计意图等角度深入解析该模式&#xff0c;结合电脑组装、文档生成等实际案例展示其实现方式…

移动端触摸事件与鼠标事件的触发机制详解

移动端触摸事件与鼠标事件的触发机制详解 在移动端开发中&#xff0c;我们经常会遇到一个现象&#xff1a;一次简单的触摸操作&#xff0c;不仅会触发touch系列事件&#xff0c;还会触发一系列mouse事件&#xff0c;最终甚至会触发click事件。这其实是浏览器为了兼容传统桌面端…

如何科学评估CMS系统性能优化效果?

为什么要评估性能优化效果&#xff1f; 在投入时间精力优化CMS系统后&#xff0c;很多开发者只凭"感觉"判断网站变快了&#xff0c;但这种主观判断往往不可靠。科学评估性能优化效果可以帮助我们&#xff1a; 量化优化成果&#xff1a;用数据证明优化的价值发现潜在问…

中控平台数据监控大屏

中控平台数据监控大屏前言&#xff1a;什么是数据大屏&#xff1f; 数据大屏就像是一个"数字仪表盘"&#xff0c;把复杂的数据用图表、动画等方式直观展示出来。想象一下汽车的仪表盘&#xff0c;能让你一眼看到速度、油量、转速等信息——数据大屏也是这个原理&…

【Vue2手录13】路由Vue Router

一、Vue Router 基础概念与核心原理 1.1 路由本质与核心要素 本质定义&#xff1a;路由是URL路径与页面组件的对应关系&#xff0c;通过路径变化控制视图切换&#xff0c;实现单页应用&#xff08;SPA&#xff09;的无刷新页面切换。核心三要素&#xff1a; router-link&#x…

【Git】零基础入门:配置与初始操作实战指南

目录 1.前言 插播一条消息~ 2.正文 2.1概念 2.2安装与配置 2.3基础操作 2.3.1创建本地仓库 2.3.2配置Git 2.3.3认识工作区&#xff0c;暂存区&#xff0c;版本库 2.3.4版本回退 2.3.5撤销修改 2.3.6删除文件 3.小结 1.前言 在 Java 开发场景中&#xff0c;团队协…

CAD多面体密堆积_圆柱体试件3D插件

插件介绍 CAD多面体密堆积_圆柱体试件3D插件可在AutoCAD内基于重力堆积算法在圆柱体容器内进行多面体的密堆积三维建模。插件采取堆积可视化交互界面&#xff0c;可观察多面体颗粒的堆积动态&#xff0c;并可采用鼠标进行多面体位置的局部微调。插件可设置重力堆积模拟时长参数…

机器学习-模型调参、超参数优化

模型调参 手工超参数微调 以一个好的baseline开始&#xff0c;即&#xff1a;在一些高质量的工具包中的默认设置&#xff0c;论文中的值调一个值&#xff0c;重新训练这个模型来观察变化重复很多次获得对以下的insight&#xff1a; 1、哪个超参数重要 2、模型对超参数的敏感度是…

STM32 单片机开发 - I2C 总线

一、IIC(I2C) 线的作用UART总线 PC端(CPU) <----------> 开发板(STM32U575RIT6)IIC总线 主控芯片(STM32U575RIT6) <---------> 传感器驱动芯片(SHT20/SI7006空气温湿度传感器)二、I2C 总线的概念图 1 I2C 总线示意图图 2 多主机多从机模式示意图I2C 总…

Redis 数据结构源码剖析(SDS、Dict、Skiplist、Quicklist、Ziplist)

Redis 数据结构源码剖析&#xff08;SDS、Dict、Skiplist、Quicklist、Ziplist&#xff09;1. 前言 Redis 的高性能与丰富数据结构密切相关。 核心数据结构包括&#xff1a; SDS&#xff08;Simple Dynamic String&#xff09;&#xff1a;字符串底层实现。Dict&#xff08;哈希…

无人机图传系统的功能解析和技术实现原理

无人机图传系统要将机载摄像头捕捉到的画面以尽可能低的时延、尽可能高的清晰度、稳定可靠地送达地面操作员或指挥中心&#xff0c;进而驱动现场行动。为此&#xff0c;核心功能可以从四个维度来解构&#xff1a;实时性、画质与稳定性、覆盖与冗余、以及安全协同。实时性要求在…

微服务网关的bug

从你提供的Eureka控制台信息来看&#xff0c;SPRINGCLOUD-PRODUCT已成功注册到Eureka&#xff0c;且状态为UP&#xff08;实例地址localhost:springcloud-product:8082&#xff09;&#xff0c;排除了“服务未注册”“实例离线”的基础问题。但仍报“负载均衡无可用服务”&…

LeetCode:2.字母异位词分组

目录 1.字母异位词分组 1.字母异位词分组 对于这道题来说&#xff0c;关键的地方在于字母异位词他们排序后的字符串完全相等&#xff0c;所以我们可以通过哈希表来建设一个字符串和其排序相同的字符串数组的映射关系 class Solution { public:vector<vector<string>…