在这里插入图片描述

Zero-Shot Day-Night Domain Adaptation with a Physics Prior(ICCV,2021)

  • 专题介绍
  • 一、研究背景
  • 二、方法
        • 1. 物理反射模型与颜色不变特征的推导(原理推导、物理依据)
        • 2. 颜色不变特征的计算(特征计算公式整个过程)
        • 3. 可训练的CIConv层设计(将第二节的计算过程卷积化)
  • 三、实验结果
        • 1. 合成图像分类实验
        • 2. 自然图像分类实验
        • 3. 语义分割实验
  • 四、总结
      • 在暗光增强任务作为结构先验应用的前景

本文将对 Zero-Shot Day-Night Domain Adaptation with a Physics Prior,这篇文章进行讲解。参考资料如下:

[1] 文章
[2] 代码


专题介绍

在低光照环境下,传统成像设备往往因画面昏暗、细节丢失而受限。LLIE(低照度暗光增强)技术应运而生,它通过提升图像亮度、对比度,减少噪点并恢复色彩细节,让暗夜变得清晰可见。

LLIE技术从传统方法如直方图均衡化、Retinex模型等起步,近年来借助深度学习,尤其是卷积神经网络(CNN),GAN模型,扩散模型实现了质的飞跃。这些算法能自动学习图像特征,精准处理低光照图像,效果显著优于传统技术。

本专题将聚焦LLIE技术的核心原理、应用案例及最新进展,让我们一起见证LLIE如何点亮暗夜,开启视觉新视界!欢迎一起探讨交流!

系列文章如下
【1】ZeroDCE
【2】HVI
【3】CLIP-LIT
【4】GLARE
【5】Retinexformer
【6】SG-LLIE
【7】GPP-LLIE
【8】FusionNet
【9】EnligtenGAN
【10】PTG
【11】CSNorm


一、研究背景

本文介绍了SG-LLIE这篇文章中的结构先验计算方法。
该论文在昼夜域适应方面探索了零样本的情况。传统的域适应是在一个域上训练,然后利用测试集中的无标签数据来适应目标域,但收集测试数据既贵又有时甚至收集不到。所以作者不依赖测试数据图像,而是利用从基于物理的反射模型中得出的视觉归纳先验来做域适应。作者把一些颜色不变边缘检测器设计成卷积神经网络中的可训练层,还评估了这些层对光照变化的稳健性。结果显示,这种颜色不变层能减少整个网络中特征图激活的昼夜分布差异,而且在合成和自然数据集上的分类、分割、地点识别等多种任务中,都能提升零样本昼夜域适应的性能。

二、方法

方案主要围绕颜色不变卷积层(CIConv) 的设计展开,该卷积层基于物理反射模型推导的颜色不变特征,用于解决昼夜光照变化导致的域偏移问题。具体内容如下:

1. 物理反射模型与颜色不变特征的推导(原理推导、物理依据)
  • 基础模型:方法基于Kubelka-Munk(KM)反射模型,该模型描述了物体反射光的光谱特性,公式为:
    E(λ,x)=e(λ,x)((1−ρf(x))2R∞(λ,x)+ρf(x))E(\lambda, x)=e(\lambda, x)\left(\left(1-\rho_{f}(x)\right)^{2} R_{\infty}(\lambda, x)+\rho_{f}(x)\right)E(λ,x)=e(λ,x)((1ρf(x))2R(λ,x)+ρf(x))
    其中,EEE 为反射光光谱,eee 为光源光谱,R∞R_{\infty}R为物体材料反射率,ρf\rho_{f}ρf为菲涅尔反射系数,λ\lambdaλ为光的波长,xxx 为图像空间位置。
  • 颜色不变特征:通过对上述模型的简化假设(这里感兴趣的读者可以详细了解一下KM反射模型,本文不做过多介绍),推导得出多种颜色不变边缘检测器(如E、W、C、N、H),这些特征仅依赖物体材料属性 R∞R_{\infty}R,不受光照强度、颜色、场景几何(如阴影)等因素影响(表1列出了各特征的不变性属性)。
    在这里插入图片描述
2. 颜色不变特征的计算(特征计算公式整个过程)
  • RGB到光谱特征的转换:利用高斯颜色模型(高斯颜色模型(Gaussian Color Model)是一种用于图像边缘检测的经典方法,核心思想是利用高斯核函数对图像的颜色(或灰度)信息进行滤波,通过计算像素点在空间和颜色维度上的梯度变化来检测边缘。),将RGB图像转换为与光谱相关的特征(EEEEλE_{\lambda}EλEλλE_{\lambda\lambda}Eλλ),公式为:
    [E(x,y)Eλ(x,y)Eλλ(x,y)]=[0.060.630.270.30.04−0.350.34−0.60.17][R(x,y)G(x,y)B(x,y)]\left[\begin{array}{c}E(x, y) \\ E_{\lambda}(x, y) \\ E_{\lambda \lambda}(x, y)\end{array}\right]=\left[\begin{array}{ccc}0.06 & 0.63 & 0.27 \\ 0.3 & 0.04 & -0.35 \\ 0.34 & -0.6 & 0.17\end{array}\right]\left[\begin{array}{c}R(x, y) \\ G(x, y) \\ B(x, y)\end{array}\right]E(x,y)Eλ(x,y)Eλλ(x,y)=0.060.30.340.630.040.60.270.350.17R(x,y)G(x,y)B(x,y)
    其中,EEE 为光强,EλE_{\lambda}EλEλλE_{\lambda\lambda}Eλλ分别为一二阶光谱导数。
  • 空间导数计算:对于每个光谱特征(如EEE),通过与高斯导数核进行卷积计算空间导数。以ExE_xExEEE在x方向的空间导数)为例,计算公式为:
    Ex(x,y,σ)=∑t∈ZE(t,y)∂g(x−t,σ)∂xE_{x}(x, y, \sigma)=\sum_{t \in \mathbb{Z}} E(t, y) \frac{\partial g(x-t, \sigma)}{\partial x}Ex(x,y,σ)=tZE(t,y)xg(xt,σ)
    其中,g(x−t,σ)g(x-t, \sigma)g(xt,σ)是标准差为σ\sigmaσ的高斯函数,∂g∂x\frac{\partial g}{\partial x}xg为其x方向的导数,通过滑动窗口与图像中的EEE值卷积,得到x方向的空间导数。类似地,可计算y方向的空间导数(如EyE_yEy),以及结合光谱导数的空间导数(如EλxE_{\lambda x}EλxEλλyE_{\lambda\lambda y}Eλλy等)。
  • 颜色不变特征计算:计算完了空间导数,颜色不变特征即可根据表一公式进行计算。
3. 可训练的CIConv层设计(将第二节的计算过程卷积化)

CIConv层是将第二阶段的计算过程卷积化,使其可以进行训练。

  • 尺度参数的学习:高斯导数核的尺度参数σ\sigmaσ影响特征细节与抗噪性(小σ\sigmaσ 保留细节但敏感于噪声,大σ\sigmaσ抗噪但丢失细节)。作者将σ\sigmaσ 设为可训练参数(通过σ=2s\sigma=2^sσ=2s转换,sss 为训练参数),以适应任务需求。
  • CIConv层的输出:层的输出通过对颜色不变特征的平方进行对数变换和样本归一化得到,对数变换和归一化降低了光照强度变化对边缘检测的影响。即使在低光或不均匀光照下,W 也能稳定表示图像的固有结构。公式为:
    CIConv(x,y)=log⁡(CI2(x,y,σ=2s)+ϵ)−μSσSCIConv(x, y)=\frac{\log \left(CI^{2}\left(x, y, \sigma=2^{s}\right)+\epsilon\right)-\mu_{\mathcal{S}}}{\sigma_{\mathcal{S}}}CIConv(x,y)=σSlog(CI2(x,y,σ=2s)+ϵ)μS
    其中,CICICI 为所选颜色不变特征,μS\mu_{\mathcal{S}}μSσS\sigma_{\mathcal{S}}σS 为样本均值和标准差,ϵ\epsilonϵ为数值稳定项。

该设计将物理先验融入神经网络,使模型无需目标域数据即可减少昼夜光照导致的特征分布偏移,为零样本域适应提供了基础。对于LLIE任务来说,提取的该颜色不变特征可以作为一种先验信息进行任务指导。

三、实验结果

该研究通过多个实验验证了基于物理先验的零样本昼夜域适应方法的有效性,涵盖分类、分割等任务,具体如下:

1. 合成图像分类实验
  • 数据集:使用从ShapeNet数据集中选取的子集,通过物理渲染器Mitsuba生成合成图像,包含10个物体类别。训练集在“正常”光照条件(6500K)下生成,每个类别1000个样本;测试集则在不同光照强度(从暗到亮)和颜色(2500K到20000K)条件下生成,每个类别300个样本。
  • 模型与训练:训练基线ResNet-18和分别加入E、W、C、N、H五种颜色不变卷积层(CIConv)的ResNet-18,训练175个epoch,使用SGD优化器,采用随机水平翻转、裁剪和旋转等数据增强方式。
  • 结果:基线模型在光照条件偏离训练集时精度迅速下降,而加入CIConv层的模型性能更稳定,其中W不变量模型表现最优,且能减少网络各层特征图的分布偏移。
    在这里插入图片描述
2. 自然图像分类实验
  • 数据集:构建Common Objects Day and Night(CODaN)数据集,包含10个常见物体类别,由ImageNet、COCO和ExDark数据集组成。训练集为白天图像(每个类别1000个样本),验证集为白天图像(每个类别50个样本),测试集分为白天和夜间图像(每个类别300个样本)。
  • 模型与训练:训练加入不同颜色不变层的ResNet-18,训练设置与合成图像实验类似,但数据增强改为随机亮度、对比度、色调和饱和度调整。
  • 结果:W不变量模型在夜间测试集上准确率达59.67%,显著优于基线模型(48.31%)和其他方法(如AdaBN的55.55%),且其生成的边缘图能更好地保留低强度和低饱和度边缘,同时抑制噪声。
    在这里插入图片描述
    在这里插入图片描述
3. 语义分割实验
  • 数据集:使用CityScapes的白天训练集(2975张标注图像)进行训练,在Nighttime Driving(50张粗标注夜间图像)和Dark Zurich(151张精标注夜间图像)测试集上评估。
  • 模型与训练:采用RefineNet架构,分别使用ResNet-101和加入W不变量层的W-ResNet-101作为特征提取器,训练时使用随机缩放、亮度/对比度/色调调整和水平翻转等数据增强。
  • 结果:W-RefineNet在Nighttime Driving和Dark Zurich测试集上的mIoU分别为41.6和34.5,优于仅使用源域数据训练的其他模型(如RefineNet的34.1和30.6),且与使用源域和目标域数据的方法性能接近。
    在这里插入图片描述

这些实验从不同任务和数据集角度,验证了CIConv层在减少昼夜光照导致的分布偏移、提升模型鲁棒性方面的有效性。

四、总结

该论文聚焦零样本昼夜域适应问题,提出了一种基于物理先验的解决方案。通过引入基于Kubelka-Munk反射模型的颜色不变特征,设计了可训练的Color Invariant Convolution(CIConv)层,将其作为CNN的输入层,以减少光照变化导致的特征分布偏移。

在暗光增强任务作为结构先验应用的前景

暗光增强任务的核心是在提升图像亮度的同时,保留关键结构信息(如边缘、纹理)并抑制噪声。本文提出的颜色不变特征及CIConv层作为结构先验,在该领域具有以下优势:

  1. 保留结构一致性:颜色不变特征(如W不变量)对光照强度不敏感,能在暗光环境下稳定提取物体边缘和结构信息。将其作为先验融入暗光增强模型(如生成对抗网络),可引导模型在提亮过程中优先保留这些关键结构,避免过度增强导致的边缘模糊或细节丢失。
  2. 抑制噪声干扰:CIConv层通过学习高斯核尺度参数σ,在提取结构时能平衡细节保留与抗噪性(大σ增强抗噪性)。这一特性可辅助暗光增强模型区分真实结构与噪声,减少暗光环境下传感器噪声对增强结果的影响。
  3. 增强域适应性:暗光增强常面临“白天-黑夜”“正常光-低光”的域偏移问题,本文的物理先验可帮助模型学习光照不变的结构表示,提升模型在不同光照条件下的泛化能力,减少对大量配对暗光-正常光数据的依赖。

感谢阅读,欢迎留言或私信,一起探讨和交流。
如果对你有帮助的话,也希望可以给博主点一个关注,感谢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/93489.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/93489.shtml
英文地址,请注明出处:http://en.pswp.cn/web/93489.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Font Awesome Kit 使用详解

在现代网页设计中,图标是提升用户体验的关键元素。而 Font Awesome 作为最受欢迎的图标库,其最新版本 Font Awesome 7 通过 Kit 功能提供了更便捷高效的集成方式。本文将带你全面了解如何使用 Font Awesome Kit,让你的网站图标管理变得轻松高…

第七十八章:AI的“智能美食家”:输出图像风格偏移的定位方法——从“滤镜病”到“大师风范”!

AI图像风格偏移前言:AI的“火眼金睛”——输出图像风格偏移的定位方法!第一章:痛点直击——“画风跑偏”?AI生成艺术的“审美危机”!第二章:探秘“画风密码”:什么是风格偏移?它藏在…

Android原生(Kotlin)与Flutter混合开发 - 设备控制与状态同步解决方案

Kotlin 原生实现 (Android) 1.1 AndroidManifest.xml <manifest xmlns:android"http://schemas.android.com/apk/res/android"package"com.afloia.smartconnect"><applicationandroid:name".MainApplication"android:label"Smart …

已开源:Highcharts.NET,Highcharts Android,与Highcharts iOS集成

近期了解到&#xff0c;Highcharts官方宣布将Highcharts.NET&#xff0c;Highcharts Android&#xff0c;与Highcharts iOS集成转换为开源。对于Highcharts提供世界一流的数据可视化工具&#xff0c;一直致力于将资源集中在可以为您提供最大价值的地方。官方提到&#xff1a;这…

KingbaseES:一体化架构与多层防护,支撑业务的持续稳定运行与扩展

声明&#xff1a;文章为本人真实测评博客&#xff0c;非广告 目录 引言 一、什么是KingbaseES&#xff1f; 二、KingbaseES核心特性 1. 一键迁移&#xff0c;极速性能&#xff0c;安全无忧​ 2. 性能强劲&#xff0c;扩展性强&#xff0c;助力企业应对大规模并发挑战​ …

scikit-learn/sklearn学习|广义线性回归 Logistic regression的三种成本函数

【1】引言 前序学习进程中&#xff0c;已经对线性回归和岭回归做了初步解读。 实际上&#xff0c; Logistic regression是一种广义的线性模型&#xff0c;在对线性分类的进一步学习前&#xff0c;有必要了解 Logistic regression。 【2】Logistic regression的3种成本函数 …

Tiptap(基于 Prosemirror)vs TinyMCE:哪个更适合你的技术栈?

在这之前&#xff0c;先来介绍一下 ProseMirror&#xff1a; 1. ProseMirror 是底层内核 定位&#xff1a;一个强大的 富文本编辑框架/引擎&#xff0c;不是一个成品编辑器。 作者&#xff1a;Marijn Haverbeke&#xff08;CodeMirror 作者&#xff09;。 核心思想&#xff1…

多墨智能-AI一键生成工作文档/流程图/思维导图

本文转载自&#xff1a;多墨智能-AI一键生成工作文档/流程图/思维导图 - Hello123工具导航 ** 一、AI 文档与视觉化创作助手 多墨智能是一款基于人工智能的在线工具&#xff0c;支持一键生成专业文档、流程图与思维导图&#xff0c;通过关键词输入快速完成内容创作&#xff0…

Kafka_Broker_副本基本信息

Kafka副本作用&#xff1a;提高数据可靠性 Kafka默认副本1个&#xff0c;生产环境一般配置为2个&#xff0c;保证数据可靠性&#xff0c;太多副本会增加磁盘存储空间&#xff0c;增加网络上数据传输&#xff0c;降低效率 Kafka中副本分为&#xff1a;Leader和Follower&#xff…

FreeRTOS 中的守护任务(Daemon Task)

在 FreeRTOS 中&#xff0c;守护任务&#xff08;Daemon Task&#xff09;是一个特殊的系统任务&#xff0c;主要用于管理软件定时器和其他后台操作。以下是关于 FreeRTOS 守护任务的详细信息&#xff1a; 守护任务的作用软件定时器管理&#xff1a; 当启用 configUSE_TIMERS 时…

博士招生 | 麻省理工学院 招收化学+人工智能方向 博士/博士后

内容源自“图灵学术博研社”gongzhonghao学校简介麻省理工学院&#xff08;MIT&#xff09;QS世界排名第1&#xff0c;是全球科技研究领域的顶尖学府。自成立以来&#xff0c;MIT以其卓越的科研和教育质量赢得了世界的尊敬。学校在科学、工程、经济和管理等多个领域具有深远的影…

云计算-OpenStack 实战运维:从组件配置到故障排查(含 RAID、模板、存储管理,网络、存储、镜像、容器等)

介绍 在云计算技术快速发展的背景下,OpenStack 作为开源的云计算管理平台,凭借其灵活性、可扩展性和强大的组件生态,成为构建私有云、公有云和混合云的重要选择。无论是云主机的创建与管理、存储方案的配置(如 RAID 阵列、Swift 对象存储、Cinder 块存储),还是网络编排、…

idea代码bug检测插件

代码检测工具&#xff08;插件&#xff09;推荐&#xff1a;Alibaba Java Coding Guidelines、CheckStyle、PMD、FindBugs、SonarLint。可以在idea中安装插件 让你在关注代码质量的同时&#xff0c;减少 code review 的工作量&#xff0c;提高 code review 的效率&#xff0c;…

Java String为什么要设计成不可变的?

大家好&#xff0c;我是锋哥。今天分享关于【Java String为什么要设计成不可变的?】面试题。希望对大家有帮助&#xff1b; Java String为什么要设计成不可变的? 超硬核AI学习资料&#xff0c;现在永久免费了&#xff01; Java中的String类被设计为不可变&#xff08;immut…

集成电路学习:什么是ORB方向性FAST和旋转BRIEF

ORB:方向性FAST和旋转BRIEF ORB(Oriented FAST and Rotated BRIEF)是一种在计算机视觉领域广泛应用的特征描述算法,它结合了FAST角点检测算法和BRIEF描述子算法的优点,以实现高效且具有旋转不变性的特征提取和匹配。以下是关于ORB算法的详细解析: 一、ORB算法概述 …

【langgraph基础入门】

1. LangGraph图结构概念说明在以图构建的框架中&#xff0c;任何可执行的功能都可以作为对话、代理或程序的启动点。这个启动点可以是大模型的 API 接口、基于大模型构建的 AI Agent&#xff0c;通过 LangChain 或其他技术建立的线性序列等等&#xff0c;即下图中的 “Start” …

[逆向知识] AST抽象语法树:混淆与反混淆的逻辑互换(一)

博客配套代码发布于github&#xff1a;半自动化cookie更新&#xff08;欢迎顺手Star一下⭐&#xff09; 相关逆向知识&#xff1a; [逆向知识] AST抽象语法树&#xff1a;混淆与反混淆的逻辑互换&#xff08;二&#xff09;-CSDN博客 相关爬虫专栏&#xff1a;JS逆向爬虫实战…

网络安全合规6--服务器安全检测和防御技术

一、服务器安全风险主要威胁&#xff1a;不必要的服务暴露&#xff08;如仅需HTTP却开放多余端口&#xff09;。外网扫描&#xff08;IP/端口扫描&#xff09;、DDoS攻击。系统漏洞攻击&#xff08;操作系统、软件版本已知漏洞&#xff09;。Web攻击&#xff08;SQL注入、XSS、…

Mutually aided uncertainty

cycle loss calculation in order to regularize the two aux-decoders 辅助信息 作者未提供代码

go基础学习笔记

思维导图变量 声明形式为var 变量名 变量类型 赋值形式为变量名变量值 声明和赋值同时形式为变量名:变量值 多个变量同时声明使用形式为 var (x intb bool )当有多个变量类型一样时&#xff0c;可以放在一行&#xff0c;形式为var x,y int,当类型一样&#xff0c;并且需要赋值同…