Real-World Deep Local Motion Deblurring

      • 1. 研究目标与实际问题意义
        • 1.1 研究目标
        • 1.2 实际问题
        • 1.3 产业意义
      • 2. 创新方法:LBAG模型与关键技术
        • 2.1 整体架构设计
        • 2.2 关键技术细节
          • 2.2.1 真实模糊掩码生成(LBFMG)
          • 2.2.2 门控块(Gate Block)
          • 2.2.3 模糊感知补丁裁剪(BAPC)
        • 2.3 损失函数设计
        • 2.4 与现有方法的对比优势
        • 2.5 核心公式总结
        • 2.6 消融实验验证(表3)
      • 3. 实验设计与结果
        • 3.1 数据集:ReLoBlur
        • 3.2 实验结果
      • 4. 未来挑战与创新机会
        • 4.1 挑战
        • 4.2 创新方向
        • 4.3 投资机会
      • 5. 不足与批判性思考
      • 6. 可复用创新与学习建议
        • 6.1 核心可复用技术
        • 6.2 启发与背景补充

1. 研究目标与实际问题意义

1.1 研究目标

论文旨在解决局部运动模糊(Local Motion Blur) 问题,即图像中仅部分区域因物体快速运动而产生的模糊。传统去模糊方法主要针对全局模糊(如相机抖动),但局部模糊因目标位置随机、模糊程度未知且占比小,成为现有技术的短板。

1.2 实际问题
  • 数据缺失:缺乏真实局部模糊数据集,现有数据集多以合成或全局模糊为主。
  • 算法局限:全局去模糊网络在局部模糊任务中表现不佳,易在清晰背景区域引入伪影。
  • 数据不平衡:模糊区域通常仅占图像的11.75%,导致模型忽视模糊区域。
1.3 产业意义
  • 安防监控:提升运动目标(如行人、车辆)的清晰度。
  • 自动驾驶:增强动态障碍物识别能力。
  • 影视制作:修复运动物体的局部模糊,提升画面质量。

2. 创新方法:LBAG模型与关键技术

2.1 整体架构设计

图4:LBAG网络架构
图4
SCM提取浅层细节,AFF融合多尺度特征,门控块实现区域聚焦。

论文提出 LBAG(Local Blur-Aware Gated Network),其核心架构基于多尺度UNet(MIMO-UNet)并引入局部模糊感知模块。网络流程如下:

  1. 输入:多尺度局部模糊图像(缩放因子0.5, 1.0, 2.0)。
  2. 编码器-解码器结构
    • 3个收缩层(下采样)提取多尺度特征。
    • 3个扩张层(上采样)恢复空间分辨率。
    • 集成浅层卷积模块(SCM)非对称特征融合模块(AFF) 增强特征传递。
  3. 门控块(Gate Block):位于每个扩张层末端,实现模糊区域定位与内容重建的解耦。

“The gate block divides an input 4-channel feature map into a 3-channel latent and a 1-channel latent. The 1-channel latent passes through a sigmoid layer, forming a pixel-level local blur mask prediction.”

2.2 关键技术细节
2.2.1 真实模糊掩码生成(LBFMG)

方法:基于高斯混合模型(GMM) 的背景减除法生成真实模糊掩码(GT Mask):

  1. 输入当前模糊图像 B T B_T BT 和同场景其他清晰/模糊图像。
  2. 通过GMM更新背景模型,输出 B T B_T BT 的前景掩码作为GT Mask。
    优势:避免手动标注,适应复杂场景(如运动物体与静态背景粘连)。
2.2.2 门控块(Gate Block)

图5:门控块操作流程
图5
输入特征拆分为内容与掩码分支,通过Sigmoid生成软掩码加权输出。

结构(图5):

  1. 输入特征图 F ∈ R H × W × 4 F \in \mathbb{R}^{H \times W \times 4} FRH×W×4 拆分为:
    • 内容特征 F c ∈ R H × W × 3 F_c \in \mathbb{R}^{H \times W \times 3} FcRH×W×3
    • 掩码特征 F m ∈ R H × W × 1 F_m \in \mathbb{R}^{H \times W \times 1} FmRH×W×1
  2. 掩码预测:
    m ^ = σ ( F m ) , 其中  σ  为Sigmoid函数 \hat{m} = \sigma(F_m), \quad \text{其中} \ \sigma \ \text{为Sigmoid函数} m^=σ(Fm),其中 σ Sigmoid函数
    m ^ ( x , y ) ∈ [ 0 , 1 ] \hat{m}(x,y) \in [0,1] m^(x,y)[0,1] 表示像素 ( x , y ) (x,y) (x

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85640.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85640.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/85640.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Docker基础】Docker镜像管理:docker commit详解

目录 引言 1 docker commit命令概述 1.1 什么是docker commit 1.2 使用场景 1.3 优缺点分析 2 docker commit命令详解 2.1 基本语法 2.2 常用参数选项 2.3 实际命令示例 2.4 提交流程 2.5 步骤描述 3 docker commit与Dockerfile构建对比 3.1 构建流程对比 3.2 对…

可调式稳压二极管

1.与普通稳压二极管的比较: 项目普通稳压二极管可调式稳压二极管(如 TL431)输出电压固定(如5.1V、3.3V)可调(2.5V ~ 36V,取决于外部分压)精度低(5%~10%)高&a…

Kafka使用Elasticsearch Service Sink Connector直接传输topic数据到Elasticsearch

链接:Elasticsearch Service Sink Connector for Confluent Platform | Confluent Documentation 链接:Apache Kafka 一、搭建测试环境 下载Elasticsearch Service Sink Connector https://file.zjwlyy.cn/confluentinc-kafka-connect-elasticsearch…

讯方“教学有方”平台获华为昇腾应用开发技术认证!

教学有方 华为昇腾应用开发技术认证 权威认证 彰显实力 近日,讯方技术自研的教育行业大模型平台——“教学有方”,成功获得华为昇腾应用开发技术认证。这一认证不仅是对 “教学有方” 平台技术实力的高度认可,更标志着讯方在智慧教育领域的…

保护你的Electron应用:深度解析asar文件与Virbox Protector的安全策略

在现代软件开发中,Electron框架因其跨平台特性而备受开发者青睐。然而,随着Electron应用的普及,如何保护应用中的核心资源文件——asar文件,成为了开发者必须面对的问题。今天,我们将深入探讨asar文件的特性&#xff0…

端口安全配置示例

组网需求 如图所示,用户PC1、PC2、PC3通过接入设备连接公司网络。为了提高用户接入的安全性,将接入设备Router的接口使能端口安全功能,并且设置接口学习MAC地址数的上限为接入用户数,这样其他外来人员使用自己带来的PC无法访问公…

零基础RT-thread第四节:电容按键

电容按键 其实只需要理解,手指按上去后充电时间变长,我们可以利用定时器输入捕获功能计算充电时间,超过无触摸时的充电时间一定的阈值就认为是有手指触摸。 基本原理就是这样,我们开始写代码: 其实,看过了…

SQL基础操作:从增删改查开始

好的!SQL(Structured Query Language)是用于管理关系型数据库的标准语言。让我们从最基础的增删改查(CRUD)​​ 操作开始学习,我会用简单易懂的方式讲解每个操作。 🛠 准备工作(建表…

vim 编辑模式/命令模式/视图模式常用命令

以下是一份 Vim 命令大全,涵盖 编辑模式(Insert Mode)、命令模式(Normal Mode) 和 视图模式(Visual Mode) 的常用操作,适合初学者和进阶用户使用。 🧾 Vim 模式简介 Vim…

每天看一个Fortran文件(10)

今天来看下MCV模式调用物理过程的相关代码。我想改进有关于海气边界层方面的内容,因此我寻找相关的代码,发现在physics目录下有一个sfc_ocean.f的文件。 可以看见这个文件是在好多好多年前更新的了,里面内容不多,总共146行。是计算…

python打卡day37

疏锦行 知识点回顾: 1. 过拟合的判断:测试集和训练集同步打印指标 2. 模型的保存和加载 a. 仅保存权重 b. 保存权重和模型 c. 保存全部信息checkpoint,还包含训练状态 3. 早停策略 作业:对信贷数据集训练后保存权重&#xf…

【Spark征服之路-2.9-Spark-Core编程(五)】

RDD行动算子: 行动算子就是会触发action的算子,触发action的含义就是真正的计算数据。 1. reduce ➢ 函数签名 def reduce(f: (T, T) > T): T ➢ 函数说明 聚集 RDD 中的所有元素,先聚合分区内数据,再聚合分区间数据 val…

【入门】【练17.3 】比大小

| 时间限制:C/C 1000MS,其他语言 2000MS 内存限制:C/C 64MB,其他语言 128MB 难度:中等 分数:100 OI排行榜得分:12(0.1分数2难度) 出题人:root | 描述 试编一个程序,输入…

CppCon 2017 学习:Free Your Functions!

“Free Your Functions!” 这句话在C设计中有很深的含义,意思是: “Free Your Functions!” 的理解 “解放你的函数”,鼓励程序员: 不要把所有的函数都绑在类的成员函数里,优先考虑写成自由函数(non-mem…

日常运维问题汇总-19

60. OVF3维护成本中心与订货原因之间的对应关系时,报错提示,SYST: 不期望的日期 00/00/0000。消息号 FGV004,如下图所示: OVF3往右边拉动,有一个需要填入的字段“有效期自”,此字段值必须在成本中心定义的有…

2025SCA工具推荐︱基于多模态SCA的新一代开源供应链风险审查与治理平台

近年来,随着开源软件在企业数字化转型中的广泛应用,开源供应链攻击事件频发,企业普遍面临三大突出难题:一是不清楚自身引入了哪些开源组件,二是不掌握组件中潜在的安全漏洞和合规风险,三是缺乏自动化、全流…

CppCon 2017 学习:Migrating a C++03 library to C++11 case study

这段内容是在介绍 Wt(发音类似 “witty”) —— 一个用于 C 的 Web UI 框架。总结如下: 什么是 Wt? Wt 是一个 用 C 编写的 widget(控件)驱动的 Web 框架。类似于桌面 GUI 框架(比如 Qt&#…

coding习惯 + Bug记录整理

📖 清单 1、包装类型导致的NPE2、xxApiWrapper命名3、see注释4、MySQL模糊匹配特殊字符bug 整理些平时不好的coding习惯导致的bug📝 1、包装类型导致的NPE 处理项目的一个bug,看日志是发生了空指针,相关代码如下: D…

机器学习项目微服务离线移植

机器学习项目微服务离线移植 引言:为什么需要Docker化机器学习项目? 在当今的机器学习工程实践中,项目部署与移植是一个常见但极具挑战性的任务。传统部署方式面临着"在我机器上能运行"的困境——开发环境与生产环境的不一致导致…

JS红宝书笔记 8.4 类

与函数类型相似,定义类也有两种主要方式:类声明和类表达式,这两种方式都使用class关键字加大括号 与函数表达式类似,类表达式在它们被求值前也不能引用,不过与函数定义不同的是,虽然函数声明可以提升&…